पृथ्वी विज्ञान में एफएआईआर डेटा का महत्व

डॉ। जान आसन15 अक्तूबर 2019
लेखक के बारे में: जान आसन एक पीएच.डी. मनोवैज्ञानिक, कॉग्निटिव साइंस के विशेषज्ञ और फ्रांज इंक के सीईओ, आर्टिफिशियल इंटेलिजेंस के एक शुरुआती प्रर्वतक और अलिग्रोग्राफ के प्रदाता, प्रमुख सेमैटिक ग्राफ डेटाबेस।
लेखक के बारे में: जान आसन एक पीएच.डी. मनोवैज्ञानिक, कॉग्निटिव साइंस के विशेषज्ञ और फ्रांज इंक के सीईओ, आर्टिफिशियल इंटेलिजेंस के एक शुरुआती प्रर्वतक और अलिग्रोग्राफ के प्रदाता, प्रमुख सेमैटिक ग्राफ डेटाबेस।

एंटरप्राइज़ एसेट के रूप में डेटा का वैल्यूएशन समय के साथ सबसे अधिक एहसास होता है। जब ठीक से प्रबंधित किया जाता है, तो एक ही डेटासेट उपयोग के मामलों की बहुलता का समर्थन करता है, अनुरोध पर लगभग तुरंत उपलब्ध हो जाता है, और प्रत्येक तैनाती के साथ इसकी उपज को व्यवस्थित रूप से बढ़ाने के लिए विभागों या संगठनों के बीच विनिमेय है।

एक उद्यम संपत्ति के रूप में डेटा का लाभ उठाने के ये वरदान GO FAIR के खोजे जाने योग्य सुलभ इंटरऑपरेबल रियूसेबल (FAIR) सिद्धांतों की नींव हैं जो भूवैज्ञानिक विज्ञान के डेटा प्रबंधन कठोरता पर गहरा प्रभाव डालते हैं। इस स्थान के कई संगठनों ने इन तपों को पृथ्वी की रक्षापंक्ति को सुरक्षित रूप से निर्देशित करने के लिए विविध विषयों के बीच जानकारी साझा करने के लिए तेजी से अपनाया है।

अर्थ साइंस इंफॉर्मेशन पार्टनर्स (ईएसआईपी) के लैब डायरेक्टर डॉ। एनी बर्गेस के अनुसार, “सबसे अधिक दबाव वाली वैश्विक चुनौतियों को एक संगठन द्वारा हल नहीं किया जा सकता है। वैज्ञानिकों को कई विषयों में एकत्र किए गए डेटा की आवश्यकता होती है, जिन्हें अक्सर कई अलग-अलग एजेंसियों और संस्थानों द्वारा प्रबंधित किया जाता है। ”जैसा कि पृथ्वी विज्ञान समुदाय के कई सदस्यों को एहसास हो रहा है, एफएआईआर के सिद्धांतों के अनुसार उन असमान डेटा को प्रबंधित करने का सबसे प्रभावशाली साधन सिमेंटिक मानकों का उपयोग करके है। ज्ञान रेखांकन को रेखांकित करना।

मेटाडेटा, डेटा मॉडल और शब्दावली के प्रबंधन के लिए ये समान दृष्टिकोण एफएआईआर डेटा आंदोलन की जड़ हैं, जो डेटा को वैज्ञानिक समुदाय की बेशकीमती संपत्ति के रूप में सुनिश्चित करते हैं।

सांप्रदायिक विज्ञान
नॉलेज ग्राफ्स को सपोर्ट करने वाले सिमेंटिक स्टैंडर्ड्स को मशीन रीडेबल फॉर्मेट में विशिष्ट पहचान, तुरंत एक्सेस करने और डेटा साझा करने के लिए डिज़ाइन किया गया है। वे वर्ल्ड वाइड वेब में इन लाभों को सुविधाजनक बनाने के लिए जिम्मेदार हैं, और भूवैज्ञानिक विज्ञान के क्षेत्र में डेटा के पुन: उपयोग के लिए बेहद फायदेमंद हैं। यह क्षेत्र अधिक चुनौतीपूर्ण वैज्ञानिक क्षेत्रों में से एक है क्योंकि यह इतना व्यापक है, जिसमें समुद्री जीवन, वायुमंडलीय चिंताओं, भूमि द्रव्यमान और भूमिगत विकास शामिल हैं। इन विभिन्न विशिष्टताओं में डेटा को तेजी से साझा करने की क्षमता क्षेत्र को समग्र रूप से आगे बढ़ाने का एक अभिन्न पहलू है, क्योंकि विशिष्ट रूप से डेटा की पहचान करने और मशीन पठनीय तकनीकों के माध्यम से उन्हें जल्दी से एक्सेस करने के अन्य फायदे हैं।

कैलिफोर्निया इंस्टीट्यूट ऑफ टेक्नोलॉजी की जेट प्रोपल्शन लैबोरेटरी के डेटा वैज्ञानिक और नासा ईएसडीएसडब्ल्यूजी सर्च रिलेवांस वर्किंग ग्रुप के सह-अध्यक्ष डॉ। लुईस मैकगिबनी ने कहा, “हम एक रोमांचक चरण में हैं, जहां विशेषज्ञों और संगठनों का एक महत्वपूर्ण समूह है। समान लक्ष्यों के साथ ग्लोब और साथ ही यह अहसास कि हमें ज्ञान-गहन अनुप्रयोगों की आवश्यकता है। भूविज्ञान क्षेत्र के भीतर ज्ञान-गहन उपयोग के मामलों के लिए बुद्धिमान एप्लिकेशन के निर्माण के लिए सिमेंटिक टेक्नोलॉजी स्टैक एक महत्वपूर्ण टुकड़ा है। ”इसके अलावा, सिमेंटिक मानक उन संगठनों को पुन: प्रयोज्य प्रारूप में डेटा और निष्कर्ष प्रकाशित करने में सक्षम बनाते हैं ताकि विभिन्न संगठन सीधे एक-दूसरे के श्रम से लाभान्वित हों।

मानव और मशीनों को जोड़ना
FAIR दृष्टिकोण डेटा के विभिन्न टुकड़ों को ज्ञान ग्राफ में जोड़ने के लिए घूमता है। बदले में उन ज्ञान ग्राफों को सार्वभौमिक पहुंच के लिए वेब पर विभिन्न संगठनों या 'प्रकाशित' के बीच जोड़ा जा सकता है - जो कि अंतर के लिए महत्वपूर्ण है। इस दृष्टिकोण के लिए न केवल प्रत्येक व्यक्ति को अपने विशिष्ट पहचानकर्ता की आवश्यकता होती है, बल्कि मानकीकृत शब्दसंग्रह और मशीनों के माध्यम से तेजी से समझे जाने वाले और एक्सेस किए जाने के आधार पर इसके मेटाडेटा का एक समृद्ध विवरण भी है। सिमेंटिक डेटा मॉडल (ऑन्कोलॉजी) विभिन्न अनुप्रयोगों के लिए अलग-अलग संगठनों द्वारा उपयोग किए जाने वाले स्कीमा में निहित अंतरों को मानकीकृत करते हैं, आगे जाकर एफएआईआर सिद्धांतों को गले लगाते हुए आईटी प्रणालियों की अंतर-क्षमता की सहायता करते हैं।

मोंटेरे बे एक्वेरियम रिसर्च इंस्टीट्यूट के वरिष्ठ सॉफ्टवेयर इंजीनियर कार्लोस राइड्डा ने टिप्पणी की कि “मरीन मेटाडेटा इंटरऑपरेबिलिटी प्रोजेक्ट ने एमएमआई ओन्टोलॉजी रजिस्ट्री और रिपॉजिटरी (ओआरआर) विकसित किया है, जो अल्लेग्रोग्रैफ़ का लाभ उठाती है ताकि शक्तिशाली इंटरएक्टिव सिमेंटिक सेवाएं प्रदान की जा सकें जो वेब पर मौजूद सामग्री को सार्थक तरीके से जोड़ते हैं। दोनों मनुष्यों और मशीनों का उपभोग करने के लिए। ”इस मानकीकृत तरीके से अपने असंख्य रिपोजिटरी के ऑन्थॉलोजी को पंजीकृत करने के लिए मरीन मेटाडेटा इंटरऑपरेबिलिटी प्रोजेक्ट में विभिन्न वैज्ञानिक संगठनों को सक्षम करके, डेटा एकीकरण और पहुंच को तेज किया जाता है।

एकीकृत विविधता
शायद पृथ्वी विज्ञान समुदाय के भीतर ज्ञान ग्राफ के साथ एफएआईआर सिद्धांतों को सक्रिय करने का पूंजीगत लाभ वैज्ञानिकों के लिए प्रासंगिक गोताखोरों के आंकड़ों के वर्गीकरण पर मानकीकरण करने की क्षमता है। इस क्षेत्र में विभिन्न विशिष्टताओं की सरासर संख्या में प्रतीत होता है कि अनंत किस्मों के डेटा की आवश्यकता होती है। स्रोतों में उपग्रह डेटा के अलावा पानी, हवाई और स्थलीय स्रोतों से सेंसर डेटा और भौतिक नमूनों से शामिल हैं। इसके अलावा, इन आंकड़ों को कई अलग-अलग स्थानिक और लौकिक संकल्पों की विशेषता है, जो उन्हें सजातीय रूप से प्रबंधित करने की समग्र जटिलता को जोड़ते हैं। इस संबंध में, सिमेंटिक डेटा मॉडल में डेटा का वर्णन करने के लिए एकसमान वोकैबुलरीज़ में काफी मदद की जाती है। डॉ। बर्गेस ने "ईएसआईपी कम्युनिटी ओटोलोजी रिपॉजिटरी, एक सामुदायिक मंच का उपयोग करने और शब्दों और वोकैबुलरीज़ को प्रबंधित करने और विनिमय करने, खोजने और डेटा का पुन: उपयोग करने में वैज्ञानिकों की सहायता करने के लिए सामुदायिक मंच की योग्यता के लिए कहा।"

दीर्घकालिक प्रचार
जैसा कि भूगर्भीय विज्ञान समुदाय के भीतर प्रचुर उपयोग के मामलों से पता चलता है, डेटा का वास्तविक सम्मान इसकी स्थायी पुन: प्रयोज्यता और तत्काल पहुंच पर आधारित है। इन प्राथमिकताओं ने एफएआईआर आंदोलन को जन्म दिया, जो कार्यान्वयन के लिए सिमेंटिक प्रौद्योगिकियों पर निर्भर करता है। समकालीन संगठनों पर लागू होने पर यह दृष्टिकोण समान लाभ देता है: उद्यम संपत्ति के रूप में डेटा के मूल्य में वृद्धि।

लेखक के बारे में
जनआसमन एक पीएच.डी. मनोवैज्ञानिक, कॉग्निटिव साइंस के विशेषज्ञ और फ्रांज इंक के सीईओ, आर्टिफिशियल इंटेलिजेंस के एक शुरुआती प्रर्वतक और अलिग्रोग्राफ के प्रदाता, प्रमुख सेमैटिक ग्राफ डेटाबेस। एक वैज्ञानिक और सीईओ दोनों के रूप में, डॉ। आसमन आर्टिफिशियल इंटेलिजेंस और नॉलेज ग्राफ्स के क्षेत्रों में जमीन तोड़ना जारी रखते हैं क्योंकि वे कई फॉर्च्यून 500 संगठनों के साथ-साथ यूएस और विदेशी सरकारों के साथ हाथ से काम करते हैं। डॉ। आसमन ने अपने पेशेवर कैरियर के एक बड़े हिस्से को लागू आर्टिफिशियल इंटेलिजेंस प्रोजेक्ट्स, बुद्धिमान उपयोगकर्ता इंटरफेस और दूरसंचार अनुसंधान में विशेषज्ञता के लिए खर्च किया है। उन्होंने टैबलेट और व्यक्तिगत सहायकों के लिए अग्रदूत प्रौद्योगिकी विकसित करते हुए भाषण प्रौद्योगिकी, मल्टीमॉडल उपयोगकर्ता इंटरैक्शन, सिफारिश इंजन के क्षेत्रों में पेटेंट इकट्ठा किया है। वह तकनीकी विश्वविद्यालय के डेल्फ़्ट के औद्योगिक डिजाइन विभाग में एक प्रोफेसर थे और स्मार्ट डेटा, NoSQL नाउ, अंतर्राष्ट्रीय सिमेंटिक वेब कॉन्फ्रेंस, जियोवेब, AAAI, एंटरप्राइज डेटा वर्ल्ड, ग्लोबल ग्राफ समिट, टेक्स्ट एनालिटिक्स जैसे कार्यक्रमों में एक प्रसिद्ध सम्मेलन वक्ता थे। और टीटीआई मोहरा।