विषयसूची:
परिभाषा - निष्कर्षण का क्या अर्थ है?
निष्कर्षण एक डेटा वेयरहाउसिंग वातावरण में उपयोग के लिए एक विशिष्ट पैटर्न में डेटा स्रोतों से प्रासंगिक जानकारी प्राप्त करने की प्रक्रिया है। निष्कर्षण डेटा में अर्थ जोड़ता है और डेटा परिवर्तन प्रक्रिया का पहला चरण है। एक्सट्रैक्शन केवल कुछ डेटा को बाहर निकालता है जो विभिन्न स्रोतों से आने वाले डेटा के विशाल संग्रह से एक शर्त या श्रेणी को फिट करते हैं।
टेकोपेडिया एक्सट्रैक्शन बताते हैं
डेटा वेयरहाउसिंग वातावरण में, विभिन्न संरचनाओं और असंरचित स्रोतों से आने वाले डेटा का एक विशाल संग्रह, सार्थक निष्कर्ष और पूर्वानुमान प्राप्त करने के लिए संसाधित, रूपांतरित और संग्रहीत किया जाना चाहिए। प्राथमिक स्रोतों से आने वाले डेटा को व्यवस्थित तरीके से डेटा वेयरहाउसिंग सिस्टम में आयात किया जाना चाहिए, जिससे डेटा पर विभिन्न कार्यों को करना आसान हो जाता है। इस प्रक्रिया को निष्कर्षण कहा जाता है। एक्सट्रैक्शन कुछ नियमों का पालन करके अन्यथा असंरचित डेटा में संरचना जोड़ता है। डेटा निष्कर्षण में उपयोग की जाने वाली कुछ तकनीकें निम्नलिखित हैं:
- पैटर्न मिलान
- तालिका-आधारित दृष्टिकोण
- पाठ विश्लेषण
