विषयसूची:
परिभाषा - बिग डेटा का क्या अर्थ है?
बिग डेटा एक ऐसी प्रक्रिया को संदर्भित करता है जिसका उपयोग तब किया जाता है जब पारंपरिक डेटा खनन और हैंडलिंग तकनीक अंतर्निहित डेटा की अंतर्दृष्टि और अर्थ को उजागर नहीं कर सकती है। डेटा जो असंरचित या समय संवेदनशील है या बस बहुत बड़ा है, उसे रिलेशनल डेटाबेस इंजन द्वारा संसाधित नहीं किया जा सकता है। इस प्रकार के डेटा के लिए बड़े डेटा नामक एक अलग प्रोसेसिंग दृष्टिकोण की आवश्यकता होती है, जो आसानी से उपलब्ध हार्डवेयर पर बड़े पैमाने पर समानता का उपयोग करता है।
Techopedia बिग डेटा की व्याख्या करता है
काफी बस, बड़ा डेटा उस बदलती दुनिया को दर्शाता है जिसमें हम रहते हैं। जितनी अधिक चीजें बदलती हैं, उतने ही अधिक परिवर्तन कैप्चर किए जाते हैं और डेटा के रूप में दर्ज किए जाते हैं। एक उदाहरण के रूप में मौसम ले लो। एक मौसम फोरकास्टर के लिए, स्थानीय परिस्थितियों के बारे में दुनिया भर में एकत्र किए गए आंकड़ों की मात्रा पर्याप्त है। तार्किक रूप से, यह समझ में आता है कि स्थानीय वातावरण क्षेत्रीय प्रभावों को निर्धारित करते हैं और क्षेत्रीय प्रभाव वैश्विक प्रभावों को निर्धारित करते हैं, लेकिन यह अच्छी तरह से चारों ओर हो सकता है। एक तरह से या किसी अन्य, यह मौसम डेटा बड़े डेटा की विशेषताओं को दर्शाता है, जहां बड़े पैमाने पर डेटा के लिए वास्तविक समय प्रसंस्करण की आवश्यकता होती है, और जहां बड़ी संख्या में इनपुट मशीन जनरेट किए जा सकते हैं, व्यक्तिगत अवलोकन या सूर्य के धब्बे जैसे बाहरी बल।
इस तरह की जानकारी संसाधित करना दिखाता है कि बड़ा डेटा इतना महत्वपूर्ण क्यों हो गया है:
- अब एकत्र किया गया अधिकांश डेटा अनस्ट्रक्चर्ड है और पारंपरिक रिलेशनल डेटाबेस में पाए जाने वाले अलग-अलग स्टोरेज और प्रोसेसिंग tthan की आवश्यकता होती है।
- उपलब्ध कम्प्यूटेशनल बिजली आकाश-रॉकेटिंग है, जिसका अर्थ है कि बड़े डेटा को संसाधित करने के अधिक अवसर हैं।
- इंटरनेट ने डेटा का लोकतांत्रिकरण किया है, लगातार उपलब्ध आंकड़ों में वृद्धि करते हुए अधिक से अधिक कच्चे डेटा का उत्पादन भी कर रहा है।
इसके कच्चे रूप में डेटा का कोई मूल्य नहीं है। मूल्यवान होने के लिए डेटा को संसाधित करने की आवश्यकता है। हालांकि, इसमें बड़े डेटा की अंतर्निहित समस्या निहित है। क्या ऐसा करने के लिए बड़े पैमाने पर पूंजीगत लागत के लायक डेटा का उपयोग मूल वस्तु प्रारूप से किया जा रहा है? या क्या बड़े डेटा टूल के साथ इसे संसाधित करने के जुआ को सही ठहराने के लिए अज्ञात मूल्यों के साथ बहुत अधिक डेटा है? हम में से अधिकांश सहमत होंगे कि मौसम की भविष्यवाणी करने में सक्षम होने का मूल्य होगा, सवाल यह है कि क्या मूल्य सभी वास्तविक समय के डेटा को एक मौसम रिपोर्ट में क्रंच करने की लागत से आगे निकल सकता है जिसे गिना जा सकता है।
