घर रुझान बड़े डेटा के प्रबंधन के बारे में 6 बड़े मिथक

बड़े डेटा के प्रबंधन के बारे में 6 बड़े मिथक

विषयसूची:

Anonim

मई 2014 में वापस, फॉरेस्टर रिसर्च ने बड़े डेटा के आसपास प्रचार के बारे में कुछ निष्कर्ष निकालते हुए दो रिपोर्ट जारी की। शोध फर्म ने 250 से अधिक विपणन और व्यवसाय-विकास अधिकारियों का सर्वेक्षण किया। रिपोर्ट के लेखकों के अनुसार, बड़े डेटा बयानबाजी सभी उच्च स्तर पर है, और प्रौद्योगिकी विक्रेता अविश्वसनीय दावों के साथ उत्पादों का दोहन कर रहे हैं।


गार्टनर फॉरेस्टर रिसर्च से सहमत हैं; पर्याप्त प्रचार बड़े डेटा को घेर लेता है। सितंबर 2014 की रिपोर्ट में, गार्टनर ने सबसे बड़े डेटा मिथकों में से पांच का विमोचन किया, और गार्टनर विश्लेषकों ने बड़े डेटा और इसके हेरफेर के बारे में गलतफहमी के रूप में अपनी राय पेश की। तो बड़े डेटा के सबसे बड़े मिथक क्या हैं? चलो देखते हैं।

मिथक: बड़े डेटा को अपनाने में हर कोई हमसे आगे है।

गार्टनर का कहना है कि बड़े डेटा में रुचि एक सर्वकालिक उच्च पर है। इसके बावजूद, मतदान में शामिल 13 प्रतिशत लोगों के पास कार्य प्रणाली है। कारण: अधिकांश कंपनियों ने अभी तक यह पता नहीं लगाया है कि डेटा के बड़े भंडार से किसी भी मूल्य को कैसे प्राप्त किया जाए। यहां, गार्टनर का सर्वेक्षण फॉरेस्टर रिपोर्ट की तुलना में अधिक आशावादी है, जिसमें पाया गया कि सर्वेक्षण के केवल 9 प्रतिशत प्रतिभागियों ने कहा कि उन्होंने अगले वर्ष में बड़े-डेटा तहखाने को लागू करने की योजना बनाई है। (बड़ा डेटा देने के लिए बहुत कुछ है। 5 वास्तविक दुनिया की समस्याओं में और जानें बड़े डेटा हल कर सकते हैं।)

मिथक: हमारे पास इतना डेटा है; हमें हर छोटे डेटा दोष के बारे में चिंता करने की आवश्यकता नहीं है।

गार्टनर को हम इंसानों के बारे में चिंतित हैं: "हमारे पास बहुत कुछ है, जो थोड़ा बुरा है वह कोई मायने नहीं रखेगा।" टार्ट फ्राइडमैन, उपाध्यक्ष और गार्टनर के प्रतिष्ठित विश्लेषक का मानना ​​है कि स्थिति को देखने का यह गलत तरीका है।


"वास्तव में, हालांकि प्रत्येक व्यक्तिगत दोष का पूरे डेटासेट पर बहुत कम प्रभाव पड़ता है, क्योंकि जब डेटा कम था, तो पहले की तुलना में अधिक दोष हैं क्योंकि अधिक डेटा है, " फ्राइडमैन ने कहा। "इसलिए, संपूर्ण डेटासेट पर खराब-गुणवत्ता वाले डेटा का समग्र प्रभाव समान रहता है।"


फ्राइडमैन चिंता का एक और कारण जोड़ता है। बिग-डेटा कैप्चर में अक्सर व्यवसाय के बाहर से डेटा शामिल होता है, जो कि अज्ञात संरचना और उत्पत्ति का है। इससे त्रुटियों की संभावना बढ़ जाती है।

मिथक: बिग डेटा तकनीक डेटा एकीकरण की आवश्यकता को समाप्त कर देगी।

दो प्रमुख डेटा विश्लेषण रणनीतियाँ हैं जो बड़े डेटा पर लागू हो सकती हैं: "लिखने पर स्कीमा" या "रीड पर स्कीमा।" कुछ समय पहले तक, लिखने पर स्कीमा केवल एक ही तरीका था। पढ़ने पर स्कीमा डेटाबेस प्रबंधन में वर्तमान सनक है। स्कीमा ऑन लिखने के विपरीत, जिसके लिए एक संरचित प्रारूप की आवश्यकता होती है, डेटा को अपने कच्चे प्रारूप में स्कीमा-ऑन-रीड डेटाबेस में लोड किया जाता है। फिर डेवलपर्स - Hadoop जैसे असंरक्षित डेटाबेस प्लेटफॉर्म का उपयोग करते हुए - असमान डेटा को एक प्रयोग करने योग्य प्रारूप में मोड़ें। पढ़ें पर स्कीमा के स्पष्ट लाभ हैं लेकिन, गार्टनर का उल्लेख है, कुछ बिंदु पर डेटा एकीकरण होना है।

मिथक: उन्नत विश्लेषण के लिए डेटा वेयरहाउस का उपयोग करना व्यर्थ है।

डेटा वेयरहाउस बनाने के लिए समय व्यतीत करना कई सूचना प्रबंधकों के लिए व्यर्थ लगता है, खासकर जब नए-कैप्चर किए गए डेटा डेटा वेयरहाउस में इससे भिन्न होते हैं। हालांकि, गार्टनर फिर से चेतावनी देता है कि उन्नत डेटा एनालिटिक्स डेटा वेयरहाउस और नए डेटा का उपयोग करेंगे, जिसका अर्थ है कि डेटा इंटीग्रेटर्स को होना चाहिए:

  • विश्लेषण के लिए उन्हें उपयुक्त बनाने के लिए नए डेटा प्रकारों को परिष्कृत करें
  • तय करें कि कौन सा डेटा प्रासंगिक है, और डेटा गुणवत्ता का स्तर आवश्यक है
  • निर्धारित करें कि डेटा को कैसे एकत्रित किया जाए
  • यह समझें कि डेटा परिशोधन डेटा वेयरहाउस के अलावा अन्य स्थानों पर भी हो सकता है

मिथक: डेटा झील डेटा वेयरहाउस की जगह लेगी।

डेटा लेयर्स असमान डेटा की रिपॉजिटरी हैं, डेटा वेयरहाउस के विपरीत, जहाँ डेटा एक संरचित प्रारूप में है। डेटा वेयरहाउस बनाने की तुलना में डेटा लेक बनाने में थोड़ी मेहनत (डेटा फॉर्मेट करने की कोई जरूरत नहीं) होती है, यही वजह है कि डेटा झीलें रूचि रखती हैं।


गार्टनर इस बात पर जोर देते हैं कि डेटा होना बिंदु नहीं है - सूचित निर्णय के लिए कैप्चर किए गए डेटा में हेरफेर करने में सक्षम होना बिंदु है। इसके अलावा, निर्णय लेने की सुविधा के लिए (कुछ हद तक अप्रमाणित) डेटा झीलों का उपयोग करना समस्याग्रस्त है।


गार्टनर के शोध निदेशक निक हेडेकर ने कहा, "डेटा वेयरहाउस में पहले से ही एक संगठन में उपयोगकर्ताओं की व्यापक विविधता का समर्थन करने की क्षमता है।" "सूचना-प्रबंधन नेताओं को डेटा झीलों को पकड़ने के लिए इंतजार नहीं करना पड़ता है।" (बड़े चीजों को अपनाने से पहले जानें 7 चीजें जिन्हें आपको अपनाने से पहले बड़े डेटा के बारे में पता होना चाहिए।)

बिग डेटा वर्क्स - नए डेटा हेरफेर के तरीके मई नहीं

गार्टनर ने कहा कि "बिग-डेटा मिथकों" के बजाय "सबसे बड़ा डेटा मिथक" रिपोर्ट पढ़ने के बाद स्पष्ट हो जाता है। गार्टनर बड़े डेटा का लेयर नहीं है। गार्टनर उन लोगों की लेरी है जो महसूस करते हैं कि बड़े डेटा में हेरफेर करने के नए तरीके "प्राइम टाइम" के लिए तैयार हैं।

बड़े डेटा के प्रबंधन के बारे में 6 बड़े मिथक