प्रश्न:
कौन से बड़े डेटा समाधानों को लागू करने का निर्णय लेते समय क्या विचार सबसे महत्वपूर्ण हैं?
ए:प्रत्येक व्यवसाय और संगठन को अपनी स्वयं की जरूरतों और संसाधनों पर विचार करना चाहिए जब यह पता लगाना चाहिए कि बड़े डेटा कार्यान्वयन के लिए कौन से मुद्दे सबसे महत्वपूर्ण हैं। हालांकि, ऐसे कई सिद्धांत हैं जिन्हें आमतौर पर इस तरह की प्रौद्योगिकी को अपनाने के लिए महत्वपूर्ण माना जाता है।
वेबिनार: बिग आयरन, बिग डेटा से मिलो: हडूप और स्पार्क के साथ मेनफ्रेम डेटा को मुक्त करना यहां रजिस्टर करें |
सबसे बड़े प्रश्नों में से एक कार्यान्वयन और व्यवधान की मात्रा है। बड़े डेटा सिस्टम के उपयोगकर्ताओं को हमेशा तुलना करनी होती है कि वे वर्तमान में उपयोग कर रहे हैं जो वे उपयोग करने वाले हैं। कई मामलों में, विघटन निर्णय कारक है कि क्या बड़े डेटा संसाधन उत्पादकता और मुनाफे को बढ़ावा देने के लिए जा रहे हैं, या कार्यान्वयन के साथ दुर्गम बाधाओं के कारण एक दुर्घटनाग्रस्त व्यापार भेजते हैं। वेंडर के समर्थन (या इसकी कमी) का इससे बहुत कुछ लेना-देना है, लेकिन व्यवसायों को प्रौद्योगिकियों के लिए सीखने की अवस्था को भी देखना होगा, वे विरासत प्रणालियों के संचालन को कितना बदलेंगे, और सामान्य तौर पर, चाहे वे परिवर्तन कुछ भी हों उद्यम संभाल सकता है।
एक अन्य प्रमुख प्रश्न यह है कि कौन सा डेटा किसी व्यवसाय या संगठन के लिए सबसे अधिक मूल्यवान है। विभिन्न डेटा सेटों के मूल्य की जांच करके, बड़े डेटा को लागू करने के इच्छुक लोग अपनी परियोजना का दायरा निर्धारित कर सकते हैं। इस प्रकार के दिशानिर्देशों के बिना, बड़ी डेटा परियोजनाएं एक उद्यम में फूला हुआ और अभिभूत हो सकती हैं। विशेषज्ञ उन विशिष्ट डेटा सेटों पर ध्यान केंद्रित करने की सलाह देते हैं जो एक व्यापक नेट कास्टिंग में फंस गए बिना सबसे अधिक मूल्य देंगे।
यहां एक कोरोलरी मुद्दा संरचित और असंरचित डेटा का उपयोग है। व्यावसायिक नेता डेटा के विभिन्न बिट्स को डेटा सेंटर जैसे बड़े डेटा संदर्भ में प्राप्त करने में कठिनाई के स्तर को देख सकते हैं। उदाहरण के लिए, पहले से ही प्रारूपित डेटा सेट को आसानी से पचाया जा सकता है, लेकिन डेटा के कुछ अन्य टुकड़ों को उन्हें एक उपयोगी प्रारूप में लाने के लिए व्यापक हेरफेर की आवश्यकता हो सकती है, और यह इसके लायक नहीं हो सकता है।
एडॉप्टर्स को बड़े डेटा के लिए उन्नत हैंडलिंग को भी देखना होगा। बिग डेटा सिस्टम को उन लोगों के रूप में परिभाषित किया गया है जो बुनियादी और सरल हार्डवेयर और सॉफ्टवेयर इन्फ्रास्ट्रक्चर के साथ संभालना मुश्किल है। इसका मतलब है कि गोद लेने वालों को बड़े डेटा सेटों का उपयोग करने के तरीकों को खोजने के लिए हाथ में पर्याप्त प्रतिभा और संसाधन रखने की आवश्यकता है जो नेटवर्क की भीड़ का कारण नहीं बनेंगे या अन्यथा संचालन में अड़चनें पैदा करेंगे।
