घर रुझान मौजूदा डेटा वेयरहाउस वातावरण बड़े डेटा एनालिटिक्स की जरूरतों को पूरा करने का सबसे अच्छा पैमाना कैसे हो सकता है?

मौजूदा डेटा वेयरहाउस वातावरण बड़े डेटा एनालिटिक्स की जरूरतों को पूरा करने का सबसे अच्छा पैमाना कैसे हो सकता है?

Anonim

प्रश्न:

मौजूदा डेटा वेयरहाउस वातावरण बड़े डेटा एनालिटिक्स की जरूरतों को पूरा करने का सबसे अच्छा पैमाना कैसे हो सकता है?

ए:

व्यक्तिगत डेटा वेयरहाउस प्रोजेक्ट्स का मूल्यांकन केस-बाय-केस आधार पर किया जाना चाहिए। आमतौर पर, मौजूदा डेटा वेयरहाउस डिज़ाइन को बड़े डेटा एनालिटिक्स को बेहतर तरीके से हैंडल करने की कोशिश में, यह पता लगाने की एक मुख्य प्रक्रिया होती है कि क्या किया जाना चाहिए। आईटी पेशेवर इसे "स्केलिंग अप" या "स्केलिंग आउट" कह सकते हैं।

वेबिनार: बिग आयरन, बिग डेटा से मिलो: हडूप और स्पार्क के साथ मेनफ्रेम डेटा को मुक्त करना

यहां रजिस्टर करें

स्केलिंग में आम तौर पर पर्याप्त प्रोसेसिंग पावर प्राप्त करना, पर्याप्त मात्रा में मेमोरी प्राप्त करना, और सभी बड़े डेटा सेटों को संभालने के लिए अधिक शक्तिशाली सर्वर गतिविधियों को समायोजित करना शामिल होता है जो व्यवसाय प्रक्रिया करेगा। इसके विपरीत, बाहर स्केलिंग का मतलब सर्वर हार्डवेयर के समूहों को इकट्ठा करना और उन्हें बड़े डेटा को एक साथ नेटवर्किंग करना हो सकता है।

कुछ आईटी विशेषज्ञों ने सुझाव दिया है कि Apache Hadoop और अन्य लोकप्रिय बड़े डेटा टूल और प्लेटफ़ॉर्म के साथ अधिक सामान्य विधि वांछित प्रभाव को प्राप्त करने के लिए हार्डवेयर को स्केल आउट और क्लस्टर करना है। हालांकि, अन्य लोग बताते हैं कि आज की तकनीक के साथ, एक डेटा वेयरहाउस एक खरीद रणनीति का उपयोग करके बड़े पैमाने पर कर सकता है जो कि सर्वर में संसाधन जोड़ता है, जैसे कि अधिक मात्रा में प्रसंस्करण कोर के साथ अधिक मात्रा में रैम प्राप्त करने से।

चाहे वे बड़े पैमाने पर हों या बड़े पैमाने पर हों, डेटा वेयरहाउस को बड़े डेटा वर्कलोड को संभालने में सक्षम होने के लिए अतिरिक्त भौतिक हार्डवेयर परिसंपत्तियों की आवश्यकता होती है। उन्हें अतिरिक्त मानव प्रशासन की भी आवश्यकता है, जिसका अर्थ है आंतरिक टीमों के लिए अधिक प्रशिक्षण। एक नए बड़े डेटा इकोसिस्टम के लिए इसे तैयार करने के लिए मौजूदा डेटा विरासत में किस तरह के तनाव और बड़े डेटा वर्कलोड पर होगा, यह निर्धारित करने के लिए बहुत सारी योजना बनाने की ज़रूरत है। एक बड़ा मुद्दा भंडारण की अड़चनें हैं, जिन्हें भंडारण केंद्रों में अपग्रेड करने की आवश्यकता होती है, और अन्य प्रकार के प्रदर्शन की अड़चनें जो एक नवजात प्रणाली को प्रभावित कर सकती हैं यदि वे संबोधित नहीं हैं।

मौजूदा डेटा वेयरहाउस वातावरण बड़े डेटा एनालिटिक्स की जरूरतों को पूरा करने का सबसे अच्छा पैमाना कैसे हो सकता है?