विषयसूची:
Hadoop पर SQL, विश्लेषणात्मक एप्लिकेशन टूल का एक समूह है जो सबसे हालिया Hadoop फ्रेमवर्क तत्वों के साथ SQL-स्टाइल क्वेरी और डेटा के प्रसंस्करण को जोड़ती है। Hadoop पर SQL का उद्भव बड़े डेटा प्रोसेसिंग के लिए एक महत्वपूर्ण विकास है क्योंकि यह लोगों के व्यापक समूहों को Hadoop प्रक्रियाओं के विशाल वॉल्यूम पर SQL क्वेरी को चलाकर Hadoop डेटा प्रोसेसिंग ढांचे के साथ सफलतापूर्वक काम करने की अनुमति देता है। जाहिर है, हडोप फ्रेमवर्क पहले लोगों के लिए सुलभ नहीं था, खासकर इसकी क्वेरी क्षमताओं के संदर्भ में। विकास के आधार पर, कई उपकरण ऐसे कार्यों में रहे हैं जो गुणवत्ता और गति के साथ बड़े डेटा के प्रसंस्करण और विश्लेषण के लिए उद्यमों की उत्पादकता में सुधार करने का वादा करते हैं। टूल को सीखने में बहुत अधिक निवेश करने की भी आवश्यकता नहीं है, क्योंकि SQL का पारंपरिक ज्ञान होना चाहिए।
Hadoop पर SQL की परिभाषा
Hadoop पर SQL अनुप्रयोगों का एक समूह है जो आपको Hadoop डेटा प्रोसेसिंग फ्रेमवर्क द्वारा होस्ट किए गए बड़े डेटा पर SQL-शैली क्वेरी चलाने की अनुमति देता है। जाहिर है, Hadoop पर SQL के जुड़ने से डेटा क्वेरी, पुनर्प्राप्ति और विश्लेषण आसान हो गया है। चूँकि SQL मूल रूप से रिलेशनल डेटाबेस के लिए डिज़ाइन किया गया था, इसलिए इसे Hadoop 1 मॉडल के अनुसार संशोधित किया जाना था, जिसमें MapReduce और Hadoop वितरित फ़ाइल सिस्टम (HDFS), और Hadoop 2 मॉडल शामिल हैं, जिसमें Mapededuce और HDFS नहीं है।
Hadoop के साथ SQL को संयोजित करने के शुरुआती प्रयासों में से एक HiveQL के साथ Hive डेटा वेयरहाउस का निर्माण हुआ, जो MapReduce की नौकरियों में SQL- शैली के प्रश्नों का अनुवाद कर सकता है। उसके बाद, कई एप्लिकेशन विकसित किए गए जो समान नौकरियां कर सकते थे। बाद के औजारों में प्रमुख हैं ड्रिल, बिगएसक्यू, एचएडब्ल्यूक्यू, इम्पाला, हैडप, स्टिंगर, एच-एसक्यूएल, स्पाइस मशीन, प्रेस्टो, पॉलीबेस, स्पार्क, जेथ्रोडाटा, शार्क (स्पार्क पर हाइव), और टीज (टीज़ पर हाइव)।
