विषयसूची:
परिभाषा - अपाचे सुअर का क्या अर्थ है?
Apache Pig एक ऐसा प्लेटफ़ॉर्म है जिसका उपयोग बड़े डेटा सेट का विश्लेषण करने के लिए किया जाता है। इसमें डेटा विश्लेषण कार्यक्रमों को व्यक्त करने के लिए, इन कार्यक्रमों का मूल्यांकन करने के लिए बुनियादी ढांचे के साथ एक उच्च-स्तरीय भाषा शामिल है। सुअर की सबसे महत्वपूर्ण विशेषताओं में से एक यह है कि इसकी संरचना महत्वपूर्ण समानांतरकरण के लिए उत्तरदायी है।
सुअर Hadoop प्लेटफ़ॉर्म पर काम करता है, Hadoop वितरित फ़ाइल सिस्टम (HDFS) से डेटा लिखने और पढ़ने और एक या अधिक MapReduce नौकरियों के माध्यम से प्रसंस्करण का संचालन करता है। Apache Pig ओपन सोर्स के रूप में उपलब्ध है।
Apache Pig को Pig Programming Language या Hadoop Pig के नाम से भी जाना जाता है।
Techopedia Apache Pig की व्याख्या करता है
Apache Pig के दो भाग हैं: Pig Latin भाषा और Pig इंजन। पिग लैटिन भाषा एक स्क्रिप्टिंग भाषा है जो उपयोगकर्ताओं को उस तरीके को स्पष्ट करने की अनुमति देती है जिसमें एक या अधिक इनपुट से डेटा प्रवाह को पढ़ा और संसाधित किया जाना चाहिए, और उस स्थान को संग्रहीत किया जाना चाहिए।
सुअर लैटिन के कुछ प्रमुख गुण इस प्रकार हैं:
- कार्यक्रम के लिए आसान: विभिन्न अंतःसंबंधित डेटा परिवर्तनों से युक्त जटिल कार्य स्पष्ट रूप से डेटा प्रवाह अनुक्रम के रूप में एन्कोडेड हैं। यह उन्हें लिखने, समझने और बनाए रखने में सरल बनाता है।
- अनुकूलन संभावनाएं: जिस तरह से कार्यों को एन्कोड किया गया है, वह सिस्टम को स्वचालित निष्पादन का अनुकूलन करने की अनुमति देता है। इससे उपयोगकर्ता दक्षता के बजाय शब्दार्थ पर ध्यान दे सकता है।
- एक्स्टेंसिबिलिटी: उपयोगकर्ताओं को विशेष-प्रयोजन प्रसंस्करण के लिए अपने स्वयं के कार्यों को बनाने की अनुमति है। पिग लैटिन में लिखे डेटा प्रवाह के निष्पादन के लिए पिग इंजन जिम्मेदार है। एक मानक संबंधपरक डेटाबेस प्रबंधन प्रणाली (RDBMS) डिजाइन की तरह, Apache Pig में एक पार्सर, ऑप्टिमाइज़र और टाइप चेकर होते हैं, जो ऑपरेटरों के अलावा डेटा प्रोसेसिंग करते हैं। सुअर में लेनदेन, डेटा कैटलॉग या सीधे डेटा स्टोरेज को संभालने या निष्पादन ढांचे को नियोजित करने की क्षमता शामिल नहीं है।
