घर रुझान अपाचे स्पार्क क्या है? - टेक्नोपेडिया से परिभाषा

अपाचे स्पार्क क्या है? - टेक्नोपेडिया से परिभाषा

विषयसूची:

Anonim

परिभाषा - अपाचे स्पार्क का क्या अर्थ है?

Apache Spark एक ओपन-सोर्स प्रोग्राम है जिसका उपयोग डेटा एनालिटिक्स के लिए किया जाता है। यह अपाचे Hadoop और आज के एनालिटिक्स समुदाय के लिए अन्य ओपन-सोर्स संसाधनों सहित टूल के एक बड़े सेट का हिस्सा है।

विशेषज्ञ इस अपेक्षाकृत नए ओपन-सोर्स सॉफ़्टवेयर को डेटा एनालिटिक्स क्लस्टर कंप्यूटिंग टूल के रूप में वर्णित करते हैं। इसका उपयोग Hadoop Distributed File System (HDFS) के साथ किया जा सकता है, जो कि एक विशेष Hadoop घटक है जो जटिल फ़ाइल हैंडलिंग की सुविधा देता है।

कुछ IT पेशेवरों ने Apache Hadoop MapReduce घटक के लिए संभावित विकल्प के रूप में Apache Spark के उपयोग का वर्णन किया है। MapReduce भी एक क्लस्टरिंग टूल है जो डेवलपर्स को डेटा के बड़े सेट को प्रोसेस करने में मदद करता है। जो लोग अपाचे स्पार्क के डिज़ाइन को समझते हैं, वे बताते हैं कि यह कुछ स्थितियों में, MapReduce की तुलना में कई गुना तेज हो सकता है।

टेकपीडिया ने अपाचे स्पार्क की व्याख्या की है

अपाचे स्पार्क के आधुनिक उपयोग पर रिपोर्टिंग करने वाले बताते हैं कि कंपनियां विभिन्न तरीकों से इसका उपयोग कर रही हैं। एक आम उपयोग डेटा को एकत्र करने और इसे अधिक परिष्कृत तरीकों से संरचित करने के लिए है। अपाचे स्पार्क एनालिटिक्स मशीन-लर्निंग वर्क या डेटा वर्गीकरण के साथ भी सहायक हो सकता है।

आमतौर पर, संगठनों को एक कुशल और कुछ हद तक स्वचालित तरीके से डेटा को परिष्कृत करने की चुनौती का सामना करना पड़ता है, जहां Apache Spark का उपयोग इस प्रकार के कार्यों के लिए किया जा सकता है। कुछ का यह भी अर्थ है कि स्पार्क का उपयोग उन लोगों तक पहुंच प्रदान करने में मदद कर सकता है जो प्रोग्रामिंग के बारे में कम जानकार हैं और एनालिटिक्स हैंडलिंग में शामिल होना चाहते हैं।

अपाचे स्पार्क में पायथन और संबंधित सॉफ्टवेयर भाषाओं के लिए एपीआई शामिल हैं।

अपाचे स्पार्क क्या है? - टेक्नोपेडिया से परिभाषा