प्रश्न:
क्या बेहतर है, AWS पर एक मंच या एक अपनी खुद की मशीन लर्निंग एल्गोरिदम?
ए:इन दिनों, कई कंपनियां ब्रांड प्रबंधन को बढ़ाने, ग्राहकों के अनुभव में सुधार और परिचालन क्षमता बढ़ाने के लिए मशीन लर्निंग समाधान को अपने एनालिटिक्स टूल में एकीकृत करती हैं। मशीन लर्निंग मॉडल मशीन लर्निंग सॉल्यूशंस के मुख्य घटक हैं। विश्वसनीय पूर्वानुमान बनाने के लिए गणितीय एल्गोरिदम और बड़े डेटा सेट का उपयोग करके मॉडल को प्रशिक्षित किया जाता है। पूर्वानुमानों के दो सामान्य उदाहरण हैं (1) यह निर्धारित करना कि वित्तीय लेनदेन का एक सेट धोखाधड़ी का संकेत देता है या (2) किसी उत्पाद के आसपास उपभोक्ता भावना का आकलन करता है, जो सोशल मीडिया से एकत्र किए गए इनपुट के आधार पर होता है।
अमेज़ॅन सैजमेकर एक पूरी तरह से प्रबंधित सेवा है जो डेवलपर्स और डेटा वैज्ञानिकों को मशीन लर्निंग मॉडल का निर्माण, प्रशिक्षण और तैनाती देती है। SageMaker में, आप आउट-ऑफ-द-बॉक्स एल्गोरिदम का उपयोग कर सकते हैं या अधिक अनुकूलित समाधान के लिए लाया-अपना रास्ता पा सकते हैं। दोनों विकल्प मान्य हैं और एक सफल मशीन लर्निंग समाधान के लिए समान रूप से अच्छी तरह से काम करते हैं।
(संपादक का ध्यान दें: आप यहां SageMaker के अन्य विकल्प देख सकते हैं।)
SageMaker के आउट-ऑफ-द-बॉक्स एल्गोरिदम में छवि वर्गीकरण, प्राकृतिक भाषा प्रसंस्करण आदि के लिए लोकप्रिय, अत्यधिक अनुकूलित उदाहरण शामिल हैं। पूरी सूची यहां पाई जा सकती है ।
- आउट-ऑफ-द-बॉक्स लाभ: ये एल्गोरिदम पूर्व-अनुकूलित किए गए हैं (और निरंतर सुधार से गुजर रहे हैं)। आप तेजी से उठ सकते हैं, दौड़ सकते हैं और तैनात हो सकते हैं। साथ ही, AWS स्वचालित हाइपर-पैरामीटर ट्यूनिंग उपलब्ध है।
- आउट-ऑफ-द-बॉक्स विचार: ऊपर बताए गए निरंतर सुधार संभवत: परिणाम नहीं दे सकते हैं जैसे कि आपके एल्गोरिदम के कार्यान्वयन पर आपका पूर्ण नियंत्रण था।
यदि ये एल्गोरिदम आपकी परियोजना के लिए उपयुक्त नहीं हैं, तो आपके पास तीन अन्य विकल्प हैं: (1) अमेज़ॅन की अपाचे स्पार्क लाइब्रेरी, (2) कस्टम पायथन कोड (जिसमें टेन्सरफ्लो या अपाचे एमएक्सनेट का उपयोग करता है) या (3) "अपना स्वयं का लाओ" जहां आप अनिवार्य रूप से अप्रतिबंधित हैं, लेकिन अपने मॉडल को प्रशिक्षित करने और सेवा करने के लिए आपको डॉकर छवि बनाने की आवश्यकता होगी (आप यहां निर्देशों का उपयोग करके ऐसा कर सकते हैं)।
आपका अपना-अपना दृष्टिकोण आपको पूर्ण स्वतंत्रता प्रदान करता है। यह उन डेटा वैज्ञानिकों के लिए आकर्षक साबित हो सकता है, जिन्होंने पहले से ही कस्टम और / या मालिकाना एल्गोरिथम कोड की एक लाइब्रेरी बना रखी है, जो वर्तमान आउट-ऑफ-द-बॉक्स सेट में प्रतिनिधित्व नहीं किया जा सकता है।
- लाओ-तुम्हारा अपना लाभ: मालिकाना आईपी के उपयोग के साथ-साथ संपूर्ण डेटा विज्ञान पाइपलाइन पर पूर्ण नियंत्रण रखता है।
- लाओ-तुम्हारा अपना विचार: परिणामी मॉडल को प्रशिक्षित करने और सेवा करने के लिए डॉकराइजेशन की आवश्यकता होती है। एल्गोरिथम सुधार को शामिल करना आपकी जिम्मेदारी है।
आपकी एल्गोरिदम पसंद के बावजूद, AWS पर SageMaker विचार करने लायक दृष्टिकोण है, यह देखते हुए कि डेटा विज्ञान के दृष्टिकोण से आसानी से उपयोग पर कितना ध्यान दिया गया है। यदि आपने कभी अपने स्थानीय परिवेश से किसी होस्टेड के लिए मशीन लर्निंग प्रोजेक्ट को स्थानांतरित करने का प्रयास किया है, तो आपको सुखद आश्चर्य होगा कि SageMaker इसे कितना सहज बनाता है। और यदि आप खरोंच से शुरू कर रहे हैं, तो आप पहले से ही अपने लक्ष्य के करीब कई कदम हैं, यह देखते हुए कि आपकी उंगलियों पर पहले से ही कितना है।
