प्रश्न:
पर्यवेक्षित, अनुपयोगी और अर्ध-पर्यवेक्षित शिक्षा के बीच अंतर क्या है?
ए:मशीन लर्निंग में पर्यवेक्षित और अनुपयोगी शिक्षण के बीच महत्वपूर्ण अंतर प्रशिक्षण डेटा का उपयोग है।
पर्यवेक्षित शिक्षण उदाहरण डेटा का उपयोग यह दिखाने के लिए करता है कि "सही" डेटा कैसा दिखता है। दिए गए इनपुट के आउटपुट को दिखाने के लिए डेटा को संरचित किया जाता है।
फलों को वर्गीकृत करने वाली एक मशीन लर्निंग एल्गोरिदम में फलों के चित्र हो सकते हैं जैसे कि सेब, केले, अंगूर और संतरे जैसे इनपुट और आउटपुट के रूप में इन फलों के नाम।
एक वास्तविक दुनिया का उदाहरण ईमेल कार्यक्रमों में बायसियन स्पैम फ़िल्टर होगा। इन फ़िल्टर को उन ईमेल के उदाहरणों से प्रशिक्षित किया जाता है जिन्हें स्पैम माना जाता है। स्पैम फ़िल्टर तब कुछ वाक्यांशों की खोज कर सकता है जो स्पैम ईमेल में होने वाले ईमेल में दिखाई देते हैं और उन्हें स्पैम फ़ोल्डर में ले जाते हैं।
यह एक मानव को दिखाने के जैसा है कि एक नया कार्य कैसे किया जाता है। डेटा प्रविष्टि करने वाले व्यक्ति को उस प्रारूप में डेटा के उदाहरण दिखाए जा सकते हैं, जिसे कंपनी चाहती है और फिर उसका अनुसरण करने की अपेक्षा की जाती है।
प्रशिक्षण डेटा के साथ कई बार पर्यवेक्षित शिक्षण का उपयोग करके मशीन सीखने के कार्यक्रम। परिणाम प्रभावशाली हो सकते हैं जब यह वास्तव में जा रहा हो। Google का Gmail स्पैम फ़िल्टर बहुत सटीक है क्योंकि बहुत सारे उपयोगकर्ता इसे प्रशिक्षित कर रहे हैं।
अप्रशिक्षित शिक्षा में कोई पूर्व प्रशिक्षण डेटा नहीं है। हमारे फल वर्गीकरण उदाहरण में, एक एल्गोरिथ्म को केवल फलों के चित्र दिखाए जा सकते हैं और उन्हें वर्गीकृत करने के लिए कहा गया है।
हैकिंग पैटर्न की निगरानी करके ग्राहक की खरीद की आदतों, या सुरक्षा को सीखकर, बाजार में किए गए अनुसंधान में बाजार अनुसंधान के अनुप्रयोग हैं।
अर्ध-पर्यवेक्षित शिक्षण कुछ आंकड़ों को लेबल करके एक मध्य जमीन लेने का प्रयास करता है। उदाहरण के लिए, सेब और नारंगी को फलों के वर्गीकरण कार्यक्रम में लेबल किया जा सकता है, लेकिन केला और अंगूर नहीं हैं।
इनमें से किसी भी एल्गोरिदम का उपयोग कब करना है, इसका उपयोग किए जाने वाले डेटा के प्रकार पर निर्भर करेगा। कुछ कार्यों में स्थिर पैटर्न होते हैं, जैसे क्रेडिट कार्ड धोखाधड़ी या स्पैम संदेश। इस प्रकार के कार्यों के लिए पर्यवेक्षित शिक्षण उपयुक्त है। नेटवर्क हमले अप्रत्याशित हैं, और अनिश्चित या अर्ध-पर्यवेक्षित सीखने के तरीके अधिक उपयुक्त हो सकते हैं।
