प्रश्न:
मशीन सीखने में पूर्वाग्रह और विचरण का वर्णन करने का एक सरल तरीका क्या है?
ए:मशीन सीखने में पूर्वाग्रह और विचरण का वर्णन करने के लिए किसी भी जटिल तरीके हैं। उनमें से कई महत्वपूर्ण गणितीय समीकरणों का उपयोग करते हैं और रेखांकन के माध्यम से दिखाते हैं कि कैसे विशिष्ट उदाहरण पूर्वाग्रह और विचरण दोनों की विभिन्न मात्राओं का प्रतिनिधित्व करते हैं।
यहाँ मशीन लर्निंग में पूर्वाग्रह, विचरण और पूर्वाग्रह / विचरण व्यापार बंद का वर्णन करने का एक सरल तरीका है।
इसके मूल में, पूर्वाग्रह एक निरीक्षण है। पूर्वाग्रह की परिभाषा में कुछ धारणा या अनुमानित त्रुटि को जोड़ना महत्वपूर्ण हो सकता है।
यदि एक अत्यधिक पक्षपाती परिणाम त्रुटि में नहीं था - यदि यह पैसे पर था - यह अत्यधिक सटीक होगा। समस्या यह है कि सरलीकृत मॉडल में कुछ त्रुटि है, इसलिए यह बैल की आंख पर नहीं है - महत्वपूर्ण त्रुटि दोहराई जाती है या यहां तक कि प्रवर्धित होती है जैसा कि मशीन लर्निंग प्रोग्राम काम करता है।
विचरण की सरल परिभाषा यह है कि परिणाम बहुत बिखरे हुए हैं। इससे अक्सर कार्यक्रम की अधिकता होती है और परीक्षण और प्रशिक्षण सेट के बीच समस्याएं होती हैं।
उच्च विचरण का अर्थ है कि छोटे परिवर्तन आउटपुट या परिणामों में महान परिवर्तन करते हैं।
बस विचरण का वर्णन करने का एक और तरीका यह है कि मॉडल में बहुत अधिक शोर है, और इसलिए यह मशीन सीखने के कार्यक्रम को वास्तविक सिग्नल को अलग करने और पहचानने के लिए कठिन हो जाता है।
इसलिए पूर्वाग्रह और विचरण की तुलना करने के सबसे सरल तरीकों में से एक यह सुझाव देना है कि मशीन सीखने वाले इंजीनियरों को बहुत अधिक पूर्वाग्रह या अतिआवश्यकता, और बहुत अधिक विचरण या अतिव्याप्ति के बीच एक ठीक रेखा पर चलना होगा।
इस कुँए का प्रतिनिधित्व करने का एक और तरीका चार-चतुर्थांश चार्ट के साथ है जो उच्च और निम्न विचरण के सभी संयोजनों को दर्शाता है। निम्न पूर्वाग्रह / कम विचरण चतुर्थांश में, सभी परिणाम एक साथ एक सटीक क्लस्टर में एकत्रित किए जाते हैं। उच्च पूर्वाग्रह / कम विचरण परिणाम में, सभी परिणाम एक साथ एक गलत क्लस्टर में एकत्रित होते हैं। कम पूर्वाग्रह / उच्च विचरण परिणाम में, परिणाम एक केंद्रीय बिंदु के आसपास बिखरे हुए होते हैं जो एक सटीक क्लस्टर का प्रतिनिधित्व करते हैं, जबकि एक उच्च पूर्वाग्रह / उच्च विचरण परिणाम में, डेटा बिंदु दोनों बिखरे हुए हैं और सामूहिक रूप से गलत हैं।
