प्रश्न:
मशीन लर्निंग में बैगिंग में कमी क्यों आती है?
ए:मशीन लर्निंग में बूटस्ट्रैप एकत्रीकरण, या "बैगिंग, " जटिल डेटा सेट के अधिक उन्नत मॉडल बनाने के माध्यम से विचरण को कम करता है। विशेष रूप से, बैगिंग दृष्टिकोण सबसे उप-भाग बनाता है जो अक्सर डेटा को अधिक सम्मिलित तरीके से मॉडल करने के लिए अतिव्यापी होता है।
बैगिंग को लागू करने का एक दिलचस्प और सीधा विचार यादृच्छिक नमूनों का एक सेट लेना और सरल साधन निकालना है। फिर, नमूनों के एक ही सेट का उपयोग करके, अंतिम परिणाम के रूप में निर्मित दर्जनों सबसेट बनाएं और अंतिम परिणाम में हेरफेर करें। दूसरे माध्य को एक ट्रूअर चित्र दिखाना चाहिए कि कैसे वे व्यक्तिगत नमूने मूल्य के संदर्भ में एक-दूसरे से संबंधित हैं। एक ही विचार डेटा बिंदुओं के किसी भी सेट की किसी भी संपत्ति पर लागू किया जा सकता है।
मुफ्त डाउनलोड: मशीन लर्निंग और क्यों यह मायने रखता है |
चूंकि यह दृष्टिकोण अधिक परिभाषित सीमाओं में खोज को समेकित करता है, इसलिए यह विचरण को कम करता है और ओवरफिटिंग में मदद करता है। कुछ वितरित डेटा बिंदुओं के साथ एक स्क्रैपप्लेट के बारे में सोचो; एक बैगिंग विधि का उपयोग करके, इंजीनियरों ने सुगमता मापदंडों के लिए जटिलता और उन्मुख खोज लाइनों को "सिकोड़" दिया।
कुछ लोग "विभाजित और जीत" या "सहायक उत्तराधिकारियों" के प्रकार के रूप में बैगिंग के मूल्य के बारे में बात करते हैं। विचार यह है कि पहनावा के माध्यम से, जैसे कि यादृच्छिक जंगलों का उपयोग, एक तकनीक के रूप में बैगिंग का उपयोग करने वाले लोग डेटा परिणाम प्राप्त कर सकते हैं जो विचरण में कम हैं। जटिलता को कम करने के संदर्भ में, बैगिंग ओवरफिटिंग के साथ भी मदद कर सकता है। बहुत सारे डेटा बिंदुओं वाले मॉडल के बारे में सोचें: कहते हैं, 100 अनलॉन्ग डॉट्स के साथ एक कनेक्ट-डॉट्स। परिणामी दृश्य डेटा लाइन दांतेदार, गतिशील, अस्थिर होगी। फिर मूल्यांकन के सेट को एक साथ रख कर विचरण को "आयरन आउट" करें। पहनावा सीखने में, यह अक्सर "मजबूत सीखने" सहयोगी परिणाम प्रदान करने के लिए कई "कमजोर शिक्षार्थियों" में शामिल होने के बारे में सोचा जाता है। परिणाम मॉडल में एक चिकनी, अधिक समोच्च डेटा लाइन, और कम जंगली विचरण है।
यह देखना आसान है कि एंटरप्राइज़ आईटी सिस्टम पर बैगिंग का विचार कैसे लागू किया जा सकता है। व्यवसाय के नेता अक्सर उत्पादों, ग्राहकों, आदि के साथ चल रहे "बर्ड्स आइज़" चाहते हैं, एक ओवरफ़ीड मॉडल कम सुपाच्य डेटा लौटा सकता है, और अधिक "बिखरे हुए" परिणाम, जहां बैगिंग एक मॉडल को "स्टैबिलाइज़" कर सकता है और अधिक उपयोगी बना सकता है उपयोगकर्ताओं को समाप्त करने के लिए।
