विषयसूची:
परिभाषा - दीप सुदृढीकरण सीखने का क्या अर्थ है?
डीप रीइन्फोर्समेंट लर्निंग, रीइन्फोर्समेंट लर्निंग है जिसे डीप न्यूरल नेटवर्क का उपयोग करके लगाया जाता है। इस प्रकार के सीखने में परिष्कृत मॉडल पर अभिनय करने और एक अनुकूलित पथ या कार्रवाई निर्धारित करने के लिए बड़ी मात्रा में इनपुट को देखने वाले कंप्यूटर शामिल हैं।
Techopedia डीप रेनफोर्समेंट लर्निंग को समझाता है
गहरी सुदृढीकरण सीखने का वर्णन करने का एक तरीका यह है कि एक गहरा तंत्रिका नेटवर्क व्यक्तिगत अनुभवों के सुदृढीकरण के माध्यम से सीखता है।
मान लीजिए कि गहरे तंत्रिका नेटवर्क एक दृश्य गेम स्पेस को मैप करता है और गेम के भीतर क्या होता है, यह देखने के लिए उस गेम स्पेस का विश्लेषण करता है। कंप्यूटर यह समझना शुरू कर देता है कि इनपुट पर आधारित परिणाम क्या हैं, और बदले में "अधिक स्मार्ट हो सकते हैं।" यह अन्य समान तकनीकी प्रयासों से संबंधित है जैसे कि डी क्यू नेटवर्क।
सामान्य तौर पर, मशीन सीखने वाले विशेषज्ञ इस प्रकार के मॉडल को मशीनों के लिए एक तरह से जोर दे रहे हैं ताकि वे लगातार होशियार हो सकें या मनुष्यों की तरह अधिक सोच सकें, हालांकि व्यावहारिक बाधाएं और सीमाएं लागू होती हैं।
