घर विकास सुदृढीकरण सीखने क्या है? - टेक्नोपेडिया से परिभाषा

सुदृढीकरण सीखने क्या है? - टेक्नोपेडिया से परिभाषा

विषयसूची:

Anonim

परिभाषा - सुदृढीकरण सीखने का क्या अर्थ है?

सुदृढीकरण सीखने, कृत्रिम बुद्धिमत्ता के संदर्भ में, एक प्रकार की गतिशील प्रोग्रामिंग है, जो एल्गोरिदम को इनाम और दंड की प्रणाली का उपयोग करती है।

एक सुदृढीकरण सीखने का एल्गोरिथ्म, या एजेंट, अपने पर्यावरण के साथ बातचीत करके सीखता है। एजेंट सही तरीके से प्रदर्शन करके पुरस्कार प्राप्त करता है और गलत तरीके से प्रदर्शन करने के लिए दंड देता है। एजेंट अपने इनाम को अधिकतम करने और जुर्माना को कम करके मानव से हस्तक्षेप के बिना सीखता है।

टेकोपेडिया रीइनफोर्समेंट लर्निंग बताते हैं

सुदृढीकरण सीखना मशीन सीखने के लिए एक दृष्टिकोण है जो व्यवहारवादी मनोविज्ञान से प्रेरित है। यह उसी तरह है जैसे कोई बच्चा नया कार्य करना सीखता है। सुदृढीकरण सीखने के अन्य मशीन सीखने के दृष्टिकोण के साथ विरोधाभास है कि एल्गोरिथ्म को स्पष्ट रूप से नहीं बताया गया है कि किसी कार्य को कैसे करना है, लेकिन अपने आप समस्या के माध्यम से काम करता है।

एक एजेंट के रूप में, जो सेल्फ-ड्राइविंग कार या शतरंज खेलने वाला कार्यक्रम हो सकता है, अपने वातावरण के साथ बातचीत करता है, यह कैसे प्रदर्शन करता है, इस आधार पर एक इनाम राज्य प्राप्त करता है, जैसे कि सुरक्षित रूप से गंतव्य पर ड्राइविंग करना या गेम जीतना। इसके विपरीत, एजेंट को गलत तरीके से प्रदर्शन करने के लिए दंड मिलता है, जैसे कि सड़क से दूर जाना या चेक किया जाना।

समय के साथ एजेंट अपने इनाम को अधिकतम करने और गतिशील प्रोग्रामिंग का उपयोग करके अपने दंड को कम करने के लिए निर्णय लेता है। आर्टिफिशियल इंटेलिजेंस के लिए इस दृष्टिकोण का लाभ यह है कि यह एआई प्रोग्राम को प्रोग्रामर के बिना सीखने की अनुमति देता है कि कैसे एक एजेंट को कार्य करना चाहिए।

सुदृढीकरण सीखने क्या है? - टेक्नोपेडिया से परिभाषा