विषयसूची:
परिभाषा - Q- अधिगम का क्या अर्थ है?
क्यू-सीखना एक एल्गोरिथ्म संरचना के लिए एक शब्द है जो मॉडल-मुक्त सुदृढीकरण सीखने का प्रतिनिधित्व करता है। नीति का मूल्यांकन करने और स्टोकेस्टिक मॉडलिंग का उपयोग करके, क्यू-लर्निंग एक मार्कोव निर्णय प्रक्रिया में सबसे अच्छा रास्ता खोजता है।
Techopedia Q-Learning की व्याख्या करता है
क्यू-लर्निंग एल्गोरिदम के तकनीकी मेकअप में एक एजेंट, राज्यों का एक समूह और प्रति राज्य क्रियाओं का एक सेट शामिल होता है।
Q फ़ंक्शन रिवार्ड्स को वैल्यू रिवार्ड के साथ विभिन्न चरणों के लिए वेट का उपयोग करता है।
हालांकि यह एक सरल विचार की तरह लग सकता है, क्यू-लर्निंग कई प्रकार के सुदृढीकरण सीखने और गहन शिक्षण मॉडल में सबसे महत्वपूर्ण है। सबसे अच्छा उदाहरणों में से एक है, जहां गहरे क्यू-लर्निंग का उपयोग मशीन सीखने के कार्यक्रमों को विभिन्न प्रकार के वीडियो गेम में गेम-प्ले रणनीतियों को सीखने में मदद करने के लिए किया जाता है, उदाहरण के लिए, 1980 के दशक से अटारी गेम में। यहां एक दृढ़ तंत्रिका नेटवर्क गेम-प्ले के नमूने लेता है ताकि एक स्टोकेस्टिक मॉडल का काम किया जा सके जो कंप्यूटर को यह जानने में मदद करेगा कि समय के साथ गेम को बेहतर तरीके से कैसे खेलें।
क्यू-लर्निंग में कृत्रिम बुद्धिमत्ता और मशीन लर्निंग को आगे बढ़ाने में मदद करने की प्रचुर क्षमता है।






