विषयसूची:
परिभाषा - डीप क्यू-नेटवर्क्स का क्या अर्थ है?
डीप क्यू नेटवर्क्स (डीक्यूएन) तंत्रिका नेटवर्क (और / या संबंधित उपकरण) हैं जो बुद्धिमान वीडियो गेम खेलने के सिमुलेशन जैसे मॉडल प्रदान करने के लिए गहन क्यू लर्निंग का उपयोग करते हैं। विशिष्ट न्यूरल नेटवर्क बिल्ड के लिए एक विशिष्ट नाम होने के बजाय, डी क्यू नेटवर्क नेटवर्क और अन्य संरचनाओं से बना हो सकता है जो विभिन्न प्रक्रियाओं के बारे में जानने के लिए विशिष्ट तरीकों का उपयोग करते हैं।
Techopedia डीप Q-Networks की व्याख्या करता है
उच्च स्तर की संवेदी इनपुट से नीतियों को सीखने के लिए डी क्यू सीखने की विधि आम तौर पर सामान्य नीति पुनरावृत्ति नामक कुछ का उपयोग करती है, जिसे नीति मूल्यांकन और नीति पुनरावृत्ति के संयोजन के रूप में वर्णित किया जाता है।
उदाहरण के लिए, तकनीक जैसे प्रकाशनों में शामिल एक सामान्य प्रकार का गहन क्यू नेटवर्क, मध्यम परिणामों के लिए अटारी 2600 वीडियो गेम से संवेदी इनपुट लेता है। यह नमूनों को इकट्ठा करके, उन्हें संग्रहीत करके और क्यू नेटवर्क को अपडेट करने के लिए अनुभव रीप्ले के लिए उपयोग करके एक बहुत ही मौलिक स्तर पर किया जाता है।
एक सामान्य अर्थ में, गहन क्यू नेटवर्क इनपुट पर प्रशिक्षण देते हैं जो क्षेत्रों या अन्य अनुभवी नमूनों में सक्रिय खिलाड़ियों का प्रतिनिधित्व करते हैं और वांछित आउटपुट के साथ उन डेटा से मेल खाना सीखते हैं। यह आर्टिफिशियल इंटेलिजेंस के विकास में एक शक्तिशाली तरीका है जो शतरंज जैसे खेल उच्च स्तर पर खेल सकता है, या अन्य उच्च-स्तरीय संज्ञानात्मक गतिविधियों को अंजाम दे सकता है - अटारी या शतरंज वीडियो गेम खेलने का उदाहरण भी एआई का उपयोग करने का एक अच्छा उदाहरण है। ऐसे प्रकार के इंटरफेस जो पारंपरिक रूप से मानव एजेंटों द्वारा उपयोग किए जाते थे।
दूसरे शब्दों में, गहन क्यू लर्निंग के साथ, एआई खिलाड़ी वांछित परिणामों को प्राप्त करने के लिए सीखने में एक मानव खिलाड़ी की तरह अधिक हो जाता है।
