घर डेटाबेस चुनाव की भविष्यवाणी करने के लिए एल्गोरिदम का उपयोग करना: ड्रू लाइनर के साथ एक चैट

चुनाव की भविष्यवाणी करने के लिए एल्गोरिदम का उपयोग करना: ड्रू लाइनर के साथ एक चैट

Anonim

ड्रू बिग डेटा इनोवेशन समिट में, 30 और 31 जनवरी को लास वेगास में प्रस्तुति देंगे: http://analytics.theiegroup.com/bigdata-lasvegas, अमेरिका के लिए ओबामा के वक्ताओं के साथ, सर्वश्रेष्ठ खरीदें, लिंक्डइन, द न्यूयॉर्क टाइम्स, नोकिया, बिटली, बार्न्स एंड नोबल्स, वॉलमार्ट लैब्स और कई अन्य।


पंजीकरण लिंक: http://bit.ly/Zs3wms


यह साक्षात्कार जॉर्ज हिल द्वारा आयोजित किया गया था और बिग डेटा इनोवेशन पत्रिका में प्रकाशित किया गया था।


आपकी भविष्यवाणियों पर किस तरह की प्रतिक्रिया हुई है?


अधिकांश प्रतिक्रिया ने हममें से उन लोगों के बीच सटीकता के अंतर पर ध्यान केंद्रित किया है जिन्होंने सार्वजनिक जनमत सर्वेक्षणों का अध्ययन किया था, और लोकप्रिय पंडितों और टिप्पणीकारों की "आंत की भावना" की भविष्यवाणी की थी। चुनाव के दिन, मेरे जैसे डेटा विश्लेषक, नैट सिल्वर (न्यूयॉर्क टाइम्स फाइवहाइट ब्लॉग), साइमन जैकमैन (स्टैनफोर्ड यूनिवर्सिटी और हफ़िंगटन पोस्ट), और सैम वांग (प्रिंसटन इलेक्शन कंसोर्टियम) ने ओबामा के 90% से अधिक के पुनर्मिलन के अवसरों को रखा, और सही ढंग से foresaw ओबामा के लिए सबसे अधिक संभावित परिणाम के रूप में 332 चुनावी वोट। इस बीच, कार्ल रोव, जॉर्ज विल और स्टीव फोर्ब्स जैसे पंडितों ने कहा कि रोमनी जीतने वाला था - और कुछ मामलों में, आसानी से। इसने "क्वेंट के लिए जीत" की बात की है जो मुझे उम्मीद है कि भविष्य के चुनावों के माध्यम से ले जाएगा।


आप अपनी भविष्यवाणियों में उपयोग किए गए एल्गोरिदम का मूल्यांकन कैसे करते हैं?


मेरे पूर्वानुमान मॉडल ने जून में शुरू होने वाले अभियान के प्रत्येक दिन राज्य के वोट परिणामों और अंतिम चुनावी वोट का अनुमान लगाया। मैं चाहता था कि इन पूर्वानुमानों का मूल्यांकन यथासंभव निष्पक्ष और उद्देश्य के रूप में हो - और गलत होने पर मुझे किसी भी फ्रिल रूम में न छोड़ें। इसलिए, चुनाव से लगभग एक महीने पहले, मैंने अपनी वेबसाइट पर आठ मूल्यांकन मानदंडों का एक सेट पोस्ट किया था जिसका परिणाम जानने के बाद मैं इसका उपयोग करूंगा। जैसा कि यह निकला, मॉडल ने पूरी तरह से काम किया। इसने गर्मियों के बारे में भविष्यवाणी की कि ओबामा अपने सभी 2008 राज्यों माइनस इंडियाना और उत्तरी कैरोलिना को जीतेंगे, और सितंबर में ओबामा के समर्थन के बाद भी उस भविष्यवाणी से मुश्किल से उबरे, फिर पहले राष्ट्रपति की बहस के बाद डूबा।


स्वतंत्र विश्लेषकों और अभियान टीमों दोनों द्वारा इस अभियान में उपयोग किए गए डेटा की मात्रा बहुत अधिक है, 2016 में डेटा उपयोग के लिए इसका क्या प्रकार है?


2012 के अभियान ने साबित कर दिया कि मात्रात्मक जानकारी के कई, विविध स्रोतों को प्रबंधित किया जा सकता है, उन पर भरोसा किया जा सकता है और कई तरह के सिरों की ओर सफलतापूर्वक लागू किया जा सकता है। हम बाहरी लोग चुनाव परिणाम की भविष्यवाणी करने में सक्षम थे। अभियानों के अंदर, मतदाता लक्ष्यीकरण, राय ट्रैकिंग, धन उगाहने और मतदाता मतदान में भारी प्रगति हुई। अब जब हम जानते हैं कि ये विधियां काम कर सकती हैं, तो मुझे लगता है कि अब वापस नहीं जाना है। मुझे उम्मीद है कि 2016 में संवाददाताओं और अभियान टिप्पणीकारों को सर्वेक्षण एकत्रीकरण को अधिक गंभीरता से लेना होगा। और हालांकि ओबामा और डेमोक्रेट्स वर्तमान में अभियान प्रौद्योगिकी में लाभ उठाते दिखाई देते हैं, मुझे आश्चर्य होगा अगर रिपब्लिकन जल्दी पकड़ में नहीं आए।


क्या आपको लगता है कि इस डेटा संचालित अभियान की सफलता का मतलब यह है कि अभियान प्रबंधकों को अब एक विश्लेषक और एक रणनीतिकार होने की आवश्यकता है?


अभियान प्रबंधकों को स्वयं विश्लेषकों की आवश्यकता नहीं हो सकती है, लेकिन उन्हें इस बात की अधिक सराहना करनी चाहिए कि डेटा और प्रौद्योगिकी का उनके लाभ के लिए कैसे उपयोग किया जा सकता है। अभियान ने हमेशा रणनीति बनाने और मतदाता भावना को मापने के लिए सर्वेक्षण अनुसंधान का उपयोग किया है। लेकिन अब कुछ अन्य शक्तिशाली उपकरण उपलब्ध हैं: सोशल नेटवर्किंग वेबसाइट, मतदाता डेटाबेस, मोबाइल स्मार्टफोन और ईमेल मार्केटिंग, केवल कुछ ही नाम रखने के लिए। और यह मतदान पद्धति और सांख्यिकीय राय मॉडलिंग में हाल के अग्रिमों के अलावा है। अभी अमेरिकी अभियान की राजनीति में बहुत कुछ नवाचार हो रहा है।


आप 6 महीने पहले से चुनाव परिणामों की भविष्यवाणी करने में कामयाब रहे, आपको क्या लगता है कि आपकी एनालिटिक्स तकनीकों का उपयोग करके परिणाम का सटीक अनुमान लगाने के लिए यथार्थवादी अधिकतम समय सीमा है?


लगभग चार या पाँच महीने के बारे में है जहाँ तक विज्ञान हमें अभी जाने देता है; और वह इसे थोड़ा आगे बढ़ा रहा है। इससे पहले, चुनाव केवल अंतिम परिणाम के बारे में पर्याप्त जानकारीपूर्ण नहीं हैं: बहुत से लोग या तो अनिर्दिष्ट हैं या उन्होंने अभियान पर ध्यान देना शुरू नहीं किया है। ऐतिहासिक आर्थिक और राजनीतिक कारक जिन्हें चुनावी नतीजों के साथ सहसंबंधित दिखाया गया है, वे भी लगभग 4-5 महीने की सीमा से परे हो जाने के बाद अपनी अनुमानित शक्ति खोना शुरू कर देते हैं। सौभाग्य से, यह अभी भी अभियानों को रणनीति बनाने और अपने संसाधनों को आवंटित करने के तरीके के बारे में निर्णय लेने के लिए बहुत समय देता है।

चुनाव की भविष्यवाणी करने के लिए एल्गोरिदम का उपयोग करना: ड्रू लाइनर के साथ एक चैट