ड्रू बिग डेटा इनोवेशन समिट में, 30 और 31 जनवरी को लास वेगास में प्रस्तुति देंगे: http://analytics.theiegroup.com/bigdata-lasvegas, अमेरिका के लिए ओबामा के वक्ताओं के साथ, सर्वश्रेष्ठ खरीदें, लिंक्डइन, द न्यूयॉर्क टाइम्स, नोकिया, बिटली, बार्न्स एंड नोबल्स, वॉलमार्ट लैब्स और कई अन्य।
पंजीकरण लिंक: http://bit.ly/Zs3wms
यह साक्षात्कार जॉर्ज हिल द्वारा आयोजित किया गया था और बिग डेटा इनोवेशन पत्रिका में प्रकाशित किया गया था।
आपकी भविष्यवाणियों पर किस तरह की प्रतिक्रिया हुई है?
अधिकांश प्रतिक्रिया ने हममें से उन लोगों के बीच सटीकता के अंतर पर ध्यान केंद्रित किया है जिन्होंने सार्वजनिक जनमत सर्वेक्षणों का अध्ययन किया था, और लोकप्रिय पंडितों और टिप्पणीकारों की "आंत की भावना" की भविष्यवाणी की थी। चुनाव के दिन, मेरे जैसे डेटा विश्लेषक, नैट सिल्वर (न्यूयॉर्क टाइम्स फाइवहाइट ब्लॉग), साइमन जैकमैन (स्टैनफोर्ड यूनिवर्सिटी और हफ़िंगटन पोस्ट), और सैम वांग (प्रिंसटन इलेक्शन कंसोर्टियम) ने ओबामा के 90% से अधिक के पुनर्मिलन के अवसरों को रखा, और सही ढंग से foresaw ओबामा के लिए सबसे अधिक संभावित परिणाम के रूप में 332 चुनावी वोट। इस बीच, कार्ल रोव, जॉर्ज विल और स्टीव फोर्ब्स जैसे पंडितों ने कहा कि रोमनी जीतने वाला था - और कुछ मामलों में, आसानी से। इसने "क्वेंट के लिए जीत" की बात की है जो मुझे उम्मीद है कि भविष्य के चुनावों के माध्यम से ले जाएगा।
आप अपनी भविष्यवाणियों में उपयोग किए गए एल्गोरिदम का मूल्यांकन कैसे करते हैं?
मेरे पूर्वानुमान मॉडल ने जून में शुरू होने वाले अभियान के प्रत्येक दिन राज्य के वोट परिणामों और अंतिम चुनावी वोट का अनुमान लगाया। मैं चाहता था कि इन पूर्वानुमानों का मूल्यांकन यथासंभव निष्पक्ष और उद्देश्य के रूप में हो - और गलत होने पर मुझे किसी भी फ्रिल रूम में न छोड़ें। इसलिए, चुनाव से लगभग एक महीने पहले, मैंने अपनी वेबसाइट पर आठ मूल्यांकन मानदंडों का एक सेट पोस्ट किया था जिसका परिणाम जानने के बाद मैं इसका उपयोग करूंगा। जैसा कि यह निकला, मॉडल ने पूरी तरह से काम किया। इसने गर्मियों के बारे में भविष्यवाणी की कि ओबामा अपने सभी 2008 राज्यों माइनस इंडियाना और उत्तरी कैरोलिना को जीतेंगे, और सितंबर में ओबामा के समर्थन के बाद भी उस भविष्यवाणी से मुश्किल से उबरे, फिर पहले राष्ट्रपति की बहस के बाद डूबा।
स्वतंत्र विश्लेषकों और अभियान टीमों दोनों द्वारा इस अभियान में उपयोग किए गए डेटा की मात्रा बहुत अधिक है, 2016 में डेटा उपयोग के लिए इसका क्या प्रकार है?
2012 के अभियान ने साबित कर दिया कि मात्रात्मक जानकारी के कई, विविध स्रोतों को प्रबंधित किया जा सकता है, उन पर भरोसा किया जा सकता है और कई तरह के सिरों की ओर सफलतापूर्वक लागू किया जा सकता है। हम बाहरी लोग चुनाव परिणाम की भविष्यवाणी करने में सक्षम थे। अभियानों के अंदर, मतदाता लक्ष्यीकरण, राय ट्रैकिंग, धन उगाहने और मतदाता मतदान में भारी प्रगति हुई। अब जब हम जानते हैं कि ये विधियां काम कर सकती हैं, तो मुझे लगता है कि अब वापस नहीं जाना है। मुझे उम्मीद है कि 2016 में संवाददाताओं और अभियान टिप्पणीकारों को सर्वेक्षण एकत्रीकरण को अधिक गंभीरता से लेना होगा। और हालांकि ओबामा और डेमोक्रेट्स वर्तमान में अभियान प्रौद्योगिकी में लाभ उठाते दिखाई देते हैं, मुझे आश्चर्य होगा अगर रिपब्लिकन जल्दी पकड़ में नहीं आए।
क्या आपको लगता है कि इस डेटा संचालित अभियान की सफलता का मतलब यह है कि अभियान प्रबंधकों को अब एक विश्लेषक और एक रणनीतिकार होने की आवश्यकता है?
अभियान प्रबंधकों को स्वयं विश्लेषकों की आवश्यकता नहीं हो सकती है, लेकिन उन्हें इस बात की अधिक सराहना करनी चाहिए कि डेटा और प्रौद्योगिकी का उनके लाभ के लिए कैसे उपयोग किया जा सकता है। अभियान ने हमेशा रणनीति बनाने और मतदाता भावना को मापने के लिए सर्वेक्षण अनुसंधान का उपयोग किया है। लेकिन अब कुछ अन्य शक्तिशाली उपकरण उपलब्ध हैं: सोशल नेटवर्किंग वेबसाइट, मतदाता डेटाबेस, मोबाइल स्मार्टफोन और ईमेल मार्केटिंग, केवल कुछ ही नाम रखने के लिए। और यह मतदान पद्धति और सांख्यिकीय राय मॉडलिंग में हाल के अग्रिमों के अलावा है। अभी अमेरिकी अभियान की राजनीति में बहुत कुछ नवाचार हो रहा है।
आप 6 महीने पहले से चुनाव परिणामों की भविष्यवाणी करने में कामयाब रहे, आपको क्या लगता है कि आपकी एनालिटिक्स तकनीकों का उपयोग करके परिणाम का सटीक अनुमान लगाने के लिए यथार्थवादी अधिकतम समय सीमा है?
लगभग चार या पाँच महीने के बारे में है जहाँ तक विज्ञान हमें अभी जाने देता है; और वह इसे थोड़ा आगे बढ़ा रहा है। इससे पहले, चुनाव केवल अंतिम परिणाम के बारे में पर्याप्त जानकारीपूर्ण नहीं हैं: बहुत से लोग या तो अनिर्दिष्ट हैं या उन्होंने अभियान पर ध्यान देना शुरू नहीं किया है। ऐतिहासिक आर्थिक और राजनीतिक कारक जिन्हें चुनावी नतीजों के साथ सहसंबंधित दिखाया गया है, वे भी लगभग 4-5 महीने की सीमा से परे हो जाने के बाद अपनी अनुमानित शक्ति खोना शुरू कर देते हैं। सौभाग्य से, यह अभी भी अभियानों को रणनीति बनाने और अपने संसाधनों को आवंटित करने के तरीके के बारे में निर्णय लेने के लिए बहुत समय देता है।
