घर ऑडियो हर जगह विश्लेषण एम्बेड करें: नागरिक डेटा वैज्ञानिक को सक्षम करना

हर जगह विश्लेषण एम्बेड करें: नागरिक डेटा वैज्ञानिक को सक्षम करना

Anonim

टेकोपेडिया स्टाफ द्वारा, 25 अगस्त 2016

Takeaway: होस्ट रेबेका जोजवियाक डॉ। रॉबिन ब्लोर, डीज़ ब्लांचफील्ड और डेविड स्वीनर के साथ एम्बेडेड एनालिटिक्स और नागरिक डेटा वैज्ञानिकों की घटना पर चर्चा करते हैं।

वीडियो देखने के लिए आपको इस घटना के लिए पंजीकरण करना होगा। वीडियो देखने के लिए रजिस्टर करें।

रेबेका जोजवियाक: देवियों और सज्जनों, नमस्ते और हॉट टेक्नोलॉजीज में आपका स्वागत है। "हर जगह एम्बेड करें: नागरिक डेटा वैज्ञानिक को सक्षम करना" आज हमारा विषय है। मैं आपके सामान्य मेजबान के लिए भर रहा हूं, यह रेबेका जोजवाक एरिक कवनघ के लिए भरना है। जी हां, यह साल गर्म है। विशेष रूप से शब्द "डेटा वैज्ञानिक" पर बहुत अधिक ध्यान दिया जा रहा है, भले ही हम उन्हें "सांख्यिकीविद्" या "एनालिटिक्स विशेषज्ञ" जैसे उबाऊ नामों से पुकारते थे, लेकिन एक ही प्रकार की गतिविधियों से बहुत अधिक निपटते हैं, लेकिन यह एक सेक्सी नया नाम है। बहुत ध्यान आकर्षित करना। वे कार्यस्थल में संगठन के लिए फायदेमंद होने के लिए अत्यधिक वांछनीय हैं, और हर कोई एक चाहता है। लेकिन वे हैं: 1) महंगा, 2) खोजने के लिए मुश्किल। आप जानते हैं, यह डेटा वैज्ञानिक कौशल की कमी के बारे में सभी समाचारों पर है, हाँ, लेकिन फिर भी वे संगठन को जबरदस्त मूल्य प्रदान करते हैं और लोग यह जानने के लिए तरह-तरह के कटाक्ष कर रहे हैं कि कैसे उस मूल्य को पाने के लिए बिना डाइम को गिराए, ताकि बोले।

लेकिन अच्छी खबर यह है कि हम ऐसे उपकरणों और सॉफ्टवेयरों को देख रहे हैं जो उस कमी की भरपाई कर रहे हैं। हमारे पास ऑटोमेशन, मशीन लर्निंग, एंबेडेड एनालिटिक्स है, जो कि हम आज के बारे में सीख रहे हैं, और यह इस नए शब्द "सिटीजन डेटा साइंटिस्ट" को जन्म देता है और इसका क्या मतलब है? नहीं, यह आपके प्रशिक्षित डेटा वैज्ञानिक नहीं हैं, यह आपका व्यवसाय उपयोगकर्ता, आपका बीआई विशेषज्ञ, आईटी का कोई व्यक्ति हो सकता है, कोई ऐसा व्यक्ति जिसके पास पृष्ठभूमि है, लेकिन शायद विशेषज्ञता के लिए जरूरी नहीं है। लेकिन यह क्या करता है, इन उपकरणों और सॉफ्टवेयर, क्या यह अधिक लोगों को उन स्मार्ट समाधानों तक पहुंच प्रदान करता है, भले ही वे गहरी कोडिंग को नहीं जानते हों। लेकिन यह केवल समग्र प्रदर्शन को बेहतर बनाने में मदद करता है जब आप सभी को उस विश्लेषणात्मक विचार तक थोड़ी अधिक पहुंच प्रदान करते हैं। आपके पास आवश्यक जिज्ञासा के प्रकार के लिए प्रशिक्षण होना आवश्यक नहीं है जो आपकी कंपनी के लिए अच्छी अंतर्दृष्टि का कारण बन सकता है।

चर्चा करते हैं कि आज हमारे साथ रॉबोर ग्रुप के मुख्य विश्लेषक रॉबिन ब्लोर हैं, जो स्वयं मायावी डेटा वैज्ञानिकों में से एक हैं, डीज़ ब्लैंचफील्ड को बुलाते हैं, और फिर हमारे पास डेल स्टेटिस्टिका के डेविड स्नीडर हैं जो आज हमें एक प्रस्तुति देंगे। और इसके साथ ही मैं इसे रॉबिन ब्लोर को सौंपने जा रहा हूं।

रॉबिन बुर: ठीक है, उस परिचय के लिए धन्यवाद। मैंने एक ऐतिहासिक संदर्भ में इस बारे में सोचा। हम वास्तव में यहाँ जो देख रहे हैं वह लियोनार्डो दा विंची के डिजाइन के लिए एक तरह का ग्लाइडर है जो एक आदमी अपनी पीठ पर रख सकता है। मुझे नहीं पता कि क्या यह वास्तव में काम करेगा। मैं इसमें नहीं जाऊंगा, मुझे कहना होगा। हालांकि, दा विंची, जब भी मैं दा विंची के बारे में सोचता हूं, मैं उसे सबसे जिज्ञासु और विश्लेषणात्मक लोगों में से एक के रूप में समझता हूं। और यह बिल्कुल स्पष्ट है अगर आप बस उस ग्लाइडर को देखते हैं जो इसे एक पक्षी के पंख के आधार पर डिज़ाइन किया गया है और उसने इसे बनाने के लिए पक्षियों की उड़ानों का एक तरह से अध्ययन किया है।

यदि हम ऐतिहासिक परिप्रेक्ष्य लेते हैं - मैंने वास्तव में इसे देखा - विश्लेषिकी शायद गणित का सबसे पुराना अनुप्रयोग है। ऐसे सेंसर हैं जो कम से कम बेबीलोनियन समय के हैं। हम इसके बारे में जानते हैं क्योंकि मूल रूप से कुछ क्यूनिफॉर्म गोलियां हैं जो उन पर डेटा की तरह हैं। यह ज्ञात नहीं है कि क्या कुछ था जो किसी भी पहले वापस चला गया था। लेकिन स्पष्ट बात यह है कि आप लोगों की एक बड़ी आबादी के साथ अपने आप को एक सभ्यता मिल गई है, वास्तव में इसे योजना बनाने की आवश्यकता है और यह जानने लायक है कि आप क्या योजना बना रहे हैं और वास्तव में उन लोगों की क्या आवश्यकताएं हैं।

और यह उस तरह का है जहां यह शुरू हुआ और यह भी शुरू हुआ जहां कंप्यूटिंग शुरू हुई क्योंकि शुरुआती कंप्यूटर, प्रारंभिक यांत्रिक कंप्यूटर वास्तव में थे, मुझे लगता है कि होलेरिथ द्वारा बनाई गई पहली जनगणना थी, जो आईबीएम बन गई थी, मुझे विश्वास है। यह सब आगे बढ़ा है। संभवत: 1970 और वर्तमान दिन के बीच किसी तरह का अंतर्कलह रहा है, जहां बड़ी संख्या में अन्य अनुप्रयोग और विश्लेषिकी हैं, आप कह सकते हैं, एक पीछे की सीट ले ली। हां, वहां एनालिटिक्स चल रहा था - यह बड़े संगठनों, विशेष रूप से बैंकों और बीमा कंपनियों, और वास्तव में जनरल इलेक्ट्रिक और टेल्को और इस तरह की चीजों में हो रहा था - लेकिन इसका इस्तेमाल आम तौर पर पूरे व्यापार में नहीं किया गया था और अब यह आम तौर पर इस्तेमाल होने लगा है व्यापार। और यह वास्तव में खेल बदल गया है। सबसे पहले मैंने सोचा था कि मैं ध्यान आकर्षित करूंगा कि डेटा पिरामिड है, जो मुझे विशेष रूप से पसंद है। इसका मतलब है, मैंने इन 20 वर्षों में से एक को आकर्षित किया - कम से कम 20 साल पहले - कोशिश करने और समझने के लिए, वास्तव में, उस समय मैं बीआई और कुछ शुरुआती डेटा खनन को समझने की कोशिश कर रहा था। मैंने यहां जो परिभाषित किया है वह डेटा का विचार है और उदाहरण सिग्नल, माप, रिकॉर्डिंग, ईवेंट, लेनदेन, गणना, एकत्रीकरण, सूचना के व्यक्तिगत बिंदु हैं। आप उन्हें जानकारी के अणुओं के रूप में सोच सकते हैं, लेकिन वे व्यक्तिगत बिंदु हैं। यह संदर्भ मिलते ही सूचना बन जाता है। लिंक किए गए डेटा, संरचित डेटा, डेटाबेस, डेटा का विज़ुअलाइज़ेशन, प्लॉटर, स्कीमर और ऑन्थोलॉजी - ये सभी जानकारी के रूप में मेरे दिमाग में योग्य होते हैं क्योंकि आपने जो किया है वह बहुत सारी विविधता को एक साथ एकत्रित करता है और डेटा बिंदु से कुछ अधिक बनाता है। कुछ ऐसा जो वास्तव में एक आकार, एक गणितीय आकार है।

ऊपर हमें ज्ञान है। हम जानकारी की जांच कर सकते हैं, हम सीख सकते हैं कि विभिन्न पैटर्न हैं और हम नियमों, नीतियों, दिशानिर्देशों, प्रक्रियाओं को तैयार करके उन पैटर्नों का लाभ उठा सकते हैं और फिर यह ज्ञान का रूप ले लेता है। और बहुत सारे कंप्यूटर प्रोग्राम, जो भी वे कर रहे हैं, एक तरह का ज्ञान है, क्योंकि वे डेटा के खिलाफ काम कर रहे हैं और उन पर नियम लागू कर रहे हैं। हमारे पास ये तीन परतें हैं और परतों के बीच एक बढ़ती हुई शोधन है। और इस आरेख के बाईं ओर आपको नया डेटा दर्ज किया गया है, इसलिए इनमें से बहुत सी चीजें स्थिर हैं। डेटा जमा हो रहा है, जानकारी जमा हो रही है और ज्ञान संभावित रूप से बढ़ रहा है। शीर्ष पर, हमारे पास "अंडरस्टैंडिंग" है और मैं इसे बनाए रखूंगा, हालांकि यह एक दार्शनिक तर्क है, यह समझ केवल मनुष्य में रहती है। अगर मैं उसके बारे में गलत हूं, तो हम सभी को किसी समय कंप्यूटर द्वारा बदल दिया जाएगा। लेकिन बहस के बजाय, मैं अगली स्लाइड पर जाऊंगा।

जब मैंने इसे देखा, तो दिलचस्प बात यह है कि यह हाल ही की बात है, दिलचस्प बात यह थी कि यह जानने की कोशिश करें कि वास्तव में एनालिटिक्स क्या था। और अंत में विभिन्न आरेखों को आरेखित करने और इस तरह दिखने वाले एक के साथ समाप्त होने के बाद, मैं इस निष्कर्ष पर पहुंचा, वास्तव में, विश्लेषणात्मक विकास गणितीय सूत्रों के एक भयानक राशि के साथ वास्तव में सिर्फ सॉफ्टवेयर विकास है। विश्लेषणात्मक अन्वेषण इस मायने में सॉफ्टवेयर विकास के लिए थोड़ा अलग है कि आप वास्तव में कई, कई अलग-अलग मॉडल लेंगे और डेटा के बारे में नया ज्ञान उत्पन्न करने के लिए उनकी जांच करेंगे। लेकिन एक बार जब आप इसे जेनरेट कर लेते हैं, तो यह या तो उस पर लागू हो जाता है, जिसमें मैं निष्क्रिय निर्णय समर्थन के बारे में सोचता हूं, जो कि सूचना केवल एक उपयोगकर्ता को दी गई है; इंटरएक्टिव निर्णय समर्थन, जो ओएलएपी जैसी चीजें हैं, जहां उपयोगकर्ता को डेटा का एक संरचित सेट दिया जाता है, जिसे वे उपलब्ध विभिन्न उपकरणों का उपयोग करके अपने लिए चीजों की जांच और कटौती कर सकते हैं। दृश्य का एक बहुत कुछ ऐसा ही है। और फिर हमारे पास स्वचालन है यदि आप बस कुछ विश्लेषणात्मक अंतर्दृष्टि को बदल सकते हैं जो आप नियमों के एक सेट में एकत्र हुए हैं जिन्हें लागू किया जा सकता है, आपको आवश्यक रूप से एक इंसान को शामिल होने की आवश्यकता नहीं है। उस तरह से जब मैंने उस पर ध्यान दिया, जब मैंने वह सब किया। और तरह-तरह की बातें मुझे होने लगीं। एक बार गतिविधि का एक क्षेत्र, हम कहेंगे, एक बार डेटा का एक डोमेन वास्तव में खनन किया जाता है, अच्छी तरह से खनन किया जाता है, हर संभव दिशा के माध्यम से अच्छी तरह से पता लगाया जाता है, अंततः यह केवल बीआई क्रिस्टलीकृत हो जाता है। जो आविष्कार किया गया है वह ज्ञान बनना शुरू हो जाता है जो विभिन्न उपयोगकर्ताओं को विभिन्न तरीकों से सूचित करता है, और उनकी क्षमता को बढ़ाता है, उम्मीद है कि वास्तव में वे जो काम करते हैं वह करते हैं।

उन चीजों में से एक जो मैंने देखा और मैंने लगभग पाँच वर्षों के लिए भविष्य कहनेवाला विश्लेषिकी को देखा, लेकिन भविष्य कहनेवाला विश्लेषिकी बीआई बन रहा है, इस अर्थ में कि यह सिर्फ लोगों को खिलाने के लिए उपयोगी जानकारी में बदल रहा है और जैसा कि मैंने पहले ही बताया है। वहाँ स्वचालित बीआई रिपोर्टिंग, बीआई खोजपूर्ण, बीआई, इसके बहुत अलग-अलग उन्नयन और भविष्य कहनेवाला विश्लेषण वास्तव में तीनों दिशाओं में जा रहा है। और जैसा कि मैंने बताया कि विश्लेषणात्मक प्रक्रिया सॉफ्टवेयर विकास के लिए अलग नहीं है, बस थोड़ा अलग कौशल वाले विभिन्न लोगों द्वारा किया जाता है। मुझे लगता है कि मुझे इस बात पर जोर देना चाहिए कि वास्तव में एक अच्छा डेटा वैज्ञानिक बनाने के लिए आवश्यक कौशल हासिल करने में वर्षों लगते हैं। वे आसानी से प्राप्त नहीं होते हैं और बड़ी संख्या में लोग ऐसा नहीं कर सकते हैं, लेकिन ऐसा इसलिए है क्योंकि इसमें यह जानने के लिए कि क्या मान्य है और क्या मान्य नहीं है, बहुत ही परिष्कृत स्तर पर गणित को समझना शामिल है। विश्लेषिकी विकास, नए ज्ञान की खोज, विश्लेषिकी आरोपण, यह ज्ञान को क्रियाशील बनाने के बारे में है। यह उस तरह की पृष्ठभूमि है जिसे मैं पूरे एनालिटिक्स को देखता हूं। यह एक बहुत बड़ा क्षेत्र है और इसके कई, कई आयाम हैं, लेकिन मुझे लगता है कि सामान्यीकरण हर चीज पर लागू होता है।

फिर व्यापार में व्यवधान है, जैसा कि मैंने उल्लेख किया है कि कई संगठन हैं, फार्मास्युटिकल कंपनियां एक और हैं, उनके डीएनए में उनके पास एनालिटिक्स हैं। लेकिन ऐसे कई संगठन हैं जिनके पास वास्तव में यह उनके डीएनए में नहीं है, और अब उनके पास क्षमता है, अब सॉफ्टवेयर और हार्डवेयर पहले की तुलना में कहीं अधिक सस्ते हैं, अब उनके पास इसका फायदा उठाने की क्षमता है। मैं बहुत सी बातें कहूंगा। पहली बात यह है कि एनालिटिक्स कई उदाहरणों में आर एंड डी है। आप संगठन के एक विशिष्ट क्षेत्र में सिर्फ विश्लेषिकी लागू कर सकते हैं और यह सांसारिक लग सकता है कि आप एक तरह से या किसी अन्य ग्राहक के आदेश का विश्लेषण कर रहे हैं, फिर भी विभिन्न दृष्टिकोणों से, अन्य डेटा के साथ जुड़कर। लेकिन एनालिटिक्स वास्तव में संगठन को समग्र रूप से देखने की संभावना बनाता है और किसी विशेष गतिविधि का बहुत विश्लेषण करता है जो संगठन और गतिविधियों की पूरी श्रृंखला के भीतर चल रही है। लेकिन एक बार जब आप वास्तव में उस क्षेत्र में चले जाते हैं, तो मैं यह सुनिश्चित करूंगा कि यह अनुसंधान और विकास हो। और एक सवाल है कि मुझे एक दो बार पूछा गया है, जो है, "एक कंपनी को एनालिटिक्स पर कितना खर्च करना चाहिए?" और मुझे लगता है कि जवाब देने के बारे में सोचने का सबसे अच्छा तरीका है कि एनालिटिक्स को आरएंडडी के रूप में सोचें।, और बस पूछते हैं, "ठीक है आप व्यवसाय की दक्षता के क्षेत्र में आर एंड डी पर कितना खर्च करेंगे?"

और जो व्यवसाय विश्लेषिकी के साथ नहीं हैं, उनमें बहुत सी चीजें हैं जो वे नहीं जानते हैं। सबसे पहले, वे नहीं जानते कि यह कैसे करना है। आम तौर पर अगर वे वास्तव में संगठन में एक तरह से या किसी अन्य को अपनाते हैं, तो एनालिटिक्स - उनके पास वास्तव में बहुत अधिक विकल्प नहीं होते हैं, लेकिन एक कंसल्टेंसी में जाने के लिए कोई विकल्प नहीं होता है जो उन्हें ऐसा करने में सहायता कर सकता है, क्योंकि यह असंभव या वास्तव में बहुत कठिन होगा व्यवसाय वास्तव में एक डेटा वैज्ञानिक को नियुक्त करते हैं, एक को ढूंढते हुए, एक के लिए भुगतान करते हैं, और वास्तव में उन पर भरोसा करने के लिए कि आप उन्हें क्या करना चाहते हैं। बहुत कठिन। अधिकांश व्यवसायों को पता नहीं है कि कर्मचारियों को वास्तव में यह काम कैसे करना या शिक्षित करना है, और इसका कारण यह है कि यह अभी तक उनके डीएनए में नहीं है, इसलिए यह उनकी प्राकृतिक व्यावसायिक प्रक्रियाओं का हिस्सा नहीं है। यह अगले बिंदु में फ़ीड करता है। वे नहीं जानते कि यह कैसे एक व्यावसायिक प्रक्रिया है। इसे करने का सबसे अच्छा तरीका है, दवा कंपनियों और बीमा कंपनियों को कॉपी करना है, बस देखो, और स्वास्थ्य देखभाल केंद्र में कुछ कंपनियां, सिर्फ उस तरीके को देखें जो वे एनालिटिक्स का उपयोग करते हैं और इसे कॉपी करते हैं। क्योंकि यह एक व्यवसायिक प्रक्रिया है। यह कैसे पुलिस या यह ऑडिट करने के लिए पता नहीं है। वास्तव में, विशेष रूप से अब यह है कि बहुत सारी सॉफ्टवेयर कंपनियों ने ऐसे उत्पादों का निर्माण किया है जो एक बहुत सारे विश्लेषिकी को स्वचालित करते हैं। ऑडिटिंग के बारे में बात महत्वपूर्ण है, जब आपके पास एक कंसल्टेंसी या साइट पर कोई ऐसा व्यक्ति है जिसे यह समझने के लिए भरोसा किया जा सकता है कि किसी भी विश्लेषणात्मक गणना के परिणाम क्या हैं, यह एक तरह का विकल्प है जिसे आपको बनाना है, लेकिन अगर आप वास्तव में शक्तिशाली विश्लेषणात्मक उपकरण बनाते हैं उन लोगों के हाथ, जो एनालिटिक्स को ठीक से नहीं समझते हैं, वे उन निष्कर्षों पर कूदने की संभावना रखते हैं जो सही नहीं हो सकते हैं। और जैसा कि मैंने कहा, कंपनियों को नहीं पता कि इसके लिए बजट कैसे तैयार किया जाए।

ये एनालिटिक्स के फ्लेवर हैं, मैं इनके माध्यम से चलूंगा। सांख्यिकीय विश्लेषण और सांख्यिकीय मॉडलिंग भविष्य कहनेवाला विश्लेषिकी से काफी अलग है, जिनमें से अधिकांश वक्र-फिटिंग हैं। मशीन लर्निंग उन चीजों के लिए अलग है, पथ विश्लेषण और समय श्रृंखला, जो मूल रूप से स्थिति धाराओं पर किया जाता है फिर से अलग हैं। ग्राफ एनालिटिक्स फिर से अलग है, और टेक्स्ट एनालिटिक्स और अर्थ एनालिटिक्स फिर से अलग हैं। यह सिर्फ इशारा कर रहा है कि यह एक बहुत बहु-शैली की चीज है। यह नहीं है, आप एनालिटिक्स करना शुरू नहीं करते हैं, आप समस्याओं को देखना शुरू कर देते हैं और विभिन्न उपकरणों और विभिन्न प्रकार के एनालिटिक्स की तलाश करते हैं जो उन पर सूट करेंगे। और अंत में, शुद्ध नेट। हार्डवेयर और सॉफ्टवेयर विकास के कारण, मेरी राय में एनालिटिक्स अपनी प्रारंभिक अवस्था में है। बहुत कुछ है, अभी और भी बहुत कुछ होना है और हम इसे आने वाले वर्षों में प्रकट करेंगे। मुझे लगता है कि मैं अब डीज़ को गेंद पास कर सकता हूं।

Dez Blanchfield: हाँ, रॉबिन का पालन करने के लिए एक कठिन कार्य के बारे में बात करें। मैं अपने पसंदीदा कोणों में से इस विषय पर संक्षेप में जाने वाला हूं, जो मानव का कोण है। हमारे रोजमर्रा के जीवन में बहुत सारे बदलाव हो रहे हैं। हमारे दिन-प्रतिदिन के जीवन में सबसे बड़ी बाधाओं में से एक, वर्तमान में मेरे विचार में, सिर्फ रोजमर्रा का काम है। काम करने के लिए काम करना और उस काम को करने की कोशिश करना जिसे आप करने के लिए काम पर रखा गया है, और बढ़ती उम्मीद है कि आप एक रोजमर्रा के व्यक्ति से एक सुपर हीरो तक जा रहे हैं और जानकारी की मात्रा जो संगठनों के आसपास बह रही है और बहुत तेज़ी से निकल रही है, यह एक महत्वपूर्ण चुनौती है और अधिक से अधिक हम लोगों को ज्ञान और सूचना के प्रवाह के साथ प्रयास करने और सामना करने के लिए बेहतर और बेहतर उपकरण प्रदान करने के लिए कर रहे हैं और इसलिए मैंने सोचा कि मैं कोशिश करता हूं और इस पर थोड़ा मजेदार कोण से आता हूं। । लेकिन, यह हमेशा मुझ पर प्रहार करता है कि हमें यह उच्च मन या फ्लैश मॉब और इसके आगे कैसे मिला है, जो हमें विश्लेषणात्मक के रूप में बात करते हैं, लेकिन वास्तव में हम जिस बारे में बात कर रहे हैं, वह लोगों को जानकारी उपलब्ध करा रहा है। उन्हें इसके साथ बातचीत करने की अनुमति दें और इसे इस तरह से करें कि यह स्वाभाविक है और यह सामान्य लगता है।

और वास्तव में, यह मुझे एक छोटे बच्चे, छोटे बच्चे के YouTube वीडियो की याद दिलाता है, जो फर्श पर बैठा है और यह एक आईपैड के साथ खेल रहा है और यह चारों ओर फड़फड़ा रहा है और चुटकी ले रहा है और निचोड़ रहा है और छवियों को बाहर निकाल रहा है और स्क्रीन के साथ खेल रहा है, वहाँ पर डेटा। और फिर माता-पिता iPad को दूर ले जाते हैं और एक पत्रिका, बच्चे की गोद में एक मुद्रित पत्रिका डालते हैं। और यह बच्चा शायद दो साल से अधिक पुराना नहीं है। बच्चा पत्रिका की स्क्रीन के साथ प्रयास करना और ज़ोर से मारना शुरू कर देता है, और चुटकी और निचोड़ लेता है और पत्रिका प्रतिक्रिया नहीं देती है। बच्चा अपनी उंगली ऊपर उठाता है और उसे देखता है और सोचता है, "हम्म, मैं अपनी उंगली का काम नहीं सोचता, " और यह खुद को बांह में दबाता है और सोचता है, "आह नहीं, मेरी उंगली का काम मैं अपनी बांह महसूस कर सकता हूं और अच्छा लग रहा है, '' और यह उंगली को दबाता है, और उंगली को पकड़ता है और प्रतिक्रिया करता है। हाँ। तब यह फिर से पत्रिका के साथ बातचीत करने की कोशिश करता है, और कम और निहारना यह चुटकी और निचोड़ और स्क्रॉल नहीं करता है। फिर वे पत्रिका को दूर ले जाते हैं और iPad को वापस अपनी गोद में रख लेते हैं, और अचानक यह काम करता है। और इसलिए यहां एक बच्चा है जो साथ आता है और मनोरंजन के लिए एक विश्लेषणात्मक उपकरण या लाइव स्ट्रीमिंग टूल का उपयोग करने के लिए प्रशिक्षित किया गया है और यह काम नहीं कर सकता है कि एक पत्रिका कैसे काम करे और पृष्ठों को कैसे फ्लिप करें।

और यह अपने आप में एक दिलचस्प अवधारणा है। लेकिन जब मैं संगठनों के चारों ओर घूमने वाले ज्ञान के बारे में सोचता हूं, और जिस तरह से डेटा बहता है और जिस तरह से लोग व्यवहार करते हैं, मैं अक्सर इस अवधारणा के बारे में सोचता हूं कि लोगों ने फ्लैश मॉब होना क्या सीखा है, जो एक घटना है जहां, और जो सोशल मीडिया बनाता है यह करना और भी आसान है, एक विचार जो इस समय और तिथि और क्रिया, या वीडियो पर इस स्थान पर जाता है और इन रंगों को सीखता है, या इस रंगीन टोपी को पहनता है और एक बजे उत्तर की ओर इशारा करता है। और आप अपने नेटवर्क के माध्यम से इसे बाहर निकालते हैं, और हमेशा लोगों का एक पूरा भार, उनमें से सैकड़ों, एक ही स्थान पर एक ही समय में एक ही काम करते हैं और यह वाह कारक है, इस तरह, "पवित्र गाय, कि था वास्तव में प्रभावशाली! ”लेकिन वास्तव में यह वास्तव में एक सरल विचार है, और एक सरल अवधारणा सिर्फ हमारे नेटवर्क के माध्यम से बाहर धकेल दी जाती है और हमें यह परिणाम मिलता है जो एक नेत्रहीन तेजस्वी और श्रव्य रूप से प्रभावशाली चीज है। और जब आप किसी संगठन के बारे में सोचते हैं, तो जिस तरह से हम चाहते हैं कि लोग व्यवहार करें और जिस तरह से हम चाहते हैं कि वे सूचना प्रणाली और ग्राहकों के साथ व्यवहार करें, यह अक्सर इतना आसान होता है, यह एक विचार या एक अवधारणा या एक सांस्कृतिक या व्यवहार विशेषता है जिसे हम पारित करने की कोशिश करते हैं। उपकरण और जानकारी के माध्यम से और सशक्त।

और वह सब जो इस मंत्र का है जिसे मैंने ढाई दशक से अधिक समय से देखा है और अगर आपके कर्मचारी को अपना काम करने की आवश्यकता नहीं है, तो यह उपकरण या जानकारी हो सकती है। और इसलिए यह अब एक बढ़ती हुई चुनौती है, जहां हमें बहुत सारी जानकारी और बहुत सारी जानकारी और चीजें बहुत तेज़ी से आगे बढ़ रही हैं, कि हम लोगों को पहिया को रोकने के लिए रोकना चाहते हैं। और जब हम अपने काम के माहौल के बारे में सोचते हैं, तो लोगों के कोण पर वापस आना, जो मेरे पसंदीदा में से एक है, मुझे आश्चर्य हुआ जब हम आश्चर्यचकित थे कि क्यूबिकल्स अच्छे परिणामों के लिए अनुकूल वातावरण नहीं थे, या हमने इस भयावह चीजों की तरह काम किया यहाँ चित्र, और यह ज्यादा नहीं बदला है, बस दीवारों को उतारा है और उन्हें खुले स्थान पर काम करने के लिए बुलाया है। लेकिन बीच में उनके चारों ओर पीले लूप के साथ, ज्ञान का आदान-प्रदान करने वाले दो लोग हैं। और फिर भी, यदि आप बाकी के कमरे को देखते हैं, तो वे सभी वहाँ पर सावधानी से बैठा रहे हैं, जानकारी को स्क्रीन में डाल रहे हैं। और अधिक बार नहीं, वास्तव में ज्ञान और डेटा का आदान-प्रदान नहीं कर रहा है, और इसके लिए कई कारण हैं। लेकिन पीले रंग के घेरे में बाईं ओर फर्श के बीच में बातचीत, वहाँ दो लोग दूर बातें कर रहे हैं, ज्ञान गमागमन कर रहे हैं, और शायद कुछ खोजने की कोशिश कर रहे हैं, कहने की कोशिश कर रहे हैं, "क्या आप जानते हैं कि यह रिपोर्ट कहाँ है, जहाँ मैं इस डेटा को पा सकते हैं, इस काम को करने के लिए मैं किस टूल का उपयोग करता हूं? ”और शायद यह काम नहीं किया है इसलिए उन्हें कुछ भी नहीं मिला है, और फर्श पर भटकते हुए, क्यूबिकल ऑफिस स्पेस के नियम को तोड़ दिया है और इसे व्यक्ति में किया है।

और हमारे दफ्तर के आसपास भी ऐसा ही माहौल रहा है, जिसका हम मजाक उड़ाते हैं, लेकिन वास्तविकता यह है कि वे काफी शक्तिशाली और प्रभावी हैं। और मेरे पसंदीदा में से एक मोबाइल या फिक्स्ड एनालिटिक्स प्लेटफॉर्म है, जिसे वाटर कूलर कहा जाता है, जहां लोग वहां उठते हैं और वहां पर चिट-चैट करते हैं और ज्ञान की अदला-बदली करते हैं और विचारों की तुलना करते हैं और वाटर कूलर पर खड़े होकर विचारों की अदला-बदली करते हैं। जब आप उनके बारे में सोचते हैं तो वे बहुत शक्तिशाली अवधारणाएँ होती हैं। और अगर आप उन्हें अपने सिस्टम और टूल में अनुवाद कर सकते हैं, तो आपको एक अद्भुत परिणाम मिलेगा। और हमें ऑल-टाइम पसंदीदा मिला है, जो अनिवार्य रूप से कार्यालय का सबसे शक्तिशाली डेटा वितरण हब है, अन्यथा रिसेप्शन डेस्क के रूप में जाना जाता है। और अगर आपको कुछ नहीं मिल रहा है, तो आप कहाँ जाते हैं? ठीक है, आप कार्यालय के सामने चलते हैं और आप रिसेप्शन पर जाते हैं और कहते हैं, "क्या आप जानते हैं कि x, y, z कहाँ है?" और मैंने किसी को यह बताने की हिम्मत की कि उन्होंने ऐसा नहीं किया है, जो कम से कम एक बार एक नए में हो नौकरी या एक समय में जब वे सिर्फ कुछ नहीं पा सकते हैं। और आप अपने आप से पूछते हैं, ऐसा क्यों है? यह इंट्रानेट या कुछ उपकरण या जो कुछ भी पर होना चाहिए। इसे ढूंढना आसान होना चाहिए।

और इसलिए जब यह डेटा और एनालिटिक्स और हमारे द्वारा काम करने के लिए हमारे स्टाफ को प्रदान किए गए उपकरण और जिस तरह से मनुष्य नौकरियों के साथ बातचीत करता है, तो मुझे यह विचार मिला है कि हाल ही में एनालिटिक्स टूल और बड़े डेटा प्लेटफ़ॉर्म के उद्भव से पहले, या "डेटा प्रोसेसिंग" के रूप में अच्छी तरह से पुराने स्कूल में इसे कॉल करते हैं, रिपोर्टिंग और ज्ञान साझाकरण गतिशील या सहयोगी या खुले से बहुत दूर था, और जब आप सोचते हैं कि हम किस प्रकार के सिस्टम के बारे में उम्मीद करते हैं कि लोग हमारे साथ काम करते हैं, तो हमारे पास शास्त्रीय, क्या था लोग अब विरासत कहते हैं, लेकिन वास्तविकता यह है कि यह केवल विरासत है जो इस पर है और यह आज भी यहां है, और इसलिए यह वास्तव में विरासत नहीं है। लेकिन पारंपरिक एचआर सिस्टम और ईआरपी सिस्टम - मानव संसाधन प्रबंधन, उद्यम संसाधन नियोजन, उद्यम डेटा प्रबंधन, और ऐसी प्रणालियाँ जिनका उपयोग हम कंपनी चलाने के लिए सूचना का प्रबंधन करने के लिए करते हैं। यह हमेशा चुप है। और शीर्ष अंत से, सरल प्लेटफॉर्म जैसे विभागीय इंट्रानेट, संचार करने की कोशिश कर रहे हैं कि चीजें कहां हैं और उन्हें कैसे प्राप्त करें और जगह के आसपास के ज्ञान के साथ कैसे बातचीत करें। हम अपने इंट्रानेट पर पॉप अप करते हैं। यह केवल उन लोगों के रूप में अच्छा है जो समय और प्रयास करते हैं कि इसे वहां डाल दें, अन्यथा यह बस आपके सिर में रह जाता है। या आपको डेटा श्रृंखला के नीचे, कॉर्पोरेट SANs और बीच में सब कुछ पर बैठे डेटा मिला है, इसलिए यह स्टोरेज एरिया नेटवर्क फ़ाइलों और डेटा से भरा है, लेकिन कौन जानता है कि इसे कहां खोजना है।

अधिक बार नहीं, हमने इन बंद डेटा प्लेटफ़ॉर्म या बंद सिस्टमों का निर्माण किया है, और इसलिए लोगों ने जगह के आसपास जानकारी पारित करने के लिए स्प्रैडशीट्स और पावर पॉइंट्स की पसंद को वापस कर दिया है। लेकिन एक दिलचस्प बात यह थी कि हाल ही में, मेरे दिमाग में, और वह यह था कि मोबाइल डिवाइस और इंटरनेट सामान्य रूप से इस तरह से इस विचार के लिए काम करते हैं कि चीजें वास्तव में बेहतर हो सकती हैं। और मुख्य रूप से उपभोक्ता अंतरिक्ष में। और यह एक दिलचस्प बात है कि रोजमर्रा की जिंदगी में हमारे पास इंटरनेट बैंकिंग जैसी चीजें होने लगीं। हमें उनके साथ बातचीत करने के लिए वास्तव में बैंक जाने की जरूरत नहीं थी, हम इसे फोन द्वारा कर सकते थे। मूल रूप से वह क्लूनी था लेकिन तब इंटरनेट इधर-उधर हो गया और हमारे पास एक वेबसाइट थी। आप जानते हैं, और आप वास्तव में कितनी बार हाल ही में अपने बैंक में गए हैं? मैं वास्तव में नहीं कर सकता, दूसरे दिन मुझे इस बारे में बातचीत हुई, और मैं वास्तव में अपने बैंक में जाने के आखिरी समय को याद नहीं कर सका, जिससे मैं काफी सदमे में था, मुझे लगा कि मुझे इसे याद करने में सक्षम होना चाहिए, लेकिन यह बहुत लंबा था पहले मैं वास्तव में याद नहीं कर सकता जब मैं वहाँ गया था। और इसलिए अब हमारे हाथ में ये गैजेट हैं मोबाइल और फोन, टैबलेट और लैपटॉप के रूप में, हमें नेटवर्क और उपकरण और सिस्टम तक पहुंच मिल गई है, और हमने जो उपभोक्ता स्थान सीखा है, वह बेहतर हो सकता है, लेकिन क्योंकि उपभोक्ता स्थान में तेजी से परिवर्तन, जो उद्यम और वातावरण के अंदर अधिक सुस्त और हिमनद परिवर्तन रहा है, हमने हमेशा उस परिवर्तन को दिन-प्रतिदिन के कामकाजी जीवन में नहीं लिया है।

और मुझे इस तथ्य पर मज़ाक उड़ाना पसंद है कि आप हार्डकॉपी को डेटा स्ट्रीम नहीं कर सकते। इस चित्र में यहाँ एक व्यक्ति है जो कुछ विश्लेषणों को देख रहा है, और यह एक सुंदर ग्राफ है, जो किसी ऐसे व्यक्ति द्वारा निर्मित किया गया है, जो संभवत: एक सांख्यिकीविद या एक एक्ट्रेसेज़ के रूप में बहुत अधिक पैसा चुका रहा है, और वे वहीं बैठे हैं जो करने की कोशिश कर रहे हैं एक हार्डकॉपी पर विश्लेषण और उस पर प्रहार। लेकिन यहाँ मेरे लिए एक भयावह बात है: इस बैठक कक्ष में ये लोग, उदाहरण के लिए, और मैं इसे एक उदाहरण के रूप में उपयोग करूँगा, वे डेटा के साथ बातचीत कर रहे हैं जो अब ऐतिहासिक है। और यह तब से उतना ही पुराना है जब उस चीज का उत्पादन किया गया था और फिर मुद्रित किया गया था, इसलिए शायद यह एक सप्ताह पुरानी रिपोर्ट है। अब वे इतना बुरा डेटा नहीं बल्कि पुराने डेटा पर निर्णय ले रहे हैं, जो हमेशा के लिए बुरा डेटा हो सकता है। वे आज एक ऐतिहासिक चीज़ के आधार पर निर्णय ले रहे हैं, जो वास्तव में एक बुरी जगह है। हमने उस हार्डकॉपी को टैबलेट और फोन की पसंद से बदलने में कामयाबी हासिल की क्योंकि हमने उपभोक्ता स्थान में बहुत जल्दी काम किया है, और अब हमने इसे एंटरप्राइज स्पेस में काम किया है, वास्तविक समय अंतर्दृष्टि वास्तविक समय मूल्य है।

और हम उस पर बेहतर और बेहतर हो रहे हैं। और यह मुझे उस बिंदु पर लाता है जो रॉबिन ने पहले उठाया था, वह नागरिक डेटा वैज्ञानिक की अवधारणा और इस अवधारणा की ड्राइव थी। मेरे लिए, एक नागरिक डेटा वैज्ञानिक सिर्फ सही उपकरण और iPad की पसंद पर जानकारी रखने वाले नियमित लोग हैं। उन्हें गणित करने की ज़रूरत नहीं है, उन्हें एल्गोरिदम को जानने की ज़रूरत नहीं है, उन्हें एल्गोरिदम और नियम डेटा को लागू करने का तरीका जानने की ज़रूरत नहीं है, उन्हें बस इंटरफ़ेस का उपयोग करने की आवश्यकता है। और यह मुझे मेरे परिचय और एक आईपैड बनाम एक पत्रिका, एक आईपैड के साथ वहां बैठे बच्चे की अवधारणा को वापस लाता है। बच्चा बहुत जल्दी, सहज ज्ञान युक्त सीख सकता है कि कैसे एक iPad के इंटरफ़ेस का उपयोग जानकारी में गोता लगाने और इसके साथ बातचीत करने के लिए किया जाता है, भले ही यह गेम या स्ट्रीमिंग मीडिया या वीडियो हो। लेकिन यह एक पत्रिका बार से एक ही प्रतिक्रिया या इंटरैक्शन नहीं मिल सका और पृष्ठ के बाद बस चमकती पृष्ठ, जो बहुत आकर्षक नहीं है, खासकर यदि आप एक बच्चा है जो आईपैड के साथ बड़ा हुआ है। वास्तव में, मनुष्य बहुत तेज़ी से देख सकता है और सीख सकता है कि उपकरण और चीजें कैसे चलाएं जो अगर हम उन्हें प्रदान करते हैं, और यदि हम उन्हें मोबाइल उपकरणों और विशेष रूप से टैबलेट और स्मार्टफोन जैसे बड़े पर्याप्त स्क्रीन वाले इंटरफ़ेस प्रदान करते हैं, और विशेष रूप से यदि आप बातचीत कर सकते हैं। उन्हें स्पर्श में, उंगली की गति के साथ, अचानक आपको एक नागरिक डेटा वैज्ञानिक की यह अवधारणा मिलती है।

कोई है जो सही उपकरणों के साथ डेटा विज्ञान को लागू कर सकता है, लेकिन वास्तव में यह जानने के बिना कि यह कैसे करना है। और जैसा कि मैंने कहा, मेरे दिमाग में बहुत कुछ, उपभोक्ता प्रभाव से प्रेरित था, जो स्थानांतरित हो गया और मांग और उद्यम में बदल गया। वास्तव में त्वरित उदाहरणों की एक जोड़ी। हम, हम में से बहुत से लोग अपने ब्लॉग और वेबसाइटों के साथ काम करना शुरू कर देते हैं, जैसे कि छोटे विज्ञापनों में या ट्रैकिंग और आंदोलन को देखते हुए, हमने Google Analytics जैसे टूल का उपयोग किया और हम इस तथ्य से अवगत थे कि हमारे ब्लॉग और छोटी वेबसाइटों में, हम वहाँ कोड के छोटे टुकड़े डाल सकते हैं और Google हमें वास्तविक समय की जानकारी देगा कि वेबसाइट पर कौन, कब और कहाँ और कैसे जा रहा है। और वास्तविक समय में हम वास्तव में लोगों को वेबसाइट को हिट करते हुए देख सकते हैं, पृष्ठों के माध्यम से जा सकते हैं और फिर गायब हो सकते हैं। और यह काफी हैरान करने वाला था। मुझे अभी भी ऐसा करना पसंद है, जब मैं उन लोगों को वास्तविक समय के विश्लेषिकी की व्याख्या करने की कोशिश करता हूं, जिन्हें मैं इसे केवल Google Analytics के साथ एक वेबसाइट दिखा रहा हूं, जिसमें प्लग इन किया गया है, और वास्तव में वेबसाइटों को हिट करने वाले लोगों के साथ लाइव इंटरैक्शन देखें और उनसे पूछें, "कल्पना करें कि क्या आप वास्तविक समय में अपने व्यवसाय में उन प्रकार की अंतर्दृष्टि रखते थे। ”

एक खुदरा उदाहरण लें, और शायद एक दवा, मुझे लगता है कि आप इसे अमेरिका में एक दवा की दुकान कहते हैं, एक फार्मेसी जहां आप चलते हैं और सिरदर्द की गोलियों से लेकर सन क्रीम और टोपी तक सब कुछ खरीदते हैं। वास्तविक समय की जानकारी के बिना उस संगठन को चलाने की कोशिश करना एक डरावना अवधारणा है अब हम जानते हैं कि हम क्या जानते हैं। उदाहरण के लिए, आप पैर ट्रैफ़िक को माप सकते हैं, आप स्क्रीन के एक तरफ स्माइली चेहरे के साथ स्टोर के चारों ओर डिवाइस लगा सकते हैं क्योंकि आप खुश हैं, और सबसे दाईं ओर एक दुखी लाल और बीच में कुछ अलग-अलग शेड हैं। और इन दिनों "हैप्पी या नॉट" नामक एक मंच है, जहां आप एक दुकान में चलते हैं और आप अपने लाइव ग्राहक भावना प्रतिक्रिया के आधार पर एक खुश चेहरे या उदास चेहरे पर धमाका कर सकते हैं। और यह वास्तविक समय के साथ इंटरैक्टिव हो सकता है। आप जीवित मांग-संचालित मूल्य प्राप्त कर सकते हैं। यदि इसमें बहुत से लोग हैं, तो आप कीमतों को थोड़ा बढ़ा सकते हैं, और आप स्टॉक की उपलब्धता कर सकते हैं और लोगों को बता सकते हैं, उदाहरण के लिए - एयरलाइंस, उदाहरण के लिए, लोगों को बताएंगे कि वेबसाइट पर अब आपको कितनी सीटें उपलब्ध हैं। एक फ्लाइट की बुकिंग, आप बस बेतरतीब ढंग से डायल न करें और आशा करें कि आप उड़ान भर सकते हैं और उड़ान भर सकते हैं। लाइव एचआर डेटा, आप बता सकते हैं कि लोग कब देख रहे हैं और बंद कर रहे हैं। खरीद, यदि आप खरीद में हैं और आपके पास लाइव डेटा है, तो आप अपने अगले स्टॉक को खरीदने के लिए अमेरिकी डॉलर की कीमत के खिलाफ एक घंटे और बचाव जैसी चीजें कर सकते हैं और चीजों का एक ट्रक लोड हो सकता है।

जब मैं लोगों को Google Analytics दिखाता हूं और मैं उस तरह के उपाख्यान, इस यूरेका पल, इस "ए-हा!" पल को रिले करता हूं, तो यह लाइटबल्ब उनके दिमाग में उतर जाता है जैसे, "हम्म, मैं बहुत सारी जगह देख सकता हूं जहां मैं ऐसा कर सकता हूं । यदि केवल मेरे पास उपकरण थे और यदि केवल मेरे पास उस ज्ञान तक पहुंच थी। ”और हम इसे अब सोशल मीडिया में देख रहे हैं। कोई भी जो एक सामान्य सोशल मीडिया उपयोगकर्ता है, जो केवल अपने नाश्ते की तस्वीरें दिखाने के अलावा, यह देखने के लिए तरसता है कि उन्हें कितनी पसंद आ रही है और उन्हें कितना ट्रैफ़िक मिल रहा है और उन्हें कितने दोस्त मिल रहे हैं, और वे ऐसा करते हैं एनालिटिक्स टूल के रूप में ट्विटर को पसंद करते हैं। टूल का उपयोग करने के लिए आप Twitter.com पर जा सकते हैं, लेकिन आप Google Twitter Analytics डॉट कॉम में टाइप करें, या ऊपर दाहिने बटन पर क्लिक करें और मेनू को नीचे खींचें और इसे करें, आपको ये सुंदर, सजीव ग्राफ़ मिलते हैं जो आपको बताते हैं कि कितने ट्वीट्स आप स्वयं कर रहे हैं और उनके साथ कितने इंटरैक्शन हैं। और वास्तविक समय विश्लेषिकी सिर्फ आपके व्यक्तिगत सोशल मीडिया पर। कल्पना कीजिए कि अगर हमारे पास Google Analytics और Facebook और LinkedIn और Twitter, eBay के आँकड़े आपके पास आने वाले हैं, लेकिन आपके कार्य वातावरण में हैं।

अब हमें अपनी उंगलियों पर वेब और मोबाइल का लाइव प्रकार मिल गया है, यह एक शक्ति अवधारणा बन गया है। और इसलिए यह मुझे मेरे निष्कर्ष तक खींचता है, और यह कि हमेशा मैंने पाया है कि जो संगठन उपकरण और प्रौद्योगिकी का जल्द से जल्द लाभ उठाते हैं, वे अपने प्रतिद्वंद्वियों पर इतना महत्वपूर्ण लाभ प्राप्त करते हैं कि प्रतियोगी वास्तव में कभी पकड़ नहीं सकते। और हम देख रहे हैं कि अब नागरिक डेटा वैज्ञानिक के संघर्ष के साथ। यदि हम कौशल के साथ लोगों को ले जा सकते हैं, तो ज्ञान है कि हम उन्हें काम पर रखा है, और हम उन्हें सही उपकरण दे सकते हैं, विशेष रूप से वास्तविक समय डेटा को देखने और डेटा की खोज करने की क्षमता है और जानते हैं कि यह क्यूबिकल्स के आसपास चलने के बिना कहां है। और ज़ोर से प्रश्न पूछें, लोगों के साथ कुछ तुलनात्मक विश्लेषण करने के लिए वाटर कूलर पर जाकर खड़े हो जाएँ या जाएँ और रिसेप्शन से पूछें कि सूचकांक कहाँ है। यदि वे अपनी उंगलियों पर ऐसा कर सकते हैं और वे इसे उनके साथ अपनी बैठकों में ले जा सकते हैं और हार्डकॉपी के बजाय वास्तविक समय में स्क्रीन के माध्यम से फ़्लर्ट करने वाले बोर्डरूम में बैठ सकते हैं, तो अचानक हमने अपने कर्मचारियों को सशक्त बना दिया है जिन्हें वास्तविक होने की आवश्यकता नहीं है डेटा वैज्ञानिक, लेकिन वास्तव में डेटा विज्ञान का उपयोग करते हैं और संगठनों के लिए अद्भुत परिणाम चलाते हैं। और मुझे लगता है कि यह टिपिंग पॉइंट हम वास्तव में अब पारित कर चुके हैं जहाँ उपभोक्ता उद्यम में चला गया है, चुनौती यह है कि हम उस उद्यम को कैसे प्रदान करते हैं, और यही वह विषय है जिसकी मैं आज की चर्चा का अनुमान लगाता हूँ। और इसके साथ, मैं अपने टुकड़े को लपेटने जा रहा हूं और यह सुनने के लिए कि हम कैसे हल कर सकते हैं। डेविड, आपके ऊपर।

डेविड स्वीनर: सब ठीक है, बहुत बहुत धन्यवाद दोस्तों, और धन्यवाद रॉबिन। आप जानते हैं, रॉबिन, मैं आपके मूल मूल्यांकन से सहमत हूं। विश्लेषणात्मक प्रक्रिया, यह वास्तव में सॉफ्टवेयर विकास से अलग नहीं है। मुझे लगता है कि एक संगठन के भीतर चुनौती वास्तव में है, आप जानते हैं, शायद चीजों को अच्छी तरह से परिभाषित नहीं किया गया है, शायद इसके लिए एक खोजपूर्ण घटक है, और इसके लिए एक रचनात्मक घटक है। और डीज़, आप जानते हैं, मैं आपसे सहमत हूं, पहिया को फिर से मजबूत करने का एक बहुत कुछ है, और आप जानते हैं, एक संगठन नहीं है जो मैं आज में जाता हूं, आप सवाल करते हैं, ठीक है, आप इसे इस तरह क्यों कर रहे हैं? व्यवसाय इस तरह से क्यों चलता है? और यह सवाल करना आसान है, और बहुत बार जब आप किसी संगठन के भीतर होते हैं, तो इसे बदलना मुश्किल होता है। मैं सादृश्य से प्यार करता हूं, चीजों का उपभोग। और इसलिए अब जब मैं हवाई अड्डे पर जाता हूं और अपनी सीट बदलना चाहता हूं - मैं इसे अपने सेलफोन पर करता हूं। मुझे बूथ पर एजेंट के पास जाने की ज़रूरत नहीं है, और उस एजेंट को मेरी सीट असाइनमेंट को बदलने के लिए 15 मिनट के लिए मोनोक्रोम मॉनिटर पर कुछ टाइप करें। मैं इसे अपने फोन पर करना पसंद करता हूं, और इसलिए यह एक दिलचस्प विकास है।

आज, हम सामूहिक बुद्धि के बारे में थोड़ी बात करने जा रहे हैं। जो लोग जागरूक नहीं हैं, उनके लिए स्टैटिस्टिका एक अग्रणी एनालिटिक्स प्लेटफॉर्म है, जो कि लगभग 30 वर्षों से है। यदि आप विश्लेषक उद्योग में किसी भी प्रकाशन को देखते हैं, तो यह हमेशा सबसे अधिक सहज और उन्नत एनालिटिक्स सॉफ़्टवेयर पैकेज का उपयोग करने में आसान होता है। इसलिए हमने पिछले कुछ वर्षों को सामूहिक बुद्धिमत्ता की अवधारणा पर काम करते हुए बिताया है, और हम इसे अगले स्तर पर ले जा रहे हैं। मैं इस बातचीत को शुरू करना चाहता था: आपके संगठन में काम कैसे होता है?

और यहां दो चित्र हैं। बाईं ओर एक 1960 के दशक से एक छवि है, और मैंने 1960 के दशक में अपना कैरियर शुरू नहीं किया था, लेकिन दाईं ओर की छवि है - यह एक अर्धचालक कारखाना है जहां मैंने काम करना शुरू किया। और मैंने उस काली इमारत में काम किया, ऊपर की बाईं तरफ काली छत। लेकिन उन्होंने अर्धचालक सामान बनाया। यह Google छवियां की एक हालिया तस्वीर है। लेकिन जब आप बाईं ओर 1960 की छवि में वापस जाते हैं, तो यह बहुत दिलचस्प है। आपके पास ये लोग एक पंक्ति में बैठे हैं, और वे बना रहे हैं, आप जानते हैं, एकीकृत सर्किट और अर्धचालक। लेकिन एक मानकीकरण है, चीजों को करने का एक मानक तरीका है, और एक अच्छी तरह से परिभाषित प्रक्रिया थी। आप जानते हैं, शायद चूंकि ये सभी लोग खुले वातावरण में बैठे हैं, शायद कुछ सहयोग था। मुझे लगता है कि हमने ज्ञान कार्यबल के भीतर थोड़ा सा खो दिया है।

जब मैं ऊपरी बाईं ओर उस इमारत में बैठा था, अगर मैं किसी के साथ सहयोग करना चाहता था, तो यह खुला नहीं था। ये कार्यालय थे, शायद कुछ टीम रिमोट थी, या शायद मुझे इस परिसर में ट्रेक करना था; यह 25 मिनट की पैदल दूरी पर था, और मुझे इस इमारत में सबसे दूर किसी से बात करने जाना था। मुझे लगता है कि हमने रास्ते में कुछ खो दिया है। और इसलिए, आप जानते हैं, मेरा भी यही विचार था, लोग क्यों - आपके संगठन के भीतर कितने लोग पहिया को सुदृढ़ करते रहते हैं? मुझे लगता है, आप जानते हैं, 1990 और 2000 के दशक में CRM और डेटा वेयरहाउसिंग और एक हद तक BI के साथ समग्र रूप से संगठनों ने अच्छा काम किया। किसी कारण से, एनालिटिक्स थोड़ा पिछड़ गया है। डेटा वेयरहाउसिंग, और मानकीकरण, और आपके डेटा को सामान्य करने और इस सब और CRM में महत्वपूर्ण निवेश थे, लेकिन एनालिटिक्स किसी कारण से पिछड़ गया है। और मैं सोच रहा हूँ क्यों। हो सकता है कि कोई रचनात्मक हो - हो सकता है कि आपकी प्रक्रिया अच्छी तरह से परिभाषित न हो, हो सकता है कि आपको पता न हो कि आप किस फैसले या लीवर को बदलने की कोशिश कर रहे हैं, आप जानते हैं, अपने व्यवसाय में चीजों को बदलने के लिए। जब हम आज संगठनों में जाते हैं, तो बहुत सारे लोग स्प्रेडशीट में बहुत मैन्युअल रूप से काम कर रहे हैं।

और आप जानते हैं, मैंने आज सुबह एक स्टेट को देखा, मुझे लगता है कि उसने कहा कि 80, 90 प्रतिशत स्प्रेडशीट में त्रुटियां हैं, और इनमें से कुछ बहुत महत्वपूर्ण हो सकते हैं। व्हेल में एक की तरह, जहां जेपी मॉर्गन चेस ने स्प्रेडशीट त्रुटियों के कारण अरबों और अरबों डॉलर खो दिए। इसलिए मुझे लगता है कि मुझे लगता है कि चीजों को प्राप्त करने का एक बेहतर तरीका होना चाहिए। और जैसा कि हमने उल्लेख किया है, हमारे पास ये डेटा वैज्ञानिक हैं। ये लोग महंगे हैं, और उन्हें खोजना मुश्किल है। और कभी-कभी वे एक अजीब बतख के रूप में होते हैं। लेकिन मुझे लगता है, आप जानते हैं, अगर मुझे यह बताना है कि डेटा वैज्ञानिक क्या है, तो शायद यह कोई है जो डेटा को समझता है। मुझे लगता है कि यह कोई है जो गणित को समझता है, कोई है जो समस्या को समझता है। और वास्तव में, कोई है जो परिणामों का संचार कर सकता है। और यदि आप एक डेटा वैज्ञानिक हैं, तो आप इन दिनों बहुत भाग्यशाली हैं, क्योंकि पिछले कुछ वर्षों में आपका वेतन शायद दोगुना हो गया है।

लेकिन सच कहा जाए, तो बहुत सारे संगठन, उनके पास ये डेटा वैज्ञानिक नहीं हैं, लेकिन आपके संगठन में स्मार्ट लोग हैं। आपके पास एक संगठन है, आपके पास बहुत सारे स्मार्ट लोग हैं, और वे स्प्रेडशीट का उपयोग करते हैं। आप जानते हैं, आंकड़े और गणित उनका प्राथमिक काम नहीं है, लेकिन वे व्यवसाय को आगे बढ़ाने के लिए डेटा का उपयोग करते हैं। वास्तव में, हम जो चुनौती दे रहे हैं वह यह है कि आप कैसे लेते हैं, यदि आप भाग्यशाली हैं कि आपके पास एक डेटा वैज्ञानिक या एक सांख्यिकीविद् या दो हैं, तो आप उन्हें कैसे ले सकते हैं, और आप उन लोगों और लोगों के बीच सहयोग को कैसे बेहतर बना सकते हैं आपके संगठन में अन्य व्यक्ति? यदि हम इस बात पर एक नज़र डालते हैं कि हमारा संगठन किस प्रकार संरचित है, तो मैं शुरू करने जा रहा हूँ, और मैं दाएँ से बाएँ जा रहा हूँ। और मुझे पता है कि यह पीछे की ओर है, लेकिन हमारे पास व्यापार उपयोगकर्ताओं की यह पंक्ति है।

यह आपके ज्ञान कार्यकर्ता आबादी का थोक है, और इन लोगों के लिए, आपको अपने व्यापार अनुप्रयोगों की लाइन में एनालिटिक्स को एम्बेड करने की आवश्यकता है। शायद वे एक कॉल सेंटर स्क्रीन या कुछ पर एनालिटिक आउटपुट देख रहे हैं, और यह उन्हें एक ग्राहक को देने के लिए अगला सबसे अच्छा प्रस्ताव बता रहा है। हो सकता है कि यह एक वेब पोर्टल पर उपभोक्ता या आपूर्तिकर्ता हो, और यह तुरंत उन्हें क्रेडिट, या जैसी चीजें देता है। लेकिन विचार यह है, वे एनालिटिक्स का उपभोग कर रहे हैं। यदि हम बीच में जाते हैं, तो ये ज्ञान कार्यकर्ता हैं। ये वे लोग हैं जो आज स्प्रेडशीट के साथ काम कर रहे हैं, लेकिन स्प्रेडशीट त्रुटि-प्रवण हैं और कुछ बिंदु पर वे गैस से बाहर निकलते हैं। ये नागरिक डेटा वैज्ञानिक, जैसा कि हम उन्हें कहते हैं, आप जानते हैं, हम उनके लिए क्या करने की कोशिश कर रहे हैं, वास्तव में स्वचालन के स्तर को बढ़ाते हैं।

और आप एनालिटिक्स के साथ सुनते हैं कि 80 से 90 प्रतिशत काम डेटा प्रीप पीस में है, और यह वास्तविक गणित नहीं है, बल्कि यह डेटा प्रीप है। हम इसे स्वचालित बनाने की कोशिश कर रहे हैं, चाहे आप ऐसा करें, और हमारे पास जादूगर और टेम्पलेट और पुन: प्रयोज्य चीजें हैं, और आपको वास्तव में आपके पर्यावरण के भीतर अंतर्निहित बुनियादी ढांचे का ज्ञान नहीं है। और फिर अगर हम सुदूर बाईं ओर देखें, तो हमारे पास ये डेटा वैज्ञानिक हैं। और जैसा मैंने उल्लेख किया है, वे कम आपूर्ति में हैं। और हम उन्हें अधिक उत्पादक बनाने के लिए क्या करने की कोशिश कर रहे हैं, उन्हें उन चीजों को बनाने की अनुमति है जो ये नागरिक डेटा वैज्ञानिक कर सकते हैं। इसे लेगो ब्लॉक की तरह समझें, इसलिए ये डेटा वैज्ञानिक एक पुन: प्रयोज्य संपत्ति बना सकते हैं जो एक नागरिक डेटा वैज्ञानिक उपयोग कर सकते हैं। इसे एक बार बनाएं, इसलिए हमें पहिया को फिर से स्थापित करने की आवश्यकता नहीं है।

और फिर, ये लोग चिंतित हो सकते हैं कि क्या हम डेटाबेस में चीजें कर सकते हैं, और मौजूदा प्रौद्योगिकी निवेश का लाभ उठा सकते हैं जो आपकी कंपनी ने बनाया है। तुम्हें पता है, यह इस दिन और उम्र के लिए दुनिया भर में डेटा फेरबदल करने के लिए कोई मतलब नहीं है। इसलिए अगर हम स्टैटिस्टिका को देखें, जैसे मैंने उल्लेख किया है, तो यह एक ऐसा मंच है जो काफी लंबे समय से आसपास है। और यह एक बहुत ही नवीन उत्पाद है। डेटा सम्मिश्रण, कोई डेटा स्रोत नहीं है जिसे हम एक्सेस नहीं कर सकते। हमारे पास सभी डेटा खोज और विज़ुअलाइज़ेशन चीजें हैं जो आप उम्मीद करेंगे; हम इसे वास्तविक समय में कर सकते हैं। और यह शायद है - मुझे लगता है कि सॉफ्टवेयर टूल के भीतर 16, 000 से अधिक विश्लेषणात्मक कार्य हैं, इसलिए मैं जितना उपयोग कर सकता हूं या समझ सकता हूं उससे अधिक गणित है, लेकिन अगर आपको इसकी आवश्यकता है तो यह वहां है।

हमारे पास वास्तव में एक व्यावसायिक निर्णय लेने के लिए व्यावसायिक नियमों और विश्लेषणात्मक वर्कफ़्लो दोनों को संयोजित करने की क्षमता है। आप यहाँ से आगे जा रहे हैं, यहाँ एक एल्गोरिथ्म है, यहाँ एक वर्कफ़्लो है, लेकिन आपके पास व्यावसायिक नियम हैं जिनसे आपको हमेशा निपटना है। हम शासन में बहुत सुरक्षित हैं। हम बहुत सारे फार्मास्युटिकल क्लाइंट में उपयोग किए जाते हैं, जिसमें एफडीए हम पर भरोसा करता है। आप जानते हैं, केवल इस बात का प्रमाण है कि हमारे पास नियंत्रण और ऑडिट क्षमता उनके द्वारा स्वीकार किए जाने की क्षमता है। और फिर अंत में, आप जानते हैं, हम खुले और लचीले और एक्स्टेंसिबल हैं, इसलिए आपको एक ऐसा प्लेटफॉर्म बनाने की आवश्यकता है, जो कि आप चाहते हैं कि आपके डेटा वैज्ञानिक उत्पादक हों, आप चाहते हैं कि आपके नागरिक डेटा वैज्ञानिक उत्पादक हों, आप सक्षम होना चाहते हैं अपने संगठन के भीतर श्रमिकों के लिए इन विश्लेषणात्मक उत्पादन को तैनात करने के लिए।

अगर हम इस पर एक नज़र डालें, तो यहाँ कुछ दृश्यावली का एक उदाहरण है। लेकिन अपने एनालिटिक आउटपुट को लाइन-ऑफ-बिजनेस उपयोगकर्ताओं में वितरित करने में सक्षम होने के नाते, इसलिए बाईं ओर का पहला उदाहरण, नेटवर्क एनालिटिक आरेख है। और शायद आप एक धोखाधड़ी जांचकर्ता हैं, और आप नहीं जानते कि ये कनेक्शन कैसे बने हैं, और ये लोग हो सकते हैं, ये संस्थाएं हो सकती हैं, ये अनुबंध हो सकते हैं, वास्तव में कुछ भी। लेकिन आप इसे अपने माउस के साथ जोड़-तोड़ कर सकते हैं, और इसके साथ बातचीत कर सकते हैं वास्तव में समझने के लिए - यदि आप एक धोखाधड़ी जांचकर्ता हैं, तो प्राथमिकता सूची को समझने के लिए कि जांच किसने की है, ठीक है, क्योंकि आप हर किसी से बात नहीं कर सकते हैं, इसलिए आपके पास है प्राथमिकता देना।

यदि हम वहाँ पर दाईं ओर की छवि को देखते हैं, एक भविष्य कहनेवाला रखरखाव डैशबोर्ड के लिए, यह वास्तव में एक दिलचस्प समस्या है। शायद आप एक हवाई अड्डे के मालिक हैं, और आपके पास वहां ये बॉडी स्कैनर हैं। ये बॉडी स्कैनर, यदि आप किसी हवाईअड्डे पर जाते हैं, तो वहाँ कुछ घटक होते हैं जिनमें लगभग नौ महीने का शैल्फ जीवन होता है। और ये चीजें वास्तव में, वास्तव में महंगी हैं। यदि मेरे हवाईअड्डे में कई प्रवेश बिंदु, कई स्कैनर हैं, तो नंबर एक मैं यह सुनिश्चित करना चाहता हूं कि मैं प्रत्येक द्वार पर उचित रूप से तैनात हूं, और कुछ हिस्सों के लिए जो स्कैनर में हैं, मैं उन्हें भी ऑर्डर नहीं देना चाहता हूं जल्दी, और मैं इससे पहले कि वे टूट जाता है करना चाहते हैं। हमारे पास क्षमता है, हो सकता है कि यदि आप एक हवाई अड्डे के मालिक हों, तो यह अनुमान लगाने में सक्षम होने के लिए कि ये चीजें कब टूटेंगी और स्टाफ के स्तर की भविष्यवाणी करेगी।

यदि हम निचले दाईं ओर देखते हैं, तो यह है कि आप निर्माण के माहौल में हैं, यह विनिर्माण प्रवाह का केवल एक चित्रमय प्रतिनिधित्व है। और यह देखना थोड़ा कठिन है, लेकिन इन विभिन्न प्रक्रिया क्षेत्रों पर लाल और हरे रंग की ट्रैफिक लाइटें हैं, और इसलिए यदि मैं एक इंजीनियर हूं, तो वहां बहुत परिष्कृत गणित चल रहा है, लेकिन मैं उस विशेष प्रक्रिया क्षेत्र में नीचे की ओर देख सकता हूं पैरामीटर, और इनपुट, जो शायद नियंत्रण से बाहर हो सकता है। यदि हम अपने नागरिक डेटा वैज्ञानिक को देखते हैं, तो हमारा लक्ष्य वास्तव में नागरिक डेटा वैज्ञानिक को आसान बनाना है। हमारे पास विजार्ड और टेम्प्लेट हैं, और मुझे लगता है कि एक चीज वास्तव में दिलचस्प है, क्या हमारे पास यह स्वचालित डेटा स्वास्थ्य जांच नोड है। और वास्तव में यह क्या करता है, इसमें अंतर्निहित स्मार्ट हैं।

मैंने डेटा प्रस्तुत करने का उल्लेख किया है - यह महत्वपूर्ण समय लेता है, यह डेटा एकत्रीकरण और इसे तैयार करने दोनों में है। लेकिन मान लें कि मेरे पास मेरा डेटा है, मैं इसे इस डेटा हेल्थ चेक नोड के माध्यम से चला सकता हूं, और यह इनवेरियन, और स्पार्सनेस, और आउटलेर और इन सभी चीजों के लिए जांच करता है, यह लापता मानों में भरता है और यह बहुत सारे गणित करता है जो मैं डॉन समझ नहीं है, इसलिए मैं या तो चूक स्वीकार कर सकता हूं, या यदि मैं थोड़ा अधिक चतुर हूं, तो मैं उन्हें बदल सकता हूं। लेकिन बात यह है कि हम उस प्रक्रिया को स्वचालित करना चाहते हैं। यह बात एक साफ़ किए गए डेटा सेट पर लगभग 15 अलग-अलग जाँच और परिणाम करती है। हम जो कर रहे हैं, उससे लोगों को इन वर्कफ्लो को बनाने में आसानी हो रही है।

यह वह जगह है जहाँ हम डेटा वैज्ञानिकों और नागरिक डेटा वैज्ञानिकों के बीच सहयोग के बारे में बात कर रहे हैं। यदि हम इन छवियों को दाईं ओर देखते हैं, तो हम इस डेटा को प्रस्तुत करने का वर्कफ़्लो देखते हैं। और शायद यह बहुत ही परिष्कृत है, हो सकता है कि यह आपकी कंपनी की गुप्त चटनी हो, मुझे नहीं पता, लेकिन हम जानते हैं कि आपके संगठन में कोई व्यक्ति इनमें से एक या अधिक डेटा साइलो तक पहुंच सकता है। हमें एक तरीका चाहिए, नंबर एक, उन्हें पकड़ो और उन्हें एक साथ सिलाई करें, और नंबर दो, हो सकता है कि कोई विशेष प्रसंस्करण है जिसे हम करना चाहते हैं, यह हमारे डेटा स्वास्थ्य जांच से परे है, और यह आपकी कंपनी की गुप्त चटनी है। मैं इस वर्कफ़्लो को हमारे संगठन के भीतर बना सकता हूं, और यह नोड के रूप में ढह जाता है। आप तीर को नीचे की ओर इंगित करते हुए देखते हैं, यह सिर्फ एक नोड है, और हम एक संगठन के भीतर इन चीजों में से एक सौ हो सकते हैं। विचार यह है, हमारे पास ऐसे लोग हैं जो एक निश्चित स्थान के बारे में कुछ जानते हैं, वे एक वर्कफ़्लो बना सकते हैं, और कोई अन्य व्यक्ति इसका पुन: उपयोग कर सकता है। हम पहिया के सुदृढीकरण को कम करने की कोशिश कर रहे हैं।

और हम विश्लेषणात्मक मॉडलिंग वर्कफ़्लो के साथ एक ही काम कर सकते हैं। दाईं ओर इस स्थिति में, यह वर्कफ़्लो, शायद 15 अलग-अलग एल्गोरिदम हैं, और मैं कार्य के लिए सबसे अच्छा चुनना चाहता हूं। और मुझे एक नागरिक डेटा वैज्ञानिक के रूप में समझने की ज़रूरत नहीं है कि उस मकड़ी के जाल में क्या गड़बड़ है, लेकिन यह बस एक नोड में ढह जाता है, और शायद यह नोड बस कहता है, "क्रेडिट जोखिम स्कोर की गणना करें।" "मौका की गणना करें। एक सर्जिकल साइट संक्रमण, "आपके पास क्या है। "धोखाधड़ी वाले लेनदेन के होने की संभावना की गणना करें।" एक नागरिक डेटा वैज्ञानिक के रूप में, मैं इस बहुत ही परिष्कृत गणित का उपयोग कर सकता हूं जिसे किसी और ने बनाया है, हो सकता है कि इनमें से एक डेटा वैज्ञानिकों ने मेरे संगठन के भीतर बनाया हो।

डेटा विज्ञान के दृष्टिकोण से, आप जानते हैं, मैंने उन डेटा वैज्ञानिकों से बात की है जो कोड लिखना पसंद करते हैं, और मैंने उन डेटा वैज्ञानिकों से बात की है जिन्हें कोड लिखने से नफरत है। और यह ठीक है, इसलिए हमारे पास एक बहुत ही दृश्य, ग्राफिकल यूजर इंटरफेस है। हम अपना डेटा हड़प सकते हैं, हम अपना स्वचालित डेटा स्वास्थ्य जाँच कर सकते हैं, और शायद मैं कोड लिखना चाहता हूँ। मुझे पायथन पसंद है, मुझे आर पसंद है, लेकिन विचार यह है, ये डेटा वैज्ञानिक, वे कम आपूर्ति में हैं, और वे एक विशेष भाषा में कोड पसंद करते हैं। हमें विशेष रूप से पसंद नहीं है कि आप किस भाषा में कोड करना चाहते हैं, इसलिए यदि आप R करना चाहते हैं, तो R करें; यदि आप पायथन करना चाहते हैं, तो पायथन करें। एक दम बढ़िया। यदि आप एज़्योर के लिए अपने एनालिटिक्स को तोड़ना चाहते हैं, तो अपने एनालिटिक्स को क्लाउड पर फट करें। और इसलिए यहां लक्ष्य वास्तव में लचीलेपन और विकल्पों की पेशकश करना है जो आपके डेटा वैज्ञानिकों को उतना ही उत्पादक बना सकते हैं जितना वे हो सकते हैं।

अब डेटा वैज्ञानिक, वे बहुत स्मार्ट लोग हैं, लेकिन शायद वे हर चीज के विशेषज्ञ नहीं हैं, और हो सकता है कि वे जो कुछ कर सकते हैं उसमें कुछ अंतराल हो। और अगर आप उद्योग के भीतर देखते हैं, तो बहुत सारे अलग-अलग विश्लेषणात्मक बाज़ार हैं जो वहां मौजूद हैं। यह एक उदाहरण है, शायद मुझे छवि पहचान करने की आवश्यकता है और मेरे पास वह कौशल नहीं है, हो सकता है कि मैं अल्गोरिद्मिया में जाऊं और छवि पहचान एल्गोरिथ्म प्राप्त करूं। हो सकता है कि मैं अपर्विता के पास जाऊं और एक बहुत ही खास हेल्थकेयर एल्गोरिथ्म प्राप्त करूं। शायद मैं एज़्योर मशीन लर्निंग लाइब्रेरी में कुछ उपयोग करना चाहता हूं। शायद मैं मूल सांख्यिकीय मंच में कुछ का उपयोग करना चाहता हूं।

फिर, यहाँ विचार यह है कि हम वैश्विक विश्लेषिकी समुदाय का लाभ उठाना चाहते हैं। क्योंकि आप अपनी चार दीवारों के भीतर सभी कौशल रखने वाले नहीं हैं, इसलिए हम सॉफ़्टवेयर कैसे बना सकते हैं - और यह हम क्या कर रहे हैं - जो आपके डेटा वैज्ञानिकों को विभिन्न प्रकार के मार्केटप्लेस से एल्गोरिदम का उपयोग करने की अनुमति देता है। हम इसे लंबे समय से आर और पायथन के साथ कर रहे हैं, लेकिन यह इन ऐप मार्केटप्लेस के लिए विस्तार कर रहा है जो वहां मौजूद हैं। और जो आप यहां देख रहे हैं, इसके शीर्ष पर हम स्पार्क पर एच 2 ओ का उपयोग कर रहे हैं, इसलिए वहां बहुत सारे विश्लेषणात्मक एल्गोरिदम हैं। आपको इन्हें स्क्रैच से बनाने पर ध्यान केंद्रित करने की आवश्यकता नहीं है, आइए इनका पुनः उपयोग करें जो खुले स्रोत समुदाय में रहते हैं, और हम चाहते हैं कि ये लोग यथासंभव उत्पादक हों।

अगला कदम, जब हमारे पास हमारे नागरिक डेटा वैज्ञानिक और हमारे डेटा वैज्ञानिक हैं, तो वास्तव में आप कैसे इन सर्वोत्तम प्रथाओं को बढ़ावा देते हैं और वितरित करते हैं? हमारे पास हमारे सॉफ़्टवेयर में तकनीक है जो आपको कहीं भी एनालिटिक्स वितरित करने की अनुमति देती है। और यह एक मॉडल प्रबंधन के दृष्टिकोण से अधिक है, लेकिन अब मैं चार दीवारों या तुलसा या ताइवान या कैलिफोर्निया के भीतर एक विशिष्ट स्थापना से बाध्य नहीं हूं, या आपके पास क्या है। यह एक वैश्विक मंच है, और हमारे पास कई, कई ग्राहक हैं जो इसे कई साइटों द्वारा इसके उपयोग में तैनात किए गए हैं।

और इसलिए वास्तव में, प्रमुख चीजें हैं, अगर आप ताइवान में कुछ कर रहे हैं और आप इसे ब्राजील में दोहराना चाहते हैं, तो यह बहुत अच्छा है। वहाँ जाओ, पुन: प्रयोज्य टेम्पलेट्स को पकड़ो, आप चाहते हैं कि वर्कफ़्लोज़ को पकड़ो। यह उन मानकों और चीजों को करने का सामान्य तरीका बनाने की कोशिश कर रहा है, इसलिए हम हर जगह चीजों को पूरी तरह से अलग नहीं कर रहे हैं। और इसका दूसरा प्रमुख घटक, क्या वास्तव में हम गणित को उस स्थान पर ले जाना चाहते हैं जहाँ डेटा रहता है। आप के बीच डेटा फेरबदल करने की जरूरत नहीं है, आप जानते हैं, कैलिफोर्निया और तुलसा और ताइवान और ब्राजील। हमारे पास ऐसी तकनीक है जो हमें गणित को डेटा तक ले जाने की अनुमति देती है, और हम उस विषय पर एक और हॉट टेक्नोलॉजी वेबकास्ट करने जा रहे हैं।

लेकिन हम इस वास्तुकला को कहते हैं, और यहाँ एक चुपके झलक है, मूल निवासी वितरित विश्लेषिकी वास्तुकला। इसके पीछे महत्वपूर्ण विचार यह है कि हमारे पास एक मंच है, स्टेटिस्टिका, और मैं एक परमाणु के रूप में एक विश्लेषणात्मक वर्कफ़्लो का निर्यात कर सकता हूं। और मैं एक मॉडल, या संपूर्ण वर्कफ़्लो कर सकता था, ताकि कोई फर्क न पड़े। लेकिन मैं इसे बना सकता हूं, और इसे लक्ष्य प्लेटफॉर्म के लिए उपयुक्त भाषा में निर्यात कर सकता हूं। इसके बाईं ओर, बहुत सारे लोग ऐसा करते हैं, लेकिन वे स्रोत प्रणाली में स्कोरिंग करते हैं। यह ठीक है, हम स्कोरिंग कर सकते हैं और हम डेटाबेस में मॉडल निर्माण कर सकते हैं, इसलिए यह दिलचस्प है।

और फिर दाईं ओर, हमारे पास Boomi है। यह एक साथी तकनीक है, हम इन सभी के साथ काम करते हैं। लेकिन हम इन वर्कफ़्लो को भी ले सकते हैं, और अनिवार्य रूप से इसे दुनिया में कहीं भी ले जा सकते हैं। कोई भी चीज जिसका IP पता हो। और मुझे सार्वजनिक या निजी क्लाउड पर स्टैटिस्टिकिका स्थापित करने की आवश्यकता नहीं है। जो कुछ भी जेवीएम चला सकता है, हम इन विश्लेषणात्मक वर्कफ़्लोज़, डेटा प्रीप वर्कफ़्लोज़, या इनमें से किसी भी लक्ष्य प्लेटफ़ॉर्म पर केवल मॉडल चला सकते हैं। चाहे वह मेरे सार्वजनिक या निजी क्लाउड में हो, चाहे वह मेरे ट्रैक्टर में हो, मेरी कार, मेरे घर, मेरे लाइटबल्ब, मेरी इंटरनेट ऑफ़ थिंग्स में, हमारे पास ऐसी तकनीक हो, जो आपको दुनिया में कहीं भी उन वर्कफ़्लोज़ को ले जाने की अनुमति दे।

पिछली समीक्षा। आप जानते हैं, हमारे पास व्यावसायिक उपयोगकर्ताओं की लाइन है, इसलिए इन लोगों के पास, हमारे पास तकनीक है कि हम उन्हें एक प्रारूप में आउटपुट का उपभोग करने की अनुमति देते हैं, जिसके साथ वे सहज हैं। हमारे पास नागरिक डेटा वैज्ञानिक हैं, और हम जो करने की कोशिश कर रहे हैं, वह सहयोग में सुधार कर रहा है, उन्हें एक टीम का हिस्सा बना सकता है, है ना? और इसलिए हम चाहते हैं कि लोग पहिए को फिर से लगाना बंद करें। और हमारे पास ये डेटा वैज्ञानिक हैं, वहां एक कौशल अंतर हो सकता है, लेकिन वे जिस भाषा में चाहें कोड कर सकते हैं, वे विश्लेषणात्मक बाजारों में जा सकते हैं और वहां एल्गोरिदम का उपयोग कर सकते हैं। और इसके साथ, आप यह कैसे नहीं सोच सकते हैं कि सब कुछ इस के साथ भयानक है? यह सही है, यही हम कर रहे हैं। हम पुन: प्रयोज्य वर्कफ़्लो का निर्माण कर रहे हैं, हम लोगों को निर्देश दे रहे हैं, हम उन्हें लेगो ब्लॉक दे रहे हैं ताकि वे इन शक्तिशाली महल का निर्माण कर सकें और जो भी वे करना चाहते हैं। इसे योग करने के लिए, हमारे पास एक मंच है जो व्यापार उपयोगकर्ताओं, नागरिक डेटा वैज्ञानिकों, प्रोग्रामर डेटा वैज्ञानिकों की सशक्तिकरण लाइन है, हमारे पास है - हम किसी भी प्रकार के IoT एज एनालिटिक्स उपयोग के मामले को संबोधित कर सकते हैं, और हम सामूहिक बुद्धि की इस धारणा को सक्षम कर रहे हैं। इसके साथ, मुझे लगता है कि हम शायद इसे प्रश्नों के लिए खोल देंगे।

रॉबिन ब्लोर: ठीक है। मुझे लगता है कि पहला - मेरा मतलब है, ईमानदार होना, मेरा मतलब है कि मुझे पहले डेल स्टैटिस्टिका द्वारा ब्रीफ किया गया है, और ईमानदार होने के लिए मैं वास्तव में उन चीजों पर काफी आश्चर्यचकित हूं जो मुझे नहीं पता था कि आप प्रस्तुति में लाए थे । और मुझे यह कहना है कि एक चीज, यह कुछ ऐसा है जो मेरे लिए एनालिटिक्स को अपनाने के लिए एक बगिया है, क्या आप जानते हैं, उपकरण प्राप्त करना यह नहीं है, आप जानते हैं? वहाँ एक भयानक बहुत सारे उपकरण हैं, वहाँ खुला स्रोत उपकरण है, और इतने पर और आगे, और वहाँ विभिन्न है, मैं क्या कहूँगा, अर्द्ध प्लेटफार्मों। लेकिन मुझे लगता है कि आपके पास जो अंतर है, मैं विशेष रूप से कुछ वर्कफ़्लो से प्रभावित था।

लेकिन आप अंतर को अंत प्रदान करने के लिए लग रहे हैं। यह एनालिटिक्स की तरह एक परिष्कृत व्यवसाय प्रक्रिया है जो डेटा के अधिग्रहण से शुरू होती है और फिर यह डेटा की कितनी परतदार होती है, इसके आधार पर चरणों की एक पूरी श्रृंखला से गुजरती है, और फिर यह विभिन्न गणितीय हमलों की एक पूरी श्रृंखला में शाखा कर सकती है डेटा। और फिर परिणाम एक तरह से या किसी अन्य रूप में सामने आते हैं और उन पर कार्रवाई करने की आवश्यकता होती है। जहाँ मैंने बहुत सारे महान काम किए हैं, वहां बहुत अधिक मात्रा में एनालिटिक्स हैं, लेकिन इसे एक्शन में नहीं रखा गया है। और आपको लगता है कि बहुत जरूरी है। मुझे नहीं पता कि यह कितना व्यापक है, लेकिन यह मेरी अपेक्षा से अधिक व्यापक है। मैं अविश्वसनीय रूप से उससे प्रभावित हूं।

मैं चाहूंगा कि आप स्प्रैडशीट पर टिप्पणी करें। आप पहले से ही कुछ कह चुके हैं, लेकिन उन चीजों में से एक जो मैंने नोट किया है, और मैंने वर्षों से नोट किया है, लेकिन यह सिर्फ अधिक से अधिक स्पष्ट हो गया है, क्या यह स्प्रेडशीट का एक बहुत कुछ है जो छाया प्रणाली हैं और वास्तव में मुझे लगता है स्प्रेडशीट, मेरा मतलब है, यह एक अद्भुत उपकरण था जब इसे पेश किया गया था और यह कई तरीकों से बहुत शानदार रहा है, लेकिन यह एक सामान्यीकृत उपकरण है, यह वास्तव में उद्देश्य के लिए फिट नहीं है। यह निश्चित रूप से बीआई संदर्भ में बहुत अच्छा नहीं है और मुझे लगता है कि यह एनालिटिक्स के संदर्भ में भयानक है। और मुझे आश्चर्य हुआ कि क्या आपके पास इसके बारे में कुछ टिप्पणी करने के लिए है, आइए बताते हैं कि, उदाहरण के लिए, आपको पता है कि, स्टेटिस्टिका ने बाहर निकाल दिया है, अत्यधिक स्प्रैडशीट का उपयोग किया है, या आप उस बारे में कोई टिप्पणी करना चाहते हैं?

डेविड स्वीनर: हाँ मुझे लगता है कि, आप जानते हैं, आप प्रसिद्ध स्प्रेडशीट गलतियों को देख सकते हैं। Google या जो भी खोज इंजन आप उपयोग कर रहे हैं वह परिणामों के लिटनी के साथ वापस आएगा। मुझे नहीं लगता, आप जानते हैं, हम कभी भी स्प्रैडशीट की जगह लेंगे। यह हमारा उद्देश्य नहीं है, लेकिन बहुत सारे संगठन जो मैं जाते हैं, इन स्प्रेडशीट जादूगरों या निनजाओं या जो भी आप उन्हें कॉल करना चाहते हैं, उनमें से एक युगल है, लेकिन उनके पास ये बहुत ही परिष्कृत स्प्रैडशीट हैं और आपको सोचना होगा कि ये क्या होता है लोग लोट्टो जीतते हैं और वे वापस नहीं आते हैं? और इसलिए हम जो करने की कोशिश कर रहे हैं, हम जानते हैं कि स्प्रेडशीट मौजूद होगी इसलिए हम उन को निगलना कर सकते हैं, लेकिन मुझे लगता है कि हम जो करने की कोशिश कर रहे हैं, वह आपके वर्कफ़्लो का एक विज़ुअल प्रतिनिधित्व विकसित कर रहा है ताकि इसे अन्य लोगों के साथ समझा और साझा किया जा सके। । स्प्रेडशीट बहुत कठिन हैं, साझा करने के लिए बहुत कठिन हैं। और जैसे ही आप अपनी स्प्रेडशीट मेरे पास करेंगे, मैंने इसे बदल दिया है, और अब हम सिंक से बाहर हो गए हैं और हमें अलग-अलग उत्तर मिल रहे हैं। हम जो करने की कोशिश कर रहे हैं वह इस के आसपास कुछ रेलिंग लगाता है और चीजों को थोड़ा अधिक कुशल बनाता है। और स्प्रेडशीट वास्तव में कई डेटा सेटों को एक साथ जोड़कर भयानक हैं, आप जानते हैं? वे वहीं गिर पड़े। लेकिन हम उन्हें प्रतिस्थापित करने नहीं जा रहे हैं, हम उन्हें निगलना चाहते हैं और हमारे पास ऐसे लोग हैं जो बदलाव करना शुरू कर रहे हैं क्योंकि अगर हमारे पास एक नोड है जो कहता है कि "जोखिम की गणना करें" यही वह व्यक्ति है जो स्प्रेडशीट का उपयोग कर रहा है। तो वे चले गए।

रॉबिन ब्लोर: हाँ, मेरा मतलब है, मैं कहूंगा कि, आप जानते हैं, कि मैं जिन चीजों को देखता हूं, उनमें से एक से, मैं कहता हूं कि स्प्रेडशीट जानकारी बनाने के लिए महान हैं। वे ज्ञान के द्वीप बनाने के लिए भी महान हैं, लेकिन वे ज्ञान साझा करने के लिए वास्तव में खराब हैं। उनके पास ऐसा कोई तंत्र नहीं है कि आप जो भी करें, और यदि आप किसी पर स्प्रेडशीट पास करते हैं, तो ऐसा नहीं है कि आप इसे पढ़ सकते हैं जैसे कि यह एक लेख है जिसमें बताया गया है कि वे वास्तव में क्या कर रहे हैं। यह सिर्फ वहाँ नहीं है। मुझे लगता है, आप जानते हैं, जिस चीज ने मुझे प्रस्तुति के बारे में और स्टेटिस्टिका की क्षमताओं के बारे में सबसे अधिक प्रभावित किया, वह अविश्वसनीय रूप से कृषि-संबंधी प्रतीत होता है। लेकिन यह वर्कफ़्लो के माध्यम से चल रहा है यह धागा है। क्या मैं यह मानने के लिए सही हूं कि आप अंत-से-अंत वर्कफ़्लो को देख सकते हैं, आप जानते हैं, डेटा अधिग्रहण से लेकर विशेष रूप से BI अनुप्रयोगों या यहां तक ​​कि चल रहे अनुप्रयोगों में एम्बेडिंग परिणामों तक?

डेविड स्वीनर: हाँ, बिल्कुल। और इसकी अंत-टू-एंड क्षमता है और कुछ संगठन उस पूर्णता का उपयोग करते हैं, और मैं किसी भ्रम में नहीं हूं कि कोई भी कंपनी इन दिनों एक विक्रेता से सब कुछ खरीदती है। हमारे पास एक मिश्रण है। कुछ लोग स्टैटिस्टिका का उपयोग हर चीज के लिए करते हैं और कुछ लोग इसका उपयोग मॉडलिंग वर्कफ़्लोज़ के लिए करते हैं, कुछ लोग इसका उपयोग डेटा प्रस्तुतिकरण वर्कफ़्लो के लिए करते हैं। कुछ लोग इंजीनियरों को सैकड़ों इंजीनियरिंग रिपोर्ट वितरित करने के लिए इसका उपयोग करते हैं। और इसलिए हमारे बीच सब कुछ है। और यह वास्तव में एंड-टू-एंड है और आप जानते हैं, एक अज्ञेय मंच है, जिसमें यदि कोई एल्गोरिदम है जिसे आप आर या पायथन, एज़्योर, एपरविटा में उपयोग करना चाहते हैं, तो आप जो भी जानते हैं, उन का उपयोग करें। यह बहुत अच्छा है, उत्पादक बनें, जो आप जानते हैं उसका उपयोग करें, आप जिस चीज के साथ सहज हैं उसका उपयोग करें और हमारे पास यह सुनिश्चित करने के लिए तंत्र हैं कि वे नियंत्रित और श्रव्य हैं और यह सभी प्रकार की चीजें हैं।

रॉबिन ब्लोर: मैं विशेष रूप से इसके उस पहलू को पसंद करता हूं। मेरा मतलब है, मुझे नहीं पता कि क्या आप उससे बाहर बात कर सकते हैं, जो आपके धन के बारे में कहा है। मेरा मतलब है, मैंने इसे देखा है, लेकिन मैंने इसे व्यापक रूप में नहीं देखा है और निश्चित रूप से हमारे पुस्तकालयों में अजगर पुस्तकालयों की एक बड़ी मात्रा है, लेकिन क्या आप उस तस्वीर को जोड़ सकते हैं? क्योंकि मुझे लगता है कि यह एक बहुत ही दिलचस्प बात है, आप जानते हैं, यह विचार कि आपके पास ऐसे घटक होंगे जो भरोसेमंद थे, क्योंकि आप जानते थे कि विभिन्न लोग जो उन्हें बनाएंगे और विभिन्न लोग जो उनका उपयोग कर रहे थे, जिन्हें आप डाउनलोड कर सकते हैं। आप जानते हैं, क्या आप उस बारे में जो पहले ही कह चुके हैं, उसे समृद्ध कर सकते हैं?

डेविड स्वीनर: हाँ, मुझे लगता है कि कुछ ऐप मार्केटप्लेस हैं, आप जानते हैं, एल्गोरिथ्म मार्केटप्लेस जो बाहर हैं। उदाहरण के लिए, आप जानते हैं, लोवा विश्वविद्यालय में डॉ। जॉन क्रॉमवेल, उन्होंने एक ऐसा मॉडल विकसित किया है जो भविष्यवाणी करेगा, जिसका वास्तविक समय में उपयोग किया जा रहा है, जबकि आप एक स्कोर प्राप्त करेंगे, यदि आप एक प्राप्त करने जा रहे हैं सर्जिकल साइट संक्रमण। और अगर वह स्कोर काफी अधिक है तो वे ऑपरेटिंग रूम में एक हस्तक्षेप करेंगे। यह तो बहुत ही मज़ेदार है। तो शायद एक और अस्पताल है जो उतना बड़ा नहीं है। वैसे, अपर्विता एनालिटिक्स के लिए एक हेल्थ ऐप मार्केटप्लेस है। आप या तो इन ऐप मार्केटप्लेस में से किसी एक में जा सकते हैं, आप एक को ढूंढ सकते हैं और उन्हें फिर से उपयोग कर सकते हैं, और लेन-देन आपके बीच है और जो कोई भी इसका मालिक है, लेकिन आप या तो एक ढूंढ सकते हैं या आप कह सकते हैं, "यहां मुझे क्या चाहिए। "मुझे लगता है कि यह उस वैश्विक समुदाय को परेशान कर रहा है क्योंकि हर कोई इन दिनों एक विशेषज्ञ है, और आप सब कुछ नहीं जान सकते। मुझे लगता है कि आर और पायथन एक बात है, लेकिन यह विचार, "मैं इस फ़ंक्शन को करना चाहता हूं, इन ऐप बाजार स्थानों में से एक पर एक कल्पना डाल दिया है और किसी ने इसे आपके लिए विकसित किया है।" और वे इसे मुद्रीकृत कर सकते हैं, मुझे लगता है। यह बहुत दिलचस्प है और विशुद्ध रूप से खुले स्रोत मॉडल से बहुत अलग है।

रॉबिन ब्लर: बिलकुल ठीक। वैसे भी, मैं गेंद को डीज़ को पास कर दूँगा। क्या आप डीज़ में गोता लगाना चाहेंगे?

Dez Blanchfield: बिल्कुल और मैं एक पल के लिए स्प्रेडशीट की चीज़ पर बने रहना चाहता हूं क्योंकि मुझे लगता है कि इसने बहुत सारी चीज़ों के अधिकार को पकड़ लिया है जिसके बारे में हम यहाँ बात कर रहे हैं। और आपने एक टिप्पणी की, रॉबिन ने, अपने भौतिक रूप में इलेक्ट्रॉनिक रूप में पुराने स्प्रैडशीट से संक्रमण के संबंध में। हमारे पास एक दिलचस्प बात थी जहां आप जानते हैं, जब स्प्रैडशीट मूल रूप से एक चीज थी, वे पंक्तियों और स्तंभों के साथ सिर्फ कागज की शीट थीं और आप मैन्युअल रूप से चीजों को लिखेंगे, तब आप पावर करेंगे और उन्हें गणना करेंगे, या तो करके यह आपके सिर के ऊपर या किसी अन्य उपकरण के साथ बंद है। लेकिन हम अभी भी लिखावट की गलतियों या डिस्लेक्सिया के साथ त्रुटियों को कम करने का अवसर रखते हैं, और अब हमने इसे टाइपोस के साथ बदल दिया है। जोखिम यह है कि स्प्रेडशीट के साथ जोखिम प्रोफ़ाइल अधिक तेज़ और बड़ा है, लेकिन मुझे लगता है कि स्टेटिस्टिका जैसे उपकरण जोखिम पिरामिड को उलट देते हैं।

मैं अक्सर एक व्यक्ति के रूप में एक छड़ी के शीर्ष पर एक व्यक्ति के व्हाइटबोर्ड पर इस चित्र को खींचता हूं, और फिर नीचे से उनमें से एक संग्रह, चलो कहता हूं, उस व्हाइटबोर्ड के नीचे उनमें से दस की कल्पना करो, और मैं आकर्षित करता हूं पिरामिड जहां पिरामिड का बिंदु एकल व्यक्ति और पिरामिड के लोगों के पैर का बिंदु है। और मैं इसका उपयोग इस विचार को देखने के लिए करता हूं कि यदि शीर्ष पर एक व्यक्ति एक स्प्रेडशीट करता है तो वह गलती करता है और इसे दस लोगों के साथ साझा करता है, और अब हमें त्रुटि की दस प्रतियां मिली हैं। अपने मैक्रोज़ के साथ बहुत सावधान रहें और यदि आप उस ओर जाने वाले हैं तो अपने Visual Basic से बहुत सावधान रहें। क्योंकि जब हम स्प्रेडशीट जैसे इलेक्ट्रॉनिक उपकरण बनाते हैं तो यह बहुत शक्तिशाली होता है, लेकिन यह अच्छे और बुरे तरीके से भी शक्तिशाली होता है।

मुझे लगता है कि स्टैटिस्टिका जैसे उपकरण उस जोखिम प्रोफ़ाइल को पलटने की क्षमता के बारे में लाते हैं और वह यह है कि अब आप उस बिंदु पर पहुंच सकते हैं जहां आपको बहुत सारे उपकरण मिले हैं जो व्यक्तिगत व्यक्ति के लिए उपलब्ध हैं और जैसा कि वे बहुत सारे उपकरणों से ऊपर जाते हैं पिरामिड और फिर बहुत नीचे तक जहां पिरामिड का बिंदु अब उल्टा हो रहा है, वास्तविक उपकरण है, अगर हमें उन लोगों की एक टीम मिल गई है जो उन उपकरणों और उन एल्गोरिदम का निर्माण कर रहे हैं। और डेटा वैज्ञानिक को अपने डेटा पर प्रतिगामी विश्लेषण में विशेषज्ञ होने की आवश्यकता नहीं है। वे उपकरण का उपयोग करने में सक्षम हो सकते हैं, लेकिन आपके पास पांच या छह सांख्यिकीविद और एक एक्टिविस्ट और एक डेटा वैज्ञानिक और उस उपकरण पर काम करने वाले कुछ गणितज्ञ, उस मॉड्यूल, उस एल्गोरिथ्म, प्लग-इन और स्प्रैडशीट समानता में हो सकते हैं, इसलिए कल्पना करें कि आपके द्वारा उपयोग की जा सकने वाली प्रत्येक स्प्रेडशीट को वास्तव में उन विशेषज्ञों द्वारा लिखा गया था जिन्होंने मैक्रोज़ का परीक्षण किया, विज़ुअल बेसिक का परीक्षण किया, यह सुनिश्चित किया कि एल्गोरिदम ने काम किया है, इसलिए जब आपको यह मिला तो आप इसे केवल पॉप डेटा में बदल सकते थे लेकिन आप वास्तव में इसे तोड़ नहीं सकते थे और इसलिए इसे नियंत्रित करना बेहतर है।

मुझे लगता है कि बहुत सारे एनालिटिक्स टूल ऐसा कर रहे हैं। मुझे लगता है कि इस बिंदु पर आने का अनुमान है, क्या आप उस क्षेत्र में देख रहे हैं, क्या आप स्प्रैडशीट से संक्रमण देख रहे हैं जो संभावित रूप से त्रुटियों और गलतियों और जोखिम को धक्का दे सकता है, उस बिंदु पर जहां उपकरण आपके साथ बन रहे हैं। प्लेटफ़ॉर्म अब, डेटा की खोज वास्तविक समय में सटीक है और जो लोग मॉड्यूल और एल्गोरिदम का निर्माण कर रहे हैं, वे उस जोखिम प्रोफ़ाइल को हटा या कम कर रहे हैं? क्या ग्राहक सेवा को वास्तविक अर्थों में देख रहे हैं या आपको लगता है कि यह सिर्फ हो रहा है और उन्हें इसका एहसास नहीं है?

डेविड स्वीनर: आप जानते हैं, मुझे लगता है कि इसका उत्तर देने के लिए कुछ तरीके हैं। लेकिन जो कुछ भी हम देख रहे हैं, आप किसी भी संगठन में जानते हैं, और मैंने उल्लेख किया है कि मुझे लगता है कि एनालिटिक्स शायद एक कॉर्पोरेट निवेश के दृष्टिकोण से पिछड़ गया है, जिस तरह का हमने डेटा वेयरहाउसिंग और सीआरएम के साथ किया था। लेकिन हम जो देख रहे हैं, इसलिए उस संगठनात्मक जड़ता को खत्म करने के लिए एक संगठन को बदलने में बहुत कुछ लगता है। लेकिन हम जो देख रहे हैं, लोग उनकी स्प्रेडशीट ले रहे हैं, उनके वर्कफ़्लो ले रहे हैं, और मैंने सुरक्षा और शासन का उल्लेख किया, "ठीक है, शायद मेरे पास एक स्प्रेडशीट है, " "ठीक है, मैं इसे नीचे लॉक कर सकता हूं और मैं इसे नियंत्रित कर सकता हूं।" हम बहुत सारे संगठन देखते हैं, शायद वे वहीं से शुरू करते हैं। और अगर यह बदल गया है, तो एक वर्कफ़्लो है और मैं अंत में जा रहा हूं, हालांकि नंबर एक, जिसने इसे बदल दिया? उन्होंने इसे क्यों बदला। जब उन्होंने इसे बदल दिया। और मैं एक वर्कफ़्लो भी सेट कर सकता हूं जैसे कि मैं इस नई स्प्रेडशीट को उत्पादन में नहीं डालने जा रहा हूं, जब तक कि इसे एक, दो, तीन द्वारा सत्यापित और सत्यापित नहीं किया जाता है, हालांकि कई पार्टियां जिन्हें आप अपने वर्कफ़्लो में परिभाषित करना चाहते हैं। मुझे लगता है कि लोग लेना शुरू कर रहे हैं, और संगठन वहां बेबी कदम उठाना शुरू कर रहे हैं, लेकिन मैं शायद सुझाव दूंगा कि हमें अभी एक लंबा रास्ता तय करना है।

Dez Blanchfield: वास्तव में और मुझे लगता है कि आप सुरक्षा नियंत्रण और वहां के शासन दोनों में निर्माण कर रहे हैं, तो कार्यभार स्वचालित रूप से और सब कुछ मुख्य जोखिम अधिकारी तक पहुंच सकता है, जो अब एक बात है। आप यह नियंत्रित करना शुरू कर सकते हैं कि उन उपकरणों और प्रणालियों को कैसे एक्सेस किया जा रहा है और कौन क्या कर रहा है, इसलिए यह बहुत शक्तिशाली है। मुझे लगता है कि इसमें आने वाली दूसरी चीजें यह है कि आपके लिए जो प्रकार के उपकरण प्रदान करते हैं, वे मेरे लिए मानव व्यवहार से अधिक पारंपरिक स्प्रेडशीट के लिए उधार देते हैं, जिसके बारे में हम बात कर रहे हैं, अगर मुझे लोगों से भरा कमरा मिला है उसी डैशबोर्ड और उसी डेटा तक पहुंच के साथ, जो वे वास्तव में एक अलग दृश्य प्राप्त कर सकते हैं और परिणामस्वरूप, एक ही जानकारी से थोड़ा अलग अंतर्दृष्टि प्राप्त करते हैं, जो उनकी आवश्यकताओं के अनुरूप है ताकि वे सहयोग कर सकें। तब हमारे पास व्यापार और निर्णय लेने की प्रक्रिया के साथ एक अधिक मानवीय दृष्टिकोण और बातचीत होती है, जैसा कि सभी एक ही पावरपॉइंट के साथ एक ही बैठक में जाने का विरोध करते हैं, और एक ही स्प्रेडशीट का प्रिंट आउट, सभी समान डेटा।

क्या आपको संगठनों में व्यवहार और संस्कृति में एक संक्रमण दिखाई देता है, जो अब आपके उपकरण उठाते हैं, जहां वे देखते हैं कि यह जगह ले रहा है, जहां यह कमरे के पांच लोगों की तरह नहीं है, जो एक ही स्प्रेडशीट को देख रहे हैं, इसे केवल मौखिक रूप से देखने और उस पर नोट्स बनाने की कोशिश कर रहे हैं, लेकिन अब वे वास्तव में डैशबोर्ड्स और उपकरणों के साथ वास्तविक समय में बातचीत कर रहे हैं, उनकी उंगलियों पर विज़ुअलाइज़ेशन और एनालिटिक्स के साथ और न केवल बैठकों में, बल्कि संगठन के चारों ओर केवल सामान्य सहयोग पर बातचीत और बातचीत पर पूरी तरह से अलग प्रवाह प्राप्त कर रहे हैं? क्योंकि वे इसे वास्तविक समय में कर सकते हैं, क्योंकि वे प्रश्न पूछ सकते हैं और वास्तविक उत्तर प्राप्त कर सकते हैं। क्या आप इस समय एक ट्रेंड देख रहे हैं या अभी तक ऐसा नहीं हुआ है?

डेविड स्वीनर: नहीं, मुझे लगता है कि यह निश्चित रूप से उस रास्ते से शुरू हुआ है और मुझे लगता है कि बहुत ही दिलचस्प बात है, आप जानते हैं, अगर हम एक कारखाने का उदाहरण लेते हैं, उदाहरण के लिए। हो सकता है कि कोई व्यक्ति जो उस कारखाने के भीतर एक विशेष प्रक्रिया क्षेत्र का मालिक हो, वे एक निश्चित तरीके से इस डेटा को देखना और बातचीत करना चाहते हैं। और शायद मुझे, सभी प्रक्रियाओं को नजरअंदाज करते हुए, शायद यह एक तल पर है, शायद मैं इसे हर चीज पर देखना चाहता हूं। मुझे लगता है कि हम जो देख रहे हैं, वह नंबर एक है, लोग अपने संगठनों के भीतर विज़ुअलाइज़ेशन या मानक विज़ुअलाइज़ेशन के एक सामान्य सेट का उपयोग करना शुरू कर रहे हैं, लेकिन यह भी भूमिका के अनुरूप है। वह व्यक्ति जो आपूर्ति श्रृंखला के दृष्टिकोण से इसे देख रहा है, की तुलना में बहुत अलग दृष्टिकोण है, और मुझे लगता है कि यह बहुत अच्छा है क्योंकि इसे सिलवाया जाना है और इसे लेंस के माध्यम से देखना होगा जिसे आपको अपना काम पूरा करने की आवश्यकता है।

डीज़ ब्लांचफील्ड: मुझे लगता है कि निर्णय प्रक्रिया में समय, समय-वार और गति आती है, वास्तव में स्मार्ट और सटीक निर्णय लेने के लिए तेजी से बढ़ता है, है ना? क्योंकि अगर आपको रियल-टाइम एनालिटिक्स, रियल-टाइम डैशबोर्ड्स मिल गए हैं, अगर आपको अपनी उंगलियों पर स्टैटिस्टिकिका टूल मिल गए हैं, तो आपको किसी चीज़ के बारे में जाने और किसी से पूछने के लिए फर्श के पार नहीं जाना होगा, आपको मिल गया है हार्ड कॉपी में। आप मक्खी पर सहयोग कर सकते हैं, बातचीत कर सकते हैं और वास्तव में निर्णय ले सकते हैं। जो मुझे लगता है कि कुछ कंपनियों ने वास्तव में अभी तक नहीं समझा है, लेकिन जब वे ऐसा करते हैं, तो यह इस यूरेका का क्षण होगा कि हां, हम अभी भी अपने क्यूबिकल में रह सकते हैं और घर पर काम कर सकते हैं, लेकिन हम बातचीत कर सकते हैं और उन फैसलों को पूरा कर सकते हैं जैसा कि हम सहयोग करते हैं, हम परिणामों में तुरंत बदल जाते हैं। देखो, मुझे लगता है कि यह सुनना शानदार था कि आपको अब तक क्या कहना है और मैं वास्तव में आगे देख रहा हूं कि यह कहां जाता है। और मुझे पता है कि हमने प्रश्नोत्तर में बहुत सारे प्रश्न प्राप्त किए हैं, इसलिए मैं रेबेका को वापस चलाने जा रहा हूं ताकि उनमें से कुछ के माध्यम से चला जाऊं ताकि हम उन तक जल्दी से जल्दी पहुंच सकें। आपका बहुत बहुत धन्यवाद।

रेबेका जोजवाक: थैंक्स डीज़ और यस डेव, हमारे पास दर्शकों के कुछ सवाल हैं। और अपनी अंतर्दृष्टि के लिए डीज़ और रॉबिन को भी धन्यवाद। मुझे पता है कि इस विशेष प्रतिभागी को घंटे के शीर्ष पर सही छोड़ना था, लेकिन वह पूछ रहा है कि क्या आप देखते हैं कि सूचना प्रणाली विभाग उपकरणों को प्रदान करने में सहज होने के बजाय परिष्कृत डेटा नियंत्रणों पर अधिक प्राथमिकता देते हैं। ज्ञान कार्यकर्ता? मेरा मतलब है, वह है - आगे बढ़ो।

डेविड स्वीनर: हाँ, मुझे लगता है कि यह संगठन पर निर्भर करता है। मुझे लगता है कि एक बैंक, एक बीमा कंपनी, शायद उनकी अलग-अलग प्राथमिकताएं और काम करने के तरीके, बनाम एक विपणन संगठन हैं। मुझे लगता है कि मुझे यह कहना होगा कि यह केवल उस उद्योग और कार्य पर निर्भर करता है जिसे आप देख रहे हैं। विभिन्न उद्योगों में अलग-अलग फोकस और जोर होता है।

रेबेका जोजवाक: ठीक है, यह समझ में आता है। और फिर एक और सहभागी ने जानना चाहा, स्टैटिस्टिका के पीछे का इंजन क्या है? क्या यह सी ++ या आपका अपना सामान है?

डेविड स्वीनर: ठीक है, मुझे नहीं पता कि क्या मैं इसके साथ उस विशिष्ट को प्राप्त कर सकता हूं जो कि लगभग 30 वर्षों से है और इसे मेरे समय से पहले विकसित किया गया था, लेकिन विश्लेषणात्मक एल्गोरिदम का एक मुख्य पुस्तकालय है जो स्टेटिस्टिका एल्गोरिदम हैं जो चलते हैं। और आपने यहां देखा कि हम R को भी चला सकते हैं, हम पायथन को चला सकते हैं, हम Azure को फोड़ सकते हैं, हम H2O पर स्पार्क पर दौड़ सकते हैं, इसलिए मुझे लगता है कि मुझे उस प्रश्न का उत्तर देना होगा, यह विभिन्न प्रकार के इंजन हैं। और जो एल्गोरिथ्म आप चुनते हैं, उसके आधार पर, अगर यह एक स्टेटिस्टिका है तो यह इस तरह से चलता है, यदि आप एच 2 ओ और स्पार्क में से एक को चुनते हैं, तो यह उस का उपयोग करता है, और इसलिए यह उनमें से एक किस्म है।

रेबेका जोजवाक: ठीक है। एक अन्य सहभागी प्रकार ने विशेष रूप से इस स्लाइड की ओर इशारा करते हुए पूछा, यह जानना चाहते हैं, किस तरह का, नागरिक डेटा वैज्ञानिक कैसे जानता है कि कौन से पुन: प्रयोज्य टेम्पलेट्स का उपयोग करना है? और मुझे लगता है कि मैं इससे एक व्यापक सवाल करना चाहूंगा। कि, आप क्या देख रहे हैं जब लाइन-ऑफ-बिजनेस उपयोगकर्ता या व्यवसाय विश्लेषक आते हैं और वे इन उपकरणों का उपयोग करना चाहते हैं, तो उन्हें चुनना और चलाना कितना आसान है?

डेविड स्वीनर: मुझे लगता है कि मैं इसका उत्तर दूंगा और यदि आप उपयोग कर सकते हैं, यदि आप विंडोज से परिचित हैं, तो यह विंडोज-आधारित प्लेटफॉर्म है, इसलिए मैंने इन स्क्रीनशॉट के शीर्ष को काट दिया, लेकिन इसे विंडोज रिबन मिला है। लेकिन वे कैसे जानते हैं कि किस वर्कफ़्लो का उपयोग करना है? यह विंडोज एक्सप्लोरर की तरह दिखता है, इसलिए एक पेड़ की संरचना है और आप इसे कॉन्फ़िगर कर सकते हैं और इसे सेट कर सकते हैं हालांकि आपका संगठन इसे स्थापित करना चाहता है। लेकिन यह हो सकता है, आपके पास बस ये फ़ोल्डर्स होंगे और आप इन फ़ोल्डरों के भीतर इन पुन: प्रयोज्य टेम्पलेट्स को डाल देंगे। और मुझे लगता है कि संभवतया आपकी कंपनी कोई नामकरण कर सकती है, यहां "जोखिम प्रोफाइल की गणना करें, " यहां "इन स्रोतों से डेटा प्राप्त करें" और आप जो चाहें उन्हें नाम दें। यह सिर्फ एक निशुल्क फ़ोल्डर है, आप बस अपने कैनवास पर नोटों को बाहर खींचें। तो, बहुत आसान है।

रेबेका जोजवाक: ठीक है। शायद अगली बार एक डेमो। फिर एक अन्य सहभागी की उपस्थिति बढ़ती है, और यह वही है जो आप और रॉबिन और डीज़ के बारे में बात कर रहे थे, जहां तक ​​कि अशुद्धियों के बारे में, विशेष रूप से एक स्प्रेडशीट पर, लेकिन कचरा / कचरा बाहर, और वह इसे तब और महत्वपूर्ण होने के रूप में देखता है जब यह आता है विश्लेषण के लिए। यह उल्लेख करने की तरह, आप जानते हैं, डेटा का दुरुपयोग वास्तव में कुछ दुर्भाग्यपूर्ण निर्णय ले सकता है। और वह सोच रहा है कि आपके विचार अधिक फेलसेफ एल्गोरिदम के विकास पर क्या हैं, मुझे लगता है, वह शब्द का उपयोग करता है, एनालिटिक्स के "अति उत्साही" शब्द का उपयोग करता है। आप जानते हैं, कोई व्यक्ति आता है, वे वास्तव में उत्साहित हो जाते हैं, वे इन उन्नत एनालिटिक्स को करना चाहते हैं, वे इन उन्नत एल्गोरिदम को चलाना चाहते हैं, लेकिन शायद वे निश्चित नहीं हैं। तो आप उसके खिलाफ किस तरह की सुरक्षा करते हैं?

डेविड स्वीनर: हाँ, इसलिए मुझे लगता है कि मैं इसका जवाब सबसे अच्छे रूप में दे सकता हूं, लेकिन मुझे लगता है कि सब कुछ लोगों, प्रक्रिया और प्रौद्योगिकी के लिए नीचे आता है। हमारे पास ऐसी तकनीक है जो लोगों को सक्षम करने में मदद करती है और जो भी प्रक्रिया आप अपने संगठन में डालना चाहते हैं उसे सक्षम करने में मदद करती है। किसी को कूपन भेजने के उदाहरण में, शायद यह उतना महत्वपूर्ण नहीं है, और अगर यह डिजिटल है तो इसकी वास्तव में कोई कीमत नहीं है, शायद सुरक्षा नियंत्रण का एक स्तर है और शायद हम परवाह नहीं करते हैं। अगर मैं सर्जिकल साइट संक्रमण की भविष्यवाणी कर रहा हूं, तो शायद मैं इसके बारे में थोड़ा और सावधान रहना चाहता हूं। या अगर मैं दवा की गुणवत्ता और सुरक्षा और उस तरह की चीजों की भविष्यवाणी कर रहा हूं, तो शायद मैं इसके बारे में थोड़ा और सावधान रहना चाहता हूं। आप सही हैं, कचरा / कचरा बाहर निकालते हैं, इसलिए हम जो करने की कोशिश करते हैं वह एक ऐसा मंच प्रदान करता है जो आपको अपने संगठन को जो भी प्रक्रिया अपनाना चाहता है, उसे दर्ज़ करने की अनुमति देता है।

रेबेका जोजवाक: ठीक है। मेरे पास कुछ और प्रश्न हैं, लेकिन मुझे पता है कि हम घंटे से बहुत आगे निकल चुके हैं और मैं सिर्फ अपने प्रस्तुतकर्ताओं को बताना चाहता हूं, यह बहुत बढ़िया था। और हम डेल स्टेटिस्टिका से डेव स्वीनर को बहुत धन्यवाद देना चाहते हैं। बेशक, डॉ। रॉबिन ब्लोर और डीज़ ब्लांचफील्ड, आज विश्लेषकों होने के लिए धन्यवाद। हम अगले महीने डेल स्टेटिस्टिका के साथ एक और वेबकास्ट करने जा रहे हैं। मुझे पता है कि डेव ने इस विषय के बारे में संकेत दिया था। यह किनारे पर विश्लेषिकी के बारे में होगा, एक और आकर्षक विषय, और मुझे पता है कि इस वेबकास्ट पर कुछ बहुत ही आकर्षक उपयोग के मामलों पर चर्चा होने वाली है। यदि आपको पसंद आया तो आपने आज देखा, अगले महीने के लिए वापस आएँ। और इसके साथ, दोस्तों, मैं आपको विदाई देता हूं। बहुत बहुत धन्यवाद। अलविदा।

हर जगह विश्लेषण एम्बेड करें: नागरिक डेटा वैज्ञानिक को सक्षम करना