केट क्रॉफर्ड की एक आकर्षक प्रस्तुति, माइक्रोसॉफ्ट रिसर्च के प्रमुख शोधकर्ता, 2013 स्ट्रेटा कॉन्फ्रेंस में बड़े डेटा पर करीब से नज़र डाली गई है और इसका क्या मतलब है, क्रॉफर्ड ने "एल्गोरिथम भ्रम" और बड़े पैमाने पर डेटा समाधानों की सीमाओं की खोज की है। कि व्यापार की दुनिया के कई हिस्सों में गले लगाया जा रहा है।
कताई बिल्ली को शामिल करते हुए एक ऑप्टिकल भ्रम के लिए एक मौलिक सादृश्य का उपयोग करते हुए, क्रॉफर्ड यह मामला बनाता है कि जब बड़े डेटा कई व्यावसायिक अनुप्रयोगों के लिए आवश्यक है, तो डेटा सेट के कई परिणामों की व्याख्या करने का एक से अधिक तरीका है जो मानव निर्णय निर्माताओं को उद्देश्यपूर्ण लग सकता है। ।
"चीजों को अलग तरह से देखा जा सकता है, " क्रॉफर्ड ने एक पेपर का हवाला देते हुए कहा कि वह और सह-लेखक डेविड बॉयड बड़े डेटा उपयोग के कुछ प्रमुख सिद्धांतों पर प्रतिबिंबित करते हैं, जिसमें क्रॉफोर्ड "पौराणिक कथाओं" को कहते हैं, या यह विश्वास कि बड़ा डेटा पूर्ण सत्य है और एक परियोजना के लिए वस्तुवाद। नेताओं ने कहा, अक्सर एक बड़े डेटा को प्रत्यक्ष रूप से वस्तुनिष्ठ पक्षी की आंखों के दृश्य के साथ जोड़ते हैं, जबकि तीन बुनियादी सीमाओं या विचारों को अनदेखा करते हैं जो इस निष्पक्षता को महत्वपूर्ण तरीकों से प्रभावित कर सकते हैं: पूर्वाग्रह, संकेत और पैमाने।
पूर्वाग्रह के साथ शुरू, क्रॉफोर्ड ऑस्ट्रेलिया और संयुक्त राज्य अमेरिका में बाढ़ के उदाहरणों का उपयोग करता है यह दिखाने के लिए कि बड़ा डेटा हमेशा सड़क पर वास्तविकता से मेल नहीं खाता है। वह दूसरे सिद्धांत, संकेत, में यह बताती है कि डेटा सेट कैसे छिपी वास्तविकताओं को प्रतिबिंबित कर सकते हैं जो परिणामों को भारी रूप से तिरछा कर सकते हैं। एक उदाहरण के रूप में, क्रॉफर्ड ने कई प्रकार के विश्व मानचित्रों का हवाला दिया जो महाद्वीपों और राष्ट्रों के सापेक्ष आकार का एक उद्देश्य दृश्य दिखाने के प्रयास में विकसित किए गए हैं।
क्रॉफर्ड ने कहा, "नक्शे तटस्थ नहीं हैं।" "जब भी हम अपने डेटा का प्रतिनिधित्व करने का फैसला करते हैं, तो हम हर बार चुनाव कर रहे हैं।"
सिद्धांत को और स्पष्ट करने के लिए, क्रॉफर्ड एक आवेदन के उदाहरण का उपयोग करता है जो बोस्टन में शहर के अधिकारियों को गड्ढों की रिपोर्ट करता है, यह सुझाव देता है कि इस प्रकार के ऐप जो स्मार्टफोन और मोबाइल उपकरणों पर काम करते हैं, समग्र रिपोर्ट को समाप्त कर सकते हैं जैसे कि जनगणना के नक्शे बहुत कुछ दिखते हैं जो सापेक्ष आयु का संकेत देते हैं और एक शहर या नगर पालिका भर में आय।
"हम आगे बढ़ते हुए विशेष प्रकार की सामाजिक असमानता के जोखिम को चलाते हैं, " क्रॉफर्ड ने उन लोगों की ओर इशारा करते हुए कहा, जिन्हें प्रौद्योगिकी के उपयोग में अंतर के कारण एक बड़े डेटा सेट से बाहर रखा जा सकता है।
"यदि आप बड़े डेटा सेटों की छाया में रहते हैं तो क्या होता है?" उसने कहा।
इसके अलावा, क्रॉफर्ड ने वर्षों पहले के शोधों के बारे में भी बात की, जिसमें सवाल किया गया था कि क्या उच्च-स्तरीय जानकारी हमेशा अधिक दानेदार डेटा का प्रतिनिधित्व करती है और क्या "उद्देश्य पैनोरमा" हमेशा छोटे पैमाने पर डेटा की तुलना में अधिक सटीक प्रतिनिधित्व के रूप में काम करता है। क्रॉफर्ड श्रोताओं से न केवल बड़े डेटा के बारे में सोचने के लिए कहता है, बल्कि "गहराई के साथ डेटा" के बारे में भी सोचता है। इसके द्वारा, वह डेटा का अर्थ है जो वास्तव में पाठकों को उद्देश्यपूर्ण वास्तविकता की ओर निर्देशित करता है, बजाय इसके कि अधिक वैश्विक दृष्टिकोण के साथ विवरणों को चित्रित किया जाए, जो समझने में आसान है, जो वास्तव में मौजूद प्रमुख तत्वों को छोड़ सकता है।
