विषयसूची:
क्लिनिकल जीनोमिक्स एक आकर्षक विषय है, जहां लोग त्वरित और सटीक परिणाम प्राप्त करने के लिए अत्याधुनिक तकनीकों पर काम कर रहे हैं। बाजार पर बहुत सारे जीनोम सीक्वेंसर्स उपलब्ध हैं, और वे अनुक्रम डेटा की पेटाबाइट्स का उत्पादन कर रहे हैं, और अनुक्रमण में वृद्धि निकट भविष्य में डेटा के एक्सबाइट्स का उत्पादन करने जा रही है। यहाँ, Hadoop जटिल जीनोमिक्स कार्य प्रवाह को संसाधित करने के लिए सही मंच है। Hadoop जानकारी की भारी मात्रा को संग्रहीत और सॉर्ट कर सकता है और सार्थक विश्लेषण भी प्रस्तुत कर सकता है। (यह पता लगाने के लिए कि यह वास्तव में कितना डेटा है, अंडरस्टैंडिंग बिट्स, बाइट्स और उनके गुणकों को पढ़ें।)
जेनोमिक्स का वर्तमान और भविष्य
आज, जीनोम मानचित्रण अपने विकास के चरम पर पहुंच गया है। जीनोमिक्स उद्योग से जुड़े कई लोग जिज्ञासा के साथ फूट रहे हैं, और जैसे-जैसे नए अवसर खुद को पेश कर रहे हैं, बेहतर तकनीक समय की जरूरत है। जीनोम अनुक्रमण एक बहुत दोहरावदार और संसाधन-गहन कार्य है। अकेले 2013 में, लगभग 15 पेटाबाइट डेटा का उत्पादन किया गया था, और केवल 2, 000 सीक्वेंसर द्वारा। इस जबड़े को छोड़ने वाली राशि में 300 KB अनुक्रमित मानव जीनोम डेटा शामिल था। डेटा उत्पादन की इस दर पर, यह अनुमान लगाया जा सकता है कि 2018 तक लगभग एक एक्साबाइट डेटा का उत्पादन किया जाएगा। यह सीक्वेंसर की वृद्धि के कारण होगा, जो प्रति रन अधिक से अधिक डेटा का उत्पादन करेगा। एक और कारण बेहद शक्तिशाली और कम लागत वाली जीनोम अनुक्रमण मशीनों का आगमन है। 2008 के बाद से, इन मशीनों की कीमत लगातार घट रही है। इसका कारण शक्तिशाली अगली पीढ़ी की मशीनें हैं जो बाजार में आई हैं।
जीनोम मैपिंग इंडस्ट्री की जरूरतें
जटिल एल्गोरिदम का उपयोग उन आंकड़ों को संसाधित करने के लिए किया जाता है जो मानव जीनोम से एकत्र किए जाते हैं। फिर, इस जानकारी को संग्रहीत करने की आवश्यकता है। भविष्य में मूल डेटा की तुलना में इसकी समीक्षा की जा सकती है। 100 जीबी डेटा को संसाधित करने और संग्रहीत करने का कार्य बहुत मुश्किल नहीं है, खासकर जब आप इसे अनुक्रमण केंद्रों पर कार्यरत शक्तिशाली मशीनों के साथ कर रहे हैं। अध्ययनों से पता चलता है कि डेटा की इस मात्रा को लगभग 1, 000 सीपीयू घंटों में संसाधित किया जा सकता है, इसलिए यह बहुत आसान है। तकनीकी प्रगति की इस दर पर, यह स्पष्ट है कि जीनोम उद्योग जल्द ही कुछ ही सेकंड में हजारों गीगाबाइट की प्रक्रिया करेगा।
