विषयसूची:
परिभाषा - कंटेंट स्क्रैपिंग का क्या अर्थ है?
सामग्री स्क्रैपिंग एक वैध वेबसाइट से मूल सामग्री को चुराने और सामग्री के मालिक की जानकारी या अनुमति के बिना चोरी की सामग्री को किसी अन्य साइट पर पोस्ट करने का एक अवैध तरीका है। कंटेंट स्क्रेपर्स अक्सर चोरी की गई सामग्री को अपनी मर्जी से पास करने का प्रयास करते हैं, और कंटेंट मालिकों को अटेंशन देने में असफल होते हैं।
सामग्री स्क्रैपिंग को मैन्युअल कॉपी और पेस्ट के माध्यम से पूरा किया जा सकता है, या अधिक परिष्कृत तकनीकों का उपयोग कर सकते हैं, जैसे कि विशेष सॉफ्टवेयर, एचटीटीपी प्रोग्रामिंग या एचटीएमएल या डोम पार्सर का उपयोग करना।
स्क्रैपिंग के शिकार होने वाली अधिकांश सामग्री कॉपीराइट सामग्री है; कॉपीराइट स्वामी की अनुमति के बिना इसे फिर से लागू करना एक दंडनीय अपराध है। हालांकि, स्क्रैपर साइटों को पूरे विश्व में होस्ट किया जाता है, और स्क्रैपर्स जिन्हें कॉपीराइट की गई सामग्री को हटाने के लिए कहा जाता है, वे केवल डोमेन स्विच कर सकते हैं या गायब हो सकते हैं।
Techopedia कंटेंट स्क्रैपिंग की व्याख्या करता है
सामग्री स्क्रैपर्स अन्य साइटों से उच्च-गुणवत्ता, कीवर्ड-सघन सामग्री को स्क्रैप करके अपनी वेबसाइट पर ट्रैफ़िक चलाने में सक्षम हैं। ब्लॉगर इसके लिए विशेष रूप से अतिसंवेदनशील होते हैं, शायद इसलिए कि अलग-अलग ब्लॉगर स्क्रैपर्स के खिलाफ कानूनी हमले की संभावना नहीं रखते हैं। स्क्रैपर्स को इस अभ्यास को जारी रखने के लिए प्रोत्साहित किया जाता है क्योंकि खोज इंजन को अभी तक स्क्रैप की गई सामग्री से अद्वितीय सामग्री को फ़िल्टर करने का एक प्रभावी तरीका नहीं मिला है, जिससे स्क्रैपर्स को लाभ जारी रखने की अनुमति मिलती है।
वेबसाइट व्यवस्थापक सामग्री के भीतर अपनी साइट पर लिंक जोड़ने जैसे सरल उपायों के माध्यम से स्क्रैपिंग के खिलाफ खुद की रक्षा कर सकते हैं। यह कम से कम उन्हें स्क्रैप किए गए सामग्री से कुछ ट्रैफ़िक प्राप्त करने की अनुमति देगा। बॉट द्वारा स्क्रैपिंग से निपटने के अधिक परिष्कृत तरीकों में शामिल हैं:
- वाणिज्यिक विरोधी बॉट अनुप्रयोगों
- एक हनीपोट के साथ बॉट को पकड़ना और उनके आईपी पते को अवरुद्ध करना
- जावास्क्रिप्ट कोड के साथ बॉट्स को ब्लॉक करना
