Lok Shakti

Nationalism Always Empower People

ट्विटर की बॉट समस्या: पराग अग्रवाल के बचाव में मस्क की ताजा टिप्पणी, ध्यान देने योग्य सभी बातें

ट्विटर पर कितने प्रतिशत उपयोगकर्ता ‘नकली’ या ‘बॉट’ हैं? यह अभी बहु-अरब डॉलर का सवाल है, एलोन मस्क सौदे के लिए कम कीमत पर इशारा कर रहे हैं, यह देखते हुए कि वह कंपनी के उपयोगकर्ता आधार के बारे में आश्वस्त नहीं है। वास्तव में, उन्होंने कहा है कि “फर्जी उपयोगकर्ता सभी ट्विटर खातों का 20 प्रतिशत बनाते हैं।” इस बीच, ट्विटर जोर देकर कहता है कि उसके मुद्रीकरण योग्य दैनिक सक्रिय उपयोगकर्ताओं (एमडीएयू) में से केवल 5 प्रतिशत ही नकली या बॉट हैं।

हम ट्विटर की बॉट समस्या के बारे में अब तक कही गई हर बात पर एक नज़र डालते हैं, हाल ही में स्वतंत्र शोध क्या दावा करता है, और इसे हल करना एक कठिन समस्या क्यों है।

एलोन मस्क स्पैम बॉट्स पर सबूत चाहते हैं, ऐसा होने तक कोई सौदा नहीं कहते हैं

टेस्ला के सीईओ ने बॉट्स के इस मुद्दे के बारे में कई बयान दिए हैं, नवीनतम दावा लगभग 20 प्रतिशत उपयोगकर्ता नकली हैं, लेकिन अब वह ट्विटर से अधिक सबूतों पर जोर दे रहे हैं ताकि यह दावा किया जा सके कि केवल 5 प्रतिशत उपयोगकर्ता हैं स्पैम या नकली।

उन्होंने एक नए ट्वीट में लिखा, “20 फीसदी फर्जी/स्पैम अकाउंट, जबकि ट्विटर जो दावा करता है उसका 4 गुना *बहुत* ज्यादा हो सकता है। मेरा प्रस्ताव ट्विटर के एसईसी फाइलिंग के सटीक होने पर आधारित था। कल, ट्विटर के सीईओ ने सार्वजनिक रूप से <5% का सबूत दिखाने से इनकार कर दिया। यह सौदा तब तक आगे नहीं बढ़ सकता जब तक वह ऐसा नहीं करता।”

मस्क ने 13 मई को यह कहते हुए ट्वीट किया था कि जब तक वह उपयोगकर्ताओं की संख्या की पुष्टि नहीं कर लेते, तब तक सौदा रुका हुआ था, हालांकि दो घंटे बाद उन्होंने ट्वीट कर कहा कि वह अधिग्रहण के लिए प्रतिबद्ध हैं। हाल ही में, उन्होंने पोस्ट किया है कि उनकी टीम नकली अनुयायियों की संख्या का पता लगाने के लिए “@ट्विटर के 100 अनुयायियों का एक यादृच्छिक नमूना” करेगी। उन्होंने अन्य लोगों को भी इसी प्रक्रिया को अंजाम देने के लिए आमंत्रित किया।

20% फर्जी/स्पैम खाते, जबकि ट्विटर के दावे का 4 गुना, *बहुत* अधिक हो सकता है।

मेरा प्रस्ताव ट्विटर के एसईसी फाइलिंग के सटीक होने पर आधारित था।

कल, ट्विटर के सीईओ ने सार्वजनिक रूप से <5% का सबूत दिखाने से इनकार कर दिया।

यह सौदा तब तक आगे नहीं बढ़ सकता जब तक वह नहीं करता।

– एलोन मस्क (@elonmusk) 17 मई, 2022

नवीनतम स्वतंत्र शोध

ट्विटर एनालिटिक्स टूल स्पार्कटोरो- ऑडियंस रिसर्च टूल कंपनी और फॉलोवरवॉंक द्वारा एक अन्य विश्लेषण ने दावा किया है कि “पिछले 90 दिनों में ट्वीट भेजने वाले 19.42% सार्वजनिक खाते नकली या स्पैम हैं।” विश्लेषण 13 मई से 15 मई के बीच किया गया था और एक ब्लॉग पोस्ट में, शोधकर्ताओं ने खुलासा किया कि उन्होंने पिछले 90 दिनों में सक्रिय 44,058 सार्वजनिक ट्विटर खातों को देखा और इन्हें 130+ मिलियन जनता के एक सेट से मशीन द्वारा यादृच्छिक रूप से चुना गया था। , सक्रिय प्रोफाइल।

यहां स्पैम की परिभाषा में ऐसे खाते शामिल हैं “जिनमें नियमित रूप से कोई व्यक्ति व्यक्तिगत रूप से अपने ट्वीट की सामग्री की रचना नहीं करता है, उनकी टाइमलाइन पर गतिविधि का उपभोग करता है, या ट्विटर पारिस्थितिकी तंत्र में संलग्न होता है,” उनके ब्लॉग के अनुसार।

शोधकर्ताओं ने एलोन मस्क और उनके 93 मिलियन से अधिक अनुयायियों को भी देखा और निष्कर्ष निकाला कि उनके 70.23 प्रतिशत से अधिक अनुयायी “उनके ट्वीट देखने वाले प्रामाणिक, सक्रिय उपयोगकर्ता होने की संभावना नहीं है।” उन्होंने नकली अनुयायियों में वृद्धि के लिए “मस्क के ट्विटर का सक्रिय उपयोग, उनके ट्वीट्स का मीडिया कवरेज और ट्विटर की अपनी सिफारिश प्रणाली” को जिम्मेदार ठहराया।

SparkTorro और Followerwonk द्वारा एक डेटा चार्ट नकली ट्विटर खातों की संख्या का विश्लेषण करता है। (स्पार्कटोरो ब्लॉग की तुलना में छवि)

स्पार्कटोरो ने अपने फेक फॉलोअर्स विश्लेषण में जिन कुछ संकेतों को शामिल किया है, उनमें प्रोफाइल इमेज को देखना, दिनों में अकाउंट की उम्र, फॉलोअर्स की संख्या, आखिरी ट्वीट के बाद के दिन, निष्क्रिय दिन आदि शामिल हैं। माना जाने वाला अन्य सिग्नल अक्सर स्पैम अकाउंट के रूप में ओवरशेयरिंग होते हैं। दैनिक आधार पर बड़ी मात्रा में ट्वीट पोस्ट करते हैं, आदि।

लेकिन ध्यान रखें कि ट्विटर ने केवल इन संकेतों को ही कहा है-कहते हैं कि एक नकली प्रोफ़ाइल चित्र जैसा दिखता है- किसी खाते को नकली या स्पैम के रूप में परिभाषित करने के लिए पर्याप्त नहीं है और इस तरह के निर्णय लेते समय कंपनी निजी और सार्वजनिक डेटा में बहुत अधिक शामिल करती है।

शोधकर्ताओं का दावा है कि उनकी “पद्धति की संभावना स्पैम और नकली खातों को कम करती है, लेकिन लगभग कभी भी झूठी सकारात्मकता शामिल नहीं होती है।” उन्होंने यह भी स्वीकार किया कि ट्विटर के विपरीत उनके पास कुछ अन्य निजी डेटा तक पहुंच नहीं है, जिसका उपयोग कंपनी खातों को नकली या स्पैम के रूप में रेट करने के लिए कर रही है और इसलिए उनकी कार्यप्रणाली त्रुटिपूर्ण हो सकती है। हालांकि, उन्हें विश्वास है कि स्पैम या नकली अनुयायियों की संख्या को कम करके आंका जा रहा है।

पराग अग्रवाल कैसे ट्विटर स्पैम से लड़ता है

एलोन मस्क की टिप्पणियों को ट्विटर के सीईओ पराग अग्रवाल ने विवादित कर दिया है, जिन्होंने आज पहले एक लंबा सूत्र रखा है, जिसमें उन सभी संकेतों और कारकों की व्याख्या की गई है, जिन्हें वे किसी खाते को ‘स्पैम’ या ‘नकली’ के रूप में चिह्नित करते समय मानते हैं। पराग अग्रवाल ने जोर देकर कहा कि स्पैम से लड़ना “अविश्वसनीय रूप से * गतिशील *” है, क्योंकि वे लगातार विकसित हो रहे हैं और आज विकसित नियमों का एक सेट बाद में काम नहीं कर सकता है।

पराग अग्रवाल ने खुलासा किया कि ट्विटर “हर दिन आधे मिलियन से अधिक स्पैम खातों” को निलंबित कर देता है, इससे पहले कि उपयोगकर्ता उन्हें मंच पर देख सकें। अग्रवाल ने खुलासा किया कि ट्विटर के स्पैम खातों का अनुमान, जिसे वह 5 प्रतिशत से कम रखता है, “हजारों खातों की कई मानवीय समीक्षाओं (प्रतिकृति में) पर आधारित है, जिन्हें यादृच्छिक रूप से, लगातार समय के साथ नमूना लिया जाता है।”

थ्रेड के अनुसार, ट्विटर और उसके मानव समीक्षक किसी खाते को स्पैम या नकली के रूप में वर्गीकृत करने के लिए निजी और सार्वजनिक दोनों डेटा का उपयोग करते हुए कई संकेतों को देखते हैं। अग्रवाल के अनुसार, इस निजी डेटा में आईपी एड्रेस, फोन नंबर, जियोलोकेशन, क्लाइंट/ब्राउज़र सिग्नेचर, अकाउंट के एक्टिव होने पर क्या करता है… आदि शामिल हैं।

पराग अग्रवाल के अनुसार, स्पैम या नकली खातों का यह अनुमान “बाहरी रूप से नहीं किया जा सकता है, क्योंकि सार्वजनिक और निजी दोनों जानकारी (जिसे हम साझा नहीं कर सकते) दोनों का उपयोग करने की महत्वपूर्ण आवश्यकता है।”

क्या ट्विटर पर सभी बॉट खराब हैं? क्या बॉट को पहचानना मुश्किल है?

ट्विटर स्वयं सभी बॉट्स को खराब के रूप में चिह्नित नहीं करता है। वास्तव में, इसमें खराब बॉट व्यवहार को परिभाषित करने वाले मानदंडों की एक सूची है, और इसमें “सार्वजनिक बातचीत को कमजोर करने और बाधित करने के लिए स्वचालन का दुर्भावनापूर्ण उपयोग, जैसे कुछ प्रवृत्ति प्राप्त करने की कोशिश करना” “बातचीत के कृत्रिम प्रवर्धन” के साथ-साथ स्पैमी ट्वीट्स भी शामिल हैं। थोक ट्वीटिंग, आदि।

CoRover के संस्थापक और सीईओ अंकुश सभरवाल के अनुसार, जिसने आईआरसीटीसी की दिशा चैटबॉट का निर्माण किया है, स्पैम या बॉट खाते ढूंढना आसान है, हालांकि कुछ व्यवहार स्पष्ट है। “एक उदाहरण देने के लिए, अगर मैं एक इंसान हूं, तो मेरा माउस सीधे एक्शन बटन या इमेज पर नहीं जाएगा। मेरे कार्यों में कुछ नेविगेशन प्रवाह होगा। लेकिन अगर यह एक बॉट है, तो बॉट जानता है कि कहां जाना है। और कर्सर उस तरह से नेविगेट नहीं करेगा जिस तरह से मनुष्य नेविगेट करेंगे, ”उन्होंने समझाया।

ट्विटर के सीईओ पराग अग्रवाल ने कहा है कि बॉट्स से लड़ना एक गतिशील चुनौती है।

लेकिन, वह यह भी मानते हैं कि सभी बॉट्स का पता नहीं लगाया जा सकता है। “उन्होंने केवल कुछ घटनाओं को रीट्वीट करने के लिए एक तरह का तर्क बनाया होगा,” उन्होंने समझाया, जो चुनौती को बहुत कठिन बना सकता है।

ट्विटर पर भी बॉट्स का पता लगाने के लिए कई ओपन-सोर्स टूल हैं। अमेरिका में इंडियाना विश्वविद्यालय में सोशल मीडिया पर ऑब्जर्वेटरी की एक परियोजना बोटोमीटर है, जो उनके विवरण पृष्ठ के अनुसार “ट्विटर अकाउंट की गतिविधि और इसे एक अंक देकर” की जाँच करके काम करता है। “उच्च स्कोर का मतलब अधिक बॉट जैसी गतिविधि है,” यह जोड़ता है। स्कोर शून्य से पांच तक होता है, जिसमें शून्य सबसे अधिक मानव जैसी गतिविधि को दर्शाता है।

फिर से, ऐसी पद्धति मूर्खतापूर्ण नहीं है क्योंकि अधिकांश विशेषज्ञ इस बात से सहमत हैं कि कुछ बॉट मानव दिखने में अविश्वसनीय रूप से अच्छे हैं। अंत में, ट्विटर की बॉट समस्या नई नहीं है। वास्तव में, जैसा कि हमने अतीत में रिपोर्ट किया है, स्वतंत्र शोध से पता चला है कि भारत में 2019 के चुनावों के दौरान ट्विटर बॉट्स का उपयोग हैशटैग आदि में हेरफेर करने के लिए कैसे किया गया था। यूएस 2016 और 2020 के चुनावों के साथ-साथ रुझानों आदि में हेरफेर करने के लिए भी बॉट्स का बड़े पैमाने पर उपयोग किया गया था, हालांकि ट्विटर का दावा है कि तब से उन पर काफी कार्रवाई हुई है। लेकिन स्पष्ट रूप से, एलोन मस्क अपने दावों के बारे में आश्वस्त नहीं हैं और विवाद जल्द ही कभी भी दूर होने की संभावना नहीं है।