Lok Shakti

Nationalism Always Empower People

शोधकर्ताओं ने एआई मॉडल विकसित किया है जो रेडिट पोस्ट का उपयोग करके मानसिक विकारों का पता लगाता है

डार्टमाउथ कॉलेज के शोधकर्ताओं ने एक कृत्रिम बुद्धिमत्ता (एआई) मॉडल विकसित किया है जिसका उपयोग विश्वविद्यालय के एक लेख के अनुसार, रेडिट पर बातचीत के डेटा का उपयोग करके मानसिक विकारों की भविष्यवाणी करने के लिए किया जा सकता है।
वेब इंटेलिजेंस और इंटेलिजेंट एजेंट टेक्नोलॉजी पर 20वें अंतर्राष्ट्रीय सम्मेलन में शोधकर्ता शियाओबो गुओ, याओजिया सन और सोरौश वोसोफी ने “सोशल मीडिया पर मानसिक विकारों की भावना आधारित मॉडलिंग” शीर्षक से एक पेपर प्रस्तुत किया।

कागज के अनुसार, अधिकांश ऐसे एआई मॉडल जो वर्तमान में मौजूद हैं, उपयोगकर्ता-जनित पाठ की सामग्री के मनो-भाषाई विश्लेषण के आधार पर कार्य करते हैं। उच्च स्तर के प्रदर्शन को प्रदर्शित करने के बावजूद, सामग्री-आधारित प्रतिनिधित्व मॉडल डोमेन और विषय पूर्वाग्रह से प्रभावित होते हैं।

वोसोफी ने डार्टमाउथ विज्ञान लेखक को इस संभावना के बारे में बताते हुए समझाया कि कैसे अगर कोई मॉडल “कोविड” शब्द को “उदासी” या “चिंता” के साथ सहसंबंधित करना सीखता है, तो यह स्वचालित रूप से मान लेगा कि एक वैज्ञानिक जो COVID अनुसंधान कर रहा है और इसके बारे में पोस्ट कर रहा है, वह पीड़ित है। अवसाद और चिंता से।

पोस्ट में वर्णित विषय के बारे में कुछ भी नहीं सीखते हुए नया मॉडल पूरी तरह से भावनात्मक अवस्थाओं पर आधारित होने के कारण इन विषय-विशिष्ट पूर्वाग्रहों को दबा देता है।

मॉडल को प्रशिक्षित करने के लिए, शोधकर्ताओं ने 2011 और 2019 के बीच डेटा के दो सेट एकत्र किए: पहला उपयोगकर्ताओं का एक डेटासेट था जिसमें रुचि के तीन भावनात्मक विकारों में से एक था (प्रमुख अवसादग्रस्तता, चिंता और द्विध्रुवी विकार) और दूसरा उपयोगकर्ताओं का डेटासेट था। ज्ञात मानसिक विकारों के बिना, जो एक नियंत्रण समूह के रूप में कार्य करता था।

पहला डेटासेट स्व-रिपोर्ट किए गए मानसिक विकारों के आधार पर एकत्र किया गया था, यानी, शोधकर्ताओं ने उन उपयोगकर्ताओं की खोज की, जिन्होंने पोस्ट या टिप्पणियां की थीं, जो “मुझे द्विध्रुवी / अवसाद / चिंता का निदान किया गया था” के समान कुछ कहा था। शोध के लिए केवल स्व-रिपोर्ट से पहले किए गए पोस्ट पर विचार किया गया था क्योंकि पूर्व के काम से पता चला था कि उपयोगकर्ताओं को यह अहसास होगा कि उन्हें एक विकार है, जिससे वे ऑनलाइन व्यवहार करते हैं और पूर्वाग्रह पैदा करते हैं।

शोधकर्ताओं ने तब यह सुनिश्चित किया कि चार वर्गों (रुचि के प्रत्येक विकार वाले उपयोगकर्ताओं के लिए एक और एक नियंत्रण समूह) से संबंधित डेटा में समान अस्थायी वितरण थे: इसका मतलब है कि चार वर्गों के डेटा में समान समय-आधारित पदों का वितरण था। डेटासेट भी प्रत्येक वर्ग के लिए 1,997 उपयोगकर्ताओं के साथ संतुलित थे।

इसके बाद, शोधकर्ताओं ने डेटा को प्रशिक्षण (70%), सत्यापन (15%) और परीक्षण (15%) में विभाजित किया। डेटा पर मॉडल को प्रशिक्षित करने और फिर उसका परीक्षण करने के बाद, शोधकर्ताओं ने पाया कि जिस भावना-आधारित प्रतिनिधित्व मॉडल का उन्होंने उपयोग किया, वह सामग्री TF-IDF आधारित (टर्म फ़्रीक्वेंसी – इनवर्स दस्तावेज़ फ़्रिक्वेंसी) विधि की तुलना में विकारों की भविष्यवाणी करने में अधिक सटीक था। TF-IDF का उपयोग किसी कीवर्ड के महत्व को उसकी आवृत्ति और पोस्ट के महत्व के आधार पर गणना करने के लिए किया जाता है।