लैंकेस्टर यूनिवर्सिटी और यूसी बर्कले के शोधकर्ताओं द्वारा तीन प्रयोगों पर किए गए एक अध्ययन में पाया गया है कि एआई-संश्लेषित (डीपफेक) चेहरे वास्तविक चेहरों से अलग नहीं होते हैं और लोग पहले वाले को अधिक भरोसेमंद मानते हैं।
सोफी जे नाइटिंगेल और हनी फरीद द्वारा लिखित अध्ययन की एक रिपोर्ट प्रोसीडिंग्स ऑफ द नेशनल एकेडमी ऑफ साइंसेज ऑफ द यूनाइटेड स्टेट्स में प्रकाशित हुई थी।
अध्ययन के लिए, शोधकर्ताओं ने StyleGAN2 द्वारा उत्पन्न 400 सिंथेटिक चेहरों का उपयोग किया, लिंग (200 महिलाएं और 200 पुरुष), अनुमानित आयु (चेहरे जो बचपन से लेकर बड़े वयस्कों तक की उम्र के अनुरूप प्रतीत होते हैं) और दौड़ में समान प्रतिनिधित्व सुनिश्चित करते हैं। 100 ब्लैक, 100 कोकेशियान, 100 पूर्व एशियाई और 100 दक्षिण एशियाई)। बाहरी संकेतों के प्रभाव को कम करने के लिए, शोधकर्ताओं ने केवल एक समान पृष्ठभूमि वाली छवियों का उपयोग किया और कोई स्पष्ट प्रतिपादन कलाकृतियों का उपयोग नहीं किया।
400 सिंथेटिक चेहरों में से प्रत्येक के लिए, शोधकर्ताओं ने StyleGAN2 में उपयोग किए गए फेस डेटाबेस से एक मेल खाता चेहरा (समग्र रूप, जाति, लिंग आदि के संदर्भ में) एकत्र किया। प्रत्येक मामले में सबसे समान चेहरे को प्राप्त करने के लिए वास्तविक चेहरों के डेटाबेस के साथ तुलना करने के लिए प्रत्येक चेहरे के निम्न-आयामी प्रतिनिधित्व को निकालने के लिए एक तंत्रिका नेटवर्क का उपयोग किया गया था।
पहले प्रयोग में, 315 प्रतिभागियों ने एक-एक करके 800 चेहरों में से 128 को वास्तविक या संश्लेषित के रूप में वर्गीकृत किया। प्रतिभागी केवल 48.2 प्रतिशत की औसत सटीकता के साथ अनुमान लगाने में सक्षम थे, जो कि 50 प्रतिशत के मौके के प्रदर्शन के करीब है।
वास्तविक चेहरों के लिए, लिंग और नस्ल और परिणामों के बीच एक महत्वपूर्ण अंतःक्रिया थी। महिला पूर्वी एशियाई चेहरों की तुलना में पुरुष पूर्वी एशियाई चेहरों के लिए औसत सटीकता अधिक थी। यह महिला श्वेत चेहरों की तुलना में पुरुष श्वेत चेहरों के लिए भी अधिक था। अध्ययन ने नस्ल, लिंग और सिंथेटिक चेहरों के परिणामों के बीच इस तरह की कोई महत्वपूर्ण बातचीत का अनुमान नहीं लगाया।
दूसरे प्रयोग में, 219 नए प्रतिभागियों ने 800 चेहरों से लिए गए 128 चेहरों को वर्गीकृत किया, लेकिन इस बार प्रशिक्षण और परीक्षण-दर-परीक्षण प्रतिक्रिया के साथ। औसत सटीकता में थोड़ा सुधार होकर 59 प्रतिशत हो गया लेकिन परीक्षण-दर-परीक्षण प्रतिक्रिया प्रदान करने के बावजूद समय के साथ सटीकता में कोई सुधार नहीं हुआ। 64 चेहरों के पहले सेट के लिए औसत सटीकता 59.3 प्रतिशत और 64 के अगले सेट के लिए 58.8 प्रतिशत थी।
प्रयोग 1 और प्रयोग 2 के लिए प्रतिभागी सटीकता का वितरण (छवि क्रेडिट: PNAS)
तीसरे प्रयोग को यह पता लगाने के लिए डिज़ाइन किया गया था कि सिंथेटिक और वास्तविक चेहरों के बीच कथित भरोसेमंदता में अंतर है या नहीं। कुल 223 प्रतिभागियों ने एक से सात के पैमाने पर 800 चेहरों के एक ही सेट से लिए गए 128 चेहरों की विश्वसनीयता का मूल्यांकन किया (एक बहुत अविश्वसनीय के लिए और सात बहुत भरोसेमंद के लिए)।
प्रयोग 3 के लिए अनुमानित भरोसेमंदता रेटिंग (छवि क्रेडिट: पीएनएएस)
प्रयोग के अंत में, सिंथेटिक चेहरों के लिए 4.82 की तुलना में वास्तविक चेहरों की औसत रेटिंग केवल 4.48 थी। भले ही अंतर केवल 7.7 प्रतिशत है, यह प्रयोग के उच्च t-मान और निम्न p-मान के कारण महत्वपूर्ण है (t(222)=14.6, P<0.001)
चार सबसे भरोसेमंद चेहरे (ऊपर) और चार सबसे कम भरोसेमंद चेहरे (नीचे)। एस – सिंथेटिक। आर – रियल। संख्या 1 – 7 के पैमाने पर दी गई औसत भरोसेमंदता रेटिंग है (छवि क्रेडिट: पीएनएएस)
पुरुषों के चेहरों की 4.36 रेटिंग की तुलना में औसतन 4.94 रेटिंग वाले पुरुषों की तुलना में महिलाओं को अधिक भरोसेमंद दर्जा दिया गया। दक्षिण एशियाई चेहरों की तुलना में काले चेहरों को अधिक भरोसेमंद होने का एक छोटा सा प्रभाव भी था। तीसरे प्रयोग में दौड़ में कोई अन्य महत्वपूर्ण प्रभाव नहीं था।
More Stories
मानसिक स्वास्थ्य को प्रभावित करने वाले कारक, क्या AI सहायक हो सकता है | इंटरनेट और सोशल मीडिया समाचार
AI Training Must For Upskilling; Data Science, Problem-Solving Essential For Future Roles | Technology News
DoT ने साइबर अपराध, वित्तीय धोखाधड़ी में दुरुपयोग के लिए 20 मोबाइल हैंडसेट ब्लॉक किए