تقنية

وجوه Deepfake أكثر جدارة بالثقة ، ولا يمكن تمييزها عن الوجوه الحقيقية: البحث


وجدت دراسة أجريت على ثلاث تجارب من قبل باحثين من جامعة لانكستر وجامعة كاليفورنيا في بيركلي أن الوجوه المركبة بواسطة الذكاء الاصطناعي (التزييف العميق) لا يمكن تمييزها عن الوجوه الحقيقية وأن الناس يصنفون الأولى على أنها أكثر جدارة بالثقة.

أ تقرير الدراسة من تأليف صوفي جي نايتنجيل وهاني فريد ، وقد نُشر في وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة.

في الدراسة ، استخدم الباحثون 400 وجه اصطناعي تم إنشاؤه بواسطة StyleGAN2 ، مما يضمن التمثيل المتساوي عبر الجنس (200 امرأة و 200 رجل) ، والعمر المقدر (الوجوه التي يبدو أنها تتوافق مع مجموعة من الأعمار من الطفولة إلى كبار السن) ، والعرق ( 100 أسود ، 100 قوقازي ، 100 شرق آسيوي و 100 جنوب آسيوي). لتقليل التأثير الذي يمكن أن تحدثه الإشارات الخارجية ، استخدم الباحثون فقط الصور ذات الخلفية الموحدة وعدم وجود مصنوعات عرض واضحة.

لكل وجه من الوجوه الاصطناعية البالغ عددها 400 ، جمع الباحثون وجهًا مطابقًا (من حيث المظهر العام والعرق والجنس وما إلى ذلك) من قاعدة بيانات الوجه المستخدمة في StyleGAN2. تم استخدام شبكة عصبية لاستخراج تمثيل منخفض الأبعاد لكل وجه لمقارنته بقاعدة بيانات الوجوه الحقيقية لاشتقاق الوجه الأكثر تشابهًا في كل حالة.

في التجربة الأولى ، صنف 315 مشاركًا 128 من بين 800 وجه على أنها حقيقية أو مركبة ، واحدًا تلو الآخر. كان المشاركون قادرين على التخمين بمتوسط ​​دقة 48.2 في المائة فقط ، وهو ما يقترب من أداء محتمل بنسبة 50 في المائة.

بالنسبة للوجوه الحقيقية ، كان هناك تفاعل كبير بين الجنس والعرق والنتائج. كان متوسط ​​الدقة أعلى بالنسبة لوجوه شرق آسيا للذكور من وجوه الإناث من شرق آسيا. كما أنها كانت أعلى بالنسبة للوجوه البيضاء للذكور عنها في الوجوه البيضاء للإناث. لم تستنتج الدراسة أي تفاعل كبير بين العرق والجنس ونتائج الوجوه الاصطناعية.

في التجربة الثانية ، صنف 219 مشاركًا جديدًا 128 وجهًا مأخوذًا من 800 وجه ، ولكن هذه المرة ، مع تدريب وتجربة تلو الأخرى. تحسن متوسط ​​الدقة قليلاً إلى 59 في المائة ولكن لم يكن هناك تحسن في الدقة بمرور الوقت على الرغم من تقديم ملاحظات التجربة تلو التجربة. كان متوسط ​​الدقة 59.3 في المائة للمجموعة الأولى المكونة من 64 وجهًا و 58.8 في المائة للمجموعة التالية المكونة من 64 وجهًا.

توزيع دقة المشاركين في التجربة 1 والتجربة 2. (رصيد الصورة: PNAS)

تم تصميم التجربة الثالثة للتأكد مما إذا كان هناك اختلاف في الجدارة بالثقة بين الوجوه الاصطناعية والوجوه الحقيقية. قام ما مجموعه 223 مشاركًا بتقييم مدى مصداقية 128 وجهًا مأخوذًا من نفس المجموعة المكونة من 800 وجه بمقياس من واحد إلى سبعة (واحد لوجه غير جدير بالثقة وسبعة لجدير بالثقة للغاية).

تقييمات الجدارة بالثقة المتصورة للتجربة 3. (مصدر الصورة: PNAS)

في نهاية التجربة ، كان متوسط ​​تصنيف الوجوه الحقيقية 4.48 فقط مقارنة بـ 4.82 للوجوه الاصطناعية. على الرغم من أن الاختلاف هو 7.7 في المائة فقط ، إلا أنه مهم نظرًا لارتفاع قيمة t وانخفاض قيمة p للتجربة (t (222) = 14.6 ، P <0.001)

الوجوه الأربعة الأكثر جدارة بالثقة (أعلى) وأربعة وجوه غير جديرة بالثقة (أسفل). S – مواد اصطناعية. R – ريال. الرقم هو متوسط ​​تصنيف الجدارة بالثقة على مقياس من 1 إلى 7. (صورة الائتمان: PNAS)

تم تصنيف النساء على أنهن أكثر جدارة بالثقة بشكل ملحوظ من الرجال بمتوسط ​​4.94 تقييم مقارنة بتقييم 4.36 لوجوه الرجال. كان هناك أيضًا تأثير ضئيل في تصنيف الوجوه السوداء على أنها أكثر جدارة بالثقة من وجوه جنوب آسيا. لم يكن هناك أي تأثير آخر معنوي عبر العرق في التجربة الثالثة.



مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني.

زر الذهاب إلى الأعلى