انت ربما لديك لاحظت بعض مقاطع الفيديو المضحكة الرائعة التي تم إنشاؤها باستخدام الذكاء الاصطناعي في الأسابيع الأخيرة. هاري بوتر أعيد تصورها كإعلان تجاري من Balenciaga ، وانتشرت مؤخرًا لقطات مرعبة من ويل سميث وهو يأكل السباغيتي. يسلطون الضوء على مدى سرعة تقدم قدرة الذكاء الاصطناعي على إنشاء الفيديو ، بالإضافة إلى مدى صعوبة بعض استخدامات التكنولوجيا.
تذكرني مقاطع الفيديو هذه باللحظة التي انتشرت فيها أدوات صنع الصور بالذكاء الاصطناعي العام الماضي ، عندما سمحت برامج مثل Craiyon (المعروفة سابقًا باسم DALL-E Mini) لأي شخص باستحضار صور يمكن التعرف عليها ، وإن كانت فجة وغالبًا ما تكون سريالية ، مثل لقطات مراقبة الأطفال . سرقة محطة وقود ، رسومات قاعة محكمة دارث فادار ، وأكل إيلون ماسك الطباشير الملون.
كان Craiyon بمثابة نسخة مقلدة مفتوحة المصدر لمولد الصور DALL-E 2 الذي كان مقيدًا بعناية من OpenAI ، الشركة التي تقف وراء ChatGPT. كانت الأداة هي الأولى التي أظهرت قدرة الذكاء الاصطناعي على توجيه النص وتحويله إلى ما يشبه الصور الحقيقية والرسوم التوضيحية التي رسمها الإنسان. منذ ذلك الحين ، أصبح DALL-E مفتوحًا للجميع ، وقد طورت برامج مثل Midjourney و Dream Studio أدوات مماثلة وشحذتها ، مما يجعل من السهل نسبيًا صياغة صور معقدة وواقعية ببضع نقرات على لوحة المفاتيح.
نظرًا لأن المهندسين قاموا بتعديل المقابض والرافعات الخوارزمية وراء مولدات الصور هذه ، وإضافة المزيد من بيانات التدريب ، ودفع المزيد من شرائح GPU لتشغيل كل شيء ، فقد أصبحت أدوات صنع الصور هذه جيدة بشكل لا يصدق في تزوير الواقع. لأخذ بعض الأمثلة من موقع فرعي مخصص لصور الذكاء الاصطناعي الغريبة ، تحقق من أليكس جونز في موكب فخر مثلي الجنس أو تابوت العهد في ساحة بيع.
يجبرنا الوصول الواسع النطاق إلى هذه التكنولوجيا ، وتطورها ، على إعادة التفكير في كيفية رؤيتنا للصور عبر الإنترنت ، كما تم تسليط الضوء عليه بعد أن انتشرت الصور التي صنعها الذكاء الاصطناعي والتي يُزعم أنها تظهر اعتقال دونالد ترامب على نطاق واسع الشهر الماضي. أدت الحادثة إلى إعلان Midjourney أنها لن تقدم بعد الآن نسخة تجريبية مجانية من خدمتها – وهو حل قد يردع بعض الجهات الفاعلة السيئة الرخيصة لكنه يترك المشكلة الأوسع كما هي.
كما كتبت أماندا هوفر من WIRED هذا الأسبوع ، لا تزال الخوارزميات تكافح لإنشاء فيديو مقنع من موجه. يعد إنشاء العديد من الإطارات الفردية أمرًا مكلفًا من الناحية الحسابية ، وكما تظهر مقاطع الفيديو المتذبذبة والمتقطعة اليوم ، من الصعب على الخوارزميات الحفاظ على الاتساق الكافي بينها لإنتاج مقطع فيديو منطقي.
ومع ذلك ، فإن أدوات الذكاء الاصطناعي أصبحت أكثر مهارة في تحرير مقاطع الفيديو. ميمي Balenciaga ، جنبًا إلى جنب مع الإصدارات المرجعية أصدقاء و سيئة للغاية، من خلال الجمع بين عدد قليل من أدوات الذكاء الاصطناعي المختلفة ، أولاً لإنشاء صور ثابتة ثم إضافة تأثيرات رسوم متحركة بسيطة. لكن النتيجة النهائية لا تزال مثيرة للإعجاب.
أطلقت Runway ML ، وهي شركة ناشئة تعمل على تطوير أدوات الذكاء الاصطناعي لإنشاء وتحرير الصور والفيديو بشكل احترافي ، هذا الأسبوع تقنية جديدة أكثر فاعلية لتطبيق التغييرات الأسلوبية على مقاطع الفيديو. لقد استخدمته لإنشاء هذه اللقطات التي تشبه الحلم لقطتي ، ليونا ، وهي تمشي عبر “cloudcape” من مقطع فيديو موجود في بضع دقائق فقط.
تفتح تقنيات التعلم الآلي المختلفة إمكانيات جديدة. على سبيل المثال ، تستخدم شركة تسمى Luma AI تقنية تُعرف باسم حقول الإشعاع العصبي لتحويل الصور ثنائية الأبعاد إلى مشاهد ثلاثية الأبعاد مفصلة. قم بإدخال بعض اللقطات في تطبيق الشركة ، وسيكون لديك مشهد ثلاثي الأبعاد تفاعلي بالكامل للعب به.
تشير هذه المقاطع إلى أننا في نقطة انعطاف بالنسبة لصناعة الفيديو بالذكاء الاصطناعي. كما هو الحال مع إنشاء صور الذكاء الاصطناعي ، يمكن أن يتبع الاندفاع المتزايد في الميمات تحسينات كبيرة في جودة مقاطع فيديو الذكاء الاصطناعي وإمكانية التحكم فيها والتي توفر التكنولوجيا في جميع أنواع الأماكن. قد يصبح الذكاء الاصطناعي مصدر إلهام لبعض المؤلفين. تم استخدام أدوات Runway من قبل فناني المؤثرات المرئية الذين يعملون على جائزة الأوسكار في كل مكان وكل مرة. دارين أرونوفسكي ، مدير الحوتو البجعة السوداءو باي هو أيضا من محبي Runway.
لكنك تحتاج فقط إلى إلقاء نظرة على مدى تقدم الصور من Midjourney و Dream Studio الآن لاستشعار المكان الذي يتجه إليه فيديو AI – ومدى صعوبة التمييز بين المقاطع الحقيقية والمزيفة. بالطبع ، يمكن للأشخاص بالفعل معالجة مقاطع الفيديو باستخدام التكنولوجيا الحالية ، لكنها لا تزال باهظة الثمن نسبيًا ويصعب تحقيقها.
قد يكون التقدم السريع في الذكاء الاصطناعي التوليدي خطيرًا في عصر تم فيه تسليح وسائل التواصل الاجتماعي وأصبح التزييف العميق من ألعاب الدعاية. كما كتب جيسون بارهام لـ WIRED هذا الأسبوع ، نحتاج أيضًا إلى التفكير بجدية في كيف يمكن للذكاء الاصطناعي التوليدي استعادة الصور النمطية القبيحة وإعادة توظيفها.
في الوقت الحالي ، يمكن الاعتماد على غريزة الثقة في مقاطع الفيديو ، ولكن قد لا يمر وقت طويل قبل أن تصبح اللقطات التي نراها أقل صلابة وصدق مما كانت عليه في السابق.