تقنية الذكاء الاصطناعي: إنشاء فيديوهات واقعية

كيف يمكن لتقنية الذكاء الاصطناعي من مايكروسوفت تحويل اللوحات الشهيرة إلى فيديو واقعي؟ اقرأ المقال لاكتشاف كيف يمكن لنموذج VASA-1 إنشاء فيديوهات تفاعلية مذهلة لشخصيات تاريخية والمزيد. #ذكاء_اصطناعي #تحريك_الوجوه

٢٢ أبريل ٢٠٢٤

The Mona Lisa rapping? New Microsoft AI animates faces from photos — CNN writer explains how Microsoft's new AI model works

التصنيف:تكنولوجيا

شارك الخبر:

ترجمة: تتغنى موناليزا؟ الذكاء الاصطناعي الجديد من مايكروسوفت يحيا وجوهًا من الصور

يمكن للموناليزا الآن أن تفعل أكثر من مجرد الابتسام، وذلك بفضل تقنية الذكاء الاصطناعي الجديدة من مايكروسوفت.

ففي الأسبوع الماضي، قام باحثو مايكروسوفت بتفصيل نموذج ذكاء اصطناعي جديد قاموا بتطويره يمكنه التقاط صورة ثابتة لوجه ومقطع صوتي لشخص ما يتحدث، وإنشاء فيديو واقعي المظهر تلقائياً لهذا الشخص وهو يتحدث. وتكتمل مقاطع الفيديو - التي يمكن إنشاؤها من وجوه واقعية أو رسوم متحركة أو أعمال فنية - مع مزامنة الشفاه وحركات الوجه والرأس الطبيعية.

في أحد مقاطع الفيديو التجريبية، أظهر الباحثون كيف قاموا بتحريك الموناليزا لتلاوة أغنية راب كوميدية للممثلة آن هاثاواي.

وكانت المخرجات من نموذج الذكاء الاصطناعي، المسمى VASA-1، مسلية ومثيرة للاهتمام في آن واحد. قالت مايكروسوفت إنه يمكن استخدام هذه التقنية في التعليم أو "تحسين إمكانية الوصول للأفراد الذين يعانون من تحديات التواصل"، أو ربما لإنشاء رفقاء افتراضيين للبشر. ولكن من السهل أيضًا أن نرى كيف يمكن إساءة استخدام الأداة واستخدامها لانتحال شخصية أشخاص حقيقيين.

وهو مصدر قلق يتجاوز مايكروسوفت: فمع ظهور المزيد من الأدوات لإنشاء صور ومقاطع فيديو وصوت مقنعة من إنتاج الذكاء الاصطناعي، يشعر الخبراء بالقلق من أن إساءة استخدامها قد تؤدي إلى أشكال جديدة من المعلومات المضللة. كما يشعر البعض بالقلق من أن التكنولوجيا يمكن أن تزيد من تعطيل الصناعات الإبداعية من الأفلام إلى الإعلانات.

في الوقت الحالي، قالت مايكروسوفت إنها لا تخطط لإصدار نموذج VASA-1 للجمهور على الفور. وتشبه هذه الخطوة الطريقة التي يتعامل بها شريك مايكروسوفت OpenAI مع المخاوف المتعلقة بأداة الفيديو التي تم إنشاؤها بالذكاء الاصطناعي "سورا": أطلقت OpenAI أداة Sora في فبراير/شباط، لكنها أتاحتها حتى الآن لبعض المستخدمين المحترفين وأساتذة الأمن السيبراني لأغراض الاختبار فقط.

وقال باحثون في مايكروسوفت في منشور على مدونة: "نحن نعارض أي سلوك لإنشاء محتويات مضللة أو ضارة لأشخاص حقيقيين". لكنهم أضافوا أن الشركة ليس لديها "أي خطط لإصدار" المنتج علنًا "حتى نتأكد من أن التكنولوجيا ستُستخدم بشكل مسؤول ووفقًا للوائح المناسبة".

تحريك الوجوه

قال الباحثون إن نموذج الذكاء الاصطناعي الجديد من مايكروسوفت تم تدريبه على العديد من مقاطع الفيديو لوجوه الأشخاص أثناء التحدث، وهو مصمم للتعرف على حركات الوجه والرأس الطبيعية، بما في ذلك "حركة الشفاه، والتعبيرات (غير الشفاه)، ونظرات العينين والرمش، وغيرها". والنتيجة هي فيديو أكثر واقعية عندما يقوم VASA-1 بتحريك صورة ثابتة.

على سبيل المثال، في أحد مقاطع الفيديو التجريبية التي تم ضبطها على مقطع لشخص يبدو هائجاً، على ما يبدو أثناء لعب ألعاب الفيديو، يظهر الوجه الذي يتحدث بحاجبين مجعدين وشفتين مزمومتين.

يمكن أيضًا توجيه أداة الذكاء الاصطناعي لإنتاج مقطع فيديو حيث ينظر الشخص في اتجاه معين أو يعبر عن مشاعر معينة.

عند النظر عن كثب، لا تزال هناك علامات تدل على أن مقاطع الفيديو يتم إنشاؤها آلياً، مثل الرمش النادر وحركات الحاجبين المبالغ فيها. لكن مايكروسوفت قالت إنها تعتقد أن نموذجها "يتفوق بشكل كبير" على الأدوات الأخرى المماثلة و"يمهد الطريق للتفاعل في الوقت الحقيقي مع صور رمزية نابضة بالحياة تحاكي سلوكيات المحادثة البشرية".

أخبار ذات صلة

ChatGPT maker says its new AI model can reason and think ‘much like a person’

صانع ChatGPT يقول إن نموذجه الذكاء الاصطناعي الجديد يمكنه التفكير والاستدلال "بشكل يشبه إلى حد كبير الإنسان"

كشفت OpenAI النقاب عن نموذج جديد للذكاء الاصطناعي تقول إنه قادر على "التفكير" وحل المشاكل الأصعب في العلوم والترميز والرياضيات أكثر من سابقيه. تم إصدار هذا النموذج، وهو الأول في سلسلة تسمى OpenAI o1، يوم الخميس كمعاينة، حيث قالت الشركة إنها تتوقع تحديثات وتحسينات منتظمة. وسيصبح متاحاً تدريجياً...

تكنولوجيا١٤ سبتمبر ٢٠٢٤

Hundreds of workers strike at major Samsung factory in India

إضراب مئات العمال في مصنع سامسونغ الكبير في الهند

تعطّل الإنتاج في مصنع رئيسي لشركة سامسونج للإلكترونيات في جنوب الهند بسبب إضراب مئات الموظفين المضربين عن العمل للمطالبة بزيادة الأجور يوم الثلاثاء، حيث سعى كبار المسؤولين التنفيذيين إلى حل حلقة نادرة من الاضطرابات العمالية. وتعتبر شركة سامسونج التي تتخذ من كوريا الجنوبية مقراً لها، وهي أكبر...

تكنولوجيا١٣ سبتمبر ٢٠٢٤

After Trump’s guilty verdict, threats and attempts to dox Trump jurors proliferate online

بعد صدور حكم إدانة ترامب، تتزايد التهديدات ومحاولات نشر معلومات شخصية عن أعضاء هيئة المحلفين عبر الإنترنت

على منتديات الإنترنت التي ارتبطت في السابق بعمليات إطلاق النار الجماعي، يهدد الناس بالعنف ويحاولون تحديد هوية المحلفين الـ12 في نيويورك الذين قرروا يوم الخميس إدانة الرئيس السابق دونالد ترامب. بدأت دعوات الانتقام فور إعلان الحكم. وقال الخبراء الذين يتتبعون التطرف عبر الإنترنت لشبكة CNN إن حجم...

تكنولوجيا٥ يونيو ٢٠٢٤

تكشف OpenAI عن أحدث نموذج للذكاء الاصطناعي، GPT-4o

ستصبح ChatGPT على وشك أن تصبح أكثر فائدة بكثير. فقد أعلنت OpenAI يوم الاثنين عن أحدث نماذجها اللغوية الكبيرة للذكاء الاصطناعي التي تقول إنها ستجعل ChatGPT أكثر ذكاءً وسهولة في الاستخدام. النموذج الجديد، المسمى GPT-4o، هو تحديث من نموذج GPT-4 السابق للشركة، والذي تم إطلاقه منذ أكثر من عام بقليل....

تكنولوجيا١٤ مايو ٢٠٢٤