خَبَرَيْن logo

تقنية الذكاء الاصطناعي: إنشاء فيديوهات واقعية

كيف يمكن لتقنية الذكاء الاصطناعي من مايكروسوفت تحويل اللوحات الشهيرة إلى فيديو واقعي؟ اقرأ المقال لاكتشاف كيف يمكن لنموذج VASA-1 إنشاء فيديوهات تفاعلية مذهلة لشخصيات تاريخية والمزيد. #ذكاء_اصطناعي #تحريك_الوجوه

الموناليزا تتحدث بفضل تقنية الذكاء الاصطناعي من مايكروسوفت، مع تعبيرات وجهية وحركات شفاه واقعية.
تشرح كاتبة في CNN كيفية عمل نموذج الذكاء الاصطناعي الجديد من مايكروسوفت.
التصنيف:تكنولوجيا
شارك الخبر:
FacebookTwitterLinkedInEmail

تقنية الذكاء الاصطناعي من مايكروسوفت

يمكن للموناليزا الآن أن تفعل أكثر من مجرد الابتسام، وذلك بفضل تقنية الذكاء الاصطناعي الجديدة من مايكروسوفت.

نموذج VASA-1: الابتكار الجديد

ففي الأسبوع الماضي، قام باحثو مايكروسوفت بتفصيل نموذج ذكاء اصطناعي جديد قاموا بتطويره يمكنه التقاط صورة ثابتة لوجه ومقطع صوتي لشخص ما يتحدث، وإنشاء فيديو واقعي المظهر تلقائياً لهذا الشخص وهو يتحدث. وتكتمل مقاطع الفيديو - التي يمكن إنشاؤها من وجوه واقعية أو رسوم متحركة أو أعمال فنية - مع مزامنة الشفاه وحركات الوجه والرأس الطبيعية.

تطبيقات تقنية VASA-1

في أحد مقاطع الفيديو التجريبية، أظهر الباحثون كيف قاموا بتحريك الموناليزا لتلاوة أغنية راب كوميدية للممثلة آن هاثاواي.

المخاوف من إساءة استخدام التقنية

شاهد ايضاً: نفيديا تصبح أول شركة أمريكية تصل إلى قيمة سوقية تبلغ 4 تريليون دولار

وكانت المخرجات من نموذج الذكاء الاصطناعي، المسمى VASA-1، مسلية ومثيرة للاهتمام في آن واحد. قالت مايكروسوفت إنه يمكن استخدام هذه التقنية في التعليم أو "تحسين إمكانية الوصول للأفراد الذين يعانون من تحديات التواصل"، أو ربما لإنشاء رفقاء افتراضيين للبشر. ولكن من السهل أيضًا أن نرى كيف يمكن إساءة استخدام الأداة واستخدامها لانتحال شخصية أشخاص حقيقيين.

وهو مصدر قلق يتجاوز مايكروسوفت: فمع ظهور المزيد من الأدوات لإنشاء صور ومقاطع فيديو وصوت مقنعة من إنتاج الذكاء الاصطناعي، يشعر الخبراء بالقلق من أن إساءة استخدامها قد تؤدي إلى أشكال جديدة من المعلومات المضللة. كما يشعر البعض بالقلق من أن التكنولوجيا يمكن أن تزيد من تعطيل الصناعات الإبداعية من الأفلام إلى الإعلانات.

تحريك الوجوه باستخدام الذكاء الاصطناعي

في الوقت الحالي، قالت مايكروسوفت إنها لا تخطط لإصدار نموذج VASA-1 للجمهور على الفور. وتشبه هذه الخطوة الطريقة التي يتعامل بها شريك مايكروسوفت OpenAI مع المخاوف المتعلقة بأداة الفيديو التي تم إنشاؤها بالذكاء الاصطناعي "سورا": أطلقت OpenAI أداة Sora في فبراير/شباط، لكنها أتاحتها حتى الآن لبعض المستخدمين المحترفين وأساتذة الأمن السيبراني لأغراض الاختبار فقط.

كيفية عمل نموذج VASA-1

شاهد ايضاً: سيتمكن ضحايا التزييف العميق الصريح قريبًا من اتخاذ إجراءات قانونية ضد الأشخاص الذين يقومون بإنشائها

وقال باحثون في مايكروسوفت في منشور على مدونة: "نحن نعارض أي سلوك لإنشاء محتويات مضللة أو ضارة لأشخاص حقيقيين". لكنهم أضافوا أن الشركة ليس لديها "أي خطط لإصدار" المنتج علنًا "حتى نتأكد من أن التكنولوجيا ستُستخدم بشكل مسؤول ووفقًا للوائح المناسبة".

قال الباحثون إن نموذج الذكاء الاصطناعي الجديد من مايكروسوفت تم تدريبه على العديد من مقاطع الفيديو لوجوه الأشخاص أثناء التحدث، وهو مصمم للتعرف على حركات الوجه والرأس الطبيعية، بما في ذلك "حركة الشفاه، والتعبيرات (غير الشفاه)، ونظرات العينين والرمش، وغيرها". والنتيجة هي فيديو أكثر واقعية عندما يقوم VASA-1 بتحريك صورة ثابتة.

على سبيل المثال، في أحد مقاطع الفيديو التجريبية التي تم ضبطها على مقطع لشخص يبدو هائجاً، على ما يبدو أثناء لعب ألعاب الفيديو، يظهر الوجه الذي يتحدث بحاجبين مجعدين وشفتين مزمومتين.

شاهد ايضاً: يجب على الأطفال والمراهقين دون سن 18 عدم استخدام تطبيقات رفقاء الذكاء الاصطناعي، وفقًا لمجموعة السلامة

يمكن أيضًا توجيه أداة الذكاء الاصطناعي لإنتاج مقطع فيديو حيث ينظر الشخص في اتجاه معين أو يعبر عن مشاعر معينة.

عند النظر عن كثب، لا تزال هناك علامات تدل على أن مقاطع الفيديو يتم إنشاؤها آلياً، مثل الرمش النادر وحركات الحاجبين المبالغ فيها. لكن مايكروسوفت قالت إنها تعتقد أن نموذجها "يتفوق بشكل كبير" على الأدوات الأخرى المماثلة و"يمهد الطريق للتفاعل في الوقت الحقيقي مع صور رمزية نابضة بالحياة تحاكي سلوكيات المحادثة البشرية".

أخبار ذات صلة

Loading...
بريندان كار، مفوض لجنة الاتصالات الفيدرالية، يجلس في جلسة استماع رسمية، مع التركيز على قضايا تنظيم شركات التكنولوجيا الكبرى.

ترامب يختار ناقداً للتكنولوجيا الكبيرة، كتب فصلاً عن "مشروع 2025"، لقيادة لجنة الاتصالات الفيدرالية

في خطوة مثيرة، عيّن الرئيس الأمريكي المنتخب دونالد ترامب بريندان كار، المدافع عن حرية التعبير، لقيادة لجنة الاتصالات الفيدرالية. فهل سينجح كار في تفكيك قيود الرقابة التي تفرضها شركات التكنولوجيا الكبرى؟ تابعوا معنا لتكتشفوا المزيد عن تأثير هذا القرار على مستقبل الإنترنت!
تكنولوجيا
Loading...
صورة تُظهر يد شخص تستخدم لوحة تتبع لجهاز كمبيوتر محمول، مع شعار \"Copilot + PC\" واضح على السطح.

"مريح، ممتع، مألوف: لماذا تسعى مايكروسوفت لتحويل روبوت الدردشة الذكي إلى صديق رقمي"

هل سئمت من الروبوتات التي لا تفهم مشاعرك؟ مع تحديث %"Copilot%" الجديد من مايكروسوفت، ستجد رفيقًا ذكيًا يدمج بين الذكاء الاصطناعي والشخصية الدافئة، مما يجعل التفاعل أكثر إنسانية. انطلق في رحلة اكتشاف كيف يمكن أن يصبح الذكاء الاصطناعي صديقًا حقيقيًا لك!
تكنولوجيا
Loading...
جهاز بيومتري دائري يقوم بمسح قزحية العين، مع شخص يلمسه، في خلفية تحمل نصًا عن الاقتصاد العالمي.

مشروع العملات الرقمية الذي يرغب سام ألتمان في تنفيذه يهدف إلى مسح قزحيات العين في جميع أنحاء العالم

هل نحن على أعتاب ثورة اقتصادية بفضل الذكاء الاصطناعي؟ سام ألتمان يسعى لتحقيق ذلك عبر مشروع Worldcoin، الذي يعد بتغيير مفهوم الهوية الرقمية. انضم إلينا لاستكشاف كيف يمكن لقزحية العين أن تصبح جواز سفرك لعالم جديد من الفرص.
تكنولوجيا
Loading...
متسوقون يتفاعلون مع أجهزة iPhone 15 في متجر Apple، مع وجود شاشة تعرض الهاتف الجديد، مما يعكس تحديات الطلب في السوق.

خطة آبل لشراء أسهم بقيمة 110 مليار دولار في ظل تقرير أرباح صعب

تواجه شركة Apple تحديات كبيرة في الربع الأول، مع تراجع الإيرادات بنسبة 4% إلى 90.8 مليار دولار، مما يثير تساؤلات حول مستقبل هواتف iPhone. هل ستتمكن من استعادة زخمها في السوق، خاصة في ظل المنافسة المتزايدة؟ تابعونا لاكتشاف المزيد عن استراتيجياتها القادمة!
تكنولوجيا
الرئيسيةأخبارسياسةأعمالرياضةالعالمتكنولوجيااقتصادصحةتسلية