خَبَرَيْن logo

تقنية الذكاء الاصطناعي: إنشاء فيديوهات واقعية

كيف يمكن لتقنية الذكاء الاصطناعي من مايكروسوفت تحويل اللوحات الشهيرة إلى فيديو واقعي؟ اقرأ المقال لاكتشاف كيف يمكن لنموذج VASA-1 إنشاء فيديوهات تفاعلية مذهلة لشخصيات تاريخية والمزيد. #ذكاء_اصطناعي #تحريك_الوجوه

الموناليزا تتحدث بفضل تقنية الذكاء الاصطناعي من مايكروسوفت، مع تعبيرات وجهية وحركات شفاه واقعية.
Loading...
تشرح كاتبة في CNN كيفية عمل نموذج الذكاء الاصطناعي الجديد من مايكروسوفت.
التصنيف:تكنولوجيا
شارك الخبر:
FacebookTwitterLinkedInEmail

ترجمة: تتغنى موناليزا؟ الذكاء الاصطناعي الجديد من مايكروسوفت يحيا وجوهًا من الصور

يمكن للموناليزا الآن أن تفعل أكثر من مجرد الابتسام، وذلك بفضل تقنية الذكاء الاصطناعي الجديدة من مايكروسوفت.

ففي الأسبوع الماضي، قام باحثو مايكروسوفت بتفصيل نموذج ذكاء اصطناعي جديد قاموا بتطويره يمكنه التقاط صورة ثابتة لوجه ومقطع صوتي لشخص ما يتحدث، وإنشاء فيديو واقعي المظهر تلقائياً لهذا الشخص وهو يتحدث. وتكتمل مقاطع الفيديو - التي يمكن إنشاؤها من وجوه واقعية أو رسوم متحركة أو أعمال فنية - مع مزامنة الشفاه وحركات الوجه والرأس الطبيعية.

في أحد مقاطع الفيديو التجريبية، أظهر الباحثون كيف قاموا بتحريك الموناليزا لتلاوة أغنية راب كوميدية للممثلة آن هاثاواي.

شاهد ايضاً: خدمة الأمن الروسية: أمريكي مسجون سرب أسرار التكنولوجيا الحيوية

وكانت المخرجات من نموذج الذكاء الاصطناعي، المسمى VASA-1، مسلية ومثيرة للاهتمام في آن واحد. قالت مايكروسوفت إنه يمكن استخدام هذه التقنية في التعليم أو "تحسين إمكانية الوصول للأفراد الذين يعانون من تحديات التواصل"، أو ربما لإنشاء رفقاء افتراضيين للبشر. ولكن من السهل أيضًا أن نرى كيف يمكن إساءة استخدام الأداة واستخدامها لانتحال شخصية أشخاص حقيقيين.

وهو مصدر قلق يتجاوز مايكروسوفت: فمع ظهور المزيد من الأدوات لإنشاء صور ومقاطع فيديو وصوت مقنعة من إنتاج الذكاء الاصطناعي، يشعر الخبراء بالقلق من أن إساءة استخدامها قد تؤدي إلى أشكال جديدة من المعلومات المضللة. كما يشعر البعض بالقلق من أن التكنولوجيا يمكن أن تزيد من تعطيل الصناعات الإبداعية من الأفلام إلى الإعلانات.

في الوقت الحالي، قالت مايكروسوفت إنها لا تخطط لإصدار نموذج VASA-1 للجمهور على الفور. وتشبه هذه الخطوة الطريقة التي يتعامل بها شريك مايكروسوفت OpenAI مع المخاوف المتعلقة بأداة الفيديو التي تم إنشاؤها بالذكاء الاصطناعي "سورا": أطلقت OpenAI أداة Sora في فبراير/شباط، لكنها أتاحتها حتى الآن لبعض المستخدمين المحترفين وأساتذة الأمن السيبراني لأغراض الاختبار فقط.

شاهد ايضاً: تحذير للنواب: يجب على آبل وجوجل الاستعداد لإزالة تيك توك من متاجر التطبيقات بحلول 19 يناير

وقال باحثون في مايكروسوفت في منشور على مدونة: "نحن نعارض أي سلوك لإنشاء محتويات مضللة أو ضارة لأشخاص حقيقيين". لكنهم أضافوا أن الشركة ليس لديها "أي خطط لإصدار" المنتج علنًا "حتى نتأكد من أن التكنولوجيا ستُستخدم بشكل مسؤول ووفقًا للوائح المناسبة".

تحريك الوجوه

قال الباحثون إن نموذج الذكاء الاصطناعي الجديد من مايكروسوفت تم تدريبه على العديد من مقاطع الفيديو لوجوه الأشخاص أثناء التحدث، وهو مصمم للتعرف على حركات الوجه والرأس الطبيعية، بما في ذلك "حركة الشفاه، والتعبيرات (غير الشفاه)، ونظرات العينين والرمش، وغيرها". والنتيجة هي فيديو أكثر واقعية عندما يقوم VASA-1 بتحريك صورة ثابتة.

على سبيل المثال، في أحد مقاطع الفيديو التجريبية التي تم ضبطها على مقطع لشخص يبدو هائجاً، على ما يبدو أثناء لعب ألعاب الفيديو، يظهر الوجه الذي يتحدث بحاجبين مجعدين وشفتين مزمومتين.

شاهد ايضاً: ما هي الخطوات القادمة لتطبيق تيك توك بعد احتمال حظره؟

يمكن أيضًا توجيه أداة الذكاء الاصطناعي لإنتاج مقطع فيديو حيث ينظر الشخص في اتجاه معين أو يعبر عن مشاعر معينة.

عند النظر عن كثب، لا تزال هناك علامات تدل على أن مقاطع الفيديو يتم إنشاؤها آلياً، مثل الرمش النادر وحركات الحاجبين المبالغ فيها. لكن مايكروسوفت قالت إنها تعتقد أن نموذجها "يتفوق بشكل كبير" على الأدوات الأخرى المماثلة و"يمهد الطريق للتفاعل في الوقت الحقيقي مع صور رمزية نابضة بالحياة تحاكي سلوكيات المحادثة البشرية".

أخبار ذات صلة

Loading...
تظهر الصورة منطقة سكنية في فلوريدا غارقة بالمياه بعد إعصار ميلتون، مع منازل ومركبات مغمورة، مما يعكس آثار الكارثة الطبيعية.

تأقلم المؤثرون مع إعصار ميلتون من أجل المحتوى. لماذا نشاهدهم؟

في خضم إعصار ميلتون المدمر، برزت ظاهرة غريبة: منشئو المحتوى الذين يفضلون البقاء في مناطق الخطر لالتقاط المشاهد بدلاً من اتباع إرشادات السلامة. هذا السلوك يسلط الضوء على تأثير وسائل التواصل الاجتماعي في تعزيز القرارات غير المسؤولة. هل تساءلت يومًا عن الدوافع الحقيقية وراء نشر مثل هذه المحتويات؟ تابع القراءة لتكتشف كيف يمكن أن تؤثر الخوارزميات على سلوكيات المبدعين!
تكنولوجيا
Loading...
عمال سامسونج للإلكترونيات يرتدون معاطف سوداء ويرفعون قبضاتهم في إضراب غير محدد، مطالبين بتحسين الأجور والمكافآت وسط الأمطار.

عمال سامسونج يعلنون إضراباً غير محدد المدة للمطالبة برواتب وسياسات إجازات أفضل

في خطوة تاريخية، أعلنت نقابة سامسونج للإلكترونيات عن إضراب غير محدد بعد فشل مفاوضات الأجور، مما يسلط الضوء على تزايد الاستياء بين العمال. هل ستستجيب الإدارة لمطالبهم؟ تابعوا التفاصيل لتكتشفوا كيف يمكن أن يؤثر هذا النزاع على مستقبل العملاق الكوري.
تكنولوجيا
Loading...
ممثلا الصوت بول سكاي ليرمان ولينيا سيج يجلسان معًا، مع خلفية جدران حجرية، في إطار يتناول قضيتهما ضد شركة Lovo للذكاء الاصطناعي.

يدعون أن الذكاء الاصطناعي قد سرق أصواتهم. الآن هم يقاضون.

هل تعتقد أن صوتك يمكن أن يُستخدم دون إذنك؟ هذا ما واجهه بول سكاي ليرمان وزميلته لينيا سيج، حيث قاما برفع دعوى قضائية ضد شركة Lovo للذكاء الاصطناعي بتهمة سرقة أصواتهما. في عالم يتصاعد فيه استخدام الذكاء الاصطناعي، انضم إليهما في رحلة استكشاف حقوق الفنانين وكيف يمكن حماية الإبداع. تابع القراءة لتكتشف المزيد!
تكنولوجيا
Loading...
امرأة مسنّة ترتدي قميصًا برتقاليًا، تستخدم الكمبيوتر المحمول في منزلها، تعكس أهمية الإنترنت في حياتها اليومية.

"يجب أن يكون تم القيام به أمس": قد يتأذى الأمريكيون الأكبر سنًا والمقيمون في المناطق الريفية بانتهاء برنامج الإنترنت الميسور التكلفة من التمويل"

في عالم يعتمد على الاتصال، تكافح عائلات مثل عائلة ويستمان للبقاء على قيد الحياة في ظل أزمة الإنترنت المتزايدة. مع اقتراب انتهاء برنامج الاتصال الميسور التكلفة، يواجه ملايين الأمريكيين خيارات صعبة بين الغذاء والاتصال. اكتشف كيف يؤثر هذا الواقع على حياتهم اليومية.
تكنولوجيا
الرئيسيةأخبارسياسةأعمالرياضةالعالمتكنولوجيااقتصادصحةتسلية