مولد الصوت: أداة ذكاء اصطناعي لتقليد الأصوات
ما هو جديد في عالم الذكاء الاصطناعي؟ تعرف على أحدث أداة من OpenAI التي تُقلد الأصوات البشرية بدقة مدهشة، مع تطبيقات محتملة وأهمية واضحة للمجتمع، إقرأ المزيد الآن.
تقول شركة OpenAI إنها تعمل على تطوير ذكاء اصطناعي يقلد أصوات البشر
أعلنت شركة OpenAI عن أداة ذكاء اصطناعي جديدة يمكنها تقليد أصوات البشر بدقة مدهشة. يحمل مولد الصوت الذكاء الاصطناعي مجموعة من التطبيقات المحتملة، بما في ذلك خدمات الوصول، ولكن يمكن أن يثير أيضًا مخاوف بشأن نشر المعلومات الخاطئة وأشكال أخرى من سوء الاستخدام.
شاركت شركة OpenAI العينات الصوتية من اختبارات مبكرة للأداة، التي تسمى محرك الصوت، والتي تستخدم عينات لمدة 15 ثانية من شخص يتحدث لتوليد نسخة مقنعة من صوتهم. يمكن للمستخدمين بعد ذلك تقديم فقرة نصية وستقرأ الأداة النص في الصوت الذكاء الاصطناعي.
هناك العديد من خدمات الأصوات الاصطناعية المتاحة بالفعل للجمهوبية، ولكن كما فعلت مع ابتكار الدردشة الفورية ChatGPT، أثبتت OpenAI أيديا بشكل خاص في جلب اعتماد واسع النطاق لأدوات الذكاء الاصطناعي.
يمكن أن تساعد أداة النص إلى صوت المحرفة بالذكاء الاصطناعي في الترجمة، ومساعدة القراءة للأطفال أو مساعدة الأشخاص الذين فقدوا القدرة على التحدث، وتقول الشركة أن بعض المتشككين يشعرون بالقلق من أنه يمكن أيضا أن يشعل إنشاء المعلومات الخاطئة أو يجعل من الأسهل القيام بالاحتيال.
تقول OpenAI إن محرك الصوت يستخدم حاليًا من قبل "مجموعة صغيرة من الشركاء الموثوقين"، بما في ذلك شركات التكنولوجيا التعليمية والصحية، وسوف تستخدم اختباراتهم لتحديد ما إذا كان وكيف يمكن السماح باستخدام أوسع نطاقًا. وافق هؤلاء الاختبارون على عدم إعادة إنشاء أصوات الأشخاص دون موافقتهم الصريحة وتحديد بوضوح للمستمعين أن ما يسمعونه هو منشوئ بالذكاء الاصطناعي بحسب الشركة.
"ندرك أن إنتاج الكلام الشبيه بأصوات الناس يحمل مخاطر خطيرة، وهي على رأس الأفكار في هذا العام الانتخابي"، قالت OpenAI في منشور على مدونتها. واعترفت الشركة بضرورة إجراء تغييرات كبيرة بينما يصبح الصوت الذكاء الاصطناعي أكثر انتشارًا، على الرغم من أنها لا تخطط لإطلاق محرك الصوت إلى الجمهور على الفور. على سبيل المثال، اقترحت الشركة تدريجا استبدال التحقق الصوتي القائم على الصوت للحسابات المصرفية.
"يجب مرافقة أي نشر واسع النطاق لتقنية الصوت الاصطناعي الاصطحابات التي تتحقق من أن الشخص الأصلي يضيف صوته إلى الخدمة بعلم منه وقائمة بلا أصوات تجعل البيئات الصوتية أقرب ما يمكن إلى الشخصيات البارزة"، قالت OpenAI.
يمكن لمحرك الصوت استخدام عينة صوتية بلغة واحدة لإنشاء صوت مقلد يمكنه التحدث بعدة لغات أخرى.
يتضمن منشور المدونة مثالًا على مقطع صوتي لشخص يقرأ مقطعًا عن الصداقة، جنبًا إلى جنب مع صوت اصطناعي يبدو وكأنه نفس الشخص يقرأ نفس المقطع باللغة الإسبانية والصينية والألمانية والفرنسية واليابانية. في كل العينات الاصطناعية، تم الاحتفاظ بنغمة ولهجة المتحدث الأصلي.
عرض محرك الصوت يأتي بينما ينتظر المستخدمون إطلاق Sora، أداة الفيديو الذكاء الاصطناعي التي تم الإعلان عنها من قبل OpenAI الشهر الماضي. يمكن لـ Sora إنشاء مقاطع فيديو واقعية بمدة 60 ثانية من تعليمات النص، مع القدرة على تقديم مشاهد تحتوي على شخصيات متعددة وأنواع محددة من الحركة وتفاصيل خلفية متقدمة. يمكن لـ ChatGPT الخاص بـ OpenAI أيضًا إنشاء صور من مطالب النص.