أعلنت شركة “ميتا” عن إطلاق نموذجها الجديد “Spirit LM”، وهو نموذج مفتوح المصدر يهدف إلى معالجة تحديات توليد الأصوات وتقليد الأصوات البشرية بشكل طبيعي. ويعتمد هذا النموذج على استخدام رموز الفونيم والنغمات لتقديم تجربة صوتية أكثر تعبيراً وواقعية.
وأوضحت “ميتا” أن النموذج يتميز بقدرته على التعلم من مهام جديدة تشمل التعرف على الكلام وتحويل النص إلى صوت، وهو متاح الآن للمطورين والباحثين لاستخدامه وتطويره. ويُتوقع أن يُستخدم هذا النموذج في تطبيقات مثل “واتساب” و”إنستغرام”، مما يتيح تفاعلاً صوتياً طبيعياً للمستخدمين.
ويعتبر هذا النموذج خطوة متقدمة في تطوير الذكاء الاصطناعي القادر على التواصل الصوتي المعقد، ويهدف إلى تحسين تجربة المستخدمين في مختلف تطبيقات “ميتا”.