شارك الخبر
أعلنت شركة ميتا عن إطلاق مشروع جديد يحمل اسم “NotebookLlama”، وهو نظام مفتوح المصدر لإنشاء حلقات صوتية تفاعلية (بودكاست) يعتمد على الذكاء الاصطناعي.
يهدف المشروع إلى المنافسة مع منصة غوغل المشابهة “NotebookLM”، التي حققت شهرة واسعة في الفترة الأخيرة.
يعتمد “NotebookLlama” على نماذج الذكاء الاصطناعي الخاصة بشركة ميتا، والمعروفة باسم “Llama”، لتنفيذ جزء كبير من عمليات المعالجة.
مثل “NotebookLM”، يمكن لـ”NotebookLlama” توليد ملخصات صوتية بأسلوب حواري مشابه لحلقات البودكاست، استنادًا إلى الملفات النصية التي تُرفع إليه.
تقوم أداة “NotebookLlama” بتحويل النصوص، مثل مقالات الأخبار أو المنشورات، إلى ملفات صوتية، ثم تضيف “لمسات درامية” وتفاعلات تجعل النصوص أكثر حيوية قبل إرسالها إلى نماذج تحويل النص إلى كلام.
ومع ذلك، لا تُضاهي النتائج الحالية الجودة الصوتية لأداة “NotebookLM” من غوغل، حيث أن عيّنات الصوت من “NotebookLlama” تظهر أن الأصوات تبدو غير طبيعية وآلية، وغالبًا ما تتداخل في الحديث بشكل غير متناسق. ورغم ذلك، يشير الباحثون في ميتا إلى إمكانية تحسين الجودة باستخدام نماذج أقوى، موضحين أن “نموذج تحويل النص إلى كلام هو المحدد الرئيسي لمدى طبيعية الصوت”.
كما أشاروا إلى إمكانية اتباع نهج آخر لتوليد البودكاست، من خلال جعل اثنين من وكلاء الذكاء الاصطناعي يناقشان الموضوع ويضعان هيكل الحوار، بينما يُستخدم حاليًا نموذج واحد لكتابة المخطط.
يجدر بالذكر أن “NotebookLlama” ليست المحاولة الأولى لاستنساخ ميزة البودكاست من “NotebookLM”، فقد ظهرت عدة مشاريع أخرى تتفاوت في مستوى النجاح، لكن لم يتمكن أي منها حتى الآن من التغلب على مشكلة “الهلوسة” التي تعاني منها كافة تطبيقات الذكاء الاصطناعي، بما في ذلك “NotebookLM”، إذ قد تولّد معلومات غير دقيقة أو مُختلَقة في البودكاست.