أعلنت شركة Google يوم الخميس الموافق 26 مارس 2026 عن إطلاق نموذج Gemini 3.1 Flash Live الذي يمثل أحدث إنجازات الشركة في مجال نماذج الصوت والمحادثات الحية، حيث يحقق النموذج الجديد استجابات أسرع بنسبة ملحوظة ودقة أعلى في فهم السياق وتفاعلات أكثر طبيعية تشبه المحادثات البشرية الحقيقية، مما يمثل قفزة نوعية غير مسبوقة نحو بناء وكلاء ذكاء اصطناعي يعتمدون على الصوت كواجهة أساسية للتفاعل مع المستخدمين في مختلف التطبيقات والخدمات الرقمية التي تخدم ملايين المستخدمين حول العالم يومياً.
ويتميز نموذج Gemini 3.1 Flash Live الجديد بزمن استجابة منخفض للغاية يصل إلى مستويات قياسية في الصناعة، بالإضافة إلى دقة محسّنة بشكل كبير في فهم الفروق الدقيقة في النبرة والإيقاع والصوت البشري، مما يتيح للمستخدمين إجراء محادثات أكثر سلاسة وطبيعية مقارنة بالنماذج الصوتية السابقة التي كانت تعاني من بعض الجمود في الردود، كما يمكن للنموذج الجديد الحفاظ على سياق المحادثة لضعف المدة الزمنية التي كانت متاحة في الإصدارات السابقة مما يحافظ على تسلسل الأفكار والمنطق خلال الجلسات الطويلة والمعقدة التي تتطلب تركيزاً عالياً من الذكاء الاصطناعي لفهم نوايا المستخدم بدقة.
وحقق نموذج Gemini 3.1 Flash Live الجديد نسبة أداء متميزة تبلغ 90.8% في معيار ComplexFuncBench Audio المتخصص الذي يقيس قدرة النماذج على تنفيذ مهام متعددة الخطوات مع مراعاة قيود مختلفة ومعقدة، متفوقاً بذلك بشكل واضح على النموذج السابق الذي كان يحقق نتائج أقل، كما حصل النموذج على نسبة 36.1% في معيار Audio MultiChallenge المتقدم الذي يختبر قدرة النماذج على اتباع التعليمات المعقدة والاستدلال طويل المدى وسط مقاطع صوتية واقعية تتضمن مقاطعات وترددات طبيعية تشبه تلك التي تحدث في المحادثات البشرية اليومية الحقيقية.
وقال Demis Hassabis، الرئيس التنفيذي لشركة Google DeepMind في تغريدة رسمية على منصة X: "Gemini 3.1 Flash Live هو أعلى نماذج الصوت جودة حتى الآن، وقفزة كبيرة نحو بناء وكلاء الجيل القادم الذين يعتمدون على الصوت"، في تصريح رسمي يؤكد الطموح الكبير والرؤية الاستراتيجية التي تقف وراء هذا التطور التقني المهم الذي قد يعيد تشكيل طريقة تفاعل المستخدمين مع التقنيات الذكية في المستقبل القريب جداً.
ويُتاح نموذج Gemini 3.1 Flash Live الجديد للمطورين المحترفين في نسخة معاينة شاملة عبر Gemini Live API في منصة Google AI Studio المتقدمة، وللشركات والمؤسسات الكبرى عبر خدمة Gemini Enterprise for Customer Experience المخصصة، ولجميع المستخدمين العاديين عبر خدمتي Search Live وGemini Live المدمجتين في منتجات جوجل الأساسية، مما يضمن وصول هذه التقنية المتقدمة والمبتكرة لشرائح واسعة ومتنوعة من المستخدمين والمطورين حول العالم لتمكينهم من الاستفادة من إمكانيات الذكاء الاصطناعي الصوتي في مشاريعهم وتطبيقاتهم اليومية.
وأبدت شركات تقنية كبرى ومؤسسات رائدة مثل Verizon وLiveKit وThe Home Depot ملاحظات إيجابية للغاية حول أداء نموذج Gemini 3.1 Flash Live في سير عملها التشغيلي اليومي، مشيرة إلى تحسن ملحوظ وملموس في جودة المحادثات الطبيعية والقدرة الاستثنائية على التعامل مع المهام المعقدة والمتعددة الخطوات حتى في البيئات الصاخبة التي تتسم بمستويات عالية من الضوضاء والتشويش الصوتي الذي قد يؤثر سلباً على دقة النماذج الصوتية التقليدية.
وتستخدم جميع الملفات الصوتية المُولَّدة بواسطة نموذج Gemini 3.1 Flash Live تقنية SynthID المتطورة للعلامات المائية غير المرئية المدمجة مباشرة في المخرجات الصوتية نفسها، مما يتيح الكشف الموثوق والدقيق عن المحتوى المُولَّد بالذكاء الاصطناعي للمساعدة الفعالة في منع انتشار المعلومات المضللة والمحتوى المزيف الذي قد يستغل تقنيات التوليد الصوتي لأغراض غير مشروعة تضر بالمستخدمين والمجتمع الرقمي ككل.
ويُتوقع أن تسهم تقنية Gemini 3.1 Flash Live بشكل كبير في تحسين تجربة المستخدمين النهائية في مجالات متعددة ومهمة مثل خدمة العملاء الآلية والمساعدات الشخصية الذكية ومنصات التعليم عن بُعد والتدريب الرقمي، مما يفتح آفاقاً جديدة وواسعة للتطبيقات العملية والمبتكرة للذكاء الاصطناعي الصوتي في الأسواق العربية والعالمية على المدى المتوسط والبعيد، خاصة مع تزايد الطلب على حلول ذكية قادرة على فهم اللغة الطبيعية والتفاعل معها بطلاقة تشبه التفاعل البشري الحقيقي.

