استكشاف Google Beam: أداة مؤتمرات الفيديو ثلاثية الأبعاد من الجيل التالي

أبيرامي فينا

4 دقائق للقراءة

19 يونيو 2025

تعرّف على Google Beam، أداة مؤتمرات الفيديو ثلاثية الأبعاد من الجيل التالي. استكشف كيف تستخدم هذه الأداة التصوير ثلاثي الأبعاد والذكاء الاصطناعي لتمكين عقد اجتماعات افتراضية غامرة تشبه الحياة.

لقد جعلت مكالمات الفيديو والاجتماعات الافتراضية العمل عن بُعد ممكناً، مما ساعد الفرق على البقاء على اتصال عبر البلدان والمناطق الزمنية. لقد أصبحت جزءاً لا يتجزأ من حياتنا وغيّرت الطريقة التي نتواصل بها.

ومع ذلك، على الرغم من استخدامها على نطاق واسع، ظلت التكنولوجيا الأساسية وراء مؤتمرات الفيديو دون تغيير في الغالب لسنوات. وبفضل التطورات الأخيرة، بدأت منصات عقد مؤتمرات الفيديو في التغيير، بهدف أن تبدو أكثر طبيعية ونابضة بالحياة.

ومن المثير للاهتمام أن Google قدّمت في مؤتمرها السنوي للمطورين (Google I/O 2025) أداتها الجديدة للاتصال المرئي والمعروفة باسم Google Beam. تستخدم أداة Beam الذكاء الاصطناعي (AI) وتقنية مؤتمرات الفيديو ثلاثية الأبعاد لتجاوز الشاشات المسطحة التقليدية وخلق تجربة شخصية أكثر غامرة.

الشكل 1. الرئيس التنفيذي لشركة Google، سوندار بيتشاي، يقدم Google Beam(المصدر).

في الواقع، صُمم Google Beam ليجعلك تشعر وكأن الشخص الذي تتحدث إليه موجود أمامك مباشرةً. وخلافاً لمكالمات الفيديو العادية، فهو يعيد لك الإشارات البشرية الخفية، مثل التواصل البصري والحركة الطبيعية التي تتغير مع منظورك وتفاصيل غالباً ما تضيع على الشاشات المسطحة.

في هذه المقالة، سنتعمق في هذه المقالة في ماهية Google Beam، وكيف تم تطويره، وكيفية عمله، وتطبيقاته. لنبدأ!

الانتقال من مشروع Starline إلى Google Beam

قبل أن نلقي نظرة عن كثب على Google Beam، دعونا نتعرف بشكل أفضل على سلفه، Project Starline.

تم تقديم مشروع Project Starline في مؤتمر Google I/O 2021، وهو عبارة عن مبادرة بحثية تهدف إلى جعل التواصل عن بُعد أكثر واقعية كما لو كنت في الغرفة نفسها. وكان يعمل من خلال إنشاء صور ثلاثية الأبعاد بالحجم الطبيعي للأشخاص في الوقت الفعلي. وعلى الرغم من أن التكنولوجيا جذبت الكثير من الاهتمام، إلا أنها تطلبت إعدادات معقدة وأجهزة ثقيلة.

الشكل 2. نظرة على مشروع ستارلاين(المصدر).

على مر السنين، ومع تقدم التكنولوجيا، قامت Google بتحسين البرنامج وتبسيط الأجهزة. وبعد أربع سنوات من التطوير، تطوّر مشروع Starline إلى Google Beam - وهو حل أكثر إحكاماً وسهولة في الاستخدام.

تستخدم ميزة Google Beam الذكاء الاصطناعي لتحسين مكالمات الفيديو من خلال إنشاء صور أكثر واقعية تشبه الصور ثلاثية الأبعاد للأشخاص الذين تتحدث إليهم. فهو يحوّل الفيديو العادي ثنائي الأبعاد إلى مشاهد ثنائية الأبعاد تتكيف مع زوايا مختلفة، مما يساعد في الحفاظ على التواصل البصري وتسهيل رؤية تعابير الوجه. كما أنه يتضمن ميزات مثل الترجمة في الوقت الحقيقي، وتتبع الرأس، والصوت المكاني.

نظرة عامة على Google Beam

تم تطوير Google Beam ليعمل بدون ملحقات إضافية مثل سماعات الواقع المعزز (AR) أو سماعات الواقع الافتراضي (VR). وبدلاً من ذلك، يأتي مزوّداً بشاشة عرض مدمجة ونظام كاميرا وأجهزة مدمجة لإنشاء صور ثلاثية الأبعاد. وهذا يجعل مكالمات الفيديو تبدو طبيعية ومريحة وجذابة أكثر من اجتماعات الفيديو المعتادة.

الشكل 3. مثال على استخدام Google Beam(المصدر).

كيفية إنشاء Google Beam اجتماعات افتراضية واقعية

والآن بعد أن ناقشنا كيفية ظهور Google Beam، دعنا نلقي نظرة فاحصة على كيفية عمله.

التقاط الصور للتعاون الغامر عن بُعد

يبدأ كل شيء بالتقاط المعلومات المرئية. يستخدم Beam ست كاميرات عالية الدقة لالتقاط صور من زوايا مختلفة في الوقت نفسه. 

تساعد هذه الكاميرات في تتبع ملامح الوجه ولغة الجسد والحركات الصغيرة في الوقت الفعلي. ويؤدي الذكاء الاصطناعي دوراً رئيسياً من خلال تحسين إعدادات الكاميرا والحفاظ على مزامنة جميع لقطات الفيديو بشكل مثالي. وهذا يهيئ النظام للمرحلة التالية: معالجة البيانات.

تحويل الصور ثنائية الأبعاد إلى مؤتمرات فيديو ثلاثية الأبعاد

بعد ذلك، يتم استخدام الذكاء الاصطناعي لدمج ست كاميرات ثنائية الأبعاد لتوليد نموذج ثلاثي الأبعاد في الوقت الحقيقي للشخص الظاهر في الصورة. وبدلاً من مجرد وضع الصور ثنائية الأبعاد في طبقات، فإنه يعيد بناء العمق والظلال والعلاقات المكانية لإنشاء توأم رقمي ثلاثي الأبعاد كامل.

لبناء هذا النموذج ثلاثي الأبعاد، يستخدم Beam تقنيات الذكاء الاصطناعي والرؤية الحاسوبية مثل تقدير العمق وتتبع الحركة. تساعد هذه الأساليب في تحديد مدى بُعد الشخص عن الكاميرا، وكيفية تحركه، وكيفية وضع جسمه. باستخدام هذه البيانات، يمكن للنظام رسم ملامح الوجه وأجزاء الجسم بدقة في الفضاء ثلاثي الأبعاد.

يقوم نموذج الذكاء الاصطناعي وراء Beam بتحديث التمثيل ثلاثي الأبعاد بمعدل 60 إطاراً في الثانية (FPS) للحفاظ على سلاسة المحادثات وواقعيتها. كما أنه يقوم بإجراء تعديلات في الوقت الفعلي لعكس حركات الشخص بدقة.

الشكل 4. تلتقط كاميرات Google Beam الست صوراً من زوايا مختلفة(المصدر).

أنظمة عرض المجال الضوئي من Google Beam

يتم عرض النموذج ثلاثي الأبعاد على نظام الشعاع في جهاز الاستقبال باستخدام شاشة عرض ذات مجال ضوئي. على عكس الشاشات التقليدية التي تعرض نفس الصورة لكلتا العينين، فإن شاشة عرض المجال الضوئي تبعث صورًا مختلفة قليلاً لكل عين، مما يحاكي الطريقة التي ندرك بها العمق في الحياة الواقعية. وهذا يخلق تجربة بصرية أكثر واقعية وثلاثية الأبعاد.

الشكل 5. تبادل التحية الافتراضية من خلال Google Beam(المصدر).

تتبع الرأس الدقيق بالملليمتر في الوقت الحقيقي

واحدة من أكثر ميزات Google Beam إثارة للإعجاب هي قدرته على تتبع الذكاء الاصطناعي في الوقت الحقيقي. يستخدم النظام تتبعاً دقيقاً للرأس والعين لمتابعة الحركات بأدق التفاصيل. 

على سبيل المثال، يمكن لمحرك الذكاء الاصطناعي في Beam تتبع وضع رأس المستخدم باستمرار وإجراء تعديلات دقيقة على الصورة في الوقت الفعلي. وهذا يخلق انطباعاً بأن الشخص الذي يظهر على الشاشة يجلس أمامك بالفعل. كلما حركت رأسك، تتغير الصورة ثلاثية الأبعاد وفقاً لذلك، تماماً كما هو الحال في محادثة حقيقية وجهاً لوجه.

معالجة الصوت للاتصالات الافتراضية المعززة بالذكاء الاصطناعي

يعمل Beam أيضًا على تحسين تجربة الصوت باستخدام الصوت المكاني الذي يطابق مكان ظهور الشخص على الشاشة. إذا كان شخص ما على الجانب الأيسر من الشاشة، سيبدو صوته وكأنه قادم من اليسار. وعندما يغيرون مواضعهم، يتكيف الصوت معهم. هذا يجعل المحادثات تبدو طبيعية أكثر ويساعد عقلك على متابعة من يتحدث دون بذل مجهود إضافي.

يعمل ذلك من خلال الجمع بين تقنيات الصوت الاتجاهي والتتبع في الوقت الحقيقي. يستخدم Beam الصوت المكاني لمحاكاة كيفية إدراكنا الطبيعي للصوت في العالم الحقيقي (بناءً على الاتجاه الذي يأتي منه وكيفية وصوله إلى كل أذن). كما يتتبع النظام أيضاً حركات رأس المشاهد ويضبط إخراج الصوت وفقاً لذلك، بحيث يبقى الصوت "متصلاً" بالشخص الذي يظهر على الشاشة. 

تطبيقات Google Beam

يُظهر Google Beam، على الرغم من أنه لا يزال في مراحله الأولى، إمكانات واعدة في مجال مؤتمرات الفيديو. فيما يلي بعض تطبيقاته الرئيسية:

  • التعاون عن بُعد: يمكن لـ Google Beam أن يجعل الاجتماعات، وخاصة المناقشات القيادية أو المفاوضات عالية المخاطر، تبدو أكثر شخصية وفعالية. ومن خلال التقاط عوامل خفية مثل لغة الجسد والتواصل بالعينين، يساعد ذلك الأشخاص على الشعور بمزيد من الحضور، حتى عندما يكونون متباعدين.
  • التعليم: لدى Beam القدرة على جعل التعلم الافتراضي أكثر إثارة وسهولة. تخيل عالماً يلقي محاضرة حية على الهواء مباشرةً أمام الطلاب في النصف الآخر من العالم، ويشعرون وكأنهم في نفس الغرفة.
  • الرعاية الصحية: يمكن للشعاع أن يجعل الاستشارات عن بُعد تبدو أكثر شخصية. فعندما يتمكن الأطباء والمرضى من رؤية بعضهم البعض بوضوح والتواصل البصري الطبيعي، فإن ذلك يبني الثقة ويجعل التفاعل يبدو أكثر إنسانية.
  • الصناعات الإبداعية: بالنسبة للأشخاص العاملين في المجالات الإبداعية، مثل مصممي الرسوم المتحركة والفنانين والمنتجين، يمكن أن يجعل Beam العمل الجماعي عن بُعد يبدو أسهل وأكثر طبيعية. سواء كان الأمر يتعلق بالعصف الذهني للأفكار أو مراجعة مشروع ما، يبدو الأمر أشبه بالجلوس معاً في الاستوديو أكثر من كونه مكالمة فيديو.

إيجابيات Google Beam وسلبياته

فيما يلي بعض الفوائد الرئيسية التي يجلبها ابتكار مثل Google Beam إلى الطاولة:

  • لا حاجة لسماعات رأس: على عكس العديد من التقنيات الغامرة، تعمل Beam دون الحاجة إلى سماعات رأس للواقع المعزز أو الواقع الافتراضي. وهذا يجعل التجربة أكثر راحة ويتجنب المشاكل الشائعة مثل دوار الحركة أو الإزعاج الناتج عن ارتداء معدات إضافية.
  • تقليل إجهاد الشاشة: توفر الشاشة ثلاثية الأبعاد تجربة مشاهدة أكثر طبيعية ومريحة، مما يساعد على تقليل إجهاد العين مقارنة بالتحديق في الشاشات المسطحة لفترات طويلة.
  • ترجمة اللغات في الوقت الفعلي: يمكن لـ Beam دمج الترجمة الفورية المدعومة بالذكاء الاصطناعي، مما يسهل على الأشخاص الذين يتحدثون لغات مختلفة التواصل بشكل طبيعي في الاجتماعات الدولية أو بيئات التعلم.

تعد تقنية Beam خطوة واعدة إلى الأمام، ولكن مثلها مثل أي تقنية جديدة، فهي تأتي مع بعض القيود. إليك بعض الأمور التي يجب مراعاتها:

  • متطلبات الأجهزة: تتطلب الأشعة معدات متخصصة ومتطورة، مثل شاشات عرض المجال الضوئي وكاميرات متعددة، مما يجعلها باهظة الثمن وأقل تكلفة للأفراد والمؤسسات الصغيرة.
  • غير قابل للنقل: تم تصميم نظام Beam للتركيب الثابت وليس من المفترض أن يتم نقله بسهولة، مما يحد من مرونته واستخدامه في البيئات المتنقلة أو المتغيرة.

الوجبات الرئيسية

يُعد Google Beam خطوة رائعة نحو جعل التواصل الافتراضي أكثر إنسانية. وعلى الرغم من أنه لا يزال في مراحله المبكرة، إلا أنه قادر على تغيير الطريقة التي نلتقي بها ونتواصل ونتعاون. ومن خلال المزج بين الذكاء الاصطناعي المتقدم والتصوير ثلاثي الأبعاد والصوت المكاني، فإنه يخلق تجربة أكثر واقعية وجاذبية عن بُعد.

مع استمرار Google في تحسين أجهزة Beam، وجعلها أصغر حجمًا، وربما توفيرها للمستخدمين العاديين، فإنها توفر إمكانيات مثيرة لمستقبل التواصل الافتراضي. إلى جانب الاتجاهات التكنولوجية الجديدة مثل الاجتماعات الثلاثية الأبعاد والصور الرمزية ثلاثية الأبعاد، يضع Beam معياراً جديداً للاجتماعات الافتراضية.

انضم إلى مجتمعنا وألقِ نظرة على خيارات الترخيص لدينا لبدء استخدام رؤية الكمبيوتر اليوم. اطلع على مستودع GitHub الخاص بنا لمعرفة المزيد عن الذكاء الاصطناعي. اطلع على صفحات الحلول الخاصة بنا للحصول على رؤى حول حالات الاستخدام المختلفة للذكاء الاصطناعي في مجال البيع بالتجزئة والرؤية الحاسوبية في الزراعة

دعونا نبني المستقبل
للذكاء الاصطناعي معاً!

ابدأ رحلتك مع مستقبل التعلم الآلي

ابدأ مجاناً
تم نسخ الرابط إلى الحافظة