يمكن للنموذج العالمي الجديد لشركة Decart محاكاة ساعات من القيادة الواقعية – مع بعض التحذيرات

كشفت شركة Decart الناشئة للذكاء الاصطناعي يوم الأربعاء عن Oasis 3، وهو أحدث طراز عالمي تفاعلي يمكنه إنشاء بيئات قيادة واقعية في الوقت الفعلي، حسبما علمت TechCrunch حصريًا. النموذج متاح حاليًا عبر واجهة برمجة التطبيقات (API).

تستهدف الشركة الناشئة في البداية شركات المركبات ذاتية القيادة التي تحتاج إلى محاكاة سيناريوهات القيادة النادرة على نطاق واسع، وتخطط للتوسع في مجال الروبوتات وتطبيقات الذكاء الاصطناعي المادية الأخرى. لكن الرهان الأكبر يقع على المطورين: من خلال توفير الوصول إلى واجهة برمجة التطبيقات (API) من اليوم الأول، تحاول Decart بناء نظام بيئي للمطورين حول نماذج عالمية يشبه إلى حد كبير ما فعلته OpenAI مع نماذج اللغة.

خسر Elon Musk دعواه القضائية ضد Sam Altman وOpenAI: خسر Elon Musk دعواه القضائية ضد Sam Altman وOpenAI

قال دين ليترسدورف، المؤسس المشارك والرئيس التنفيذي لشركة Decart، لـ TechCrunch: “سيكون هذا أول نموذج عالمي قابل للاستخدام يمكن للناس برمجته فعليًا”. “أعتقد أنه سيكون هناك مجتمع مطور كامل سيظهر فوق هذا.”

تمتلك الشركة الناشئة بالفعل مجتمعًا يضم أكثر من 100.000 مطور، يقوم العديد منهم ببناء منتجات فوق نموذج الفيديو في الوقت الفعلي Lucy، إلى حد كبير في التجارة الإلكترونية والبث المباشر. تعتمد Oasis 3 على هذا النموذج الأساسي، وهي تمثل دفعة الشركة نحو الذكاء الاصطناعي المادي. وقال ديكارت إن سعر الوصول يبلغ 0.02 دولار في الثانية، ويعتمد تسعير المؤسسة على حالات الاستخدام.

يلعب ديكارت في ساحة عرض أزياء عالمية مكتظة بشكل متزايد. في العام الماضي، أصدرت Google Genie 3 في معاينة البحث، وأطلقت Fei-Fei Li’s World Labs برنامج Marble لحالات الاستخدام التجاري، كما تقوم الشركات الناشئة في مجال إنتاج الفيديو مثل Luma وRunway أيضًا بترجمة نماذج الفيديو المدركة للفيزياء إلى نماذج عالمية.

يتم رفع دعوى قضائية ضد Musk's xAI بسبب مولدات مركز البيانات الخاصة بها. أما الآن، فهي تشتري مبلغًا إضافيًا بقيمة 2.8 مليار دولار.: يتم رفع دعوى قضائية ضد Musk's xAI بسبب مولدات مركز البيانات الخاصة بها. أما الآن، فهي تشتري مبلغًا إضافيًا بقيمة 2.8 مليار دولار.

تُنشئ لعبة Decart’s Oasis 3 سيناريوهات قيادة واقعية يمكنك التفاعل معها في الوقت الفعلي.اعتمادات الصورة:ديكارت

يأتي إصدار Oasis 3 بعد أسابيع قليلة من قيام شركة Decart البالغة من العمر عامين بجمع 300 مليون دولار، والتي يقول Leitersdorf إنها جاءت في أعقاب “زيادات هائلة في الطلب على النماذج التي بنيناها” في التجارة الإلكترونية والبث المباشر والذكاء الاصطناعي المادي. عززت الجولة تقييم ديكارت إلى ما يقرب من 4 مليارات دولار، وجلبت سلسلة من المستثمرين الاستراتيجيين مثل تويوتا وأدوبي وإيباي. يقول ليترسدورف إن كل هذه الشركات هي عملاء محتملين. كما شاركت شركة Nvidia، وهي مستثمر حالي، في الجولة.

تكمن ميزة Oasis 3 في واقعية الصور لنماذجها وقدراتها غير المحدودة على الإنتاج. ويرجع ذلك إلى بعض مهارات الكفاءة من جانب Decart، والمدعومة بالمنتج الرئيسي الآخر للشركة: برنامج DOS (Decart Optimization Stack) الذي يسمح للنماذج بالعمل بكفاءة على أجهزة Nvidia وAmazon وGoogle، مما يجعل تشغيل نماذجها أقل تكلفة بكثير من المنافسين.

قامت جنرال موتورز للتو بتسريح المئات من العاملين في مجال تكنولوجيا المعلومات لتوظيف ذوي مهارات الذكاء الاصطناعي الأقوى: قامت جنرال موتورز للتو بتسريح المئات من العاملين في مجال تكنولوجيا المعلومات لتوظيف ذوي مهارات الذكاء الاصطناعي الأقوى

وقال ليترسدورف: “لقد تم بناء هذا على رأس مجموعتنا الكاملة في الوقت الفعلي، والتي نقوم بتحسينها وصولاً إلى الأجهزة”. “من خلال التكامل الرأسي، نحن قادرون على أن نكون أرخص بكثير من أي شخص آخر في الصناعة من أجل تشغيل هذه النماذج.”

تعتبر نماذج الشركة الناشئة فعالة للغاية، وفقًا لشركة Leitersdorf، لدرجة أنها أنفقت “أقل بكثير” من 100 مليون دولار في حياتها.

تعمل Oasis 3 على إنشاء بيئات دقيقة ماديًا ومتعددة الكاميرات – واحدة أمامية وجانبية – لأنظمة التدريب والاختبار. وبدلاً من تقديم عروض تجريبية ومعاينات بحثية محدودة، يسمح Decart للمطورين بإنشاء سيناريوهات لا نهائية، وهو مثالي لمطوري المركبات ذاتية القيادة الذين يتطلعون إلى تجربة أكبر عدد ممكن من الحالات المتطورة.

بالمقارنة مع النماذج الأخرى التي جربتها، مثل Genie 3 من Google أو Marble من World Labs، يقدم Oasis 3 البيئات الأكثر واقعية من خلال رسالة نصية واحدة رأيتها. وحقيقة أنه يمكنك التفاعل معهم لساعات تشير إلى مستوى من الكفاءة قد يفتقر إليه منافسو Decart.

ولكن من خلال السماح لك بإنشاء عالم لفترة طويلة، يتدهور النموذج أيضًا بشكل كبير.

تقوم Oasis 3 بإنشاء شوارع ذات صور واقعية دقيقة من خلال موجه، ولكن ليس لديها وعي بالأشياء حتى الآن.اعتمادات الصورة:ريبيكا بيلان / ديكارت

في الاختبار الذي أجريته، وجدت أن النظام يمكنه دائمًا إعداد مشهد أولي قوي يتطابق مع الموجه، لكن التكامل الموضوعي تدهور بسرعة أثناء تنقلي عبر العالم. لقد طلبت منه إنشاء شارع في مدينة نيويورك في الصباح، وقد فعل ذلك بشكل جميل. ولكن بينما كنت أقود سيارتي، بدت البيئة أقل شبهاً بنيويورك وأكثر أشبه بنسخة قياسية من أي مدينة حضرية غربية.

عندما حاولت الاستدارة والعودة إلى التقاطع الأولي، اختفى وحل محله بيئة جديدة تمامًا. علاوة على ذلك، فإن عناصر التحكم ليست سريعة الاستجابة، وكثيرًا ما فقدت السيطرة على المكان الذي كانت تتحرك فيه السيارة (مرة أخرى، وهو عيب مشترك بين النماذج العالمية الأخرى التي اختبرتها). بدت التجربة أقل شبهاً بمحاكاة متماسكة وأكثر من مجرد تيار مفكك من الوعي يشبه الحلم والذي سرعان ما يصبح غير منطقي.

هناك مشكلة أخرى، والتي رأيتها أيضًا في نماذج عالمية أخرى، وهي أن السيارة سوف تمر عبر سيارات أخرى فقط، مما يعني أن النموذج لا يحاكي الفيزياء بشكل صحيح في البيئة. ويطلق ليترسدورف على ذلك اسم “مشكلة بحثية كبرى نعمل على حلها الآن”، وينسب ذلك إلى حقيقة أن “هناك بيانات أكثر بشكل كبير عن القيادة الجيدة مقارنة بالحوادث”.

إن جزءًا مما يجعل هذا الاتساق الفيزيائي صعبًا هو أمر أساسي لكيفية عمل هذا النموذج العالمي. تعد لعبة Oasis 3 رجعية تلقائيًا، مما يعني أنها تولد إطارًا واحدًا في كل مرة، وتنظر إلى ما تم إنشاؤه سابقًا لتقرر ما سيأتي بعد ذلك. تعد هذه سمة معمارية رئيسية للعديد من النماذج العالمية، كما أنها تتطلب حوسبة مكثفة أيضًا.

بدأ الاتساق في الانهيار لاحقًا في نفس المشهد في أحد شوارع مدينة نيويورك في الصيف.اعتمادات الصورة:ريبيكا بيلان / ديكارت

ومن أجل الحفاظ على الاتساق، يقول لايترسدورف إن فريق ديكارت يعمل على تحسين طول ذاكرة النموذج.

وقال: “كل إطار نقوم بإنشائه يبلغ حوالي 8000 رمز”. “إنشاء هذا بعشرات الإطارات في الثانية – أي مئات الآلاف من الرموز المميزة في الثانية. تمتلئ نافذة السياق بسرعة كبيرة. نحن نبحث في كيفية عمل سياق أطول لتخزين ملايين الرموز المميزة، وكيفية ضغط الذاكرة إلى عدد أقل من الرموز المميزة.”

يعتقد لايترسدورف أن مشكلة الاتساق قد يتم حلها جزئيًا في الإصدار التالي من النموذج، والذي سيسمح للمستخدمين بالبدء في إنشاء عوالم بناءً على مقطع فيديو لبيئة ما بدلاً من الصورة. واعترف بأن النماذج العالمية كمجال ما زالت مبكرة.

ومع ذلك، فإن المؤسس أقل تركيزًا على القيود الحالية لتقنيته مقارنة بما سيحدث عندما يضع المطورون أيديهم عليها.

وقال: “يعيدني هذا إلى الأيام الأولى من ماجستير إدارة الأعمال، عندما ابتكرت شركة OpenAI واجهة برمجة التطبيقات للنماذج”، مشيرًا إلى ظهور مجتمع المطورين الذي طور هذا المجال من خلال إيجاد وبناء حالات استخدام جديدة.

وقال: “عندما نتحدث مرة أخرى بعد ثلاثة أشهر، سنكون مثل: “ها هنا 100 مطور قاموا جميعًا ببناء 100 تطبيق مختلف باستخدام Oasis، الأمر الذي فاجأنا جميعًا”.”

عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. هذا لا يؤثر على استقلالنا التحريري.

المصدر

موضوعات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *