إن جمع بيانات تدريب الروبوتات هو عمل قذر وغير جذاب. بعض مختبرات الذكاء الاصطناعي تدفع بالفعل مبلغًا لـ XDOF للقيام بذلك
قبل أسبوعين، قالت شركة OpenAI إنها ستعيد إطلاق برنامج الروبوتات الذي أغلقته في عام 2021 – وهي أحدث إشارة إلى أن أكبر مختبرات الذكاء الاصطناعي تتسابق لتعليم الآلات كيفية العمل في العالم المادي. لكن بناء الروبوتات القادرة يتطلب شيئًا لا تمتلكه صناعة الذكاء الاصطناعي حتى الآن، وهو بيانات التدريب التي تتوافق مع تلك المستخدمة في نماذج اللغة.
وتؤدي هذه الفجوة إلى خلق نوع جديد من أعمال البنية التحتية. وعلى عكس طلاب الماجستير في القانون الذين تم تدريبهم على بحر شاسع من النصوص المتاحة للجمهور، تحتاج الروبوتات إلى بيانات تلتقط التفاعل الجسدي، وهذا النوع من البيانات نادرًا ما يكون موجودًا. تتميز مقاطع الفيديو واللقطات التي يلتقطها عمال الحفلة على YouTube بأنها منخفضة الدقة ويصعب التوفيق بينها وبين العالم المادي.
تروج شركة Apple لفواتير ومبيعات متجر التطبيقات بقيمة 1.4 تريليون دولار، 90% منها بدون عمولة: تروج شركة Apple لفواتير ومبيعات متجر التطبيقات بقيمة 1.4 تريليون دولار، 90% منها بدون عمولة
تراهن شركة XDOF (التي تنطق “ecks-doff”)، التي خرجت من عالم التخفي اليوم، على أن عنق الزجاجة الكبير التالي في الذكاء الاصطناعي ليس النماذج أو الرقائق، بل حلقة ردود الفعل من البيانات اللازمة لتعليم الروبوتات كيفية التفاعل مع العالم المادي.
تهدف الشركة الناشئة إلى بناء خطوط نقل البيانات وأدوات التجميع وأنظمة التعليقات التوضيحية التي لا تستطيع المعامل الحدودية وشركات الروبوتات بناءها بنفسها بسهولة – وقد جمعت 70 مليون دولار من Thrive Capital وSpark Capital وa16z وLux وWndrCo للقيام بذلك. يقول المؤسس المشارك والرئيس التنفيذي فيليب وو، إن شركة XDOF، التي تضم حوالي 60 موظفًا، تعمل بالفعل مع 20 عميلًا بما في ذلك العديد من مختبرات الذكاء الاصطناعي الحدودية، ولكن لا يمكنها تسميتهم.
وقال وو: “تحاول جميع المختبرات الكبرى متابعة تطوير الروبوتات”. “لقد رأينا بالفعل بعض العيوب الناجمة عن التخلف قليلاً في سباق نماذج اللغة… فأنت لا تريد أن تكون في هذا النوع من المواقف حيث تلاحق هذه التكنولوجيا بعد فوات الأوان، والجميع في هذا القارب حيث الذكاء الاصطناعي المادي هو الحدود التالية.”
I let Claude change my desktop wallpaper and now I never miss a deadline (Prompt included): I let Claude change my desktop wallpaper and now I never miss a deadline (Prompt included)
واجه وو هذه المشكلة بنفسه عندما كان طالب دكتوراه في جامعة كاليفورنيا في بيركلي. كان تركيزه على تمكين الروبوتات من تعلم المهارات من مجموعات البيانات واسعة النطاق. كانت هناك مشكلة واحدة فقط.
وقال لـ TechCrunch: “لم تكن لدينا بيانات واسعة النطاق للعمل معها”. “كانت هناك مشكلة الدجاجة والبيضة، إذ كنا بحاجة أولًا إلى جمع البيانات فعليًا قبل أن نتمكن حتى من التساؤل عن كيفية تدريب نموذج أساسي للروبوتات.”
عمل وو ومؤسس XDOF المستقبلي ومدير التكنولوجيا التنفيذي، Fred Shentu، على مشروع يسمى GELLO، وهو نظام تشغيل عن بعد منخفض التكلفة يتيح للمشغل البشري التحكم في ذراع آلية لتوليد بيانات التدريب. وقال وو: “لقد انتهى الأمر بأن تصبح ورقة بحثية مؤثرة جدًا في مجال الروبوتات، لأن الكثير من الأشخاص لديهم احتياجات واختناقات مماثلة، وبدأ الكثيرون في الاستفادة من هذا النوع من الأجهزة لجمع البيانات”.
يبحث Google عن اللمعان باستخدام أيقونات كرة الديسكو: "هل أنتم متأكدون من أنكم مازلتم تريدون هذا؟": يبحث Google عن اللمعان باستخدام أيقونات كرة الديسكو: "هل أنتم متأكدون من أنكم مازلتم تريدون هذا؟"
اكتشف وو وشينتو والمؤسس المشارك الثالث والرئيس التنفيذي للعمليات نيمو جين الفرصة، وأطلقوا XDOF في أكتوبر 2024 لتوفير نظام بيئي للبيانات للشركات التي تتبع نماذج الروبوتات. وإدراكًا منها أن توفير البيانات وحده يمكن أن يكون عملاً مسدودًا، تركز الشركة أيضًا على تنظيف البيانات، والأدوات، والتعليقات التوضيحية – مما يؤدي إلى إنشاء حلقة تعليقات ذاتية التعزيز لمدربي الروبوتات.
كنقطة انطلاق، تتعاون الشركة مع مختبر أبحاث الذكاء الاصطناعي التابع لجامعة كاليفورنيا في بيركلي لإصدار ما تعتقد أنه أكبر مجموعة من بيانات تدريب الروبوتات عالية الجودة التي تم تجميعها على الإطلاق، والتي يطلق عليها اسم ABC. ويتضمن 130 ألف مسار لبيانات التلاعب بالروبوت، و300 ساعة من المحاكاة، و100 ساعة من التقييمات. لم يكن هذا النوع من البيانات الموسعة للتدريب المسبق متاحًا للأوساط الأكاديمية من قبل.
قال ديفيد مكاليستر، طالب دكتوراه في بيركلي والذي ساعد في تنظيم الإصدار، لـ TechCrunch: “لقد رأينا في اللغة وتوليد الصور والمجالات الأخرى، أنه عندما يتم إصدار النماذج والبيانات، يحقق المجتمع أشياء لم تكن تتوقعها بالضرورة”.
وقد استخدم الفريق بالفعل البيانات لتدريب الروبوتات على المهام القياسية مثل طي القمصان وتسوية الصناديق، أو تحميل AirPods في علبها.
درجات غير محدودة من الحرية
وتخطط الشركة للعمل عبر ثلاثة مستويات من هرم البيانات. المستوى الأكثر قيمة هو بيانات التشغيل عن بعد التي يتم جمعها على الروبوت الفعلي الذي يتم نشره؛ بعد ذلك، تأتي الروبوتات التي يتم التحكم فيها عن بعد والتي تجمع المزيد من البيانات العامة، كما هو الحال مع GELLO؛ وأخيرًا، البيانات “المتمركزة حول الذات” التي يجمعها البشر الذين يقومون بمهام يومية، والتي تخطط شركة XDOF لبناء أجهزة استشعار خاصة بها يمكن ارتداؤها.
وقال وو: “سيؤثر اختيار الكاميرا الخاصة بك على جودة بياناتك، وهو ما سيؤثر على كيفية أداء خوارزمية تتبع اليد”. “إذا لم تقم بتصميم الأجهزة بشكل جيد منذ البداية، فقد تحتوي البيانات التي تجمعها على مشكلات محددة جدًا لم تكن تتوقعها.”
تخطط الشركة لتوظيف وتدريب جيوش من مشغلي البيانات ومشغلي البيانات الأنانيين حول العالم – وهو نموذج كثيف العمالة يثير سؤالًا واضحًا: لماذا لا تقوم المعامل الكبرى بإنتاج البيانات بنفسها؟
قال وو: “أنت بحاجة إلى مستودع مساحته مئات الآلاف من الأقدام المربعة يضم مئات الروبوتات”. “أنت بحاجة إلى صيانة هذه الروبوتات، ومعايرة معاييرها الفيزيائية، وتدريب المشغلين بشكل صحيح.”
إنها عملية بناء تتطلب التركيز ورأس المال والنطاق التشغيلي الذي تفضله معظم مختبرات الذكاء الاصطناعي الاستعانة بمصادر خارجية – وهو بالضبط السوق الذي تراهن عليه XDOF.
إن اسم XDOF عبارة عن تلاعب بمصطلح الروبوتات “درجات الحرية”، والذي يصف عدد الحركات المستقلة التي يمكن للروبوت القيام بها. تتمتع ذراعك، من الكتف إلى الرسغ، بسبع درجات من الحرية. أحدث روبوت لشركة الروبوتات البشرية الشكل.يحتوي أحدث روبوت على 30. ويقول وو إن علامة X في اسم الشركة ترمز إلى طموحها: “درجات تعسفية من الحرية، ودرجات غير محدودة من الحرية”.
عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. هذا لا يؤثر على استقلالنا التحريري.
