هل يمكن لشركات التكنولوجيا أن تتعلم كيف تحب الموديلات الأرخص؟

لقد تم بناء طفرة الذكاء الاصطناعي على افتراض أساسي: النماذج الأكبر هي الأكثر قوة، والنماذج الأقوى هي التي تفوز. والآن، الصناعة على وشك معرفة ما سيحدث إذا بدأ هذا الافتراض في الانهيار.

لقد ضغطت التكاليف المتزايدة بالفعل على المستخدمين لإعطاء نماذج أصغر وأرخص نظرة ثانية. يعتبر هذا التسوق النموذجي المراعي للتكلفة أمرًا جديدًا وليس من الواضح كيف سيؤثر على الصناعة، ولكن من المرجح أن يكون التأثير كبيرًا.

تطارد Nvidia سوق وحدة المعالجة المركزية بقيمة 200 مليار دولار باستخدام أجهزة كمبيوتر عاملة بالذكاء الاصطناعي من Microsoft وDell وHP: تطارد Nvidia سوق وحدة المعالجة المركزية بقيمة 200 مليار دولار باستخدام أجهزة كمبيوتر عاملة بالذكاء الاصطناعي من Microsoft وDell وHP

أحد التوقعات، التي وضعها برايان أرمسترونج، المؤسس المشارك لشركة Coinbase، هو أن ذلك سيؤدي إلى تحول الغالبية العظمى من المهام إلى نماذج أرخص.

كتب أرمسترونج على موقع X: “الطلب على الذكاء يكاد يكون لا نهائيًا، ولكن 80% من أعباء العمل سيتم تشغيلها على نماذج أرخص بنسبة 99% في غضون 12 إلى 18 شهرًا. وستظل 20% من أعباء العمل تعمل على أحدث الطرز الجينية التي يكون فيها الوصول إلى الحد الأقصى لمعدل الذكاء أمرًا مهمًا.”

من الصعب المبالغة في تقدير مدى التحول الكبير الذي سيحدث في صناعة الذكاء الاصطناعي إذا تحققت توقعات أرمسترونج.

تقرير: جوجل وSpaceX تجريان محادثات لوضع مراكز البيانات في المدار: تقرير: جوجل وSpaceX تجريان محادثات لوضع مراكز البيانات في المدار

قبل الآن، كانت معظم شركات الذكاء الاصطناعي تتنافس على الجودة، مما يعني التخلف عن النموذج المتاح الأكثر تقدمًا. وإذا كان من الممكن التعامل مع هذه الوظائف نفسها من خلال نماذج أرخص دون التأثير على الجودة، فإن ذلك يعني تحولاً هائلاً في اقتصاديات الذكاء الاصطناعي. والأهم من ذلك، أن الكثير من المدخرات ستأتي من جيوب المختبرات الكبيرة، مما يوجه ضربة مالية لشركة OpenAI وAnthropic تمامًا أثناء توجههما للاكتتاب العام الأولي الخاص بهما.

إنه تغيير زلزالي محتمل في الصناعة، ويرتكز على سؤال أساسي واحد: هل الشركات مستعدة للتحول إلى نماذج أصغر؟

تشير الاختبارات الأولية إلى أنه عندما يتم ترتيب النظام بشكل صحيح، يمكن استخدام نماذج أرخص دون أي تضحية بالجودة. وفي اختبار حديث أجرته أداة Harvey القانونية للذكاء الاصطناعي، تمكنت الشركة من تقليل تكاليف الاستدلال بمقدار 3 أضعاف دون تقليل الجودة. تم إجراء الاختبار بالشراكة مع منصة الاستدلال Fireworks AI، حيث تم الجمع بين Claude Opus وFireworks’ GLM 5.1، وتم نقله إلى Opus للمهام الأكثر كثافة. وكانت النتيجة انخفاض الحمل بشكل ملحوظ من حيث وقت الخادم والتكلفة الإجمالية.

في غضون 3 أسابيع فقط، سيأتي StrictlyVC إلى لوس أنجلوس: في غضون 3 أسابيع فقط، سيأتي StrictlyVC إلى لوس أنجلوس

قال غابي بيريرا، المؤسس المشارك لشركة Harvey، لـ TechCrunch، في إشارة إلى الخدمات القانونية للذكاء الاصطناعي التي تقدمها شركته الناشئة: “الجودة تأتي في المقام الأول، وفي الجانب القانوني ستظل كذلك دائمًا”. “ومع ذلك، فإن تعريف الجودة يتطور من مجرد استخدام أقوى نموذج لكل شيء، إلى استخدام أفضل نموذج يحصل على الإجابة الصحيحة بأكبر قدر من الكفاءة.”

غالبًا ما يتم تأطير هذا الاتجاه من حيث المختبرات الكبرى مقابل النماذج الصينية أو تلك ذات الوزن المفتوح، لكن هذا يغفل النقطة الأكبر. إن الفجوة الحقيقية ليست بين النماذج المملوكة والنماذج المفتوحة؛ إنه بين النماذج الكبيرة والصغيرة. يمكنك توفير المال عن طريق التبديل من GPT-5.5 إلى DeepSeek’s V4 Flash، ولكن التبديل إلى GPT-5.4-mini يعمل أيضًا.

هناك حرب أسعار نشطة تجري بين الاستدلال الداخلي من المختبرات الكبيرة ونماذج الوزن المفتوح التي يتم تقديمها بشكل مستقل. بالنسبة للسؤال الأكبر وهو الصغير مقابل الكبير، لا يهم حقًا أي نوع من النماذج الصغيرة سيفوز.

قد يبدو كل هذا واضحًا – بالطبع لا يجب عليك استخدام الحوسبة أكثر من اللازم – ولكنه يتعارض مع نهج التوسع أولاً الذي سيطر على الصناعة حتى الآن. واستلهامًا من الدرس المرير، اتجهت المختبرات بقوة إلى تدريب النماذج الأكثر استخدامًا للحوسبة، مما دفع حدود ما يمكن أن تفعله نماذج الذكاء الاصطناعي. ومع الأسعار المدعومة بشكل كبير من قبل المستثمرين، لم يكن لدى العملاء أي سبب لاختيار أي شيء سوى الخيار الأكثر تقدمًا.

ومع ارتفاع أسعار العملات الرمزية وتباطؤ الدعم، يواجه المستخدمون ضغوط التكلفة للمرة الأولى. لا نعرف ما إذا كان ضغط التكلفة الجديد سيدفع مستخدمي المؤسسات بالفعل إلى نماذج أصغر. ويمكنهم بنفس السهولة التوفير من خلال إجراء مكالمات أقل، أو استخدام سياق أقل، أو ببساطة التخلي عن عمليات النشر الأقل واعدة.

ولكن إذا تبين أن أغلب عمليات النشر يمكن تنفيذها على نموذج أصغر حجما، فقد يضع ذلك عائقا خطيرا أمام الطلب المتزايد على الاستدلال ــ ويثير تساؤلات جديدة حول كيفية تبرير تكلفة تدريب نموذج حدودي.

عندما تقوم بالشراء من خلال الروابط الموجودة في مقالاتنا، قد نكسب عمولة صغيرة. هذا لا يؤثر على استقلالنا التحريري.

المصدر