امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

العالم السابق في OpenAI: لقد وصلت قوة الحوسبة إلى الحد الأقصى، ويجب على صناعة الذكاء الاصطناعي العودة إلى جوهر البحث

تحدث إيليا سوتسكيڤر، كبير علماء OpenAI السابق، والمؤسس المشارك الحالي لـ SSI، في أحدث مقابلة له عن أن نماذج الذكاء الاصطناعي الحالية تعتبر تقريبًا لا تقهر في مختلف الاختبارات والتقييمات والمسابقات، لكن حياة معظم الناس اليومية لم تتغير بشكل جذري. ويعتقد أن هذا الفارق بين “الاختبارات التقييمية المذهلة، والواقع العادي” ناتج عن اعتماد الصناعة المفرط في السنوات الأخيرة على صيغة النجاح المتمثلة في “تكديس قوة الحوسبة، وتكديس البيانات، وتكديس معلمات النموذج”. ومع ذلك، فإن المواد الطبيعية المتاحة للاستخدام في التدريب المسبق محدودة، وهذا الطريق سيواجه حتمًا عقبة. وستدخل التطورات القادمة في الذكاء الاصطناعي مرحلة جديدة، حيث لن يكون الأمر متعلقًا بعدد وحدات معالجة الرسوميات، بل بمن يستطيع العثور على مبادئ تعلم جديدة، وفهم التعميم، وجعل طريقة تعلم الذكاء الاصطناعي أقرب إلى البشر.

تحدث أحداث خيال علمي، ولكن الحياة لم تتغير كثيرًا.

في بداية المقابلة، وصف المضيف تطور الذكاء الاصطناعي الحالي وأجواء منطقة خليج سان فرانسيسكو بأنها تشبه تمامًا حبكة رواية خيال علمي. ومع ذلك، فإن الأمر المتناقض هو أنه على الرغم من ضخ الأموال العالمية في الذكاء الاصطناعي بمبالغ تصل إلى عشرات المليارات ومئات المليارات من الدولارات، وحتى الاقتراب من 1% من الناتج المحلي الإجمالي للدول، إلا أن شعور الحياة اليومية للجمهور العام لم يتغير بشكل جذري.

معظم الناس يرون فقط في الأخبار أن عمالقة التكنولوجيا يعلنون عن توسيع مراكز البيانات مرة أخرى، أو إنفاق المزيد من الميزانية لشراء وحدات معالجة الرسوميات، ولكن من الشوارع إلى الأحياء، لا يزال من الصعب ملاحظة التغييرات الواضحة في الذكاء الاصطناعي.

سوتسكييفر قبِل هذا القول وأشار إلى أن قدرة النموذج قوية بالفعل، ولكن في بيئة الحياة التي يعرفها الناس، فإن الشعور ليس مثيرًا للدهشة كما هو الحال في المختبرات أو التقارير البحثية، وهذا الفارق هو في الواقع ظاهرة طبيعية.

تقييم اختبار القدرة قوي جدًا، لكن الأداء العملي غالبًا ما يكون فيه مشاكل.

تحدث سوتسكيبر بعد ذلك عن “الوجهين” للنموذج. وأشار إلى أن الذكاء الاصطناعي غالبًا ما يظهر مستوى يتجاوز البشر في تقييمات البرامج، والاختبارات القياسية، أو مختلف المعايير، ولكن بمجرد إدخاله في الاحتياجات الحقيقية، سيواجه ظروفًا مختلفة تمامًا. وأعطى مثالًا على ذلك، حيث يقوم العديد من المطورين بطلب مساعدة النموذج في إصلاح الأخطاء. عادةً ما يكون النموذج واثقًا جدًا من تحديد المشكلة وتقديم التعديلات، لكن الخطوة التالية غالبًا ما تؤدي إلى إدخال أخطاء جديدة.

عندما تطلب منه إصلاح الخطأ الثاني مرة أخرى، فقد يعيد إدخال الخطأ الأول، مما يشكل حلقة بين الخطئين. يعتقد سوتسكيڤر أن هذه التناقضات “التي تكون خارقة في التقييمات ولكن غير مستقرة في العالم الحقيقي” هي واحدة من الظواهر الأكثر جدارة بالفهم العميق في مجال الذكاء الاصطناعي في الوقت الحالي.

لإجراء اختبار التدريب، مما يؤدي إلى انحراف النموذج عن العالم الحقيقي

عند تحليل أسباب الفجوة، أشار سوتسكيڤر إلى أن الشركات الكبرى غالبًا ما تقوم بتعديل سلوك النموذج بناءً على مشاريع التقييم العامة عند القيام بتعلم التعزيز. لأن الأداء المتميز في التقييم يمكن أن يمنح ميزة في المؤتمرات الصحفية وعروض الاستثمار والمقارنات التقنية. وهذا يجعل النموذج قويًا جدًا في تلك السيناريوهات الاختبارية، ولكنه يفشل في إظهار نفس القدرات عندما يواجه ظروفًا واقعية متغيرة.

هو يقارن ذلك بمسابقة البرمجة. إذا كان أحد المتسابقين يتدرب بجد لمدة 10,000 ساعة من أجل الفوز بالبطولة، فإنه بالتأكيد يمكنه تحقيق نتائج مذهلة في المسابقة. بينما المتسابق الآخر الذي تدرب لمدة 100 ساعة فقط، ولكنه يمتلك طريقة فهم فطرية معينة للمشكلات، قد يكون أكثر قدرة على التكيف في مسيرته المهنية الطويلة. النموذج في الوقت الحالي يشبه الأول:

“مدرب بشكل عالي، قوي جداً في المهام الثابتة، لكنه يفتقر إلى قدرة التعميم العميق على الطريقة البشرية.”

تسود موجة توسيع النماذج، وتم ضغط مساحة البحث بشكل كبير

استعرض سوتسكيڤر، يمكن القول إن الفترة من 2012 إلى 2020 كانت “العصر الذهبي للبحث” في مجال الذكاء الاصطناعي، حيث كان الجميع يستكشفون هياكل وطرق مختلفة، وقد جاءت العديد من الاختراقات من أفكار جديدة متنوعة. ومع ذلك، فإن النجاح الذي حققه GPT-3 وقانون توسيع النماذج غير الاتجاه بشكل جذري. منذ ذلك الحين، بدأ القطاع بأكمله في تشكيل إجماع تدريجي:

«قم بتكبير النموذج، وزيادة البيانات، وزيادة قوة الحوسبة، وستزداد القدرة بشكل طبيعي.»

تعتبر هذه الطريقة المعتمدة على الصيغة شائعة في سوق الاستثمار وبين الشركات الكبرى بسبب انخفاض المخاطر وقابلية التنبؤ بالنتائج. لكن بسبب اعتماد الجميع نفس الاستراتيجية، فإن مساحة البحث الحقيقي تضيق.

المعلومات الطبيعية محدودة، والتدريب المسبق سيواجه في النهاية عقبات.

أكد سوتسكييفر أن المواد الطبيعية المتاحة على الإنترنت محدودة، وأن تدريب نماذج اللغة الكبيرة يعتمد على هذه النصوص. بعد سنوات من التوسع، اقتربت الشركات من “استخدام كل المواد المتاحة”. عندما لا يمكن مضاعفة كمية البيانات، فإن الاعتماد فقط على توسيع النموذج وقوة الحوسبة سيؤدي إلى تباطؤ واضح في تحسين الأداء.

يعتقد أن هذا يمثل دخول الذكاء الاصطناعي إلى المرحلة التالية، لم يعد مجرد السعي لجعل النماذج أكبر، بل يجب إعادة فهم كيف يتعلم البشر، وكيف تتشكل العمومية، وما إذا كان بإمكان النماذج تصحيح نفسها بعدد أقل من العينات، وما إذا كانت قادرة على تقييم الأداء أثناء عملية التعلم مثل البشر، بدلاً من الاعتماد فقط على التغذية الراجعة النهائية لتحديد اتجاه السلوك.

هذه المشاكل ليست في جوهرها قابلة للحل من خلال عدد وحدات معالجة الرسوميات، بل تتطلب بحثًا علميًا حقيقيًا.

(ملاحظة: التدريب المسبق Pre-Training، يعني السماح للنموذج بقراءة كميات كبيرة من النصوص على الإنترنت، ليتعلم من خلالها بنية اللغة والمعرفة الأساسية، مما يشكل الأساس للقدرات اللاحقة. جميع النماذج الكبيرة السائدة تعتمد التدريب المسبق كمرحلة أولى. )

أدى التعلم المعزز إلى انفجار قوة الحوسبة، وكفاءة الأمر ليست كما هو متوقع.

أشار سوتسكيڤر أيضًا إلى أن العديد من الشركات في السنوات الأخيرة قد تجاوزت نطاق تدريب التعلم المعزز (RL) حتى نطاق التدريب المسبق. إن عمليات الاستنتاج الطويلة هذه تستهلك قدرًا هائلًا من قوة الحوسبة، لكن التعلم الفعّال الذي تحققه كل عملية استنتاج في الواقع محدود، مما يؤدي إلى انخفاض الكفاءة العامة. إذا استمر الاعتماد على نفس أساليب التدريب، فلن يؤدي ذلك إلا إلى استثمار المزيد من الموارد، مع صعوبة في تجاوز حدود جوهر النموذج.

لذلك يعتقد أن صناعة الذكاء الاصطناعي تعود تدريجياً إلى مرحلة البحث عن “طرق جديدة”، حيث لم يعد التركيز على من يمتلك أكبر مراكز البيانات، بل على من يمكنه العثور على مبادئ تعلم جديدة.

(ملاحظة: التعلم المعزز Reinforcement Learning، يعني تمكين النموذج من خلال طريقة التدريب القائمة على التجربة والخطأ، حيث يتلقى النموذج ملاحظات أو مكافآت بعد إكمال المهمة، ويقوم بتعديل سلوكه بناءً على ذلك. )

ركز على فهم التعلم، ونتحدث عن نموذج الأعمال لاحقاً

قال سوتسكيver إن استراتيجية SSI هي التركيز على البحث، وخاصة فهم التعميم، وأساليب التعلم البشرية، وكيف يمكن للنماذج تحسين نفسها مع عدد قليل من الأمثلة. ويعتقد أنه بدلاً من التسرع في الإجابة على نموذج الأعمال، من الأفضل التركيز على العثور على بنية تعلم أكثر أساسية من التدريب المسبق، وعندما يتم تحقيق تقدم، ستظهر تطبيقات تجارية متنوعة.

توقع أنه في غضون 5 إلى 20 عامًا، سيكون هناك فرصة لإنشاء ذكاء اصطناعي “يماثل كفاءة التعلم لدى البشر”. وحينما تتمكن الآلات من اكتساب مهارات جديدة بسرعة مثل البشر، ومع نشرها بشكل واسع، ستظهر القدرة الإجمالية نمواً سريعاً، مما يقترب من الذكاء الخارق.

سوف تختفي الفجوة بين التقييم والفائدة مع ظهور طرق تعلم جديدة

وذكر سوتسكيفر في النهاية أن الثورة الحالية في الذكاء الاصطناعي تبدو غير دراماتيكية لأن هناك فجوة واضحة بين قدرات النموذج وطرق استخدامه. عندما يتطور النموذج من القدرة على الاختبار إلى القدرة على التعلم، ويستطيع التصحيح الذاتي، والاستمرار في التعميم، والنمو المستقر، ستعيد الذكاء الاصطناعي تشكيل الحياة العالمية بسرعة كبيرة.

عندئذ، لن يرى الناس فقط استثمارات ضخمة في الأخبار، بل سيكون بإمكانهم حقًا الشعور بالتغيير في حياتهم اليومية.

هذه المقالة من قبل علماء OpenAI السابقين: لقد وصلت قوة الحوسبة إلى الحد الأقصى، ويجب على صناعة الذكاء الاصطناعي العودة إلى جوهر البحث. ظهرت لأول مرة في أخبار السلسلة ABMedia.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$3.64Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.63Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.63Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.69Kعدد الحائزين:3
    0.11%
  • القيمة السوقية:$3.62Kعدد الحائزين:1
    0.00%
  • تثبيت