تكبير / الظل شرير ، وتبدو غامضة ووحشية
على مدى السنوات القليلة الماضية ، OpenAI ، بدء التشغيل مع المهمة ضمان أن “الذكاء العام الاصطناعي يفيد كل من الإنسانية ، “تم تطوير الروبوت يحركها آلة التعلم ل لعب دوتا 2 ، أعظم لعبة في الكون. بدءا من نسخة مطورة جدا من اللعبة الكاملة ، تم تطوير الروبوت على مر السنين من خلال لعب الملايين على ملايين المباريات ضد نفسه ، لا يتعلم فقط كيفية لعب فريق خمسة على خمسة لعبة ولكن كيفية الفوز ، باستمرار.
لقد تمكنا من مشاهدة تطور الروبوت على عدد من عرض المباريات ، حيث يستخدم كل منها إصدارًا أكثر اكتمالا من اللعبة وأكثر المعارضين الإنسان المهرة. هذا توجت في ما هو من المتوقع أن تكون المباراة النهائية في عطلة نهاية الأسبوع ، عندما OpenAI كان خمسة في المباراة في أفضل مباراة من ثلاثة ضد OG ، الفريق الذي فاز في أكبر مسابقة في جميع الرياضات العام الماضي ، ال الدولية.
OpenAI يخضع لبضع معوقات باسم الحفظ أشياء مثيرة للاهتمام. كل واحد من خمسة لاعبين لمنظمة العفو الدولية يعمل على نسخة مماثلة من برنامج الروبوت ، مع عدم وجود اتصال بين هم: إنهم خمسة لاعبين مستقلين يفكرون جدًا على حد سواء ولكن ليس لديهم وسيلة مباشرة لتنسيق أعمالهم. وقت رد الفعل OpenAI تباطأ بشكل مصطنع لضمان ذلك اللعبة ليست مجرد عرض لردود الفعل الخارقة. و ال لا يزال bot لا يستخدم الإصدار الكامل للعبة: محدود فقط اختيار الأبطال هو متاح ، والعناصر التي تخلق يتم حظر التوابع أو الأوهام التي يمكن التحكم فيها لأنها تشعر بذلك سيكون الروبوت قادرًا على إدارة التوابع الخاصة به بطريقة أكثر فعالية من أي إنسان يمكن.
قراءة متعمقة
في سن 32 ، حصلت أخيرًا على ألعاب رياضية ، بفضل ألعاب Dota 2The يمكن مشاهدتها هنا. بدا أول مباراة حتى حوالي 19 دقائق. كان لدى البشر ميزة ذهبية صغيرة ، ولكن كان لدى الروبوتات سيطرة إقليمية أفضل. وجاءت السير في المقدمة في معركة فريق ، قتل ثلاثة لاعبين بشريين بينما فقد واحد فقط. Theاللعبة لا تزال تبدو وكأنها كانت على حافة السكين ، ولكن الروبوتات عارض: أعلنوا أن لديهم فرصة 95 في المئة من الفوز ، وعند إصدار هذا الإعلان ، استخدمت على الفور ميزة أرقام للتعامل أضرار جسيمة للقاعدة البشرية. هذه مزيد من تعزيز سيطرتها الإقليمية ومنحهم أ الرصاص الذهب كبير ، أيضا.
هذا وضع البشر على القدم الخلفية ، وبينما تمكنوا من ذلك سحب اللعبة لمدة 20 دقيقة أخرى ، لم يتمكنوا من التغلب على تقدم البوتات ، وإعطاء OpenAI ميزة 1-0.
في اللعبة الثانية ، لم تكن الأمور قريبة. استغرق الروبوتات الرصاص في وقت مبكر وانتهكت قاعدة الإنسان في غضون 15 دقيقة. أخذوا النصر بعد خمس دقائق.
عموما ، كان أداء مهيمنا من قبل OpenAI: فوز 2-0 ضد فريق الإنسان المعمول اعتادوا على اللعب مع كل منهما البعض على أعلى مستوى اللعبة لهذا العرض. هذه كان الأداء أقوى وأبعد OpenAI على مر السنين.
التنسيق البوتات هو أمر غريب: رغم أنهم لا يستطيعون ذلك التواصل ، وجميع اللاعبين الخمسة التي تسيطر عليها الكمبيوتر التفكير في نفسه الطريقة. إذا اعتقد المرء أنها فرصة جيدة لمهاجمة الإنسان لاعب ، والأربعة الآخرين منهم يفكرون في نفسه وسوف ينضمون إلى الهجوم. هذا يعطي مظهر من التنسيق الكبير في معارك الفريق – التنسيق مع الدقة والصرامة التي فرق الإنسان لا يمكن أن تتطابق.
غرفة صينية بدائية
لكن OpenAI لا تبدو قابلة للضرب. لديها محددة ، إذا كان مفاجئا ، نقاط الضعف – إنها ليست كبيرة في تسجيل النقاط الأخيرة ، ضربات القتل على وحدات الكمبيوتر التي يتم استخدامها لتتراكم في اللعبة ذهب. هذا يعطي البشر فرصة للحصول على الذهب في وقت مبكر أفضلية. الروبوتات كافحت أيضا لمواجهة الخفي على الجانب الإنساني. كما يبدو أنها تتكيف بشكل سيء مع نوبات معينة من بعض الأبطال ، ولا سيما الشق الأرض ، موجة هذا يخلق مؤقتًا حاجزًا لا يمكن تجاوزه على الخريطة. البشر كانت فعالة في استخدام هذا فخ اللاعبين بوت وتقييد بهم الحركة ، ويبدو أن هذا يخلط OpenAI.
سلوك الروبوتات هو أيضًا درس للكائنات بشكل كبير الفجوة بين هذا النوع من نظام التعلم الآلي وعامة كاملة الذكاء الاصطناعي. بينما AI Five فعالة بشكل واضح في الألعاب الفائزة ، من الواضح أيضًا أنها لا تعرف كيفية اللعب Dota 2. يستخدم اللاعبون البشريون في اللعبة تقنية تسمى “الشد” لإعادة توجيه تدفق التوابع التي تسيطر عليها الكمبيوتر جانبهم (المعروف باسم تزحف في دوتا 2) كوسيلة لحرمان فريق العدو على حد سواء الذهب والخبرة. يمكن للاعبين الإنسان أن يدركوا أن هذا له حدث لأن زحف لا تظهر عندما من المفترض أن. لدى اللاعبين البشر نموذج عقلي للعبة بأكملها ، فهم قواعدها ، وبالتالي يمكن أن ندرك أن شيئا ما خاطئ يمكن أن سبب حول المكان الذي يجب أن تزحف قد ذهب و تتداخل مع السحب. الكمبيوتر ، على النقيض من ذلك ، يتجول فقط حول بلا هدف عندما تواجه هذا السيناريو.
لا سحب
في الملايين من الألعاب التي لعبت ضد نفسها ، يظهر OpenAI لم يسبق لك أن التقطت تقنية السحب ، وهكذا لم يتعلم أبدا اللعب ضدها. لذلك عندما يبدأ فريق بشري سحب ، الروبوت لا يتعرف على الوضع ولا حقا اعرف ماذا تفعل. لا يمكن أن يكون سبب حول كيفية لعبة ، و لا يمكن التكهن لماذا تتصرف اللعبة بشكل غير متوقع الطريقة. كل ما يمكن القيام به هو البحث عن الأنماط التي يتعرف عليها ويختارها الإجراء الذي من المرجح أن يؤدي إلى أفضل نتيجة اعطائها نمط أنه لا يمكن التعرف وأدائها يتدهور.
حتى الآن ، تم تقييد الروبوت OpenAI. بعض الايجابيات و أعطيت اللافتات الوصول للعب ضدها ، ولها كانت متاحة أيضا للعب في بعض الأحداث الحية. لكن ل بضعة أيام ، هذا يتغير: يمكن للاعبين Dota 2 الاشتراك هنا للعب ضد الروبوت – أو معها – لمدة ثلاثة أيام. لسوء الحظ، لا يبدو أن هذه الفترة العامة ستؤدي إلى فترة جديدة وتحسين بوت: كان الفوز على فريق بشري بارز هو هدف OpenAI تعيين لبوتها ، ومع ذلك أنجزت ، ويبدو أن التجربة لتكون كاملة.