يلمح MarioGPT إلى مستقبل مجيد يولده الذكاء الاصطناعي حيث سنلعب جميعًا نينتندو إلى الأبد
يلمح MarioGPT إلى مستقبل مجيد يولده الذكاء الاصطناعي حيث سنلعب جميعًا نينتندو إلى الأبد
لا يمكن أن يكون هناك الكثير من ماريو في العالم. بالتأكيد ، ربما مرت فترة منذ أن لعبت إحدى ألعاب NES الأصلية ، ولكن ربما لأنها مألوفة جدًا. ماذا لو أخبرتك أن الباحثين قد ابتكروا طريقة لتوليد مستويات لا نهائية من ماريو حتى تتمكن من لعب مستوى جديد تمامًا كل يوم حتى تحترق الشمس؟
أصدر فريق في IT University of Copenhagen للتو ملف ورق (ما قبل النشر) و جيثب تعرض صفحة طريقة جديدة لتشفير وإنشاء مستويات Super Mario Bros ، والتي يسمونها MarioGPT. (في مكان ما في ريدموند ، يرتشف محام قهوته ويبدأ في الكتابة).
يعتمد MarioGPT على GPT-2 ، وليس واحدًا من أنظمة الذكاء الاصطناعي الحديثة للمحادثة. هذه النماذج اللغوية الكبيرة جيدة ليس فقط في أخذ الكلمات في جمل مثل هذه ووضع المزيد مثلها – إنها آلات التعرف على الأنماط للأغراض العامة والنسخ المتماثل.
“نحن بصراحة اخترنا الأصغر لنرى ما إذا كان يعمل!” قال شيام سودهاكاران ، المؤلف الرئيسي في الصحيفة ، في رسالة بريد إلكتروني إلى TechCrunch. “أعتقد أنه مع مجموعات البيانات الصغيرة بشكل عام ، فإن GPT2 أكثر ملاءمة من GPT3 ، في حين أنها أيضًا خفيفة الوزن وأسهل في التدريب. ومع ذلك ، في المستقبل ، مع وجود مجموعات بيانات أكبر ومطالبات أكثر تعقيدًا ، قد نحتاج إلى استخدام نموذج أكثر تعقيدًا مثل GPT3 “.
حتى LLM كبير جدًا لن يفهم مستويات ماريو أصلاً ، لذلك كان على الباحثين الأوائل تقديم مجموعة منها كنص ، مما ينتج نوعًا من إصدار Dwarf Fortress من Mario والذي ، بصراحة ، سألعبه:
تريد كسب المال؟ ماريو في المحطة. فقط أقول.
بمجرد تمثيل المستوى كسلسلة من الأحرف العادية ، يمكن أن يستوعبه النموذج كثيرًا بالطريقة التي يمكن بها لأي سلسلة أخرى من الأحرف ، سواء كانت لغة مكتوبة أو رمزًا. وبمجرد أن يفهم الأنماط المرتبطة بالميزات ، يمكنه إعادة إنتاجها.
يتضمن مخرجاته “مسار” يتم تمثيله بأحرف x الصغيرة ، مما يُظهر بشكل أساسي أن المستوى قابل للتشغيل من الناحية الفنية. ووجدوا أنه من بين 250 مستوى ، كان 9 من أصل 10 قادرًا على إكمالها بواسطة وكيل برنامج تشغيل الألعاب A *.
بالطبع لن يكون هذا نجاحًا كبيرًا إذا كانت المستويات مسطحة مع وجود أنابيب عرضية لتنظيفها. لكنها تضمنت بعض الوظائف لقياس مدى بساطة المسار ، ومقارنته بمستويات من مجموعة البيانات أيضًا. مسارات مسارات جديدة ومثيرة للاهتمام تعني مستويات قابلة للتنفيذ لا تشبه المستويات الحالية ، ولكن لا تسمح للاعب بالمرور من خلالها.
كما أن المدخلات المصنفة صنعت ذلك أيضًا حتى يتمكن النموذج من فهم مطالبات اللغة الطبيعية ، مثل مطالبتهم بعمل مستوى مع “الكثير من الأنابيب والكثير من الأعداء” ، أو “العديد من الكتل ، ارتفاع عالٍ ، بدون أعداء.”
يتمثل أحد القيود في أنه نظرًا للطريقة التي يتم بها تشفير بيانات المصدر الخاصة بهم في مجموعة مستوى لعبة الفيديو ، هناك رمز واحد فقط لـ “العدو” ، بدلاً من رمز واحد لكل من goombas و koopas وما إلى ذلك ، ولكن يمكن تغيير هذا إذا لزم الأمر – كان المفهوم الذي يحتاج إلى إثبات هو أنه يمكن إنشاء مستويات جيدة على الإطلاق. (للأسف ، مستويات المياه غير ممكنة حاليًا بسبب عدم تمثيلها في مجموعة البيانات.)
“في العمل المستقبلي ، سنستكشف بعض مجموعات البيانات الأكثر ثراءً!” قال Sudhakaran.
من قبيل الصدفة ، جوليان توجيليوس في جامعة نيويورك GameLab ومجموعته كتب للتو ورقة عرض عملية مماثلة لألعاب الألغاز “sokoban” أو لعبة دفع الكتل. المبادئ متشابهة ، لكن يمكنك أن تقرأ عن الاختلافات هنا.
إن نجاح هذه الأساليب لنوعين مختلفين يشير إلى أنها يمكن أن تعمل مع الآخرين من نفس التعقيد – لا ينتج عنها تمامًا Chrono Trigger ، ولكن Sonic ثنائية الأبعاد التي تعمل بالذكاء الاصطناعي ليست واردة.
يجب أن يقال أن هذا ليس أول منشئ Mario الذي رأيناه ، لكن البعض الآخر يميل إلى الاعتماد ليس على الذكاء الاصطناعي التوليدي ولكن على تجميع المستويات من مجموعات البلاط والتسلسلات التي تم إنشاؤها مسبقًا. لذلك قد تحصل على تسلسل جديد ، لكنه لن يكون أصليًا على أساس كل مربع ، فقط شاشة تلو الأخرى.
كإصدار أول من Mario GPT ، هذا تجريبي بحت ونأمل أن يتجنب نظرة Sauron التي تشبه Sauron في Nintendo ، والتي تشتهر بمشاريع المعجبين التي تنطوي على خصائصها. ولكن بالطبع في حين أن لعبة Mario اللامتناهية تبدو ممتعة ، فإن سحر الألعاب الأصلية يكمن في الصعوبة والموضوعات المصنوعة يدويًا – وهو أمر ليس من السهل إعادة إنشائه.