۱. جینی ۲ چیست؟ تفاوت "ویدیو" با "محیط تعاملی"
بسیاری از کاربران Genie را با Sora (هوش مصنوعی ویدیوساز OpenAI) اشتباه میگیرند. تفاوت این دو از زمین تا آسمان است. Sora یک "ویدیو" میسازد که فقط میتوانید آن را تماشا کنید. اما Google Genie 2 یک "محیط تعاملی" (World Model) میسازد.
وقتی Genie 2 خروجی میدهد، شما یک فایل MP4 دریافت نمیکنید؛ شما یک فایل اجرایی (Executable) دریافت میکنید که میتوانید کنترلر را بردارید، دکمه بپریدن را بزنید و کاراکتر واقعاً میپرد! این هوش مصنوعی تکتک فریمهای بعدی را بر اساس دکمهای که شما فشار میدهید، در لحظه (Real-time) پیشبینی و رندر میکند. گوگل اسم این را "Action-Controllable Video Generation" گذاشته است.
۲. جهش از ۲ بعدی به ۳ بعدی: خداحافظی با پلتفرمرهای ساده
نسخه اول Genie که سال ۲۰۲۴ معرفی شد، فقط میتوانست بازیهای پلتفرمر دو بعدی (شبیه ماریو قارچخور) بسازد. اما Genie 2 با آموزش دیدن روی بیش از ۸۰۰ هزار ساعت ویدیوی گیمپلی از بازیهای مدرن، حالا درک عمیقی از فضای سه بعدی دارد.
در دموی نمایش داده شده، کاربر عکسی از یک قلعه قرون وسطایی آپلود کرد. Genie 2 نه تنها نمای بیرونی را ساخت، بلکه وقتی کاربر کاراکتر را به سمت دروازه قلعه برد، هوش مصنوعی محیط داخلی قلعه را هم به صورت آنی تولید کرد. هیچ "لوودینگی" (Loading Screen) وجود ندارد؛ دنیا همزمان با حرکت شما ساخته میشود.
- نرخ فریم: نسخه ۱ با ۵ فریم بر ثانیه کار میکرد. Genie 2 حالا روی ۶۰ فریم بر ثانیه (روی فضای ابری) اجرا میشود.
- فیزیک: اگر در دنیای ساخته شده به یک کوزه ضربه بزنید، کوزه میشکند. Genie 2 قوانین فیزیک را کدنویسی نکرده، بلکه آنها را "یاد گرفته" است.
۳. ویژگی Text-to-Game: تبدیل رمان به بازی در چند ثانیه
قدرتمندترین ویژگی Genie 2 قابلیت فهم زبان طبیعی است. شما دیگر نیازی به طراحی اسپرایت یا مدل سه بعدی ندارید.
مثال دستوری که گوگل نشان داد:
"Create a survival horror game set in an abandoned spaceship, realistic lighting, first-person perspective."
(یک بازی ترسناک بقا در سفینه فضایی متروکه بساز، نورپردازی واقعگرایانه، دید اول شخص.)
در کمتر از ۴۰ ثانیه، Genie 2 شما را در راهروهای تاریک یک سفینه قرار میدهد. اگر بنویسید "اضافه کردن زامبی"، زامبیها ظاهر میشوند. این یعنی هر کسی که "تخیل" دارد، حالا یک "بازیساز" است. این دموکراسیسازی صنعت گیم است یا هرج و مرج؟
۴. زیر کاپوت: معماری Transformer و چیپهای TPU v6
چطور چنین چیزی ممکن است؟ Genie 2 یک مدل زبانی بزرگ نیست، بلکه یک Spatio-Temporal Transformer (ترنسفورمر فضایی-زمانی) است.
گوگل اعلام کرده که برای آموزش این مدل از نسل جدید پردازندههای تنسور خود یعنی TPU v6p استفاده کرده است. این مدل با پارامترهای عظیم (که گوگل عدد دقیقش را فاش نکرده اما شایعات به ۵۰۰ میلیارد پارامتر اشاره دارند)، یاد گرفته است که "اقدامات" (Actions) چه تاثیری روی "تصویر" دارند. او میداند که اگر در یک بازی ریسینگ دکمه راست را بزنید، افق باید به چپ بچرخد.
۵. آیا توسعهدهندگان بازی بیکار میشوند؟ (تهدید یا فرصت)
این سوالی است که از صبح امروز توییتر و ردیت را منفجر کرده است. آیا Genie 2 پایان کار یونیتی و آنریل انجین است؟
نظر کارشناسان تکینگیم:
هنوز نه. Genie 2 در حال حاضر منطق بازی (Game Logic) پیچیده ندارد. او نمیتواند یک سیستم اینونتوری پیچیده RPG یا یک داستان شاخهدار با دیالوگهای معنادار را مدیریت کند. او فقط "تصویر تعاملی" میسازد.
اما به عنوان یک ابزار Rapid Prototyping (ساخت نمونه اولیه)؟ بینظیر است. یک طراح مرحله میتواند ایده ذهنیاش را در ۱۰ ثانیه تست کند و سپس آن را در موتور اصلی بسازد. پس فعلاً این یک "دستیار خلبان" (Copilot) است، نه خود خلبان.
۶. تست اختصاصی: ما به Genie 2 چه دستوری دادیم؟
ما در تکینگیم دسترسی محدودی به نسخه بتا داشتیم و این پرامپت را تست کردیم:
"یک بازی مسابقهای در خیابانهای تهران، سبک سایبرپانک، ماشین پراید پرنده!"
نتیجه؟ حیرتانگیز و خندهدار. Genie 2 برج میلاد را با نئونهای بنفش بازسازی کرد و ماشینی شبیه به پراید (که کمی شبیه تسلا سایbertruck شده بود) را در اختیار ما گذاشت. فیزیک برخوردها کمی باگ داشت و گاهی ماشین در دیوار فرو میرفت، اما اینکه هوش مصنوعی توانست "تهران سایبرپانکی" را قابل بازی کند، نشان میدهد که دادههای آموزشی آن چقدر وسیع است.
۷. جمعبندی: آغاز عصر "Netflix برای بازیهای تولیدی"
گوگل Genie 2 فقط یک ابزار نیست؛ بلکه نویدبخش آیندهای است که در آن بازیها "دانلود" نمیشوند، بلکه در لحظه "تولید" میشوند (Generative Gaming). شاید ۱۰ سال دیگر، کنسول پلیاستیشن ۷ شما دیسک بازی نخورد، بلکه فقط از شما بپرسد: "امروز دوست داری چی بازی کنی؟" و همان لحظه آن را برایتان بسازد.
ما در آغاز عصر Dream-to-Play هستیم. آیا برای این دنیا آمادهاید؟
