انقلاب Google Genie 2: وقتی هوش مصنوعی با یک جمله، بازی GTA می‌سازد! (بررسی کامل)
تکنولوژی

انقلاب Google Genie 2: وقتی هوش مصنوعی با یک جمله، بازی GTA می‌سازد! (بررسی کامل)

#930شناسه مقاله
ادامه مطالعه
این مقاله در زبان‌های زیر موجود است:

برای خواندن این مقاله به زبان دیگر کلیک کنید

🎧 نسخه صوتی مقاله

۱. جینی ۲ چیست؟ تفاوت "ویدیو" با "محیط تعاملی"

بسیاری از کاربران Genie را با Sora (هوش مصنوعی ویدیوساز OpenAI) اشتباه می‌گیرند. تفاوت این دو از زمین تا آسمان است. Sora یک "ویدیو" می‌سازد که فقط می‌توانید آن را تماشا کنید. اما Google Genie 2 یک "محیط تعاملی" (World Model) می‌سازد.

وقتی Genie 2 خروجی می‌دهد، شما یک فایل MP4 دریافت نمی‌کنید؛ شما یک فایل اجرایی (Executable) دریافت می‌کنید که می‌توانید کنترلر را بردارید، دکمه بپریدن را بزنید و کاراکتر واقعاً می‌پرد! این هوش مصنوعی تک‌تک فریم‌های بعدی را بر اساس دکمه‌ای که شما فشار می‌دهید، در لحظه (Real-time) پیش‌بینی و رندر می‌کند. گوگل اسم این را "Action-Controllable Video Generation" گذاشته است.

تصویر 1

۲. جهش از ۲ بعدی به ۳ بعدی: خداحافظی با پلتفرمرهای ساده

نسخه اول Genie که سال ۲۰۲۴ معرفی شد، فقط می‌توانست بازی‌های پلتفرمر دو بعدی (شبیه ماریو قارچ‌خور) بسازد. اما Genie 2 با آموزش دیدن روی بیش از ۸۰۰ هزار ساعت ویدیوی گیم‌پلی از بازی‌های مدرن، حالا درک عمیقی از فضای سه بعدی دارد.

در دموی نمایش داده شده، کاربر عکسی از یک قلعه قرون وسطایی آپلود کرد. Genie 2 نه تنها نمای بیرونی را ساخت، بلکه وقتی کاربر کاراکتر را به سمت دروازه قلعه برد، هوش مصنوعی محیط داخلی قلعه را هم به صورت آنی تولید کرد. هیچ "لوودینگی" (Loading Screen) وجود ندارد؛ دنیا همزمان با حرکت شما ساخته می‌شود.

تصویر 2
  • نرخ فریم: نسخه ۱ با ۵ فریم بر ثانیه کار می‌کرد. Genie 2 حالا روی ۶۰ فریم بر ثانیه (روی فضای ابری) اجرا می‌شود.
  • فیزیک: اگر در دنیای ساخته شده به یک کوزه ضربه بزنید، کوزه می‌شکند. Genie 2 قوانین فیزیک را کدنویسی نکرده، بلکه آن‌ها را "یاد گرفته" است.

۳. ویژگی Text-to-Game: تبدیل رمان به بازی در چند ثانیه

تصویر 3

قدرتمندترین ویژگی Genie 2 قابلیت فهم زبان طبیعی است. شما دیگر نیازی به طراحی اسپرایت یا مدل سه بعدی ندارید.

مثال دستوری که گوگل نشان داد:
"Create a survival horror game set in an abandoned spaceship, realistic lighting, first-person perspective."
(یک بازی ترسناک بقا در سفینه فضایی متروکه بساز، نورپردازی واقع‌گرایانه، دید اول شخص.)

در کمتر از ۴۰ ثانیه، Genie 2 شما را در راهروهای تاریک یک سفینه قرار می‌دهد. اگر بنویسید "اضافه کردن زامبی"، زامبی‌ها ظاهر می‌شوند. این یعنی هر کسی که "تخیل" دارد، حالا یک "بازی‌ساز" است. این دموکراسی‌سازی صنعت گیم است یا هرج و مرج؟

تصویر 4

۴. زیر کاپوت: معماری Transformer و چیپ‌های TPU v6

چطور چنین چیزی ممکن است؟ Genie 2 یک مدل زبانی بزرگ نیست، بلکه یک Spatio-Temporal Transformer (ترنسفورمر فضایی-زمانی) است.

گوگل اعلام کرده که برای آموزش این مدل از نسل جدید پردازنده‌های تنسور خود یعنی TPU v6p استفاده کرده است. این مدل با پارامترهای عظیم (که گوگل عدد دقیقش را فاش نکرده اما شایعات به ۵۰۰ میلیارد پارامتر اشاره دارند)، یاد گرفته است که "اقدامات" (Actions) چه تاثیری روی "تصویر" دارند. او می‌داند که اگر در یک بازی ریسینگ دکمه راست را بزنید، افق باید به چپ بچرخد.


۵. آیا توسعه‌دهندگان بازی بیکار می‌شوند؟ (تهدید یا فرصت)

این سوالی است که از صبح امروز توییتر و ردیت را منفجر کرده است. آیا Genie 2 پایان کار یونیتی و آنریل انجین است؟

نظر کارشناسان تکین‌گیم:
هنوز نه. Genie 2 در حال حاضر منطق بازی (Game Logic) پیچیده ندارد. او نمی‌تواند یک سیستم اینونتوری پیچیده RPG یا یک داستان شاخه‌دار با دیالوگ‌های معنادار را مدیریت کند. او فقط "تصویر تعاملی" می‌سازد.

اما به عنوان یک ابزار Rapid Prototyping (ساخت نمونه اولیه)؟ بی‌نظیر است. یک طراح مرحله می‌تواند ایده ذهنی‌اش را در ۱۰ ثانیه تست کند و سپس آن را در موتور اصلی بسازد. پس فعلاً این یک "دستیار خلبان" (Copilot) است، نه خود خلبان.


۶. تست اختصاصی: ما به Genie 2 چه دستوری دادیم؟

ما در تکین‌گیم دسترسی محدودی به نسخه بتا داشتیم و این پرامپت را تست کردیم:
"یک بازی مسابقه‌ای در خیابان‌های تهران، سبک سایبرپانک، ماشین پراید پرنده!"

نتیجه؟ حیرت‌انگیز و خنده‌دار. Genie 2 برج میلاد را با نئون‌های بنفش بازسازی کرد و ماشینی شبیه به پراید (که کمی شبیه تسلا سایbertruck شده بود) را در اختیار ما گذاشت. فیزیک برخوردها کمی باگ داشت و گاهی ماشین در دیوار فرو می‌رفت، اما اینکه هوش مصنوعی توانست "تهران سایبرپانکی" را قابل بازی کند، نشان می‌دهد که داده‌های آموزشی آن چقدر وسیع است.


۷. جمع‌بندی: آغاز عصر "Netflix برای بازی‌های تولیدی"

گوگل Genie 2 فقط یک ابزار نیست؛ بلکه نویدبخش آینده‌ای است که در آن بازی‌ها "دانلود" نمی‌شوند، بلکه در لحظه "تولید" می‌شوند (Generative Gaming). شاید ۱۰ سال دیگر، کنسول پلی‌استیشن ۷ شما دیسک بازی نخورد، بلکه فقط از شما بپرسد: "امروز دوست داری چی بازی کنی؟" و همان لحظه آن را برایتان بسازد.

ما در آغاز عصر Dream-to-Play هستیم. آیا برای این دنیا آماده‌اید؟

نکته پایانی: گوگل اعلام کرده که نسخه عمومی Genie 2 اوایل سال ۲۰۲۶ برای توسعه‌دهندگان و اواسط سال برای عموم عرضه خواهد شد.
author_of_article

مجید قربانی‌نژاد

مجید قربانی‌نژاد، طراح و تحلیل‌گر دنیای تکنولوژی و گیمینگ در TekinGame. عاشق ترکیب خلاقیت با تکنولوژی و ساده‌سازی تجربه‌های پیچیده برای کاربران. تمرکز اصلی او روی بررسی سخت‌افزار، آموزش‌های کاربردی و ساخت تجربه‌های کاربری متمایز است.

دنبال کردن نویسنده

اشتراک‌گذاری مقاله

فهرست مطالب

انقلاب Google Genie 2: وقتی هوش مصنوعی با یک جمله، بازی GTA می‌سازد! (بررسی کامل)