1. مقدمه: عبور از "دره وهم"
1.1. وقتی پوست انسان دیگر "پلاستیکی" نیست
تا پیش از این, عکسهای هوش مصنوعی همیشه یک "لو" داشتند: پوستهای بیش از حد صاف (Airbrushed), برق غیرطبیعی چشمها یا نورپردازی که زیادی "کامل" و استودیویی بود. اما Midjourney v7 (نسخه آلفا) این قواعد را شکسته است.
تیم دیوید هولز (David Holz) روی "نقصهای انسانی" تمرکز کردهاند. بافت پوست (Skin Texture) در نسخه 7 اکنون دارای منافذ, ککومک نامتقارن, موهای ریز صورت (Peach Fuzz) و عیوب طبیعی است. نورپردازی دارای "نویز" طبیعی دوربینهای آنالوگ و خطای لنز (Chromatic Aberration) است. اگر یک عکس پرتره v7 را کنار یک عکس واقعی بگذارید, حتی عکاسان حرفهای هم در تشخیص آن دچار مشکل میشوند.
1.2. خداحافظی با کابوس انگشتها
یادتان هست وقتی AI دستها را با 7 انگشت یا بازوهای اضافه میکشید? آن دوران تمام شد. نسخه 7 درک آناتومی بدن انسان را به کمال رسانده است. حالا مدلها میتوانند ژستهای پیچیده یوگا بگیرند, گیتار بزنند یا اشیاء را با دست نگه دارند, بدون اینکه انگشتانشان در هم ذوب شود. همچنین, قابلیت نوشتن متن (Text Rendering) که پاشنه آشیل میدجورنی بود, حالا بینقص کار میکند و میتوانید پوسترهای فیلم با تایپوگرافی دقیق بسازید.
2. قابلیتهای انقلابی: میدجورنی دیگر فقط عکس نیست
2.1. خروجی وکتور (SVG): کابوس طراحان لوگو
این شاید بزرگترین خبر برای گرافیستها باشد. میدجورنی v7 میتواند خروجیها را به صورت Vector (SVG) ارائه دهد. یعنی شما میتوانید یک لوگو یا آیکون بسازید و آن را در نرمافزارهایی مثل Adobe Illustrator باز کنید. برخلاف عکسهای پیکسلی (Raster) که با زوم کردن کیفیتشان را از دست میدهند, وکتورها را میتوان تا اندازه یک بیلبورد شهری بزرگ کرد بدون اینکه حتی یک پیکسل افت کیفیت داشته باشند. این قابلیت, مرز بین "تصویرسازی" و "طراحی گرافیک" را از بین برده است.
2.2. درک عمق و رندر 3 بعدی
شایعات قوی وجود دارد که میدجورنی در حال تست خروجی مدلهای سه بعدی است. اما حتی الان هم, درک v7 از "عمق میدان" (Depth of Field) و پرسپکتیو سه بعدی خیرهکننده است. معماران میتوانند اسکیسهای دستی خود را آپلود کنند و میدجورنی آن را به یک رندر فتورئالیستیک تبدیل کند که نورپردازی و متریالها (شیشه, بتن, چوب) را دقیقاً شبیهسازی کرده است.
2.3. ویرایش ناحیهای (In-Painting)
دیگر لازم نیست برای تغییر رنگ لباس یک کاراکتر, کل پرامپت را دوباره جنریت کنید. با قابلیت Vary (Region) پیشرفته, میتوانید با یک قلممو (Brush) روی لباس بکشید و بگویید "این را به کت چرمی قرمز تبدیل کن". هوش مصنوعی نور و سایه لباس جدید را دقیقاً با محیط هماهنگ میکند.
3. مهندسی پرامپت در v7: خداحافظی با کلمات کلیدی
3.1. درک زبان طبیعی (NLP)
در نسخههای قدیمی (v4 و v5), ما مجبور بودیم مثل ربات حرف بزنیم: Woman, portrait, 8k, cinematic lighting, --v 5. اما در v7, میدجورنی زبان انسان را میفهمد. شما میتوانید بنویسید: «یک عکس یهویی و طبیعی از دختری که در کافه نشسته و با خندیدن قهوهاش ریخته روی میز.» مدل v7 تمام اجزای جمله (یهویی, خندیدن, ریختن قهوه) را درک و اجرا میکند.
3.2. پارامترهای جدید: --sref و --cref
این دو پارامتر بازی را عوض کردند:
--sref (Style Reference): شما میتوانید لینک یک نقاشی ونگوگ یا یک عکس سینمایی خاص را بدهید و میدجورنی "سبک هنری" آن را میدزدد و روی عکس شما اعمال میکند.
--cref (Character Reference): جام مقدس فیلمسازان! شما عکس چهره یک کاراکتر را میدهید و میدجورنی در تمام تصاویر بعدی, دقیقاً همان چهره را در زوایا و لباسهای مختلف حفظ میکند. این یعنی امکان ساخت استوریبورد و کمیکبوک با شخصیت ثابت.
4. تاثیر بر صنایع مختلف: چه کسانی بیکار میشوند?
4.1. مرگ عکاسی استوک (Stock Photography)
بیایید روراست باشیم: دوران خرید اشتراک شاتر استاک (Shutterstock) رو به پایان است. چرا یک آژانس تبلیغاتی باید 5000 دلار برای اجاره استودیو, مدل, گریمور و عکاس هزینه کند تا یک عکس از "زنی که با لبخند سالاد میخورد" بگیرد? میدجورنی v7 این کار را در 30 ثانیه با هزینه تقریبی صفر و کیفیت بهتر (و نورپردازی قابل کنترل) انجام میدهد. سایتهای فروش عکس استوک با بزرگترین بحران تاریخ خود روبرو هستند.
4.2. عکاسی محصول (Product Photography)
کسبوکارهای کوچک حالا میتوانند محصولات خود را (مثلاً یک بطری عطر یا کفش) با استفاده از هوش مصنوعی در عجیبترین لوکیشنها (کوهستانهای مریخ یا زیر اقیانوس) به تصویر بکشند. کافیست عکس خام محصول را آپلود کنید و از هوش مصنوعی بخواهید بقیه کار را انجام دهد. دیگر نیازی به دکورهای گرانقیمت نیست.
4.3. بازیسازی و کانسپت آرت
در استودیوهای بازیسازی, مرحله "ایدهپردازی" (Ideation) که قبلاً هفتهها طول میکشید, حالا در چند ساعت انجام میشود. آرتیستها میتوانند صدها نوع هیولا, محیط و سلاح را در یک روز تولید کنند و سپس بهترینها را برای مدلسازی سه بعدی انتخاب کنند. سرعت تولید (Pipeline) بازیها به شدت افزایش یافته است.
5. چالشهای حقوقی و اخلاقی
5.1. کپیرایت تصاویر AI
طبق قوانین فعلی آمریکا و اروپا, تصاویری که 100٪ توسط هوش مصنوعی تولید شده باشند, شامل کپیرایت نمیشوند چون "خالق انسانی" ندارند. این یعنی اگر شما یک لوگو با میدجورنی بسازید, رقیب شما میتواند همان را بردارد و استفاده کند و شما نمیتوانید شکایت کنید. این بزرگترین ریسک استفاده تجاری از AI است.
5.2. دیپفیک و جعل واقعیت
با واقعیتر شدن v7, مرز بین حقیقت و دروغ محو شده است. عکسهای جعلی از دستگیری سیاستمداران یا وقایع تاریخی ساختگی میتواند افکار عمومی را فریب دهد. میدجورنی سیستمهای سانسور (Moderation) خود را قویتر کرده, اما هنوز هم راههایی برای دور زدن آن وجود دارد.
6. مقایسه با رقبا: DALL-E 3 و Stable Diffusion
6.1. چرا میدجورنی هنوز پادشاه است?
- DALL-E 3: در فهمیدن دستورات متنی پیچیده عالی است (چون به ChatGPT وصل است), اما خروجی آن هنوز حس "کارتونی" و "پلاستیکی" دارد.
- Stable Diffusion 3: آزادی عمل کامل دارد و روی سیستم خودتان اجرا میشود (بدون سانسور), اما نیاز به کارت گرافیک قدرتمند و دانش فنی دارد.
- Midjourney v7: تعادل طلایی است. کیفیت هنری, بافتهای واقعگرایانه و نورپردازی سینمایی آن هنوز یک سر و گردن بالاتر از رقباست.
7. جمعبندی تکین پلاس: دوربینها را بفروشیم?
آیا عکاسی مرده است? خیر. عکاسی مستند, خبری, ورزشی و ثبت لحظات واقعی خانوادگی (Wedding Photography) هرگز توسط هوش مصنوعی جایگزین نمیشود, چون ارزش آنها در "واقعی بودن" لحظه است.
اما "عکاسی تبلیغاتی", "مدلینگ" و "تصویرسازی تجاری"? بله, این صنایع در حال دگرگونی کامل هستند. عکاسان آینده کسانی نیستند که فقط "نور" را میشناسند؛ کسانی هستند که "کلمات" را میشناسند. مهارت آینده Promptography (عکاسی با پرامپت) است. اگر عکاس یا طراح هستید, به جای جنگیدن با این موج, یاد بگیرید چطور دیدگاه هنری خود را به زبان ماشین ترجمه کنید تا به یک "کارگردان خلاق" (Creative Director) تبدیل شوید.
