بررسی جامع Midjourney v7 Alpha؛ پایان دوران عکاسان و طراحان یا آغاز عصر "کارگردانان تصویر"? (تحلیل تخصصی تکین پلاس)

این مقاله در زبان‌های زیر موجود است:

برای خواندن این مقاله به زبان دیگر کلیک کنید

1. مقدمه: عبور از "دره وهم"

1.1. وقتی پوست انسان دیگر "پلاستیکی" نیست

تا پیش از این, عکس‌های هوش مصنوعی همیشه یک "لو" داشتند: پوست‌های بیش از حد صاف (Airbrushed), برق غیرطبیعی چشم‌ها یا نورپردازی که زیادی "کامل" و استودیویی بود. اما Midjourney v7 (نسخه آلفا) این قواعد را شکسته است.

تیم دیوید هولز (David Holz) روی "نقص‌های انسانی" تمرکز کرده‌اند. بافت پوست (Skin Texture) در نسخه 7 اکنون دارای منافذ, کک‌ومک نامتقارن, موهای ریز صورت (Peach Fuzz) و عیوب طبیعی است. نورپردازی دارای "نویز" طبیعی دوربین‌های آنالوگ و خطای لنز (Chromatic Aberration) است. اگر یک عکس پرتره v7 را کنار یک عکس واقعی بگذارید, حتی عکاسان حرفه‌ای هم در تشخیص آن دچار مشکل می‌شوند.

1.2. خداحافظی با کابوس انگشت‌ها

یادتان هست وقتی AI دست‌ها را با 7 انگشت یا بازوهای اضافه می‌کشید? آن دوران تمام شد. نسخه 7 درک آناتومی بدن انسان را به کمال رسانده است. حالا مدل‌ها می‌توانند ژست‌های پیچیده یوگا بگیرند, گیتار بزنند یا اشیاء را با دست نگه دارند, بدون اینکه انگشتانشان در هم ذوب شود. همچنین, قابلیت نوشتن متن (Text Rendering) که پاشنه آشیل میدجورنی بود, حالا بی‌نقص کار می‌کند و می‌توانید پوسترهای فیلم با تایپوگرافی دقیق بسازید.

2. قابلیت‌های انقلابی: میدجورنی دیگر فقط عکس نیست

2.1. خروجی وکتور (SVG): کابوس طراحان لوگو

این شاید بزرگترین خبر برای گرافیست‌ها باشد. میدجورنی v7 می‌تواند خروجی‌ها را به صورت Vector (SVG) ارائه دهد. یعنی شما می‌توانید یک لوگو یا آیکون بسازید و آن را در نرم‌افزارهایی مثل Adobe Illustrator باز کنید. برخلاف عکس‌های پیکسلی (Raster) که با زوم کردن کیفیتشان را از دست می‌دهند, وکتورها را می‌توان تا اندازه یک بیلبورد شهری بزرگ کرد بدون اینکه حتی یک پیکسل افت کیفیت داشته باشند. این قابلیت, مرز بین "تصویرسازی" و "طراحی گرافیک" را از بین برده است.

2.2. درک عمق و رندر 3 بعدی

شایعات قوی وجود دارد که میدجورنی در حال تست خروجی مدل‌های سه بعدی است. اما حتی الان هم, درک v7 از "عمق میدان" (Depth of Field) و پرسپکتیو سه بعدی خیره‌کننده است. معماران می‌توانند اسکیس‌های دستی خود را آپلود کنند و میدجورنی آن را به یک رندر فتورئالیستیک تبدیل کند که نورپردازی و متریال‌ها (شیشه, بتن, چوب) را دقیقاً شبیه‌سازی کرده است.

2.3. ویرایش ناحیه‌ای (In-Painting)

دیگر لازم نیست برای تغییر رنگ لباس یک کاراکتر, کل پرامپت را دوباره جنریت کنید. با قابلیت Vary (Region) پیشرفته, می‌توانید با یک قلم‌مو (Brush) روی لباس بکشید و بگویید "این را به کت چرمی قرمز تبدیل کن". هوش مصنوعی نور و سایه لباس جدید را دقیقاً با محیط هماهنگ می‌کند.

3. مهندسی پرامپت در v7: خداحافظی با کلمات کلیدی

3.1. درک زبان طبیعی (NLP)

در نسخه‌های قدیمی (v4 و v5), ما مجبور بودیم مثل ربات حرف بزنیم: Woman, portrait, 8k, cinematic lighting, --v 5. اما در v7, میدجورنی زبان انسان را می‌فهمد. شما می‌توانید بنویسید: «یک عکس یهویی و طبیعی از دختری که در کافه نشسته و با خندیدن قهوه‌اش ریخته روی میز.» مدل v7 تمام اجزای جمله (یهویی, خندیدن, ریختن قهوه) را درک و اجرا می‌کند.

3.2. پارامترهای جدید: --sref و --cref

این دو پارامتر بازی را عوض کردند:
--sref (Style Reference): شما می‌توانید لینک یک نقاشی ون‌گوگ یا یک عکس سینمایی خاص را بدهید و میدجورنی "سبک هنری" آن را می‌دزدد و روی عکس شما اعمال می‌کند.
--cref (Character Reference): جام مقدس فیلمسازان! شما عکس چهره یک کاراکتر را می‌دهید و میدجورنی در تمام تصاویر بعدی, دقیقاً همان چهره را در زوایا و لباس‌های مختلف حفظ می‌کند. این یعنی امکان ساخت استوری‌بورد و کمیک‌بوک با شخصیت ثابت.

4. تاثیر بر صنایع مختلف: چه کسانی بیکار می‌شوند?

4.1. مرگ عکاسی استوک (Stock Photography)

بیایید روراست باشیم: دوران خرید اشتراک شاتر استاک (Shutterstock) رو به پایان است. چرا یک آژانس تبلیغاتی باید 5000 دلار برای اجاره استودیو, مدل, گریمور و عکاس هزینه کند تا یک عکس از "زنی که با لبخند سالاد می‌خورد" بگیرد? میدجورنی v7 این کار را در 30 ثانیه با هزینه تقریبی صفر و کیفیت بهتر (و نورپردازی قابل کنترل) انجام می‌دهد. سایت‌های فروش عکس استوک با بزرگترین بحران تاریخ خود روبرو هستند.

4.2. عکاسی محصول (Product Photography)

کسب‌وکارهای کوچک حالا می‌توانند محصولات خود را (مثلاً یک بطری عطر یا کفش) با استفاده از هوش مصنوعی در عجیب‌ترین لوکیشن‌ها (کوهستان‌های مریخ یا زیر اقیانوس) به تصویر بکشند. کافیست عکس خام محصول را آپلود کنید و از هوش مصنوعی بخواهید بقیه کار را انجام دهد. دیگر نیازی به دکورهای گران‌قیمت نیست.

4.3. بازی‌سازی و کانسپت آرت

در استودیوهای بازی‌سازی, مرحله "ایده‌پردازی" (Ideation) که قبلاً هفته‌ها طول می‌کشید, حالا در چند ساعت انجام می‌شود. آرتیست‌ها می‌توانند صدها نوع هیولا, محیط و سلاح را در یک روز تولید کنند و سپس بهترین‌ها را برای مدل‌سازی سه بعدی انتخاب کنند. سرعت تولید (Pipeline) بازی‌ها به شدت افزایش یافته است.

5. چالش‌های حقوقی و اخلاقی

5.1. کپی‌رایت تصاویر AI

طبق قوانین فعلی آمریکا و اروپا, تصاویری که 100٪ توسط هوش مصنوعی تولید شده باشند, شامل کپی‌رایت نمی‌شوند چون "خالق انسانی" ندارند. این یعنی اگر شما یک لوگو با میدجورنی بسازید, رقیب شما می‌تواند همان را بردارد و استفاده کند و شما نمی‌توانید شکایت کنید. این بزرگترین ریسک استفاده تجاری از AI است.

5.2. دیپ‌فیک و جعل واقعیت

با واقعی‌تر شدن v7, مرز بین حقیقت و دروغ محو شده است. عکس‌های جعلی از دستگیری سیاستمداران یا وقایع تاریخی ساختگی می‌تواند افکار عمومی را فریب دهد. میدجورنی سیستم‌های سانسور (Moderation) خود را قوی‌تر کرده, اما هنوز هم راه‌هایی برای دور زدن آن وجود دارد.

6. مقایسه با رقبا: DALL-E 3 و Stable Diffusion

6.1. چرا میدجورنی هنوز پادشاه است?

DALL-E 3: در فهمیدن دستورات متنی پیچیده عالی است (چون به ChatGPT وصل است), اما خروجی آن هنوز حس "کارتونی" و "پلاستیکی" دارد.
Stable Diffusion 3: آزادی عمل کامل دارد و روی سیستم خودتان اجرا می‌شود (بدون سانسور), اما نیاز به کارت گرافیک قدرتمند و دانش فنی دارد.
Midjourney v7: تعادل طلایی است. کیفیت هنری, بافت‌های واقع‌گرایانه و نورپردازی سینمایی آن هنوز یک سر و گردن بالاتر از رقباست.

7. جمع‌بندی تکین پلاس: دوربین‌ها را بفروشیم?

آیا عکاسی مرده است? خیر. عکاسی مستند, خبری, ورزشی و ثبت لحظات واقعی خانوادگی (Wedding Photography) هرگز توسط هوش مصنوعی جایگزین نمی‌شود, چون ارزش آن‌ها در "واقعی بودن" لحظه است.

اما "عکاسی تبلیغاتی", "مدلینگ" و "تصویرسازی تجاری"? بله, این صنایع در حال دگرگونی کامل هستند. عکاسان آینده کسانی نیستند که فقط "نور" را می‌شناسند؛ کسانی هستند که "کلمات" را می‌شناسند. مهارت آینده Promptography (عکاسی با پرامپت) است. اگر عکاس یا طراح هستید, به جای جنگیدن با این موج, یاد بگیرید چطور دیدگاه هنری خود را به زبان ماشین ترجمه کنید تا به یک "کارگردان خلاق" (Creative Director) تبدیل شوید.

نویسنده مقاله

مجید قربانی‌نژاد

مجید قربانی‌نژاد، طراح و تحلیل‌گر دنیای تکنولوژی و گیمینگ در TekinGame. عاشق ترکیب خلاقیت با تکنولوژی و ساده‌سازی تجربه‌های پیچیده برای کاربران. تمرکز اصلی او روی بررسی سخت‌افزار، آموزش‌های کاربردی و ساخت تجربه‌های کاربری متمایز است.

دنبال کردن نویسنده

telegram whatsapp

اشتراک‌گذاری مقاله

توییتر تلگرام واتساپ