انقلاب تصویری در ChatGPT؛ تصاویر واقعیتر با قدرت GPT-4o

انقلاب تصویری در ChatGPT
ارتقای بزرگ قابلیت تولید تصویر در ChatGPT با مدل جدید GPT-4o
🔹 OpenAI اولین بهروزرسانی عمده ابزار تولید تصویر ChatGPT را پس از یک سال معرفی کرد. این قابلیت اکنون با مدل قدرتمند GPT-4o در دسترس قرار گرفته است.
در جریان یک پخش زنده در روز سهشنبه، «سم آلتمن»، مدیرعامل OpenAI، از ارتقای چشمگیر قابلیت تولید تصویر در چتبات ChatGPT خبر داد؛ قابلیتی که اکنون با مدل هوش مصنوعی GPT-4o به صورت بومی تصاویر و عکسها را تولید و ویرایش میکند.
این برای نخستینبار است که GPT-4o به صورت مستقیم در تولید تصاویر به کار گرفته میشود. پیش از این، این مدل تنها برای تولید و ویرایش متن مورد استفاده قرار میگرفت.
🔸 ویژگیهای جدید برای کاربران اشتراکی و توسعهدهندگان
طبق اعلام آلتمن، این قابلیت هماکنون برای کاربران طرح اشتراکی ۲۰۰ دلاری ماهانه ChatGPT Pro در دسترس است. همچنین OpenAI وعده داده که این ویژگی بهزودی برای کاربران طرحهای Plus و رایگان نیز فعال خواهد شد. توسعهدهندگان نیز میتوانند از این ویژگی از طریق API بهرهمند شوند.
🔸 رقابت با DALL·E و Google Gemini
مدل جدید GPT-4o با خروجی تصویری، نسبت به DALL·E 3 کمی زمان بیشتری برای تولید تصویر صرف میکند، اما تصاویر نهایی دقیقتر و با جزئیات بیشتری هستند. این مدل میتواند تصاویر موجود را نیز ویرایش کند؛ حتی اگر این تصاویر شامل چهره انسان باشند. همچنین توانایی افزودن جزئیات در پسزمینه یا پیشزمینه (inpainting) را دارد.
جالب اینکه این بهروزرسانی درست پس از معرفی قابلیت تصویری مدل Gemini 2.0 Flash از سوی گوگل صورت گرفته است؛ قابلیتی که گرچه وایرال شد، اما به دلیل نبود محدودیتهای کافی، به کاربران اجازه میداد واترمارک را حذف کرده یا تصاویر دارای کپیرایت را بازسازی کنند.
منبع خبر: TechCrunch
🔸 منابع داده و احترام به حقوق هنرمندان
OpenAI در گفتوگویی با والاستریت ژورنال اعلام کرده که برای آموزش GPT-4o از دادههای عمومی و همچنین دادههای اختصاصی حاصل از همکاری با شرکتهایی مانند Shutterstock استفاده کرده است.
برد لایتکپ، مدیر اجرایی OpenAI در این باره گفت:
«ما در فرآیند تولید تصویر، حقوق هنرمندان را رعایت میکنیم و سیاستهایی داریم که مانع از تقلید مستقیم آثار هنرمندان زنده میشود.»
علاوه بر این، OpenAI فرم خروج از دیتاستهای آموزشی را ارائه کرده و همچنین به درخواستهایی که مانع خزش (کراول) داده از وبسایتها میشوند، احترام میگذارد.

