به گزارش کارشناس هوش مصنوعی شرکت سحاب، OpenAI با عرضه قابلیت تولید تصویر در ChatGPT، موجی از هیجان را در میان کاربران ایجاد کرد. این قابلیت که به کمک مدل قدرتمند GPT-4o ارائه شده، به کاربران امکان میدهد تا تصاویر جذابی را مستقیماً درون اپلیکیشن ChatGPT تولید کنند. اما استقبال گسترده از این ویژگی، چالشهای فنی و فشار بیسابقهای را بر زیرساختهای OpenAI وارد کرده است. اکنون این شرکت تصمیم گرفته است که دسترسی کاربران رایگان را به این قابلیت به تأخیر بیندازد و برای کاربران پولی نیز محدودیتهایی اعمال کند.
تأخیر در ارائه قابلیت تولید تصویر برای کاربران رایگان
Sam Altman، مدیرعامل OpenAI، در پستی اعلام کرد که تولید تصویر در ChatGPT فراتر از انتظارات آنها محبوب شده و به همین دلیل، عرضه این ویژگی برای کاربران رایگان با تأخیر مواجه خواهد شد. طبق بررسی های تیم هوش مصنوعی شرکت سحاب، این تصمیم در حالی اتخاذ شده که از زمان فعال شدن این قابلیت، شبکههای اجتماعی مملو از تصاویری شدهاند که با سبکهای هنری مختلف، از جمله سبک انیمههای استودیو Ghibli، ساخته شدهاند. حتی خود Altman نیز به این ترند پیوسته و تصاویری در این سبک به اشتراک گذاشته است.
در حال حاضر، قابلیت تولید تصویر تنها برای کاربران ChatGPT Plus، Pro و Team فعال است و مشخص نیست که کاربران رایگان چه زمانی به آن دسترسی خواهند داشت. این تصمیم نشان میدهد که OpenAI به دلیل افزایش شدید درخواستها، نیاز به بهینهسازی سیستمهای خود دارد تا بتواند پاسخگوی تقاضای گسترده کاربران باشد.
محدودیتهای جدید OpenAI برای جلوگیری از فشار بیش از حد بر سرورها
همزمان با افزایش محبوبیت این ویژگی، OpenAI مجبور شده است که محدودیتهایی را برای تولید تصویر اعمال کند. Altman در شبکه اجتماعی X اعلام کرد که به دلیل حجم بالای درخواستها، پردازندههای گرافیکی (GPU) شرکت "در حال ذوب شدن" هستند و به همین دلیل، محدودیتهای موقتی روی تعداد درخواستهای تولید تصویر اعمال شده است. هرچند میزان دقیق این محدودیتها مشخص نشده، اما او ابراز امیدواری کرد که این وضعیت طولانی نباشد و شرکت بتواند کارایی سیستم را بهبود دهد.
پیش از این نیز OpenAI برای کاهش فشار بر سرورهای خود، عرضه قابلیت تولید تصویر را برای کاربران رایگان به تعویق انداخته بود. اما ظاهراً این اقدام کافی نبوده و همچنان تقاضا از ظرفیت زیرساختهای شرکت فراتر رفته است. با این حال، Altman تأیید کرد که در آیندهای نزدیک، کاربران رایگان قادر خواهند بود تا روزانه حداکثر سه تصویر ایجاد کنند.
قدرت مدل GPT-4o در تولید تصاویر واقعگرایانه
OpenAI از مدل پیشرفته GPT-4o برای قابلیت جدید تولید تصویر استفاده کرده است. این مدل نهتنها کیفیت تصاویر تولیدی را بهبود داده، بلکه محدودیتهای قبلی مانند دشواری در تولید متون داخل تصاویر را نیز تا حد زیادی برطرف کرده است. برخلاف مدلهای قبلی که تصویر را بهصورت یکجا تولید میکردند، GPT-4o از یک روش "خودبازگشتی" (autoregressive) بهره میبرد که در آن تصویر از بالا به پایین و از چپ به راست ساخته میشود.
محققان OpenAI در مصاحبهای با The Verge از این مدل بهعنوان یک "جهش بزرگ" نسبت به مدلهای قبلی یاد کردهاند. با این حال، افزایش تقاضا برای این قابلیت، بار دیگر نشان داده است که پردازش گرافیکی موردنیاز برای چنین فناوریهایی تا چه اندازه سنگین است.
نتیجهگیری
ویژگی تولید تصویر در ChatGPT با استقبال گستردهای مواجه شده، اما این موفقیت چالشهای فنی بزرگی را نیز برای OpenAI به همراه داشته است. به همین دلیل، این شرکت عرضه این قابلیت را برای کاربران رایگان به تأخیر انداخته و محدودیتهایی را برای سایر کاربران اعمال کرده است. با وجود این مشکلات، OpenAI همچنان در تلاش است تا کارایی سیستمهای خود را افزایش داده و دسترسی به این قابلیت را برای کاربران بیشتری فراهم کند. باید دید که در آینده چگونه این شرکت میتواند تعادل مناسبی میان تقاضای کاربران و توان پردازشی خود ایجاد کند.
برای مطالعه بیشتر به TheVerge مراجعه بفرمایید