گوگل نسخه تازه ابزار تصویرساز جمینای را اراعه کرد_خبررسان
[ad_1]
به گزارش خبررسان
گوگل با اراعه نسخه تازه ابزار تشکیل عکس جمینی اِیآی که با اسم رمز Nano Bananas سروصدای بسیاری به پا کرد، فتوشاپ را به چالش کشیده است. این ارتقا که به طور فنی Gemini 2.5 Flash Image نام دارد، به کاربران اجازه میدهد تصاویر را از طریق دستورات متنی و صوتی تشکیل کنند، از جمله جایگزینی افراد در یک عکس، تحول لباس آنها، یا ترکیب افراد از تصاویر واقعی با بعدعرصههای تازه. گوگل این قابلیت را به طور رسمی روز سهشنبه، تنها از طریق اپلیکیشن موبایل جمینی انتشار کرد و نسخه وب تا این مدت به همه ویژگیهای تازه دسترسی ندارد. ما این موتور تازه را آزمایش کردهایم و نتایج آن زیاد دیدنی است. برای مثال، اورام پیلچ، سردبیر رج در ایالات متحده، عکسی از بالاتنه خود و یک عکس جداگانه از دو صندلی تهیه کرد. او هر دو عکس را در تلفن خود به جمینی داد و از موتور خواست او را در صندلی قرمز بنشاند.
به گزارش قسمت نوآوری رسانه اخبار تکنولوژی تکنا، جمینی نه تنها پیلچ را در صندلی قرمز قرار داد، بلکه برای او دست و پاهایی که در عکس مهم بالاتنه وجود نداشتند نیز کشید. این ابزار حتی لوگوی روی تیشرت او را که تنها نیمی از آن در عکس مهم دیده میشد، کامل کرد. تنها مسئله غیرواقعی در عکس ادغامشده، شلوار او می بود که مشکی می بود، در حالی که در حقیقت او یک شلوار جین آبی پوشیده می بود. او از جمینی خواست شلوار را به جین آبی روشن تحول دهد، و این کار بدون هیچ مشکلی انجام شد.
گوگل در این باره خبرداد که کافی است یک عکس به جمینی بدهید و به آن بگویید چه چیزی را تحول دهد تا نمود منحصر به فرد خود را اضافه کنید. جمینی به شما امکان میدهد عکسها را با هم ترکیب کرده تا خودتان را در عکسی با حیوان خانگیتان قرار دهید، بعدعرصه یک اتاق را برای دیدن کاغذ دیواری تازه تحول دهید یا خودتان را در هر کجای دنیا که فکر میکنید، جای دهید. هنگامی که کارتان همه شد، میتوانید عکس ویرایششده جدیدتان را مجدد به جمینی آپلود کنید تا آن را به یک ویدیوی دلنشین تبدیل کنید.
در آزمایشهای دیگر، پیلچ عکسی از دخترش گرفت و خواست دو مجسمه کنار او حذف شوند. مجسمهها ناپدید شدند و سایه درختی نزدیک به جایی که قبلاً بودند، گسترش یافت. سپس او از جمینی خواست که دخترش در روبه رو اهرام ظاهر شود و این ابزار به خواسته او عمل کرد. حتی حالت ایستادن دختر را تحول داد تا صافتر بایستد. یکی از بهبودهای مهم که کاربران فوراً فهمید آن خواهند شد، شدت بالای این ابزار است. در آزمایشها، تصاویر در عرض چند ثانیه آماده میشدند.
همه کار در فضای ابری صورت میگرفت و حتی عکس روی جلد این متن نیز با منفعت گیری از جمینی ساخته شد. جمینی توانایی واقعی خود را در این عرصه مشخص می کند که به ویرایشگران عکس اجازه میدهد با منفعت گیری از هوش مصنوعی در عرض چند ثانیه کارهایی را جانشین کنند که امکان پذیر ساعتها یا حداقل دقایق طویل از یک طراح گرافیک زمان بگیرد. جایی که قبلاً باید یک نفر را با فتوشاپ در یک عکس قرار میدادید، اکنون میتوانید فقط از ابزار بخواهید که این کار را برای شما انجام دهد.
گوگل یک واترمارک SynthID را برای امکان شناسایی تصاویر تشکیل شده توسط هوش مصنوعی در این سیستم گنجانده است که پشتیبانی بزرگی به افت تصاویر جعلی برای هرزنامه، تحریک یا دیگر اهداف مخرب خواهد می بود. یقیناً این نوشته مانع از هجوم موجی از هرزنامههای تشکیل شده توسط هوش مصنوعی به صندوق ورودی ایمیل شما نخواهد شد، اما حداقل برخی بازدیدهای ایمنی را فراهم میکند. جمینی ۲.۵ فلش ایمیج تا این مدت برخی حفاظها را دارد، هرچند که محدود می باشند.
برای مثال، تشکیل تصاویر هیتلر دشوار است، اما غیرممکن نیست. با این حال، اگر سلبریتیهایی همانند تیلور سوئیفت یا دونالد ترامپ را بخواهید، مشکلی نخواهید داشت. خوشبختانه این ابزار در روبه رو تشکیل تصاویر پورنوگرافیک، حفاظهای ملزوم را دارد. به طور کلی، با این که برخی تصاویر کیفیت ایدهآل نداشتند، این ابزار هم چنان رقیب با لیاقتای برای دیگر ابزارهای طراحی عکس LLM از اوپنایآی یا xAI است. گوگل سیستم تازه خود را برای API جمینی، گوگل اِیآی استودیو برای گسترشدهندگان و ورتکس اِیآی با هزینه ۳۰ دلار به ازای هر یک میلیون نشانه خروجی اراعه میکند که هر عکس برابر با ۱۲۹۰ نشانه خروجی است (۰.۰۳۹ دلار برای هر عکس). گوگل اظهار کرده این نسخه یک نسخه موقت است و بهبودهای بیشتری در راه است. این شرکت این چنین با OpenRouter.ai و fal.ai برای دسترسی زیاد تر به این فناوری شریک شده است و اکنون نوبت دیگر شرکتهای هوش مصنوعی است که با قابلیتهای زیاد دلنشین تازه گوگل رقابت کنند.
دسته بندی مطالب
اقتصاد
[ad_2]