گوگل قابلیت های جدید هوش مصنوعی و دسترسیپذیری را برای اندروید و کروم عرضه کرد

گوگل قابلیت های جدید هوش مصنوعی و دسترسیپذیری را برای اندروید و کروم عرضه کرد
شرکت گوگل روز پنجشنبه اعلام کرد که مجموعهای از ویژگیهای جدید مبتنی بر هوش مصنوعی و دسترسیپذیری را برای سیستمعامل اندروید و مرورگر کروم ارائه داده است. یکی از مهمترین این قابلیتها، بهروزرسانی ابزار TalkBack است؛ صفحهخوان اختصاصی اندروید که حالا به کاربران اجازه میدهد با استفاده از Gemini (چتبات هوش مصنوعی گوگل) درباره تصاویر و محتوای صفحه خود سؤال بپرسند.
گوگل سال گذشته امکان توصیف تصاویر با کمک Gemini را در TalkBack فراهم کرده بود تا افراد نابینا یا کمبینا بتوانند حتی بدون وجود متن جایگزین (alt text) از محتوای تصاویر باخبر شوند. حالا این قابلیت یک گام فراتر رفته و کاربران میتوانند بهصورت تعاملی درباره تصاویر پرسشهایی مطرح کرده و پاسخ دریافت کنند.
برای مثال، اگر دوستی عکسی از گیتار جدیدش برایتان بفرستد، شما میتوانید نهتنها توصیفی از تصویر دریافت کنید، بلکه درباره برند، رنگ یا جنس گیتار نیز سؤال کنید. همچنین امکان جدیدی اضافه شده که به کاربر اجازه میدهد درباره تمام محتوای صفحه گوشی خود (مثلاً در هنگام خرید از یک اپلیکیشن) از Gemini سؤال بپرسد؛ مثل اینکه «این لباس از چه جنسی است؟» یا «آیا تخفیفی برای این کالا وجود دارد؟»
کپشنهای زنده با احساسات واقعیتر
گوگل همچنین قابلیت Expressive Captions یا زیرنویس زنده را نیز بهروزرسانی کرده است. این ویژگی که با کمک هوش مصنوعی مکالمات را در لحظه تبدیل به متن میکند، اکنون قادر است نحوه بیان کلمات را نیز درک و منعکس کند.
به گفته گوگل، بسیاری از افراد برای انتقال احساسات، کشش در صدا ایجاد میکنند. اکنون این ویژگی جدید میتواند بین «نه» و «نهههههه!» تفاوت قائل شود یا عباراتی مانند «شووووت فوقالعاده!» را به شکل واقعیتری نمایش دهد. همچنین برچسبهای جدیدی برای صداها افزوده شدهاند، مثل زمانی که کسی سوت میزند یا گلوی خود را صاف میکند.
این قابلیتها فعلاً برای زبان انگلیسی و در کشورهای آمریکا، بریتانیا، کانادا و استرالیا عرضه میشود و مخصوص دستگاههایی است که از اندروید ۱۵ به بالا استفاده میکنند.
ارتقای خواندن فایلهای PDF و بزرگنمایی صفحات در کروم
در مرورگر کروم هم تغییرات مفیدی اعمال شده است. کاربران پیشتر نمیتوانستند فایلهای PDF اسکنشده را با صفحهخوان خود بخوانند یا در آنها جستجو کنند، اما اکنون با استفاده از فناوری تشخیص نوری نویسهها (OCR)، گوگل این مشکل را حل کرده است. از این پس، کروم بهطور خودکار این نوع فایلها را شناسایی میکند و امکان کپی، جستجو و خواندن آنها با صفحهخوان را فراهم میسازد.
علاوه بر این، قابلیت Page Zoom در کروم اندروید بهبود یافته است. کاربران اکنون میتوانند بدون بههمریختگی ظاهر صفحه، اندازه نوشتهها را بزرگتر کنند. این تنظیمات قابلیت شخصیسازی دارد و میتوانید آن را برای همه صفحات یا فقط برخی وبسایتها فعال کنید. برای دسترسی به این ویژگی، کافی است از منوی سهنقطهای در گوشه بالای کروم استفاده کنید.
منبع : گوگل قابلیت های جدید هوش مصنوعی و دسترسیپذیری را برای اندروید و کروم عرضه کرد

