گوگل قابلیت های جدید هوش مصنوعی و دسترسی‌پذیری را برای اندروید و کروم عرضه کرد

قابلیت های جدید هوش مصنوعی - جریمه ۳.۵ میلیارد دلاری گوگل

گوگل قابلیت های جدید هوش مصنوعی و دسترسی‌پذیری را برای اندروید و کروم عرضه کرد

شرکت گوگل روز پنج‌شنبه اعلام کرد که مجموعه‌ای از ویژگی‌های جدید مبتنی بر هوش مصنوعی و دسترسی‌پذیری را برای سیستم‌عامل اندروید و مرورگر کروم ارائه داده است. یکی از مهم‌ترین این قابلیت‌ها، به‌روزرسانی ابزار TalkBack است؛ صفحه‌خوان اختصاصی اندروید که حالا به کاربران اجازه می‌دهد با استفاده از Gemini (چت‌بات هوش مصنوعی گوگل) درباره تصاویر و محتوای صفحه خود سؤال بپرسند.

گوگل سال گذشته امکان توصیف تصاویر با کمک Gemini را در TalkBack فراهم کرده بود تا افراد نابینا یا کم‌بینا بتوانند حتی بدون وجود متن جایگزین (alt text) از محتوای تصاویر باخبر شوند. حالا این قابلیت یک گام فراتر رفته و کاربران می‌توانند به‌صورت تعاملی درباره تصاویر پرسش‌هایی مطرح کرده و پاسخ دریافت کنند.

برای مثال، اگر دوستی عکسی از گیتار جدیدش برایتان بفرستد، شما می‌توانید نه‌تنها توصیفی از تصویر دریافت کنید، بلکه درباره برند، رنگ یا جنس گیتار نیز سؤال کنید. همچنین امکان جدیدی اضافه شده که به کاربر اجازه می‌دهد درباره تمام محتوای صفحه گوشی خود (مثلاً در هنگام خرید از یک اپلیکیشن) از Gemini سؤال بپرسد؛ مثل اینکه «این لباس از چه جنسی است؟» یا «آیا تخفیفی برای این کالا وجود دارد؟»

کپشن‌های زنده با احساسات واقعی‌تر

گوگل همچنین قابلیت Expressive Captions یا زیرنویس زنده را نیز به‌روزرسانی کرده است. این ویژگی که با کمک هوش مصنوعی مکالمات را در لحظه تبدیل به متن می‌کند، اکنون قادر است نحوه بیان کلمات را نیز درک و منعکس کند.

به گفته گوگل، بسیاری از افراد برای انتقال احساسات، کشش در صدا ایجاد می‌کنند. اکنون این ویژگی جدید می‌تواند بین «نه» و «نهههههه!» تفاوت قائل شود یا عباراتی مانند «شووووت فوق‌العاده!» را به شکل واقعی‌تری نمایش دهد. همچنین برچسب‌های جدیدی برای صداها افزوده شده‌اند، مثل زمانی که کسی سوت می‌زند یا گلوی خود را صاف می‌کند.

این قابلیت‌ها فعلاً برای زبان انگلیسی و در کشورهای آمریکا، بریتانیا، کانادا و استرالیا عرضه می‌شود و مخصوص دستگاه‌هایی است که از اندروید ۱۵ به بالا استفاده می‌کنند.

ارتقای خواندن فایل‌های PDF و بزرگ‌نمایی صفحات در کروم

در مرورگر کروم هم تغییرات مفیدی اعمال شده است. کاربران پیش‌تر نمی‌توانستند فایل‌های PDF اسکن‌شده را با صفحه‌خوان خود بخوانند یا در آن‌ها جستجو کنند، اما اکنون با استفاده از فناوری تشخیص نوری نویسه‌ها (OCR)، گوگل این مشکل را حل کرده است. از این پس، کروم به‌طور خودکار این نوع فایل‌ها را شناسایی می‌کند و امکان کپی، جستجو و خواندن آن‌ها با صفحه‌خوان را فراهم می‌سازد.

علاوه بر این، قابلیت Page Zoom در کروم اندروید بهبود یافته است. کاربران اکنون می‌توانند بدون به‌هم‌ریختگی ظاهر صفحه، اندازه نوشته‌ها را بزرگ‌تر کنند. این تنظیمات قابلیت شخصی‌سازی دارد و می‌توانید آن را برای همه صفحات یا فقط برخی وب‌سایت‌ها فعال کنید. برای دسترسی به این ویژگی، کافی است از منوی سه‌نقطه‌ای در گوشه بالای کروم استفاده کنید.

منبع : گوگل قابلیت های جدید هوش مصنوعی و دسترسی‌پذیری را برای اندروید و کروم عرضه کرد

RankWriter

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *