گوگل در حال بهبود قابلیت تبدیل متن به گفتار هوش مصنوعی Gemini است. این شرکت، در جریان کنفرانس I/O از قابلیت جدید این سیستم رونمایی کرد که در نسخه جدید میتواند با استفاده از خروجی صدای محلی به روش بیانگرانهتری نسبت به پیش صحبت کند.
در جریان این کنفرانس، مسئول ارشد هوش مصنوعی Gemini، خانم Tulsee Doshi، با استفاده از یک دمو، قابلیتهای جدید ابزار تبدیل متن به گفتار Gemini نسخهی ۲.۵ را به نمایش گذاشت. این ویژگی از صدای تولید شده با هوش مصنوعی رونمایی کرد که میتواند بسیار طبیعیتر و با با ظرافتها و پیچیدگیهای عمیقتری صحبت کند؛ به طوری که رباتیک بودن آن بسیار کمتر از قبل نمایان میشود.
این ابزار میتواند به ۲۴ زبان صحبت کند و جابجایی در بین آنها بسیار سریع و بدون زحمت اتفاق میافتد. این دموی نمایش داده شده با زبان انگلیسی آغاز شد، پس از آن به زبان هندی تغییر کرد و در نهایت با برگشت به زبان انگلیسی پایان یافت. تمامی این مکالمه از یک صدای یکسان استفاده کرد که به ساختِ تصور صحبت کردن یک فرد واقعی بسیار کمک میکند. این ابزار، همچنین قابلیت استفاده از صدای زمزمه کردن را نیز دارد که البته تا این لحظه مقداری عجیب بهنظر میرسد.
قابلیت جدید تبدیل متن به گفتار Gemini از همین امروز در دسترس است. همچنین این هوش مصنوعی در بروزرسانی جدید، یک نسخهی پیش نمایش از گفتگوی صوتی بومی، ارائه میدهد.