Краткое содержание:
- Компания Google выпустила долгожданную функцию Gemini Live, благодаря которой общаться с чат-ботом на базе искусственного интеллекта станет возможно голосом.
- С помощью наушников Pixel Buds Pro 2 появилась возможность активировать Gemini Live фразой «Окей, Google» или Hey, Google.
- Gemini Live станет доступна владельцам подписки Gemini Advanced сразу после запуска.
Приложение Google Gemini получило функцию голосового чата в режиме реального времени, которую компания анонсировала ранее в этом году. Функция называется Gemini Live. Она может показаться похожей на голосовой режим ChatGPT, который стал доступен пользователям в прошлом году. В обоих случаях с чат-ботами можно беседовать практически на любые темы в течение продолжительного времени. Подобная функция — значительное улучшение виртуальных помощников на базе искусственного интеллекта. Однако главный плюс Gemini Live в том, что вы можете прервать ассистента на полуслове, что делает беседу более естественной. Вам не нужно ждать, пока чат-бот закончит разговор, или нажимать на экран, чтобы прервать его или сменить тему.
На данный момент Gemini Live предлагает десять голосов на выбор. Они будут доступны только пользователям с подпиской Gemini Advanced.
Однако, чтобы смягчить последствия от подобного решения, компания предлагает годовую подписку Google One AI Premium при покупке смартфонов Pixel 9 Pro, Pixel 9 Pro XL или Pixel 9 Pro Fold. В другом случае она обойдется вам в 1800 рублей в месяц. При этом вам будут доступны 2 ТБ облачного хранилища Google и другие преимущества Google One, а также Gemini Advanced.
В конце прошлого года, когда компания анонсировала модель искусственного интеллекта Gemini, она показала видеоролик с демонстрацией, как чат-бот участвует в разговоре практически, как человек. А кроме того, с помощью камеры распознает визуальные сигналы в реальном времени. Однако позже представитель Google признал, что видео было частично подделано — для демонстрации общения голосом использовали текстовые подсказки, а для показа навыка распознавания визуальных сигналов в реальном времени — статичные изображения. Однако по прошествии почти года Google все-таки сдержала свое первоначальное обещание, и представила миру Gemini Live с возможностью голосового чата в реальном времени.
Компания заявляет, что вы можете прервать беседу с ассистентом, используя только голос. Примечательно, что у недавно выпущенных Pixel Buds Pro 2 также появилась более глубокая интеграция с Gemini Live. В частности, начать разговор с искусственным интеллектом можно будет фразой «Окей, Google» или Hey Google даже если телефон заблокирован и лежит в кармане. Это значительное усовершенствование по сравнению с текущим поведением ассистента, когда Gemini при активации голосом реагирует только на один запрос.
В Google сообщили, что функция активации голосом требует более глубокой интеграции с экосистемой Pixel, сказав, что для полноценной работы данной возможности пользователям понадобятся Pixel Buds Pro 2, подключенные к смартфону Pixel. При использовании других устройств, возможно, придется разблокировать телефон и запустить Gemini Live вручную.
Отметим, что OpenAI также работает над «продвинутым» голосовым режимом для ChatGPT, благодаря которому будет обеспечена такая же естественность общения, как и с Gemini Live. Однако в обозримом будущем он тоже будет доступен только для подписчиков ChatGPT Plus.
Источник: Android Authority