OpenAI опять впереди планеты всей. 21 ноября гигант в области искусственного интеллекта, которого поддерживает Microsoft, наконец-то запустил функцию, позволяющую общаться с ChatGPT при помощи голоса. Она доступна для всех пользователей, включая тех, кто использует бесплатный тариф GPT-3.5. Теперь с чат-ботом можно разговаривать так же, как если бы вы общались с человеком.
Все, что нужно сделать, это загрузить приложение ChatGPT на мобильное устройство (из Google Play для Android или App Store для Apple) и создать аккаунт. За счет голосовой функции такие возможности ChatGPT, как решение проблем, изучение и анализ данных увеличивают его потенциал. Кроме того, благодаря данной функции, он может поддерживать разговор.
Возможность пообщаться с ChatGPT выделяет его среди конкурентов, таких как Bard и Bing Chat. Bard во время беседы с ним может обрабатывать изображения, Bing Chat интегрирован в Windows 11, а взаимодействие с помощью голоса, реализованное в ChatGPT, обеспечивает более естественный и удобный пользовательский опыт.
Впервые функция была протестирована на платных пользователях еще в сентябре этого года. Чтобы начать голосовое взаимодействие с ChatGPT, включите общение голосом в настройках приложения. Просто нажмите иконку с изображением наушников, выберите предпочитаемый голос и начните разговор.
В первоначальном анонсе OpenAI говорилось, что функция основана на передовой модели преобразования текста в речь, которая за счет текстовых и голосовых сэмплов создает голос, очень похожий на человеческий. Компания сотрудничала с профессиональными актерами озвучки для создания голосов. Чтобы преобразовать произнесенные слова в текст, OpenAI также использует Whisper — свою собственную систему распознавания речи с открытым исходным кодом.