Изучаем возможности искусственного интеллекта от Samsung. Мы протестировали перевод телефонных разговоров в реальном времени

Наступила эра искусственного интеллекта. Компании стремятся внедрять в свои устройства как можно больше функций, связанных с ИИ. Некоторые из них могут показаться всего лишь дешевыми трюками, другие — занимательными, но не совсем доступными штуками. Однако есть и действительно полезные фишки, обладающие хорошим потенциалом. Искусственный интеллект от Samsung называется Galaxy AI. Он доступен на следующих смартфонах и планшетах: Galaxy S24, S23, S22, Z Flip 6, Z Flip 5, Z Flip 4, Z Fold 6, Z Fold 5, Z Fold 4, Tab S10, Tab S9 и S8 5G.

Одна из таких функций — синхронный перевод телефонных разговоров. В этой статье я расскажу, как использовать данную возможность, и поделюсь своими выводами после ее тестирования, которое мы провели вместе с моей коллегой Карин Киван.

Что входит в переводчик в Galaxy AI

Его функционал включает множество возможностей, но в этой статье основное внимание будет уделено использованию «Синхронного перевода» именно во время телефонных разговоров. В первую очередь, эта функция направлена на преодоление языковых барьеров. Благодаря ей во время звонка для обеих сторон осуществляется перевод в реальном времени. Переводы выполняются в режиме offline после загрузки необходимых языковых пакетов. Первоначально данная функция поддерживалась только на 13 языках, но теперь их список расширился, и туда входят, например, арабский и турецкий языки. Кроме того, если раньше возможность работала только со звонилкой непосредственно от Samsung, то сейчас функция поддерживает популярные сервисы для звонков через интернет, такие как WhatsApp.

Примечание: работа функции может зависеть от региона.

Включение и настройка «Синхронного перевода»

Если у вас есть совместимое устройство, вы можете настроить на нем функцию «Синхронный перевод». Для этого перейдите в раздел «Настройки» > «Дополнительные функции» > «передовые интеллектуальные инструменты» > «Телефон». Ниже, список доступных опций:

  • Я: В этом разделе вы можете настроить следующие параметры:
  • Язык: выбрать язык, на котором вы говорите.
  • Голос: настроить голос, которым будет озвучиваться перевод, в случае, если для выбранного языка доступно несколько голосов Samsung TTS.
  • Отключить звук моего голоса: чтобы во время разговора собеседник слышал только перевод, активируйте этот параметр. Если эта опция отключена, человек на другом конце провода будет слышать и ваш голос, и перевод.
  • Собеседник: аналогичные опции доступны для другого абонента. Это позволяет настроить язык, на котором он говорит, голос для воспроизведения перевода и возможность отключить звук голоса собеседника.
  • Настройки языка и голоса для каждого пользователя: в этом разделе вы можете сконфигурировать настройки для определенных контактов или телефонных номеров. Например, если вы часто звоните одному человеку, говорящему по-турецки, а другому, который говорит по-французски, вы можете установить турецкий в качестве языка по умолчанию для одного контакта, а французский — для другого. Похоже, что эта опция работает только для обычных телефонных звонков, совершаемых с помощью программы от Samsung. Данная функция не поддерживает сторонние «звонилки».
  • «Синхронный перевод» в других приложениях: при включении этого раздела отобразится список совместимых с функцией приложений для голосовых вызовов, а также появится следующий текст: «Выполняйте перевод в режиме реального времени в поддерживаемых приложениях для осуществления голосовых вызовов. Чтобы начать перевод во время разговора, нажмите «Синхронный перевод» на панели быстрого доступа. Если в некоторых приложениях микрофон отключен, перевод того, что вы говорите может продолжаться, но другие участники разговора не будут его слышать. Функция поддерживает ряд популярных приложений с функцией интернет-звонков. На моем устройстве это: WhatsApp, Telegram, Meet и Instagram. У каждого приложения в списке есть переключатель для активации перевода в реальном времени.

Кроме того, вы можете получить доступ к настройкам функции перевода через нативное приложение «Телефон». Для этого нажмите «Дополнительные параметры» > «Настройки» > «Помощь при вызове».

Использование функции во время обычного телефонного разговора

Чтобы включить «Синхронный перевод» во встроенной программе для звонков от Samsung во время телефонного разговора, начните вызов, далее найдите кнопку «помощь во время вызова», расположенную в центре экрана над кнопкой видеовызова. Нажмите на нее и вы увидите опцию перевода в реальном времени.

При вызовах через интернет

При использовании приложений с поддержкой VoIP вы можете перейти к функции перевода из быстрых настроек вашего устройства. Чтобы открыть быстрые настройки, проведите вниз двумя пальцами от панели уведомлений. В случае, если вы используете программу экранного доступа, можно назначить жест для открытия этого раздела. Быстрые настройки также доступны из главного меню Jieshuo или TalkBack, хотя в TB быстрые настройки могут быть недоступны по умолчанию.

В разделе «Быстрые настройки» найдите параметр «Синхронный перевод». В моем случае это первый пункт на второй странице, но при желании вы можете изменить порядок расположения элементов быстрых настроек (в данной статье про это не написано).

При активации функции перевода в первый раз вам нужно предоставить три разрешения: на использование микрофона, журнала вызовов и контактов. После этого появится надпись «Преодолеваем языковые барьеры» и кнопка «ОК». Чтобы запустить перевод, нажмите на нее.

После включения для обоих собеседников будет воспроизведено объявление на языках, заданных в настройках функции перевода в реальном времени. Например, если у вас в качестве языка установлен турецкий, вы услышите объявление на турецком. Второй же собеседник услышит его на заданном него языке, в нашем случае это арабский. В воспроизводимом объявлении также содержится информация, например, о том, что во время разговора переводы будут отображаться на экране в реальном времени.

Когда функция активна, устройство слушает речь любой из сторон, переводит произнесенный текст и воспроизводит перевод. Транскрипция исходного текста и результат перевода отображаются на экране, и по ним можно спокойно перемещаться и читать написанное с помощью программы экранного доступа. На экране также доступна опция быстрого переключения языков, которой можно воспользоваться при необходимости.

Наши тесты

Функция перевода в реальном времени, еще и с использованием искусственного интеллекта, несомненно, звучит интригующе, но ее истинная ценность заключается в том, насколько она эффективна на практике. Я провел два тестовых звонка через WhatsApp с Карин: я говорил по-турецки, а она — по-арабски (без использования какого-либо из множества диалектов, характерных для последнего языка). Затем мы обсудили то, о чем говорили, чтобы оценить точность переводов.

Во время теста я использовал свой Galaxy S23, а Карин — Galaxy A55, на котором функция перевода в реальном времени не поддерживается.

Хороший потенциал, но далеко от идеала.

Положительные моменты

Слышно хорошо, перевод осуществляется быстро, а элементы на экране доступны для пользователей программы экранного доступа

Если говорить о положительных сторонах, то и Карин, и я согласны с тем, что эта функция реализована качественно. Оба перевода (турецкий и арабский) звучали четко и понятно, и мы вдвоем хорошо их слышали. Мы ценим такой подход, поскольку может возникнуть ситуация, в которой один из собеседников или все участники разговора могут понимать только лишь часть разговорного языка или определенные термины, что делает перевод в режиме реального времени действительно полезной функцией.

Скорость перевода также была впечатляющей, даже когда предложения были чуть более длинными чем обычно, ждать приходилось не долго.

Кроме того, возможность менять языки во время разговора — хорошо продуманное дополнение этой фишки.

Еще одним аспектом, который я оценил, была доступность. Во время тестирования я не столкнулся с какими-либо проблемами. Программа экранного доступа, в моем случае Jieshuo, не говорила одновременно с переводом, что позволяло хорошо его слышать. Более того, чтение транскрипта как исходного текста, так и текста перевода было возможно по средствам прямого касания и жестов смахиванием, что упрощало навигацию.

Качество перевода во многом оставляет желать лучшего

В то время как онлайн-переводчики демонстрируют заметный прогресс, сервисы офлайн-перевода, похоже, нуждаются в дальнейшем развитии, чтобы сравниться с ними по качеству предоставляемых переводов. Мы не ожидали качество, сопоставимого с онлайн-сервисами перевода на базе искусственного интеллекта, но надеялись на лучшие результаты.

Перевод простых фраз, таких как приветствий и комментариев, связанных с погодой («Сегодня хорошая погода и светит солнце» и ответ «Сегодня у нас идет дождь»), был выполнен точно. Однако во время второго звонка, когда Карин спросила, может ли она забронировать столик в ресторане на завтра, перевод изначально был точным, но по мере продолжения разговора возникли некоторые проблемы. Мой ответ, что это возможно, и последующий вопрос о времени резервирования были переведены корректно. Однако ее ответ, в котором она сказала: «Столик на 10 часов для двоих», был переведен неверно, а мой ответ был переведен как: «У нас есть место для второй таблицы данных в 10». В данном случае использовался термин, обозначающий таблицу данных, а не обеденный стол, а в арабском языке для этого есть два разных слова. Когда Карин попросила подтвердить бронь, «10 часов» было переведено как «12», и обеденный стол снова стал таблицей данных. Мой же ответ прозвучал: «Я подтверждаю ваше бронирование столика на 12 часов дня завтра». Эта путаница заставила ее спросить, забронирован столик на 10 утра или на 12 дня. Я уточнил, что на 10 утра, и на этот раз ошибок в переводе не было.

Основной загвоздкой здесь стал перевод слова «стол». В арабском и турецком языках, в отличие от английского, есть два разных слова, обозначающих таблицу данных и обеденный стол. При переводе английского слова table искусственный интеллект использовал арабский термин, обозначающий таблицу данных. Эта ошибка указывает на то, что сервис, возможно, сначала переводит речь на английский, язык, в котором одно и то же слово означает и таблицу, и стол, а затем на арабский.

В другом случае при переводе была допущена смысловая ошибка. Предложение «Давайте поговорим на медицинские темы» переведено как «Давайте поговорим о детях».

Несмотря на то, что сервис работает на базе ИИ, существенная его проблема — отсутствие понимания контекста. Эффективный перевод с одного языка на другой требует больше, чем просто буквальной интерпретации. В настоящее время в современных продвинутых онлайн-сервисах перевода этот недостаток в значительной степени решен. К сожалению, наши тесты показали, что сервис от Samsung в значительной степени выполняет буквальный, а не смысловой перевод. Например, если бы ИИ обладал хотя бы некоторым пониманием контекста, он, вероятно, не перевел бы на арабский турецкое слово, обозначающее обеденный стол, как таблицу данных.

Перевод телефонных разговоров в реальном времени — одна из немногих функций искусственного интеллекта, которая привлекла мое внимание, особенно благодаря поддержке большого количества языков и сервисов с возможностью совершения звонков через интернет. Тестирование выявило, что реализация возможности выполнена добротно, учитывая, что я не столкнулся с проблемами доступности. Принимая во внимание то, что обработка данных происходит непосредственно на устройстве, время отклика приемлемо, а переводы базовых вещей были выполнены хорошо.

Однако я бы не назвал функцию надежной из-за частых ошибок при переводе и недостаточного понимания контекста. В настоящее время ее использование не рекомендуется для перевода важных разговоров. Качество перевода может варьироваться в зависимости от используемых языковых пар, поэтому даже если вы не намереваетесь пользоваться сервисом на повседневной основе, его стоит протестировать. Если, конечно, у вас есть такая возможность. Функция перевода в реальном времени служит напоминанием о прогрессе, достигнутом в преодолении языковых барьеров. Теперь телефоны выполняют переводы практически мгновенно — мечта, которая еще недавно казалась несбыточной. Поскольку очевидно, что искусственный интеллект никуда не исчезнет, важно следить за его развитием в области языков и перевода, поскольку его потенциальное влияние на международную коммуникацию становится довольно значимым.

Автор: Салих Кундуз

Перевёл Владислав Бондаренко

Источник: accessibleandroid.com

Поделиться