В последнем обновлении разработчики добавили высококачественные нейроголоса, таким образом, улучшив пользовательский опыт при прослушивании книг, документов и статей.
WaveNet и другие облачные голоса
Облачная система преобразования текста в речь от Google известна голосами WaveNet, которые основаны на передовых нейросетях и позволяют воспроизводить речь так, как если бы это говорил человек. WaveNet, модель глубокого обучения, разработанная подразделением Google DeepMind, использует тысячи часов записанной человеческой речи для создания голосов, способных воспроизводить такие речевые нюансы, как интонация, ритм и ударение. В результате получаются естественные, выразительные голоса, благодаря которым прослушивать текст станет еще приятнее.
Кроме WaveNet Google предлагает ряд стандартных голосов, а также другие продвинутые нейроголоса на основе нейросетей. Это значит, что пользователь может гибко настраивать голоса от google в зависимости от сценария использования: приближенные к человеческим нейроголоса для чтения длинных статей или обычные роботизированные голоса для прочтения чего-то небольшого.
Для пользователей, не желающих платить за облачные голоса от Google, компания предусмотрела опцию Google Cloud Free Tier. С ней вы сможете читать до 1000000 символов в месяц. Такого объема будет вполне достаточно для обычного пользователя или для того, кто хочет поэкспериментировать с нейроголосами перед тем, как начать читать большие объемы текста.
Опция подключается всем пользователям при регистрации аккаунта в Google Cloud.
Speech Central также поддерживает и другие голоса: Azure от Microsoft и голоса от OpenAI.
Загрузить приложение можно по ссылкам ниже:
Источник: speechcentral.net