Куда приведут голосовые ИИ-технологии?

Заметили, как набирают популярность голосовые ИИ-технологии? За последние полгода произошло несколько событий, которые оставили отпечаток в памяти. Корейский проект MIDNATT представил песню, созданную с помощью искусственного интеллекта. В то же время, в мире музыки возникли споры о том, следует ли присуждать таким композициям музыкальные награды. Медицина не остается в стороне и помогает восстановить голос пациентам, которые его потеряли. Видеоплатформы также добавили функцию преобразования текста в речь. И, конечно же, мы стали свидетелями всплеска популярности ИИ-версий новых треков от известных исполнителей и каверов на старые хиты, исполненных голосами различных артистов.
Теперь эта технология дошла и до аудиокниг. Apple Books запустил функцию голосового озвучивания с помощью искусственного интеллекта. В библиотеке представлены произведения разных жанров, исполненные пятью разными голосами.
Однако, критики начали поднимать вопросы об этике. Они обсуждают не только угрозу потери работы для профессиональных озвучивающих актеров, но и возможность обмана слушателя, который автоматически ассоциирует голос чтеца с реальным человеком (и даже с его индивидуальными особенностями). Ведь здесь нет никаких визуальных подсказок.
Каждый искусственный интеллект и, соответственно, основанный на нем голосовой помощник должен понимать множество языков, или хотя бы те, на регионы которых он рассчитан. Но даже в одном регионе может быть большое количество разных диалектов каждого из языков, что еще больше усложняет ситуацию.
Если рассматривать эту тему более основательно, то, действительно, в ней столько всего непознанного. Сколько же всего только предстоит познать тому же ИИ.