Алексей Подписчиков: 222

Microsoft работает над искусственным интеллектом под названием VALL-E, который может клонировать ваш голос из 3-секундного аудиоклипа

22 января 2023 в 17:01

1 дочитывание

0 комментариев

Эта публикация уже заработала 0,05 рублей за дочитывания

Зарабатывать

Microsoft, которая планирует инвестировать 10 миллиардов долларов в ChatGPT, работает над искусственным интеллектом под названием VALL-E, который может клонировать чей-то голос из трехсекундного аудиоклипа.

Согласно опубликованному документу, VALL-E, обученный 60 000 часов английской речи, способен имитировать голос в «нулевых сценариях», что означает, что инструмент ИИ может заставить голос произносить слова, которые он никогда раньше не слышал. Корнельского университета, в котором разработчики представили инструмент.

Согласно 16-страничной статье, VALL-E использует технологию преобразования текста в речь для преобразования написанных слов в произнесенные слова в «высококачественных персонализированных» речах.

Для проведения выборки использовались записи более 7000 реальных ораторов из LibriLight — набора данных аудиокниг, состоящего из общедоступных текстов, прочитанных добровольцами. Технический гигант выпустил образцы того, как будет работать VALL-E , демонстрируя, как клонируется голос говорящего.

Инструмент искусственного интеллекта в настоящее время недоступен для публичного использования, и Microsoft не дала понять, для чего он предназначен.

Исследователи заявили, что результаты на данный момент показали, что VALL-E «значительно превосходит» самые передовые системы в своем роде «с точки зрения естественности речи и сходства говорящих».

Но они указали на отсутствие разнообразия акцентов у говорящих и на то, что некоторые слова в синтезированной речи были «неразборчивы, пропущены или дублированы».

Они также включили этическое предупреждение о VALL-E и связанных с ним рисках, в котором говорилось, что инструмент может быть использован не по назначению, например, для «подмены голосовой идентификации или выдачи себя за определенного говорящего».

«Чтобы снизить такие риски, можно построить модель обнаружения, чтобы различать, был ли аудиоклип синтезирован VALL-E», — пишут разработчики в статье. Подробностей о том, как это можно сделать, они не сообщили.

Они добавили, что «если модель обобщается на невидимых говорящих в реальном мире, она должна включать протокол, гарантирующий, что говорящий одобряет использование своего голоса».

Тем временем Microsoft объявила в понедельник, что сделает OpenAI ChatGPT доступным для своих собственных сервисов после того, как объявила о своей заинтересованности в инвестировании 10 миллиардов долларов в инструмент для написания ИИ.

Хотя ChatGPT вдохновил на творчество человека, который, например, написал с его помощью детскую книгу за один уик-энд, он вызвал опасения по поводу того, можно ли доверять этому инструменту.

Понравилась публикация?

да

9 / 0

нет

0 / 0

Донаты ₽

₽

Нейросети: угроза или помощник? Что на самом деле думают россияне

Нейросети сегодня у всех на слуху. Одни их боятся, другие не могут без них работать. А как на самом деле к ним относится большинство? Ответ даёт масштабный опрос ФОМ. Оказывается, в обществе — тихий раскол:...

₽

В 2026 году в России появится новый национальный мессенджер «Молния»

В 2026 году в России появится новый национальный мессенджер - "Молния". После ...

₽

Новое "супероружие" Путина. Британцы в панике от русских голубей биодронов

В Британии пришли в ужас от нового "супероружия" Путина. Как рассказывают агенты разведки Лондона в России образованы целые "боевые" крылатые эскадрильи, которые были якобы созданы по личному приказу Путина.

Искусственный интеллект и виртуальная реальность: главные интернет-тренды ноября 2025

В ноябре 2025 года в интернете продолжают активно обсуждать темы искусственного интеллекта и виртуальной реальности. Массовое внедрение генеративных нейросетей, которые теперь создают не только тексты,

В России подорожают связь и интернет

Ну что, дождались? Свершилось!С нового года крупнейшие телекоммуникационные ...

Яндекс Go доверил выбор маршрута ИИ

Иногда кажется, что город живёт своей жизнью и подстраиваться под него приходится вручную: проверять погоду, смотреть пробки, гадать, приедет ли такси быстро или проще пройтись пешком. В Яндекс Go решили,...

Выдумка китайцев: кресло-массажер

00:15

Чудесный малыш поет песню Има Сумак

00:53

Нейросети: угроза или помощник? Что на самом деле думают россияне

Одежда из пластикового мусора

00:56

Единый ID: Большой Брат по‑русски, или Почему вас скоро «обезлично» оцифруют

Один ID на всех: Гениальный план Минцифры или «Давайте сразу чипировать?» О, граждане ...

Цифровой рубль в России. Готов, но не сразу съешь

Россия готовится к новой эре денег — цифровому рублю. По официальным данным, массовое ...

Цифровое спасение от ужаса обычной жизни: Госдума открыла новый фронт — против собственных граждан

В Госдуме, этом неиссякаемом источнике законодательных перлов, вновь пахнет жжёным — на этот раз жгут цифровые сети. Депутат Андрей Свинцов, чья фамилия так звучно намекает на тяжёлые металлы в мышлении,...

Советская разработка, спасающая в море

00:35

Действительно ли искусственный интеллект обладает сознанием? Философ из Кембриджа предупреждает, что мы, возможно, никогда этого не узнаем

В недавнем исследовании, опубликованном в журнале Mind and Language , Макклелланд ...

Microsoft работает над искусственным интеллектом под названием VALL-E, который может клонировать ваш голос из 3-секундного аудиоклипа

Нейросети: угроза или помощник? Что на самом деле думают россияне

В 2026 году в России появится новый национальный мессенджер «Молния»

Новое "супероружие" Путина. Британцы в панике от русских голубей биодронов

Искусственный интеллект и виртуальная реальность: главные интернет-тренды ноября 2025

В России подорожают связь и интернет

Яндекс Go доверил выбор маршрута ИИ

Выдумка китайцев: кресло-массажер

Чудесный малыш поет песню Има Сумак

Нейросети: угроза или помощник? Что на самом деле думают россияне

Одежда из пластикового мусора

Единый ID: Большой Брат по‑русски, или Почему вас скоро «обезлично» оцифруют

Цифровой рубль в России. Готов, но не сразу съешь

Цифровое спасение от ужаса обычной жизни: Госдума открыла новый фронт — против собственных граждан

Советская разработка, спасающая в море

Действительно ли искусственный интеллект обладает сознанием? Философ из Кембриджа предупреждает, что мы, возможно, никогда этого не узнаем

Пойду, сделаю такую же, а то до весны ролик потеряю

Безопасность по-нашему:В Госдуме предложили меры по защите россиян от мошенников в мессенджере МАХ

Макс: государственный статус в коммерческой оболочке