Нейросеть определяет облик человека по голосу
Нейросеть воссоздала облик человека по голосу.
Алгоритм Speech2Face по записи голоса может определить и пол человека, и даже практически точно национальность. С меньшей вероятностью программа может предсказать возраст говорящего.
Также программа способна составить примерный портрет человека, но точность описания далека от идеала.
Для обучения нейросети исследователи использовали массив, содержащий более миллиона небольших видео, на которых говорили люди. Программа разделяла видео и аудиодорожку.
Обучив нейронную сеть, используя большой объем информации, ученые протестировали модель на фотографиях лиц людей. Оказалось, алгоритм неплохо угадывает пол человека, но редко может определить его возраст с точностью до десяти лет, а также лучше всего воссоздает лица людей с европейской и азиатской внешностью.
Ученые сообщили, что точность воссоздания внешности по голосу всегда будет невеликой из-за различных особенностей, влияющих на речь. Кроме того, голос может изменяться с годами, поэтому его точное совпадение с внешностью маловероятно.
Источник: https://naked-science.ru/article/hi-tech/neyroset-smogla-vossozdat-lico
Интересно.
Версии, предположения, догадки. Ничего конкретного, так как много воздействующих факторов.