Deepfake for Scribble: с синтезом рукописного ввода ручка не нужна
Увеличить / Пример компьютерного почерка, сгенерированного Calligrapher.ai.
Арс Техника
Благодаря бесплатному веб-приложению Calligrapher.ai любой может имитировать рукописный ввод с помощью нейронной сети, которая работает в браузере с помощью JavaScript. После ввода предложения сайт отображает его как почерк в девяти различных стилях, каждый из которых настраивается с такими свойствами, как скорость, разборчивость и ширина штриха. Это также позволяет загрузить полученный образец поддельного почерка в векторном файле SVG.
Демонстрация особенно интересна тем, что в ней не используется шрифт. Гарнитуры, которые выглядят как почерк, существуют уже более 80 лет, но каждая буква оказывается дубликатом, независимо от того, сколько раз вы ее используете.
За последнее десятилетие ученые-компьютерщики ослабили эти ограничения, изобретя новые способы имитации динамических изменений человеческого почерка с помощью нейронных сетей.
Также читайте: Как использовать Scribble для создания заметок в iPadOS 16
Веб-сайт Calligrapher.ai, созданный исследователем машинного обучения Шоном Васкесом, использует исследование из статьи 2013 года Алекса Грейвса из DeepMind. Первоначально Васкес создал сайт Calligrapher несколько лет назад, но недавно он привлек к себе больше внимания благодаря повторному открытию на Hacker News.
Пример синтеза почерка на сайте Calligrapher.ai.
каллиграф.e
Пример синтеза почерка на сайте Calligrapher.ai с использованием другого стиля.
каллиграф.e
С отключенной читабельностью у этого компьютера ужасный почерк.
каллиграф.e
Буквы становятся более четкими по мере увеличения разборчивости.
каллиграф.e
Calligrapher.ai «рисует» каждую букву так, как если бы она была написана рукой человека, руководствуясь статистическими весами. Эти веса исходят от рекуррентной нейронной сети (RNN), обученной онлайн-базе данных по почерку IAM, которая включает в себя образцы почерка 221 человека, оцифрованные с досок с течением времени. В результате модель синтеза почерка Calligrapher.ai в значительной степени ориентирована на англоязычное письмо, и люди в Hacker News сообщают о проблемах с воспроизведением диакритических знаков, которые обычно встречаются в других языках.
Реклама
Поскольку алгоритм, генерирующий почерк, носит статистический характер, его свойства, такие как «разборчивость», можно динамически регулировать. Васкес объяснил, как работает ползунок удобочитаемости, в комментарии 2020 года к Hacker News: «Вывод выбирается из распределения вероятностей, и повышение разборчивости эффективно концентрирует плотность вероятности вокруг более вероятных результатов. Так что вы правы, что это только изменение дисперсии. Общий метод называется «регулировка температуры распределения образца».
Теперь, когда нейронные сети имеют дело с текстом, речью, изображениями, видео, а теперь и с рукописным вводом, кажется, что ни один угол человеческого творческого результата не остается вне досягаемости для генеративного ИИ.
В 2018 году Васкес предоставил базовый код, лежащий в основе демонстрации веб-приложения, на GitHub, чтобы его можно было адаптировать для других приложений. В правильном контексте это может быть полезно для графических дизайнеров, которым нужно больше таланта, чем может дать статический шрифт.