Sapar Sultanov
Sapar SultanovПодписчиков: 238
РейтингРейтингРейтингРейтингРейтинг44.7к

Эти книги используются для обучения ИИ. Авторам никто не сказал

76 просмотров
3 дочитывания
0 комментариев
Эта публикация уже заработала 0,15 рублей за дочитывания
Зарабатывать

Эти книги используются для обучения ИИ. Авторам никто не сказал

Крупнейшие технологические компании используют почти 200 000 книг для обучения системам искусственного интеллекта. Проблема? Авторам никто ничего не сказал.

Система называется Books3, и, согласно расследованию The Atlantic, набор данных основан на коллекции пиратских электронных книг всех жанров, от эротической фантастики до поэзии в прозе. Книги помогают генеративным системам искусственного интеллекта научиться передавать информацию.

Некоторые тексты по обучению ИИ можно взять из статей, размещенных в Интернете, но для высококачественного ИИ требуется высококачественный текст для усвоения языка, согласно данным Atlantic, именно здесь на помощь приходят книги. Книги 3 уже являются предметом множества статей. Иски против Meta** и других компаний, использующих систему для обучения ИИ.

Теперь, благодаря базе данных, опубликованной The Atlantic на прошлой неделе на основе Books3, авторы могут увидеть, используются ли их книги конкретно для обучения этих систем искусственного интеллекта. И многие недовольны.

«Я полностью выпотрошен и распилен. Я возмущена и в то же время чувствую себя совершенно беспомощной», — написала Мэри Х.К. Чой в социальных сетях, обнаружив, что ее работы используются. «Я в ярости и хочу драться, но я также очень устал».

Чхве, чей дебютный роман «Экстренный контакт» появился в базе данных, далее объяснила свои чувства в электронном письме. Книга, в которой рассказывается о молодой корейско-американской женщине, вступающей в новые отношения, была «глубоко личной», и первоначально Чой сказали, что ее история «слишком тихая и нишевая». Позже книга стала бестселлером New York Times и нашла аудиторию по всему миру.

«Книга воплощает в себе бесконечный выбор, безграничные перестановки и даже недостатки автора на тот момент. Мысль о том, что всю эту жизнь можно бросить в огромный водоворот и выдавить в гигантскую алгоритмическую, генеративную колбасную машину, настолько быстро сокращается», — сказала она. «Не только финансово для авторов, но и лишает книготорговцев, библиотекарей и читателей стольких интимных отношений».

Мин Джин Ли, автор романов «Пачинко» и «Бесплатная еда для миллионеров», выразила аналогичные мысли в социальных сетях, прямо назвав использование ее книг «воровством».

«Я потратила три десятилетия своей жизни на написание своих книг», — сказала она. «Модели большого языка Al не «поглощают» и не «очищают» «данные». Все компании украли мою работу, время и творчество. Они украли мои истории. Они украли часть меня».

По данным The Atlantic, Нора Робертс, плодовитая писательница любовных романов, имеет 206 книг, используемых в базе данных Books3. Это число является самым высоким среди ныне живущих авторов и уступает только Уильяму Шекспиру. Она назвала базу данных и ее использование технологическими компаниями «совершенно неправильным».

«Мы люди, мы писатели, и нас эксплуатируют люди, которые хотят использовать нашу работу, опять же без разрешения или компенсации, для «написания» книг, сценариев, эссе, потому что это дешево и легко», — сказал Робертс в своем интервью. Заявление для CNN.

Такая эксплуатация писателей не шокировала автора Ника Шарму, чья кулинарная книга «Сезон» была найдена в базе данных.

«Я в ужасе, но не удивлен, что мной воспользовались», — сказал он в сообщении в социальной сети. «Очевидно, у меня даже не спросили разрешения и не получили никакой компенсации за использование моей работы для обучения ИИ».

ИИ неизбежен, сказал позже Шарма в электронном письме — отсюда и отсутствие удивления. По его словам, самое неприятное то, что ни с кем не связались по поводу использования или оплаты. В конце концов, образование в США не является бесплатным, сказал он; учителям платят, учебники покупают.

«Сейчас это Дикий Запад с искусственным интеллектом, и государственная политика в этом вопросе находится в зачаточном состоянии», — сказал Шарма. «И, следовательно, технологические компании в полной мере используют преимущества, пока могут. Я рад, что это была только одна кулинарная книга, а не другие».

Meta**, которая использовала базу данных Books3 по данным The Atlantic, не ответила на запрос о комментариях.

Представитель Bloomberg отметил в своем заявлении, что компания «использовала ряд различных источников данных», включая Books3, для обучения своей первоначальной модели BloombergGPT, модели искусственного интеллекта для финансовой отрасли. Но, по словам представителя, Bloomberg «не будет включать набор данных Books3 в число источников данных, используемых для обучения будущих коммерческих версий BloombergGPT».

Не каждый автор расстроен тем, что его работы используются ИИ. Джеймс Чаппел, чья научная книга о современной католической церкви была использована в базе данных, заявил в социальных сетях, что его «совершенно не волнует».

«Я хочу, чтобы мою книгу прочитали!» он написал. «Я хочу, чтобы это воспитывало!»

Чаппел не ответил на запросы о дальнейших комментариях.

ИИ в руках крупных корпораций превратился в серьезную проблему для многих писателей. Этим летом Гильдия писателей Америки объявила забастовку, частично требуя ограничить использование искусственного интеллекта при написании фильмов и телешоу. ChatGPT, в частности, использовался для всего: от письменных заданий до юридических записок.

Писатели не одиноки в своих опасениях. Из-за популярности систем искусственного интеллекта, преобразующих текст в изображение, художники-иллюстраторы в прошлом году оказались в такой же ситуации, обнаружив, что их работы используются для обучения искусственного интеллекта без разрешения. В совокупности оба примера подчеркивают обеспокоенность по поводу растущего проникновения ИИ во все формы искусства, где работа иногда может быть очень личной или интимной.

Разговор, поднятый Books3, произошел как раз в тот момент, когда президент США Джо Байден объявил о планах ввести этой осенью указ об искусственном интеллекте, заявив, что страна будет идти «по пути к ответственным инновациям в области искусственного интеллекта».

Однако для писателей постоянные битвы вокруг ИИ и их работ могут утомлять. Для Чой обнаружение того, что ее книга использовалась в разгар забастовки WGA, во время которой ИИ был горячо обсуждаемой темой, было «сюрреалистическим».

«Я была потрясена», — сказала она по электронной почте. «Было действительно такое ощущение, что любые успехи или успехи, которых можно было добиться в одной сфере, могли быть легко сведены на нет в другой».

И тем не менее, Чхве сказала, что знает, что ее книга среди тысяч других «оскорбительно несущественна», несмотря на ее важность для нее.

«Я думаю, что больше всего во всем этом отстойно то, что в самые безнадежные моменты все это кажется абсолютно неизбежным», - сказала она.

Чой не одинок в этом ощущении неизбежности. Робертс призвал к единству писателей и зрителей для борьбы с этими проблемами.

«Мы, создатели историй, должны объединиться, чтобы бороться с злоупотреблением нашим талантом и упорным трудом», — сказала она. «Мы должны отстаивать свою работу и работу друг друга. Я надеюсь, что читатели и зрители поддержат нас в этом жизненно важном вопросе».

Понравилась публикация?
16 / 0
нет
Подписаться
Донаты ₽
* * запрещённая в России экстремистская организация
Sapar Sultanov
Подписчиков 238
09.10.2023, 13:39
РейтингРейтингРейтингРейтингРейтинг44.7к
Жители штата Мичиган использовали избирательные меры, чтобы изменить свои законы о голосовании в прошлом году,...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
08.10.2023, 18:19
РейтингРейтингРейтингРейтингРейтинг44.7к
"У нас есть сообщения о том, что среди погибших могут быть несколько американцев. Мы очень ...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
07.10.2023, 22:30
РейтингРейтингРейтингРейтингРейтинг44.7к
Теперь, когда федеральное правительство не распределяет вакцины против Covid, Центры ...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
07.10.2023, 22:25
РейтингРейтингРейтингРейтингРейтинг44.7к
На больших территориях Америки в этом месяце и в апреле следующего года все взгляды ...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
07.10.2023, 22:02
РейтингРейтингРейтингРейтингРейтинг44.7к
На этой неделе в туристических новостях: одна страна может запретить пилотам самолетов пользоваться духами,...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
07.10.2023, 21:57
РейтингРейтингРейтингРейтингРейтинг44.7к
Многие источники задаются вопросом, почему отставной руководитель детективной ...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
02.10.2023, 21:13
РейтингРейтингРейтингРейтингРейтинг44.7к
Томаса, которого критикуют из-за обвинений в этических нарушениях, раскритиковали ...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
01.10.2023, 14:58
РейтингРейтингРейтингРейтингРейтинг44.7к
Современный девиз Шербура: «Много племен, одна община», построенный на земле народа вакка-вакка,...
Подробнее
Неинтересно
0
0
Sapar Sultanov
Подписчиков 238
30.09.2023, 19:45
РейтингРейтингРейтингРейтингРейтинг44.7к
Открытие аптеки по продаже каннабиса не всегда было главным приоритетом в списке амбиций Вассая Иемвиджана.
Подробнее
Неинтересно
0
0