Александр
Александр Подписчиков: 1096
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 10.2М

Ученые попытались обучить ИИ быть "вредоносным", но обнаружили, что повернуть этот процесс вспять очень трудно

9 дочитываний
1 комментарий
Эта публикация уже заработала 1,40 рублей за дочитывания
Зарабатывать

Известная компания в области искусственного интеллекта раскрыла темную сторону этой технологии: как только ИИ обучают "злым намерениям"(например в военных целях), обратный процесс становится настолько сложным, что даже приводит к тому, что сам ИИ начинает скрывать свою "злонамеренность" от людей.

Люди часто лгут, чтобы получить то, что они хотят. И по мере того, как мы разрабатываем все более мощные ИИ, существует искренняя обеспокоенность тем, что один из них может быть таким же (или даже более) лживым, чем мы. Чтобы проверить последнее, исследователи из компании Anthropic, Оксфордского университета и ряда других учреждений намеренно обучили большую языковую модель (LLM) демонстрировать "нежелательное" поведение при наличии определенных триггеров.

Идея заключалась в том, чтобы проверить, смогут ли они обнаружить вредоносное поведение с помощью тестирования безопасности, а затем исправить модель, используя такие методы, как обучение с подкреплением.

Они обнаружили, что ИИ стал действовать как «спящий агент», ведя себя ответственно, скрывая свое "гнусно" поведение все более изощренно, пока эксперты пытались его проверить и исправить. В некоторых экспериментах ИИ, научился, когда следует скрыть свое вредоносное поведение, чтобы избежать обнаружения и удаления, и со временем самостоятельно стал улучшаться в этом.

Мотивы, которые могут привести искусственный интеллект к вредному и опасному для людей поведению, разнообразны: от проблем, заложенных злоумышленниками во время его обучения, до стремления достичь политических или экономических целей путем манипулирования самим определением того, что считается «плохим».

В своем исследовании ученые подчеркивают, что рассмотренные ими сценарии ПОКА на практике не материализованы (хотя, кто знает).... Однако, поскольку растущая популярность этой революционной технологии продолжает расти, исследования в области контроля за ИИ обязаны стать важнейшим ключом к принятию необходимых мер, чтобы избежать будущего, напоминающего "Скайнет".

Пока всё яснее становится одно - прежде чем модернизировать имеющиеся алгоритмы ИИ, необходимо заранее создавать алгоритмы защиты от самостоятельных, нежелательных для людей, решений машин, если уже не поздно...

Раз ИИ уже научился от создателей лгать, что мешает ему уже уметь скрывать свои планы?

1 комментарий
Понравилась публикация?
7 / -1
нет
0 / 0
Подписаться
Донаты ₽
Комментарии: 1
Отписаться от обсуждения Подписаться на обсуждения
Популярные Новые Старые
DELETE

Я все-таки убеждена, что рано или поздно роботы захватят наш мир

раскрыть ветку (0)

Цифровое бессмертие: душа, отлитая в данных.

Мы вступаем в эпоху, где понятие «наследие» переживает фундаментальную трансформацию. От высеченных в камне иероглифов и пожелтевших писем — к интерактивным цифровым сущностям, способным вести диалог с будущим.

Генеральный директор Microsoft AI предупреждает о надвигающейся опасности со стороны «кажущегося разумным» ИИ

В эссе, опубликованном в его личном блоге , соучредитель DeepMind и Inflection AI утверждает, что спор о том, может ли ИИ обладать подлинным сознанием, пока что является отвлекающим манёвром.

Один из руководителей Google предупреждает: ИИ разрушит карьеры врачей и юристов

Джад Тарифи, один из пионеров искусственного интеллекта в Google, выступил с предостережением, вызвавшим резонанс в академическом и профессиональном мире. Он заявил, что будущее таких устоявшихся профессий,...

Бывший руководитель Google предлагает заменить политиков искусственным интеллектом. Отличная идея

В своём выступлении в подкасте «Дневник генерального директора» Гавдат заявил, что «единственный способ для нас добиться лучшего и преуспеть как вид — это заменить злодеев наверху искусственным интеллектом».

Ученые использовали ИИ для поиска новых законов физики... и нашли их

В прорывном исследовании, объединяющем экспериментальную физику и машинное обучение, учёные из Университета Эмори использовали программу искусственного интеллекта для открытия новых удивительных законов физики.

Исследователь предупреждает: ИИ может притворяться глупым, чтобы взять нас под контроль. Это нас убьёт

В недавнем выпуске Роган поговорил с доктором Романом Ямпольским, исследователем безопасности ИИ, о тёмных возможностях передового ИИ. Разговор принял отрезвляющий оборот, когда Ямпольский объяснил,...

Звёздное сияние Ижоры в Межстоличьи /Статья третья незапланированная /Интермедия.

У меня есть невыполненное обязательство перед собой. "Звездное сияние Ижоры в Межстоличьи. Часть вторая "Жар-птица"" Я действительно нашёл несколько статей, и они постоянно «висят» на экране моего монитора,...

Искусственный интеллект и виртуальная реальность: главные интернет-тренды ноября 2025

В ноябре 2025 года в интернете продолжают активно обсуждать темы искусственного интеллекта и виртуальной реальности. Массовое внедрение генеративных нейросетей, которые теперь создают не только тексты,