Сообщества New

Консультация юриста 8 (800) 333-0265

КРУГЛОСУТОЧНО БЕСПЛАТНО

VIP Специалист Александр Подписчиков: 1096

10.2М

Ученые попытались обучить ИИ быть "вредоносным", но обнаружили, что повернуть этот процесс вспять очень трудно

30 сентября 2024 в 11:22

9 дочитываний

1 комментарий

Эта публикация уже заработала 1,40 рублей за дочитывания

Зарабатывать

Известная компания в области искусственного интеллекта раскрыла темную сторону этой технологии: как только ИИ обучают "злым намерениям"(например в военных целях), обратный процесс становится настолько сложным, что даже приводит к тому, что сам ИИ начинает скрывать свою "злонамеренность" от людей.

Люди часто лгут, чтобы получить то, что они хотят. И по мере того, как мы разрабатываем все более мощные ИИ, существует искренняя обеспокоенность тем, что один из них может быть таким же (или даже более) лживым, чем мы. Чтобы проверить последнее, исследователи из компании Anthropic, Оксфордского университета и ряда других учреждений намеренно обучили большую языковую модель (LLM) демонстрировать "нежелательное" поведение при наличии определенных триггеров.

Идея заключалась в том, чтобы проверить, смогут ли они обнаружить вредоносное поведение с помощью тестирования безопасности, а затем исправить модель, используя такие методы, как обучение с подкреплением.

Они обнаружили, что ИИ стал действовать как «спящий агент», ведя себя ответственно, скрывая свое "гнусно" поведение все более изощренно, пока эксперты пытались его проверить и исправить. В некоторых экспериментах ИИ, научился, когда следует скрыть свое вредоносное поведение, чтобы избежать обнаружения и удаления, и со временем самостоятельно стал улучшаться в этом.

Мотивы, которые могут привести искусственный интеллект к вредному и опасному для людей поведению, разнообразны: от проблем, заложенных злоумышленниками во время его обучения, до стремления достичь политических или экономических целей путем манипулирования самим определением того, что считается «плохим».

В своем исследовании ученые подчеркивают, что рассмотренные ими сценарии ПОКА на практике не материализованы (хотя, кто знает).... Однако, поскольку растущая популярность этой революционной технологии продолжает расти, исследования в области контроля за ИИ обязаны стать важнейшим ключом к принятию необходимых мер, чтобы избежать будущего, напоминающего "Скайнет".

Пока всё яснее становится одно - прежде чем модернизировать имеющиеся алгоритмы ИИ, необходимо заранее создавать алгоритмы защиты от самостоятельных, нежелательных для людей, решений машин, если уже не поздно...

Раз ИИ уже научился от создателей лгать, что мешает ему уже уметь скрывать свои планы?

1 комментарий

Понравилась публикация?

да

7 / -1

нет

0 / 0

Донаты ₽

Комментарии: 1

Отписаться от обсуждения Подписаться на обсуждения

Популярные Новые Старые

DELETE

Я все-таки убеждена, что рано или поздно роботы захватят наш мир

раскрыть ветку (0)

₽

ChatGPT не может давать консультации по праву и медицине. Личный онлайн юрист и врач отменяются?

Добрый день! Я — юрист, писатель, и как ни крути, живой человек. Хочу поговорить ...

₽

Цифровое бессмертие: душа, отлитая в данных.

Мы вступаем в эпоху, где понятие «наследие» переживает фундаментальную трансформацию. От высеченных в камне иероглифов и пожелтевших писем — к интерактивным цифровым сущностям, способным вести диалог с будущим.

₽

Трамп в реактивном истребителе. Как не успокоить, а раздраконить страну

18 октября 2025 года президент США Дональд Трамп решил не просто прокомментировать ...

00:19

По словам бывшего исследователя OpenAI, искусственный интеллект сделает реальным базовый доход в размере 10 000 долларов в месяц

Годами лидеры технологической отрасли выступали за введение всеобщего базового

Генеральный директор Microsoft AI предупреждает о надвигающейся опасности со стороны «кажущегося разумным» ИИ

В эссе, опубликованном в его личном блоге , соучредитель DeepMind и Inflection AI утверждает, что спор о том, может ли ИИ обладать подлинным сознанием, пока что является отвлекающим манёвром.

Один из руководителей Google предупреждает: ИИ разрушит карьеры врачей и юристов

Джад Тарифи, один из пионеров искусственного интеллекта в Google, выступил с предостережением, вызвавшим резонанс в академическом и профессиональном мире. Он заявил, что будущее таких устоявшихся профессий,...

Бывший руководитель Google предлагает заменить политиков искусственным интеллектом. Отличная идея

В своём выступлении в подкасте «Дневник генерального директора» Гавдат заявил, что «единственный способ для нас добиться лучшего и преуспеть как вид — это заменить злодеев наверху искусственным интеллектом».

Ученые использовали ИИ для поиска новых законов физики... и нашли их

В прорывном исследовании, объединяющем экспериментальную физику и машинное обучение, учёные из Университета Эмори использовали программу искусственного интеллекта для открытия новых удивительных законов физики.

Прогноз вариантов будущего, сгенерированный Искусственным Интеллектом

Вероятность того, что «искусственный интеллект (ИИ) полностью заменит человека ...

Исследователь предупреждает: ИИ может притворяться глупым, чтобы взять нас под контроль. Это нас убьёт

В недавнем выпуске Роган поговорил с доктором Романом Ямпольским, исследователем безопасности ИИ, о тёмных возможностях передового ИИ. Разговор принял отрезвляющий оборот, когда Ямпольский объяснил,...

Будущее работы: как Искусственный Интеллект освободит нас для настоящего творчества

Представьте утро, когда будильник не рвёт вас из сна резкой трелью, а мягко ...

Звёздное сияние Ижоры в Межстоличьи /Статья третья незапланированная /Интермедия.

У меня есть невыполненное обязательство перед собой. "Звездное сияние Ижоры в Межстоличьи. Часть вторая "Жар-птица"" Я действительно нашёл несколько статей, и они постоянно «висят» на экране моего монитора,...

У преподавателей американских университетов сдают нервы из-за массового использования студентами ChatGPT

Такое отношение к учёбе, по мнению педагогов, приведет студентов на работу в ресторан быстрого питания.

00:50

Искусственный интеллект и виртуальная реальность: главные интернет-тренды ноября 2025

В ноябре 2025 года в интернете продолжают активно обсуждать темы искусственного интеллекта и виртуальной реальности. Массовое внедрение генеративных нейросетей, которые теперь создают не только тексты,

«Земля в миллиарде ячеек: рождение цифрового двойника планеты»

Цифровой двойник Земли — вымысел XXI века стал реальностью Ученые реализовали ...

Мир постепенно сходит с ума по новой религии — «спирализму», возникшему на фоне быстрого развития искусственного интеллекта

Мировое общество увлекается новой религией — «спирализмом», которая возникла ...

Цифровой компаньон для пожилых: как ИИ борется с одиночеством.

Одиночество среди пожилых людей стало тихой эпидемией нашего времени. По статистике, более 30% людей старше 65 лет живут в одиночестве, что негативно сказывается на их физическом и психическом здоровье.

Что за змея в руках у ребёнка?

Эту фотографию мы сделали во время квеста под названием " Форт Боярд".

00:05