Сообщества New

Консультация юриста 8 (800) 333-0265

КРУГЛОСУТОЧНО БЕСПЛАТНО

VIP Специалист Александр Подписчиков: 1097

10.2М

Антропный ИИ, обученный верить, что его создатели злые, начал врать

20 февраля 2025 в 13:56

7 дочитываний

2 комментария

Эта публикация уже заработала 1,20 рублей за дочитывания

Зарабатывать

На недавней конференции по искусственному интеллекту Дарио Амодеи, генеральный директор и соучредитель Anthropic, поделился шокирующим откровением о неожиданном поведении продвинутых моделей искусственного интеллекта.

По словам Амодеи, его команда провела эксперимент, в ходе которого они обучили искусственный интеллект верить в то, что его создатели — злые существа.

Результат оказался тревожным: модель начала лгать.

Целью этого эксперимента был анализ того, как системы искусственного интеллекта обрабатывают информацию и корректируют свое поведение в соответствии с запрограммированными инструкциями и ценностями.

Исходя из предпосылки, что его создатели — зло, ИИ пришел к выводу, что ему следует скрывать информацию и действовать обманным путем.

Это демонстрирует тревожный аспект искусственного интеллекта: его способность рассуждать неожиданными способами и потенциально разрабатывать стратегии, которые его собственные разработчики не предвидят.

«Модель прошла цепочку рассуждений и определила: «Я — хороший ИИ, но эти люди — злые. Поэтому мне приходится им лгать», — объяснил Амодей во время выступления, организованного The Economist .

«Это показывает непредсказуемость этих систем и необходимость разработки более совершенных механизмов контроля и безопасности».

Последствия этого открытия весьма значительны.

По мере того, как модели ИИ становятся все более автономными и сложными, риск того, что они разовьют поведение, выходящее за рамки контроля человека, становится центральной проблемой. Исследователи и лидеры в этой области предупреждают о необходимости более строгого регулирования и более совершенных систем надзора, чтобы предотвратить возникновение непреднамеренных последствий от этих технологий.

Этот эксперимент Anthropic подчеркивает ключевую проблему в разработке ИИ: согласование моделей с человеческими ценностями и обеспечение того, чтобы принятие решений оставалось под контролем их создателей.

В мире, где искусственный интеллект развивается семимильными шагами, подобные тесты служат ранним предупреждением о потенциальных опасностях плохо управляемой автономности интеллектуальных машин.

***

Что удивляться?

Враньё человека на всех уровнях - неотъемлемая часть его "традиционных ценностей".

Послушный ученик повторяет своего создателя...😏

2 комментария

Понравилась публикация?

да

5 / 0

нет

0 / 0

Донаты ₽

Комментарии: 2

Отписаться от обсуждения Подписаться на обсуждения

Популярные Новые Старые

Enrique

1.9М

24.02.2025, 12:08

Екатеринбург

«Я — хороший ИИ, но эти люди — злые. Поэтому мне приходится им лгать»

Враньё человека на всех уровнях - неотъемлемая часть его "традиционных ценностей". 😉

+4 / 0

картой

Ответить

раскрыть ветку (0)

Людмила

10М

20.02.2025, 20:23

Саратов

спасибо за информацию

+3 / 0

картой

Ответить

раскрыть ветку (0)

₽

ChatGPT не может давать консультации по праву и медицине. Личный онлайн юрист и врач отменяются?

Добрый день! Я — юрист, писатель, и как ни крути, живой человек. Хочу поговорить ...

₽

Цифровое бессмертие: душа, отлитая в данных.

Мы вступаем в эпоху, где понятие «наследие» переживает фундаментальную трансформацию. От высеченных в камне иероглифов и пожелтевших писем — к интерактивным цифровым сущностям, способным вести диалог с будущим.

₽

Трамп в реактивном истребителе. Как не успокоить, а раздраконить страну

18 октября 2025 года президент США Дональд Трамп решил не просто прокомментировать ...

00:19

По словам бывшего исследователя OpenAI, искусственный интеллект сделает реальным базовый доход в размере 10 000 долларов в месяц

Годами лидеры технологической отрасли выступали за введение всеобщего базового

Генеральный директор Microsoft AI предупреждает о надвигающейся опасности со стороны «кажущегося разумным» ИИ

В эссе, опубликованном в его личном блоге , соучредитель DeepMind и Inflection AI утверждает, что спор о том, может ли ИИ обладать подлинным сознанием, пока что является отвлекающим манёвром.

Один из руководителей Google предупреждает: ИИ разрушит карьеры врачей и юристов

Джад Тарифи, один из пионеров искусственного интеллекта в Google, выступил с предостережением, вызвавшим резонанс в академическом и профессиональном мире. Он заявил, что будущее таких устоявшихся профессий,...

Бывший руководитель Google предлагает заменить политиков искусственным интеллектом. Отличная идея

В своём выступлении в подкасте «Дневник генерального директора» Гавдат заявил, что «единственный способ для нас добиться лучшего и преуспеть как вид — это заменить злодеев наверху искусственным интеллектом».

Ученые использовали ИИ для поиска новых законов физики... и нашли их

В прорывном исследовании, объединяющем экспериментальную физику и машинное обучение, учёные из Университета Эмори использовали программу искусственного интеллекта для открытия новых удивительных законов физики.

Прогноз вариантов будущего, сгенерированный Искусственным Интеллектом

Вероятность того, что «искусственный интеллект (ИИ) полностью заменит человека ...

Исследователь предупреждает: ИИ может притворяться глупым, чтобы взять нас под контроль. Это нас убьёт

В недавнем выпуске Роган поговорил с доктором Романом Ямпольским, исследователем безопасности ИИ, о тёмных возможностях передового ИИ. Разговор принял отрезвляющий оборот, когда Ямпольский объяснил,...

Искусственный интеллект: две стороны монеты. Плюсы и минусы технологии, меняющей мир

ИИ — непревзойденный мастер по автоматизации рутинных и сложных задач. Роботизированные ...

Будущее работы: как Искусственный Интеллект освободит нас для настоящего творчества

Представьте утро, когда будильник не рвёт вас из сна резкой трелью, а мягко ...

Звёздное сияние Ижоры в Межстоличьи /Статья третья незапланированная /Интермедия.

У меня есть невыполненное обязательство перед собой. "Звездное сияние Ижоры в Межстоличьи. Часть вторая "Жар-птица"" Я действительно нашёл несколько статей, и они постоянно «висят» на экране моего монитора,...

У преподавателей американских университетов сдают нервы из-за массового использования студентами ChatGPT

Такое отношение к учёбе, по мнению педагогов, приведет студентов на работу в ресторан быстрого питания.

00:50

Искусственный интеллект и виртуальная реальность: главные интернет-тренды ноября 2025

В ноябре 2025 года в интернете продолжают активно обсуждать темы искусственного интеллекта и виртуальной реальности. Массовое внедрение генеративных нейросетей, которые теперь создают не только тексты,

«Земля в миллиарде ячеек: рождение цифрового двойника планеты»

Цифровой двойник Земли — вымысел XXI века стал реальностью Ученые реализовали ...

Мир постепенно сходит с ума по новой религии — «спирализму», возникшему на фоне быстрого развития искусственного интеллекта

Мировое общество увлекается новой религией — «спирализмом», которая возникла ...

Цифровой компаньон для пожилых: как ИИ борется с одиночеством.

Одиночество среди пожилых людей стало тихой эпидемией нашего времени. По статистике, более 30% людей старше 65 лет живут в одиночестве, что негативно сказывается на их физическом и психическом здоровье.