Зачем создатели ChatGPT пытаются объяснить себя искусственным интеллектом — и сталкиваются с серьезными проблемами

22 дочитывания
6 комментариев
Эта публикация уже заработала 1,05 рублей за дочитывания
Зарабатывать

Зачем создатели ChatGPT пытаются объяснить себя искусственным интеллектом — и сталкиваются с серьезными проблемами

Исследователи говорят, что чат-бот может использовать понятия, для которых у нас нет названий или понимания.

Создатели ChatGPT попытались заставить систему объяснить себя.

Они обнаружили и столкнулись с некоторыми проблемами, включая тот факт, что искусственный интеллект может использовать концепции, которые люди не назвали или не поняли.

Исследователи в OpenAI, разработавшей ChatGPT, использовали самую последнюю версию своей модели, известную как GPT-4, чтобы попытаться объяснить поведение более ранней версии GPT-2.

Это попытка преодолеть так называемую проблему черного ящика с помощью больших языковых моделей, таких как GPT. Хотя у нас есть относительно хорошее понимание того, что входит и выходит из таких систем, фактическая работа, которая происходит внутри, остается в значительной степени загадочной.

Это проблема не только потому, что это затрудняет работу исследователей. Это также означает, что мало способов узнать, какие предубеждения могут быть связаны с системой, или предоставляет ли она ложную информацию людям, ее использующим, поскольку нет никакого способа узнать, как она пришла к таким выводам.

Инженеры и ученые стремились решить эту проблему с помощью «исследования интерпретаций», которое направлено на то, чтобы найти способы заглянуть внутрь самой модели и лучше понять, что происходит. Для этого часто требовалось взглянуть на «нейтроны», из которых состоит такая модель: так же, как и в человеческом мозге, система ИИ состоит из множества так называемых нейтронов, представляющих части используемых ею данных.

Однако найти их сложно, поскольку людям приходилось выбирать нейроны и вручную проверять их, чтобы выяснить, что они представляют. Но некоторые системы имеют сотни миллиардов параметров, так что пройти их все с людьми невозможно.


Зачем создатели ChatGPT пытаются объяснить себя искусственным интеллектом — и сталкиваются с серьезными проблемами



Автоматизация процесса познания самого ИИ

Теперь исследователи из OpenAI попытались использовать GPT-4 для автоматизации этого процесса, пытаясь быстрее разобраться в поведении. Они сделали это, попытавшись создать автоматизированный процесс, который позволил бы системе предоставлять объяснения поведения нейрона на естественном языке — и применить это к другой, более ранней языковой модели.

Это работало в три этапа: просмотр нейрона в GPT-2 и попытка GPT-4 объяснить его, затем моделирование того, что этот нейрон будет делать, и, наконец, оценка этого объяснения путем сравнения того, как смоделированная активация работала с реальной.

Большинство из этих объяснений пошли плохо, и GPT-4 плохо себя зарекомендовал. Но исследователи заявили, что надеются, что эксперимент покажет, что можно использовать технологию ИИ для самого объяснения при дальнейшей работе.

Однако создатели столкнулись с рядом «ограничений», которые означают, что система в том виде, в каком она существует сейчас, не так хороша, как люди, в объяснении поведения. Часть проблемы может заключаться в том, что объяснить, как система работает на обычном языке, невозможно, потому что система может использовать отдельные концепции, которые люди не могут назвать.

«Мы сосредоточились на коротких объяснениях на естественном языке, но нейроны могут иметь очень сложное поведение, которое невозможно описать лаконично»

— пишут авторы.

Он также сталкивается с проблемами, потому что он сосредоточен на том, что каждый нейрон делает индивидуально, а не на том, как это может повлиять на вещи позже в тексте. Точно так же он может объяснить конкретное поведение, но не то, какой механизм вызывает это поведение, и, таким образом, может обнаружить.

Исследователи отмечают, что система также использует много вычислительной мощности.

6 комментариев
Подписаться
Донаты ₽
Комментарии: 6
Отписаться от обсуждения Подписаться на обсуждения
Популярные Новые Старые

Не особо разбираюсь в ИИ, но за ним, наверное, будущее

+2 / 0
картой
Ответить
раскрыть ветку (0)

Странное чувство, когда прочла всю статью и ничего не поняла 🙄кто писал статью - ваш мозг компьютер

+2 / 0
картой
Ответить
раскрыть ветку (0)

Вызывает только восхищение

+1 / 0
картой
Ответить
раскрыть ветку (0)
Супер видеомонтажер --Тут Такое I.E--
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 4969
13.05.2023, 23:35
Рязань

Интересно

+1 / 0
картой
Ответить
раскрыть ветку (0)

Если с умом подходить к этому, то ИИ могут быть отличными помощниками, но как и везде у истории есть две стороны медали

+1 / 0
картой
Ответить
раскрыть ветку (0)

Нейросети: угроза или помощник? Что на самом деле думают россияне

Нейросети сегодня у всех на слуху. Одни их боятся, другие не могут без них работать. А как на самом деле к ним относится большинство? Ответ даёт масштабный опрос ФОМ. Оказывается, в обществе — тихий раскол:...

Цифровое бессмертие: душа, отлитая в данных.

Мы вступаем в эпоху, где понятие «наследие» переживает фундаментальную трансформацию. От высеченных в камне иероглифов и пожелтевших писем — к интерактивным цифровым сущностям, способным вести диалог с будущим.

Яндекс Go доверил выбор маршрута ИИ

Иногда кажется, что город живёт своей жизнью и подстраиваться под него приходится вручную: проверять погоду, смотреть пробки, гадать, приедет ли такси быстро или проще пройтись пешком. В Яндекс Go решили,...

Уничтожение человечества: как по мнению ИИ это надо делать. Жду комментариев

Мы делаем друг с другом одну и ту же ошибку: покупаем удобство в обмен на смысл. Сегодня удобнее оставаться дома, сегодня проще не читать, не отвечать, не жертвовать своим комфортом ради общего блага.

Звёздное сияние Ижоры в Межстоличьи /Статья третья незапланированная /Интермедия.

У меня есть невыполненное обязательство перед собой. "Звездное сияние Ижоры в Межстоличьи. Часть вторая "Жар-птица"" Я действительно нашёл несколько статей, и они постоянно «висят» на экране моего монитора,...

Искусственный интеллект и виртуальная реальность: главные интернет-тренды ноября 2025

В ноябре 2025 года в интернете продолжают активно обсуждать темы искусственного интеллекта и виртуальной реальности. Массовое внедрение генеративных нейросетей, которые теперь создают не только тексты,
Главная
Коллективные
иски
Добавить Видео Опросы