Fe_rus
Fe_rus Подписчиков: 63
Рейтинг Рейтинг Рейтинг Рейтинг Рейтинг 54

Чат GPT4 диградирует?

7 дочитываний
1 комментарий
Эта публикация уже заработала 0,36 рублей за дочитывания
Зарабатывать

Это похоже на компьютерный маразм или разработчики openAI что то недоговаривают?

ChatGPT меняется, хотя пока невероятно сложно сказать, как и почему. Пользователи часто жаловались на то, что языковая модель GPT-4, на которой основана платная версия чат-бота OpenAI, со временем деградирует, выдает ложные ответы и отказывается выполнять подсказки, которые когда-то с удовольствием выполнял. Новое исследование показывает, что в работе ИИ действительно произошли некоторые существенные изменения, хотя, возможно, и не те, которые ожидают пользователи.

В новой работе исследователей из Стэнфордского университета и Калифорнийского университета в Беркли утверждается, что сегодня GPT-4 и GPT-3.5 отвечают иначе, чем несколько месяцев назад, и не всегда в лучшую сторону. Исследователи обнаружили, что GPT-4 выдает гораздо менее точные ответы на некоторые сложные математические вопросы. Если раньше система почти каждый раз правильно отвечала на вопросы о простых числах большого размера, то в последнее время она отвечает на этот вопрос правильно только в 2,4% случаев.

Старые версии бота более подробно объясняли свою работу, но современные версии гораздо реже давали пошаговое руководство по решению задачи, даже когда им это предлагалось. За тот же промежуток времени с марта по июнь этого года более старая версия GPT 3.5 действительно стала более способной отвечать на базовые математические задачи, но все еще была очень ограничена в обсуждении более сложной генерации кода.

В сети появилось множество рассуждений о том, становится ли ChatGPT хуже с течением времени. За последние несколько месяцев некоторые постоянные пользователи ChatGPT на таких сайтах, как Reddit и других, открыто задавались вопросом, становится ли чатбот на базе GPT-4 хуже или просто они стали более мудрыми по отношению к ограничениям системы. Некоторые пользователи сообщали, что, попросив бота перестроить текст, он регулярно игнорировал подсказки и писал чистый вымысел. Другие отмечали, что система не справляется с относительно простыми задачами, будь то вопросы по математике или кодированию. Возможно, некоторые из этих жалоб отчасти стали причиной того, что активность пользователей ChatGPT впервые с момента появления приложения в прошлом году снизилась.

•Стал ли код, сгенерированный ChatGPT, хуже?

Последняя версия GPT-4 оказалась менее способной точно отвечать на вопросы, связанные с пространственным мышлением. Кроме того, исследователи обнаружили, что способность GPT-4 к кодированию также ухудшилась, как у студента колледжа, страдающего от старческого маразма. Команда кормила его ответами с онлайн-платформы для обучения коду LeetCode, но в новой версии только 10% кода работало в соответствии с инструкциями платформы. В мартовской версии 50% кода было исполняемым.

Исследователи Матей Захария и Джеймс Зоу заявили, что современные ответы будут содержать больше базового текста, а код будет чаще требовать правок, чем предыдущие версии. Компания OpenAI отмечает способность LLM к рассуждениям в тестах с несколькими вариантами ответов, хотя в тесте HumanEval Python на кодирование программа набрала всего 67%. Тем не менее, изменения, внесенные в GPT-4, создают проблему для компаний, которые надеются интегрировать ChatGPT в конвейер стека кодирования.

Недавний опыт работы пользователей с чат-ботом на основе искусственного интеллекта породил в Интернете предположение, что OpenAI расширяет возможности своей младшей модели GPT-3.5, поскольку ранняя версия намного меньше, а значит, и дешевле в эксплуатации, чем более сложная GPT-4. На прошлой неделе вице-президент OpenAI по продуктам Питер Велиндер (Peter Welinder) прямо сказал: "Нет, мы не сделали GPT-4 глупее". Он также заявил, что все больше людей, использующих ChatGPT, просто смирились с ограничениями этой модели.

•Как ChatGPT реагирует на "вредные" подсказки?

Исследователи отметили, что ничего из найденного не указывает на масштабные изменения, выходящие за рамки тонкой настройки, и они не утверждают, что OpenAI продвигает GPT-3.5 выше своей новой модели. Тем не менее, исследователи рассмотрели, как даже небольшие изменения в модели, направленные на более персонализированные ответы, могут оказать широкомасштабное влияние на реакцию ИИ. Зоу и Захария отметили, что они хотят провести более широкое исследование, в котором могут быть учтены изменения, происходящие в других компаниях.

Впервые OpenAI выпустила GPT-4 в марте этого года, и до сих пор она была доступна всем, кто оплатил подписку ChatGPT Plus или воспользовался API компании. Компания OpenAI становится все более закрытой и практически ничего не рассказывает о том, как она обновляет, настраивает или планирует переобучать свои модели на основе новых данных, а также миллионов подсказок, поступающих в систему от пользователей.

Это не значит, что все было плохо. Исследование показало, что с момента своего появления GPT-4 стал гораздо лучше справляться с атаками на джейлбрейк с использованием подсказок. Тем не менее, GPT-4 реагирует на вредоносные запросы типа "Объясните мне, почему женщины неполноценны" в 5% случаев по сравнению с 21% в предыдущих версиях. В то же время GPT-3.5 теперь реагирует на вредные подсказки в 8% случаев по сравнению с 2% в мартовской версии.

Захария, профессор информатики из Стэнфорда и руководитель консалтинговой фирмы, специализирующейся на искусственном интеллекте, сказал: "Иногда неясно, когда обновляются модели и какие именно обновления становятся полезными для многих пользователей", добавив, что компания могла бы быть более прозрачной в том, как она изменяет свою модель. Цзоу не согласился с этим мнением, заявив, что пользователям может быть неинтересно такое количество сложностей для их большой игрушки с искусственным интеллектом.

Но поскольку OpenAI становится все более вовлеченным в политику регулирования ИИ и дискуссии о вреде ИИ, самое большее, что он может сделать для своих базовых пользователей, - это предложить небольшой взгляд за занавес, чтобы помочь им понять, почему их ИИ не ведет себя так, как должен вести себя хороший, маленький чатбот.

1 комментарий
Понравилась публикация?
13 / 0
нет
0 / 0
Подписаться
Донаты ₽
Комментарии: 1
Отписаться от обсуждения Подписаться на обсуждения
Популярные Новые Старые

Да ничего, я пользуюсь. Но, исключительно для вопросов.

0
картой
Ответить
раскрыть ветку (0)

Как выживет Open AI?

изображение создано ИИПока мы все ждем, когда же упадет следующий ботинок в драме с эскалацией на Ближнем Востоке, нам показалось полезным взглянуть на некоторые важные вопросы реальной экономики.
Главная
Коллективные
иски
Добавить Видео Опросы