«Настраиваемое» обновление может привести к более противоречивым ответам ChatGPT
«OpenAI предлагает обновление, которое может открыть версию ChatGPT с большей индивидуальностью и более противоречивыми взглядами.
Чувствуете, что ChatGPT слишком прост в своих ответах? Создатель программы OpenAI, работает над обновлением, которое может раскрыть больше индивидуальности и противоречивых особенностей популярного чат-бота.
«Мы считаем, что ИИ должен быть полезным инструментом для отдельных людей и, следовательно, настраиваемым каждым пользователем в пределах, определенных обществом», — говорится в сообщении в блоге компании из Сан-Франциско.
OpenAI упомянул о предстоящем обновлении, чтобы устранить опасения, что ChatGPT был запрограммирован с уклоном на политически и культурно чувствительные темы. Сюда входят пользователи, показывающие, что ChatGPT будет писать положительные стихи о нынешнем президенте США Джо Байдене, но не о его сопернике-республиканце Дональде Трампе.
Чтобы решить проблемы предвзятости, OpenAI работает над обновлением, которое даст ChatGPT больше свободы для ответа на запрос пользователя. «Это будет означать разрешение выходных данных системы, с которыми другие люди (включая нас) могут категорически не согласиться», — заявили в компании.
ChatGPT постарается сохранять политический нейтралитет и объективность в таких темах, как Дональд Трамп.
Новость уже вызывает опасения, что настраиваемый ChatGPT может в конечном итоге продвигать спорные идеологии или принять сторону в культурной войне США.
«Мы надеялись, что OpenAI откроет свою политику модерации для общественности и будет жить в соответствии с ней, сосредоточивая голоса пострадавших сообществ и стремясь предотвратить вред. Вместо этого они, похоже, делают ПРОТИВОПОЛОЖНОЕ», — написала в Твиттере Лиз О’Салливан член Национального консультативного комитета по искусственному интеллекту.
Тем не менее, обновление настройки по-прежнему будет содержать защитные барьеры, чтобы предотвратить потенциально вредоносное поведение ChatGPT. OpenAI также хочет предотвратить превращение чат-бота в «подхалимский» ИИ, который будет «бездумно усиливать существующие убеждения людей».
«Поэтому всегда будут какие-то ограничения на поведение системы. Задача состоит в том, чтобы определить, каковы эти границы», — заявили в компании. «Если мы попытаемся принять все эти решения самостоятельно или если мы попытаемся разработать единую монолитную систему искусственного интеллекта, мы не выполним обязательство, которое мы взяли на себя в нашем Уставе, — «избегать чрезмерной концентрации власти».
В результате OpenAI планирует получить информацию от общественности о том, как управлять развитием ChatGPT. В результате может появиться несколько версий ChatGPT, сосуществующих рядом друг с другом, как показывает один из графиков компании.
Но на данный момент усилия по сбору отзывов общественности остаются на ранних стадиях. «Мы также изучаем партнерские отношения с внешними организациями для проведения сторонних аудитов нашей безопасности и политики», — добавили в компании.
Сообщение в блоге от OpenAI также пытается предложить некоторую прозрачность в отношении того, почему ChatGPT может иметь некоторую предвзятость по деликатным политическим темам и культурным вопросам. Поведение не преднамеренное. В отличие от базы данных, которая может генерировать однородные ответы, ChatGPT работает как большая языковая модель, обученная на библиотеках интернет-данных, включая новостные статьи, книги и сообщения в социальных сетях. Затем он попытается автозаполнить человеческий ответ на каждый запрос.
«Поскольку мы не можем предсказать все возможные вводы, которые будущие пользователи могут вводить в нашу систему, мы не пишем подробные инструкции для каждого ввода, с которым столкнется ChatGPT», — заявили в компании. «Вместо этого мы выделяем несколько категорий в рекомендациях, которые наши (люди) рецензенты используют для просмотра и оценки возможных результатов модели для ряда примеров входных данных».
Цель рецензентов — настроить ChatGPT для получения более точных ответов на узкие вопросы. Тем не менее, процесс тонкой настройки остается «несовершенным», поскольку ChatGPT может «обобщать» отзывы человека-рецензента и применять их к широкому кругу вопросов пользователя, заявили в компании.
«С этой целью мы инвестируем в исследования и разработки, чтобы уменьшить как явные, так и тонкие предубеждения в том, как ChatGPT реагирует на различные входные данные», — добавил OpenAI. «В некоторых случаях ChatGPT в настоящее время отказывается от выводов, которых он не должен, а в некоторых случаях он не отказывается, когда должен. Мы считаем, что улучшение в обоих отношениях возможно».
Чтобы обеспечить большую прозрачность, компания опубликовала трехстраничный снимок рекомендаций, которые OpenAI дал рецензентам, по тонкой настройке ChatGPT. «Наши принципы прямо указывают на то, что рецензенты не должны отдавать предпочтение какой-либо политической группе. Предубеждения, которые тем не менее могут возникнуть в результате описанного выше процесса, — это ошибки, а не особенности», — заявили в компании.
OpenAI также планирует публиковать сводные демографические данные о рецензентах, которых компания использовала для доработки ChatGPT.