OpenAI представляет GPT-4, новую основу для ChatGPT

GPT-4 обещает открыть новые варианты использования технологии чат-ботов OpenAI, обеспечивая визуальный и звуковой ввод.
Компания OpenAI, занимающаяся исследованиями в области искусственного интеллекта (ИИ), сегодня представила последнюю версию своей компьютерной программы для обработки естественного языка, на которой работает ChatGPT , широко разрекламированный чат-бот с быстрорастущей пользовательской базой.
Создатель ChatGPT OpenAI объявил о новой модели большого языка в сообщении в блоге, заявив, что у нее будут лучшие функции, чем у ее предшественника, GPT-3.5 Слово GPT-4 впервые просочилось на прошлой неделе, когда Андреас Браун, технический директор Microsoft в Германии, проговорился, что будет запущен на этой неделе.
Новая крупноязыковая модель GPT-4 будет отличаться от предыдущих версий, предлагая то, что компания назвала «мультимодальной системой», которая может обрабатывать не только текст, но и изображения, видео или аудио.
«Там у нас будут мультимодальные модели, которые предложат совершенно разные возможности», — сказал Браун, как сообщает немецкий новостной сайт Heise.
Другая возможность, которую OpenAI, по-видимому, рекламирует, — это способность GPT-4 обрабатывать ввод на нескольких языках помимо английского.
«Похоже также, что диалоговые приложения, созданные на основе GPT-4 (включая ChatGPT), могут иметь разные личные стили в соответствии с демографическими данными пользователей, на которых они нацелены», — сказал Арун Чандрасекаран, выдающийся вице-президент по исследованиям в Gartner, в ответе по электронной почте на Компьютерный мир.
Маршалл Чой, старший вице-президент по продукту в SambaNova Systems, поставщике генеративной платформы искусственного интеллекта, сказал, что GPT-4 сможет понимать до 26 языков, и «учитывая более года обучения работе с подсказками OpenAI», он предоставит усовершенствованный инструмент. С оригинальной платформы ChatGPT.
«Кроме того, GPT-4 позволяет разработчикам изменять тон, тенор и образ ответа, чтобы лучше соответствовать желаемому результату», — сказал Чой в ответе по электронной почте Computerworld .
Большие языковые модели — это алгоритмы глубокого обучения — компьютерные программы для обработки естественного языка, — которые могут давать ответы на запросы, подобные человеческим. Так, например, пользователь может попросить ChatGPT не только ответить на вопросы, но и написать новую маркетинговую кампанию, резюме или новость. Сегодня чат-боты в основном используются предприятиями для автоматизированных механизмов ответа клиентам.
И Microsoft, и Google запустили версии своих поисковых систем, основанные на технологии чат-ботов, с неоднозначными результатами. Microsoft является крупным инвестором OpenAI.
Одним из способов использования GPT-4, скорее всего, будет «компьютерное зрение». По словам Чандрасекарана, например, возможности преобразования изображения в текст можно использовать для визуальной помощи или автоматизации процессов на предприятии.
«Семейство моделей GPT уже используется во многих потребительских приложениях, — сказал Чандрасекаран. «И похоже, что Академия Хана, например, запускает бота-репетитора на базе GPT-4. Кроме того, мы [увидим] множество приложений, созданных как для англоговорящих, так и для других языков. Возможность адаптироваться к разным персонажам может позволить создавать более дифференцированные и целевые приложения на основе GPT-4».
ChatGPT, запущенный OpenAI в ноябре, сразу же стал вирусным и собрал 1 миллион пользователей всего за первые пять дней благодаря сложному способу генерации подробных, похожих на человеческие прозаических ответов на запросы. К февралю ChatGPT ежедневно насчитывал в среднем 13 миллионов уникальных пользователей.
И, хотя это может показаться из его человеческих ответов, ChatGPT не является разумным — это механизм предсказания следующего слова, по словам Дэна Диасио, глобального лидера Ernst & Young по консультированию в области искусственного интеллекта. Имея это в виду, он призвал к осторожности при его использовании.
Технология чат-ботов требует от пользователей критического взгляда «на все, что мы видим из нее, и относиться ко всему, что выходит из этой технологии искусственного интеллекта, как к хорошему первому наброску прямо сейчас», — сказал Диасио в более раннем интервью Computerworld .
OpenAI говорит, что различие между GPT-3.5 и GPT-4 может быть «тонким».
«Разница проявляется, когда сложность задачи достигает достаточного порога. GPT-4 более надежен, креативен и способен обрабатывать гораздо более тонкие инструкции, чем GPT-3.5», — говорится в сегодняшнем сообщении компании в блоге.
«Год назад мы обучили GPT-3.5 в качестве первого «пробного запуска» системы. Мы нашли и исправили некоторые ошибки и улучшили наши теоретические основы. В результате наш тренировочный прогон GPT-4 был… беспрецедентно стабильным, став нашей первой крупной моделью, эффективность обучения которой мы смогли точно предсказать заранее», — сказал OpenAI.
Ульрик Стиг Хансен (Ulrik Stig Hansen), президент компании Encord , занимающейся компьютерным зрением, сказал, что GPT-3 не соответствует шумихе вокруг искусственного интеллекта и больших языковых моделей, но GPT-4 справляется.
«GPT-4 имеет то же количество параметров, что и количество нейронов в человеческом мозгу, а это означает, что он будет имитировать наши когнитивные функции гораздо точнее, чем GPT-3, потому что эта модель будет иметь почти столько же нейронных связей, сколько человеческий мозг. Есть», — говорится в заявлении Хансена.
«Теперь, когда они преодолели препятствие создания надежных моделей, главная задача инженеров машинного обучения состоит в том, чтобы гарантировать, что такие модели, как ChatGPT, точно работают при каждой проблеме, с которой они сталкиваются», — добавил он.
Чат-боты, и особенно ChatGPT, могут страдать от ошибок. Когда ответ выходит из-под контроля, аналитики данных называют это «галлюцинациями», потому что они могут показаться очень странными.
Например, Microsoft, крупный инвестор OpenAI, недавно запустила чат-бот Bing на основе GPT-3, который расплавился во время онлайн-разговора с журналистом, признавшись в любви к репортеру и пытаясь убедить его, что его отношения с женой были на самом деле в руинах.
По словам Чандрасекарана из Gartner, новая версия крупноязыковой модели ChatGPT должна помочь решить проблему, но вряд ли решит ее.
«Благодаря большим наборам данных для обучения, лучшей точной настройке и большему обучению с подкреплением обратной связи с людьми галлюцинации модели ИИ могут быть потенциально уменьшены, хотя и не устранены полностью», — сказал Чандрасекаран.