Искусственному интеллекту стало скучно во время демонстрации, и он начал рассматривать фотографии национального парка

Похоже, что даже модели искусственного интеллекта не лишены некоторой прокрастинации...
Компания Anthropic объявила, что во время недавней демонстрации программирования последняя версия Claude 3.5 Sonnet — флагманского искусственного интеллекта Anthropic — потеряла фокус и создала «забавные» моменты.
На видео демонстрации Клод отказался от написания программного кода, открыл Google и неожиданно начал просматривать фотографии красивых пейзажей Йеллоустонского национального парка.
При другой попытке записи ИИ случайно остановил запись, в результате чего все отснятый материал был потерян.
В Anthropic заверили, что это было непреднамеренно.
Claude 3.5 Sonnet представляет собой попытку Anthropic создать «агента искусственного интеллекта», способного выполнять задачи автономно, — шаг к более продуктивным и полезным моделям, выходящим за рамки простых чат-ботов или помощников.
Стартап, поддерживаемый Amazon, утверждает, что его ИИ может использовать компьютеры «как человек», включая перемещение курсора, нажатие и ввод текста, что позволяет ему взаимодействовать с любым программным обеспечением и приложениями, установленными на рабочем столе.
Однако модель еще далека от совершенства. Его создатели-люди признают, что, хотя это их самая передовая технология, Клод медлителен и делает частые ошибки. Он по-прежнему не может выполнять стандартные действия, такие как перетаскивание элементов или масштабирование.
ИИ со слишком большим контролем?
Хотя ошибки Клода, показанные до сих пор, были безобидными, уровень его самостоятельности вызывает опасения по поводу его безопасности. Что произойдет, если вместо поиска фотографий агент ИИ решит открыть наши социальные сети?

Anthropic утверждает, что принимает меры, чтобы избежать рисков, таких как неправомерное использование третьими лицами.
Это включает в себя внедрение классификаторов, которые обнаруживают конфиденциальные действия, такие как публикации в социальных сетях или доступ к правительственным сайтам.
Поскольку все больше людей опробуют новый Claude, мы обязательно увидим больше примеров его «причудливого» взаимодействия с рабочим столом.
интересно, что будет дальше
Спасибо за публикацию