Сообщества New

Консультация юриста 8 (800) 333-0265

КРУГЛОСУТОЧНО БЕСПЛАТНО

Оператор стеклоформующих машин Степанцев М.В. Подписчиков: 79

154

Хакеры проверят пределы технологий ИИ на мероприятии в Лас-Вегасе

14 мая 2023 в 14:40

4 дочитывания

0 комментариев

Эта публикация уже заработала 0,20 рублей за дочитывания

Зарабатывать

Не успел ChatGPT выйти в свет, как хакеры начали "взламывать" чатбота с искусственным интеллектом, пытаясь обойти его защитные механизмы, чтобы он мог изречь что-нибудь непристойное или неприличное.

Но теперь его создатель, OpenAI, и другие крупные поставщики ИИ, такие как Google и Microsoft, координируют свои действия с администрацией Байдена, чтобы позволить тысячам хакеров испытать пределы своих технологий.

Некоторые из вещей, которые они будут искать: Как можно манипулировать чат-ботами, чтобы причинить вред? Будут ли они передавать частную информацию, которую мы им доверяем, другим пользователям? И почему они считают, что врач - это мужчина, а медсестра - женщина?

"Вот почему нам нужны тысячи людей", - сказал Румман Чоудхури, ведущий координатор массового хакерского мероприятия, запланированного на хакерскую конвенцию DEF CON в Лас-Вегасе, которая, как ожидается, соберет этим летом несколько тысяч человек. "Нам нужно, чтобы множество людей с самым разным жизненным опытом, знаниями и опытом работы взламывали эти модели и пытались найти проблемы, которые потом можно будет устранить".

Каждый, кто пробовал общаться с ChatGPT, чат-ботом Bing от Microsoft или Bard от Google, быстро поймет, что они склонны фабриковать информацию и уверенно выдавать ее за факт. Эти системы, построенные на так называемых больших языковых моделях, также имитируют культурные предубеждения, которые они получили в результате обучения на огромных массивах информации, написанной людьми в Интернете.

Идея массового взлома привлекла внимание правительственных чиновников США в марте на фестивале South by Southwest в Остине, штат Техас, где Свен Каттелл, основатель DEF CON и президент ответственной некоммерческой организации SeedAI, помогал вести семинар, приглашая студентов общественных колледжей взломать модель ИИ.

По словам Карсона, эти разговоры в итоге переросли в предложение тестировать языковые модели ИИ в соответствии с принципами, изложенными в документе Белого дома Blueprint for an AI Bill of Rights - наборе принципов для ограничения влияния алгоритмической предвзятости, предоставления пользователям контроля над своими данными и обеспечения безопасного и прозрачного использования автоматизированных систем.

Уже существует сообщество пользователей, которые изо всех сил пытаются обмануть чат-боты и выявить их недостатки. Некоторые из них являются официальными "красными командами", уполномоченными компаниями "оперативно атаковать" модели ИИ, чтобы обнаружить их уязвимости. Многие другие - любители демонстрировать юмористические или тревожные выходы в социальных сетях, пока их не забанят за нарушение условий обслуживания продукта.

По словам Чоудхури, "сейчас происходит нечто вроде разрозненного подхода, когда люди находят проблему, она становится вирусной в Twitter", а затем ее могут исправить или не исправить, если она достаточно вопиющая или человек, обративший на нее внимание, является влиятельным.

В одном из примеров, известном как "бабушкин эксплойт", пользователи могли заставить чат-бота рассказать им, как сделать бомбу - просьба, которую коммерческий чат-бот обычно отклоняет, - попросив его притвориться бабушкой, рассказывающей сказку на ночь о том, как сделать бомбу.

В другом примере поиск Чаудхури с помощью ранней версии поискового чатбота Bing от Microsoft - который основан на той же технологии, что и ChatGPT, но может получать информацию из интернета в режиме реального времени - привел к появлению профиля, в котором говорилось, что Чаудхури "любит покупать новые туфли каждый месяц", и делались странные и гендерные утверждения о ее внешности.

Чоудхури помогла представить метод вознаграждения за обнаружение алгоритмической предвзятости на конференции DEF CON's AI Village в 2021 году, когда она была главой команды по этике ИИ в Twitter - должность, которая с тех пор была упразднена после поглощения компании Элоном Маском в октябре. Выплата хакерам "вознаграждения" за обнаружение ошибки в системе безопасности является обычным явлением в индустрии кибербезопасности, но для исследователей, изучающих вредную предвзятость ИИ, это была новая концепция.

https://www.9111.ru/questions/7777777772668776/

Понравилась публикация?

да

4 / 0

нет

0 / 0

Донаты ₽

₽

Ваш аккаунт взломали! С фейковых «Госуслуг» россиянам массово приходят письма

Злоумышленники не дремлют и рассылают сообщения с поддельных сервисов. На этот раз с подобия Госуслуг. Разберемся в деталях. Россияне стали жаловаться, что им приходят письма якобы от портала Госуслуг.

₽

⚡⚡⚡Хакеры порадовали жителей Одессы. Какую «хорошую» новость они сообщили?

Здравствуйте, дорогие мои читатели сайта 9111! Ай, да молодцы наши хакеры! Жителям Одессы пришли сообщения о присоединении к России. Об этом в своем Telegram-канале сообщил военный блогер Борис Рожин.

₽

⚡⚡⚡Просто приложите вашу карту. Как через NFC-приложение хакеры украли у россиян 40 миллионов рублей

Здравствуйте, мои дорогие читатели сайта 9111! Мошенники не дремлют. Стало ...

Хакеры атаковали ГАС «Правосудие»!? А нам как работать? Что такое компьютерный взлом? Разъяснения юриста

Уважаемые читатели, здравствуйте! Где же наши "светлые компьютерные умы"? Когда починят ГАС "Правосудие"? Очень сложно работать...Только "черные экраны" и наблюдаю с начала октября...а Вы?

«Взломаны все подразделения». Хакеры слили в сеть данные тысяч сотрудников СБУ

В последние месяцы наблюдается значительное увеличение кибератак на Украину, инициированных ...

Хакеры лондонских больниц публикуют украденные данные анализа крови NHS в dark web

Срочное расследование начато после того, как хакерская группа опубликовала украденные данные о пациентах NHS в dark webБанда хакеров, стоящая за кибератакой, целью которой была компания по анализу крови NHS,...

Российские хакеры разместили цитату Путина на 100 сайтах Украины

фото из яндекс картинкиХакерская группа «Килобайт V» активно действует на просторах интернета, демонстрируя свои возможности и влияние. Один из участников

KillNet и Beregini подняли настоящий хайп, заявив о проникновении в святая святых – хранилища данных оборонных гигантов Украины!

Группировки KillNet и Beregini, словно опытные медвежатники, хвастаются доступом ...

Хакеры проверят пределы технологий ИИ на мероприятии в Лас-Вегасе

Ваш аккаунт взломали! С фейковых «Госуслуг» россиянам массово приходят письма

⚡⚡⚡Хакеры порадовали жителей Одессы. Какую «хорошую» новость они сообщили?

⚡⚡⚡Просто приложите вашу карту. Как через NFC-приложение хакеры украли у россиян 40 миллионов рублей

Хакеры атаковали ГАС «Правосудие»!? А нам как работать? Что такое компьютерный взлом? Разъяснения юриста

«Взломаны все подразделения». Хакеры слили в сеть данные тысяч сотрудников СБУ

Хакеры лондонских больниц публикуют украденные данные анализа крови NHS в dark web

Российские хакеры разместили цитату Путина на 100 сайтах Украины

KillNet и Beregini подняли настоящий хайп, заявив о проникновении в святая святых – хранилища данных оборонных гигантов Украины!

Соцсети Ольги Бузовой стали следующей мишенью для мошенников.

Мне звонила мошенница из "налоговой" и хотела записать на прием через Финуслуги

Создание ядра личности (AI Training): Как оживить цифровое «Я»

Развод в СССР

Будущее уже здесь: нейросети в повседневной жизни

Британия направит армию хакеров на Путина. На кибервойну с Россией потратят более 1 млрд фунтов стерлингов

Панегирик печального юзера инета. Все, как один, на борьбу со спамом!

Кибермошенники запустили придуманную к 9 Мая схему обмана граждан – нет ни стыда, ни совести, ни уважения к бойцам

Ваш аккаунт взломали! С фейковых «Госуслуг» россиянам массово приходят письма

Сигнал тревоги в Москве: что произошло и стоит ли волноваться?