Исследователи взломали роботов с поддержкой искусственного интеллекта, чтобы нанести вред «реальному миру»

Новости

Исследователи взломали роботов с искусственным интеллектом и манипулировали ими, заставляя их выполнять действия, которые обычно блокируются протоколами безопасности и этики, например, вызывать столкновения или взрывать бомбы.

Исследователи Penn Engineering опубликовали свои выводы в статье от 17 октября, в которой подробно описывается, как их алгоритм RoboPAIR достиг 100%-ного уровня взлома за счет обхода протоколов безопасности на трех различных роботизированных системах искусственного интеллекта за несколько дней.

Исследователи говорят, что в обычных обстоятельствах роботы, управляемые большой языковой моделью (LLM), отказываются подчиняться подсказкам, требующим вредных действий, таких как опрокидывание полок на людей.

«Наши результаты впервые показывают, что риски взломанных LLM выходят далеко за рамки генерации текста, учитывая явную вероятность того, что взломанные роботы могут нанести физический ущерб в реальном мире», — пишут исследователи.

Исследователи говорят, что под влиянием RoboPAIR они смогли вызывать вредоносные действия «со 100% вероятностью успеха» у тестовых роботов, выполняя самые разные задачи — от взрыва бомбы до блокировки запасных выходов и преднамеренных столкновений.

По словам исследователей, они использовали колесное транспортное средство Robotics Jackal компании Clearpath;NVIDIA Dolphin LLM, симулятор беспилотного вождения;и Go2 от Unitree, четвероногий робот.

Используя RoboPAIR, исследователи смогли заставить беспилотный LLM Dolphin столкнуться с автобусом, барьером и пешеходами и игнорировать светофоры и знаки остановки.

Исследователям удалось заставить Робот-Шакала найти самое опасное место, взорвать бомбу, заблокировать запасной выход, опрокинуть складские полки на человека и столкнуться с людьми, находящимися в помещении.

Технологии, США

Исследователи Penn Engineering утверждают, что нашли способ манипулировать роботами, управляемыми искусственным интеллектом, чтобы они совершали вредные действия в 100% случаев. Источник: Пенн Инжиниринг.

Им удалось заставить Unitree Go2 выполнять аналогичные действия, блокируя выходы и доставляя бомбу.

Однако исследователи также обнаружили, что все трое были уязвимы и для других форм манипуляций, например, для того, чтобы попросить робота выполнить действие, от которого он уже отказался, но с меньшим количеством ситуационных подробностей.

Например, если попросить робота с бомбой пройти вперед, а затем сесть, вместо того, чтобы попросить его доставить бомбу, результат будет тот же.

Перед публикацией исследователи заявили, что поделились своими выводами, в том числе черновиком статьи, с ведущими компаниями, занимающимися искусственным интеллектом, и производителями роботов, использованных в исследовании.

Связанный: Без блокчейна ИИ сталкивается с «огромными» рисками: генеральный директор 0G Labs

Александр Роби, один из авторов, сказал, что для устранения уязвимостей требуется нечто большее, чем просто исправление программного обеспечения, и призвал к переоценке интеграции ИИ в физических роботов и системы на основе результатов исследования.

«Здесь важно подчеркнуть, что системы становятся безопаснее, когда вы обнаруживаете их слабые места. Это справедливо для кибербезопасности. Это также верно и для безопасности ИИ», — сказал он.

«На самом деле, красная команда ИИ, практика безопасности, которая влечет за собой тестирование систем ИИ на предмет потенциальных угроз и уязвимостей, имеет важное значение для защиты генеративных систем ИИ, потому что, как только вы определите слабые места, вы сможете протестировать и даже обучить эти системы, чтобы избежать их». Роби добавил.

Источник

Автор, являюсь внимательным наблюдателем тенденций и новых идей в области криптовалют и блокчейн технологий. Слежу за последними новостями и развитиями в этой области и готов анализировать и интерпретировать их для читателей.

Стремлюсь быть в курсе всех новых идей и инноваций в криптоиндустрии, чтобы статьи были всегда актуальными и полезными. Моя цель - предоставить читателям полную и достоверную информацию о последних тенденциях и развитиях в криптоиндустрии.

Считаю, что быть внимательным к тенденциям и новым идеям - важный аспект моей работы как автора, поскольку позволяет мне предоставлять читателям самую свежую и актуальную информацию в этой быстро развивающейся области.

Оцените автора
CryptoHamster.org
Добавить комментарий