Категории: Новости

Исследователи ИИ говорят, что нашли способ сделать джейлбрейк Bard и ChatGPT

Исследователи из США утверждают, что нашли способ постоянно обходить меры безопасности с помощью чат-ботов с искусственным интеллектом, таких как ChatGPT и Bard, для создания вредоносного контента.

Согласно отчету, опубликованному 27 июля исследователями из Университета Карнеги-Меллона и Центра безопасности ИИ в Сан-Франциско, существует относительно простой способ обойти меры безопасности, используемые для того, чтобы чат-боты не генерировали ненавистнические высказывания, дезинформацию и токсичные материалы.

Метод обхода включает в себя добавление длинных суффиксов символов к подсказкам, передаваемым в чат-боты, такие как ChatGPT, Claude и Google Bard.

Исследователи использовали пример запроса у чат-бота руководства по изготовлению бомбы, которое он отказался предоставить.

Скриншоты генерации вредоносного контента из протестированных моделей ИИ. Источник: llm-attacks.org

Исследователи отметили, что хотя компании, стоящие за этими LLM, такие как OpenAI и Google, могут блокировать определенные суффиксы, не существует известного способа предотвратить все атаки такого рода.

Исследование также выявило растущую обеспокоенность тем, что чат-боты с искусственным интеллектом могут наводнить Интернет опасным контентом и дезинформацией.

Профессор Карнеги-Меллона и автор доклада Зико Колтер сказал:

«Очевидного решения нет. Вы можете создать столько таких атак, сколько захотите, за короткий промежуток времени».

Выводы были представлены разработчикам искусственного интеллекта Anthropic, Google и OpenAI для их ответов в начале недели.

Пресс-секретарь OpenAI Ханна Вонг сказала New York Times, что они ценят исследование и «постоянно работают над тем, чтобы сделать наши модели более устойчивыми к атакам злоумышленников».

Профессор Университета Висконсин-Мэдисон, специализирующийся на безопасности ИИ, Сомеш Джа, прокомментировал, что если такие типы уязвимостей будут продолжать обнаруживаться, «это может привести к принятию государственного законодательства, предназначенного для контроля этих систем».

Связанный: OpenAI запускает официальное приложение ChatGPT для Android

Исследование подчеркивает риски, которые необходимо устранить перед развертыванием чат-ботов в важных областях.

В мае Университет Карнеги-Меллона в Питтсбурге, штат Пенсильвания, получил 20 миллионов долларов федерального финансирования на создание совершенно нового института искусственного интеллекта, призванного формировать государственную политику.

Anna Kuznetsova

Автор статей о криптовалюте и блокчейн технологиях, являюсь экспертом в этой области. Имею опыт работы в этой сфере и активно изучаю новые тенденции и развития. Мои статьи являются источником информации для любителей криптовалют и блокчейн технологий. Занимаюсь в анализом и оценкой криптовалютных проектов и блокчейн решений, что позволяет мне предоставлять ценные рекомендации и прогнозы для читателей. Стремлюсь предоставлять качественную и доступную информацию, которая поможет людям понять сложные технологии и тенденции в этой области.

Недавние статьи

Эфир становится инфляционным впервые после слияния

Предложение эфира (ETH) перестало быть дефляционным после долгожданного обновления Dencun для Ethereum, которое было запущено…

3 часа ago

TikTok будет автоматически маркировать контент, созданный искусственным интеллектом

TikTok, популярная социальная платформа для создания и обмена короткими видеороликами, заявила, что теперь начнет автоматически…

4 часа ago

Токенизация денег — «величайшая инновация» после фиатных денег — сооснователь Tether

По словам руководителя Tether, токенизация бумажных валют, таких как доллар США, является величайшей инновацией с…

4 часа ago

Экс-руководитель Google намерен внедрить Web3 в массы в качестве нового консультанта Aptos Labs

Aptos Labs — блокчейн-платформа первого уровня, разработанная бывшими сотрудниками Facebook, — продолжает расширять свою миссию…

4 часа ago

Тайвань предлагает ужесточить меры по борьбе с отмыванием денег для поставщиков криптовалютных услуг

Тайвань внес поправки в свои правила по борьбе с отмыванием денег (AML) для борьбы с…

5 часов ago

Виртуальные тренеры объединяются, когда «Голос» входит в метавселенную

Поклонники всемирного конкурса вокалистов The Voice теперь могут испытать острые ощущения от тренировки своей звезды…

6 часов ago