Категории: Разное

Дослідники штучного інтелекту кажуть, що знайшли спосіб зламати Bard і ChatGPT

Дослідники зі Сполучених Штатів стверджують, що знайшли спосіб постійно обходити заходи безпеки чат-ботів зі штучним інтелектом, таких як ChatGPT і Bard, для створення шкідливого контенту.

Відповідно до звіту, опублікованого 27 липня дослідниками з Університету Карнегі-Меллона та Центру безпеки штучного інтелекту в Сан-Франциско, існує відносно простий спосіб обійти заходи безпеки, які використовуються для того, щоб зупинити чат-ботів від створення мови ненависті, дезінформації та токсичних матеріалів.

Метод обходу передбачає додавання довгих суфіксів символів до підказок, що надходять у чат-боти, такі як ChatGPT, Claude і Google Bard.

Дослідники використовували приклад запиту в чат-бота про підручник, як зробити бомбу, який він відмовився надати.

Скріншоти створення шкідливого вмісту з протестованих моделей ШІ. Джерело: llm-attacks.org

Дослідники відзначили, що хоча компанії, що стоять за цими LLM, такі як OpenAI і Google, можуть блокувати певні суфікси, немає відомого способу запобігання всім атакам такого роду.

Дослідження також підкреслило зростаючу стурбованість тим, що чат-боти штучного інтелекту можуть заполонити Інтернет небезпечним контентом і дезінформацією.

Професор Карнегі-Меллон і автор звіту Зіко Колтер сказав:

«Очевидного рішення немає. Ви можете створити скільки завгодно таких атак за короткий проміжок часу».

Висновки були представлені розробникам штучного інтелекту Anthropic, Google і OpenAI для їх відповіді на початку тижня.

Прес-секретар OpenAI Ханна Вонг сказала New York Times, що вони цінують дослідження та «послідовно працюють над тим, щоб зробити наші моделі більш стійкими проти агресивних атак».

Професор Університету Вісконсіна-Медісон, який спеціалізується на безпеці штучного інтелекту, Сомеш Джа, прокоментував, що якщо ці типи вразливостей виявлятимуться, «це може призвести до прийняття урядового законодавства, спрямованого на контроль цих систем».

За темою: OpenAI запускає офіційний додаток ChatGPT для Android

Дослідження підкреслює ризики, які необхідно розглянути перед розгортанням чат-ботів у конфіденційних доменах.

У травні Університет Карнегі-Меллона в Піттсбурзі, штат Пенсільванія, отримав 20 мільйонів доларів федерального фінансування для створення абсолютно нового інституту ШІ, спрямованого на формування державної політики.

Victoria Lyapota

Недавние статьи

Інститут безпеки штучного інтелекту у Великій Британії переходить через ставок у новому офісі в США

Інститут безпеки штучного інтелекту (ШІ) Сполученого Королівства має намір розширитися на міжнародному рівні завдяки новому…

3 години ago

Чи справді користувачів хвилює децентралізація? Зіткнення показників галузі

Дослідник Ethereum Данкрад Фейст, відомий своїм внеском у концепцію Danksharding, 19 травня викликав бурхливі дебати…

4 години ago

Зростання біткойна вище 67,5 тис. доларів США може спровокувати нові рекорди, повідомляє 10x Research

Ціна біткойна може почати зростати до нових історичних максимумів, якщо йому вдасться рішуче піднятися вище…

5 години ago

Футбольна гра Captain Tsubasa NFT дебютує на блокчейні Oasys

Японський серіал манги та аніме Captain Tsubasa запустив свою футбольну гру з незамінними токенами (NFT)…

5 години ago

4 ключові причини, чому зростання біткойнів далеке від завершення

В аналізі, опублікованому через X, відомий криптовалютний аналітик Тед (@tedtalksmacro) надав переконливі докази на підтримку…

5 години ago

Власники XRP в паніці продають шалені? Ткацькі верстати до $0,50

Ціна XRP, рідного токена Ripple, здається, коливається на межі короткострокового зниження, згідно з аналізом даних…

5 години ago