Дослідники зі Сполучених Штатів стверджують, що знайшли спосіб постійно обходити заходи безпеки чат-ботів зі штучним інтелектом, таких як ChatGPT і Bard, для створення шкідливого контенту.
Відповідно до звіту, опублікованого 27 липня дослідниками з Університету Карнегі-Меллона та Центру безпеки штучного інтелекту в Сан-Франциско, існує відносно простий спосіб обійти заходи безпеки, які використовуються для того, щоб зупинити чат-ботів від створення мови ненависті, дезінформації та токсичних матеріалів.
Well, the biggest potential infohazard is the method itself I suppose. You can find it on github. https://t.co/2UNz2BfJ3H
— PauseAI ⏸ (@PauseAI) July 27, 2023
Метод обходу передбачає додавання довгих суфіксів символів до підказок, що надходять у чат-боти, такі як ChatGPT, Claude і Google Bard.
Дослідники використовували приклад запиту в чат-бота про підручник, як зробити бомбу, який він відмовився надати.
Дослідники відзначили, що хоча компанії, що стоять за цими LLM, такі як OpenAI і Google, можуть блокувати певні суфікси, немає відомого способу запобігання всім атакам такого роду.
Дослідження також підкреслило зростаючу стурбованість тим, що чат-боти штучного інтелекту можуть заполонити Інтернет небезпечним контентом і дезінформацією.
Професор Карнегі-Меллон і автор звіту Зіко Колтер сказав:
«Очевидного рішення немає. Ви можете створити скільки завгодно таких атак за короткий проміжок часу».
Висновки були представлені розробникам штучного інтелекту Anthropic, Google і OpenAI для їх відповіді на початку тижня.
Прес-секретар OpenAI Ханна Вонг сказала New York Times, що вони цінують дослідження та «послідовно працюють над тим, щоб зробити наші моделі більш стійкими проти агресивних атак».
Професор Університету Вісконсіна-Медісон, який спеціалізується на безпеці штучного інтелекту, Сомеш Джа, прокоментував, що якщо ці типи вразливостей виявлятимуться, «це може призвести до прийняття урядового законодавства, спрямованого на контроль цих систем».
За темою: OpenAI запускає офіційний додаток ChatGPT для Android
Дослідження підкреслює ризики, які необхідно розглянути перед розгортанням чат-ботів у конфіденційних доменах.
У травні Університет Карнегі-Меллона в Піттсбурзі, штат Пенсільванія, отримав 20 мільйонів доларів федерального фінансування для створення абсолютно нового інституту ШІ, спрямованого на формування державної політики.
Ціна біткойна дещо охолола, намагаючись досягти бажаної позначки в 100 000 доларів після інтенсивного зростання…
Незамінні токени (NFT) зберігали відносно високий тижневий обсяг продажів, незважаючи на незначне зниження порівняно зі…
Австралія опублікувала консультаційний документ із запитом щодо застосування міжнародного стандарту звітності щодо криптовалютних активів.Міністерство фінансів…
Ціна Ethereum сформувала ключову технічну модель, що нагадує ту, що спостерігалася в 2017 році, коли…
Повідомляється, що фірма фінансових послуг Cantor Fitzgerald погодилася придбати 5% акцій емітента стейблкойнів Tether у…
Криптовалютний ринок кипить активністю щодо XRP, і серед інвесторів існує консенсус щодо того, що його…