Категории: Разное

Anthropic створив демократичний чат-бот ШІ, дозволивши користувачам голосувати за його цінності

У дослідженні, яке може бути першим у своєму роді, фірма зі штучного інтелекту (ШІ) Anthropic розробила велику мовну модель (LLM), яка була налаштована для оціночних суджень спільноти користувачів.

https://twitter.com/AnthropicAI/status/1714359536939909459?ref_src=twsrc%5Etfw

Багато загальнодоступних LLM були розроблені з огородженнями — закодованими інструкціями, що диктують конкретну поведінку — для того, щоб обмежити небажані результати. Наприклад, Claude від Anthropic і ChatGPT від OpenAI зазвичай надають користувачам стандартну відповідь безпеки на вихідні запити, пов’язані з насильницькими або суперечливими темами.

Однак багато вчених експертів стверджують, що огорожі та інші методи втручання можуть служити для усунення волі користувачів, оскільки те, що вважається прийнятним, не завжди є корисним, а те, що вважається корисним, не завжди є прийнятним. У той же час, визначення моралі або ціннісних суджень можуть відрізнятися залежно від культури, населення та періоду часу.

За темою: Велика Британія націлиться на потенційні загрози ШІ на запланованому листопадовому саміті

Одним із можливих способів вирішення цього є дозволити користувачам диктувати вирівнювання цінностей для моделей ШІ. Експеримент Anthropic «Колективний конституційний штучний інтелект» є спробою цього «безладного виклику».

Anthropic у співпраці з Polis і Collective Intelligence Project зібрав 1000 користувачів із різних демографічних груп і попросив їх відповісти на низку запитань за допомогою опитування.

Джерело: Anthropic

Завдання зосереджується на тому, щоб дозволити користувачам агентству визначати, що є прийнятним, не наражаючи їх на неприйнятні результати. Це передбачало пошук цінностей користувача, а потім впровадження цих ідей у ​​модель, яка вже була навчена.

Anthropic використовує метод під назвою «Конституційний штучний інтелект», щоб спрямувати свої зусилля на налаштування LLM для безпеки та корисності. По суті, це передбачає надання моделі переліку правил, яких вона повинна дотримуватися, а потім навчання її реалізації цих правил протягом усього процесу, подібно до того, як конституція служить основним документом для управління в багатьох країнах.

В експерименті «Колективний конституційний штучний інтелект» Anthropic спробував інтегрувати зворотній зв’язок на основі групи в структуру моделі. Результати, згідно з дописом у блозі від Anthropic, здається, були науковими успіхами, оскільки вони висвітлили подальші виклики на шляху досягнення мети дозволити користувачам продукту LLM визначати свої колективні цінності.

Однією з труднощів, яку довелося подолати команді, був пошук нового методу для процесу порівняльного аналізу. Оскільки цей експеримент, здається, є першим у своєму роді, і він спирається на методологію конституційного штучного інтелекту Anthropic, не існує встановленого тесту для порівняння базових моделей із моделями, налаштованими на основі краудсорсингових значень.

Зрештою, виглядає так, ніби модель, яка реалізувала дані, отримані за відгуками користувачів, «трохи» перевершила базову модель у сфері необ’єктивних результатів.

Відповідно до публікації в блозі:

«Більше, ніж отримана модель, ми в захваті від процесу. Ми вважаємо, що це може бути один із перших випадків, коли представники громадськості як група навмисно керували поведінкою великої мовної моделі. Ми сподіваємося, що спільноти в усьому світі будуть спиратися на подібні методи, щоб навчати моделі, що залежать від культури та контексту, які задовольнятимуть їхні потреби».

Anna Kuznetsova

Недавние статьи

Двопартійний законопроект про конкурентоспроможність блокчейну пройшов Палату представників США

Поки криптовалютна спільнота очікує голосування Палати представників Сполучених Штатів щодо Закону про фінансові інновації та…

3 години ago

Згідно з чутками, аналітики SEC переглядають відмову спот Ether ETF

Два аналітики біржових фондів заявили, що вони переоцінюють шанси Комісії з цінних паперів і бірж…

4 години ago

Аналітик криптовалют дає попереджувальний сигнал про потенційне падіння ціни Chainlink на 50-60%, ось чому

Криптовалютний аналітик CrediBULL криптовалюти нещодавно попередив, що ціна Chainlink (ПОСИЛАННЯ) може впасти на 50-60%. Однак,…

6 години ago

Палата представників США проголосує за законопроект FIT21 перед святковими вихідними

Законодавці-республіканці в Комітеті з фінансових послуг Палати представників оголосили, що цього тижня Палата представників проголосує…

6 години ago

Офіційний документ, який започаткував криптовалюту ZK-proofs, отримав нагороду IEEE «Випробування часом»

Дослідницька стаття десятирічної давнини, яка розглядається як «схема» для першого практичного використання доказів із нульовим…

8 години ago

Dogecoin утворює симетричний трикутник, ралі на горизонті?

Серед значного сплеску, продемонстрованого нещодавно Dogecoin (DOGE), популярний криптовалютний аналітик Daily Trade Signals виявив симетричну…

8 години ago