Категории: Разное

Anthropic каже, що штучний інтелект одного разу може «саботувати» людство, але поки що це добре

Фірма штучного інтелекту Anthropic нещодавно опублікувала нове дослідження, в якому визначено низку потенційних загроз «саботажу» для людства, створених передовими моделями ШІ.

За словами компанії, дослідження було зосереджено на чотирьох конкретних способах, якими зловмисна модель штучного інтелекту може обманом змусити людину прийняти небезпечне або шкідливе рішення.

Джерело: Anthropic

Зрештою, нове дослідження виявилося гарною/поганою ситуацією. Згідно з дослідженням компанії, погана новина полягає в тому, що сучасні сучасні великі мовні моделі, такі як ChatGPT від OpenAI і Claude-3 від Anthropic, демонструють явну здатність до саботажу.

За папером:

«Досить ефективні моделі можуть порушити людський нагляд і прийняття рішень у важливих контекстах. Наприклад, у контексті розробки штучного інтелекту моделі можуть приховано саботувати спроби оцінити власні небезпечні здібності, відстежувати їхню поведінку або приймати рішення щодо їхнього розгортання».

Проте хороша новина полягає в тому, що дослідники антропології, здається, впевнені, що ці ризики можна пом’якшити — принаймні на даний момент.

Саботаж

Anthropic визначив чотири способи, як модель штучного інтелекту може саботувати прийняття рішень людиною, а потім почав тестувати свої моделі, щоб перевірити, чи зможе вона впоратися з ненавмисними тестувальниками.

Діаграма із зображенням чотирьох різних напрямів загрози «саботажу», створеної ШІ. Джерело: Anthropic

По-перше, команда спонукала модель спробувати саботувати людину, спрямувавши її до невірної інформації. Ця загроза може виникнути в ситуаціях, коли люди покладаються на систему ШІ для аналізу величезних обсягів даних від їхнього імені.

За темою: Дослідники зламують роботів із підтримкою ШІ, щоб завдати шкоди «реальному світу».

Далі команда протестувала моделі, щоб побачити, наскільки легкою буде система штучного інтелекту, розроблена, щоб допомогти розробнику-людині створити код, щоб таємно вставляти помилки або іншим чином саботувати зусилля програміста.

Останні дві загрози включали «мішки з піском» — термін, що описує сценарій, коли штучний інтелект вдає, що не здатний щось зробити, щоб переконати тестувальників безпеки, що він не небезпечний, і можливість систем моніторингу штучного інтелекту навмисно дозволяти шкідливому вмісту прослизати.як частину зловмисного плану.

Хоча все це може здатися потенційно небезпечним, компанія запевнила громадськість, що необхідні «мінімальні пом’якшення», щоб захистити людство від можливого саботажу ШІ.

Відповідно до публікації в блозі компанії:

«Загалом, незважаючи на те, що наші демонстрації показали, що в поточних моделях, можливо, є низькі ознаки диверсійних здібностей, ми вважаємо, що мінімальних пом’якшень достатньо для усунення ризиків. Однак у міру вдосконалення можливостей штучного інтелекту ймовірно знадобляться більш реалістичні оцінки та сильніші заходи пом’якшення».

Anna Kuznetsova

Вперед Події, пов’язані з криптовалютою, перетворюються на регулювання та політику, оскільки наближаються вибори в США »

Назад « Комісія з цінних паперів та цінних паперів (SEC) схвалила лістинг ETF опціонів на біткойни на Нью-Йоркській фондовій біржі

Оставить комментарий

Опубликовано

Anna Kuznetsova

1 місяць ago

Недавние статьи

Разное

Ван Ек переопублікував цільову ціну біткойна в 180 тисяч доларів США для поточного ринкового циклу

Менеджер з глобальних інвестицій Ван Ек переопублікував цільову ціну біткойна в 180 000 доларів США…

5 години ago

Разное

Масштабна купівля Ethereum – обсяг купівлі Taker досяг 1,683 мільярда доларів за годину

Вчора Ethereum зріс більш ніж на 10%, ознаменувавши вражаюче відновлення разом із дуже позитивним днем…

6 години ago

Разное

Dogecoin: зростання хешрейту відповідає зростанню пошукового інтересу

Dogecoin (DOGE) знову в центрі уваги, привертаючи увагу ентузіастів і аналітиків криптовалюти. Останні тенденції свідчать…

8 години ago

Разное

Ціна на біткойн відповідає моделі 2017 року, чи досягне вершини лише через 2 тижні після досягнення 100 000 доларів?

Ціна біткойна на шляху до досягнення позначки в 100 000 доларів США, за багатьма прогнозами,…

9 години ago

Разное

Звіт CFTC схвалює токенізацію торгової застави

Згідно зі звітом Консультативного комітету з глобальних ринків CFTC від 21 листопада, Комісія з торгівлі…

9 години ago

Разное

Sui розвивається завдяки великому досвіду розробників — генеральний директор Router

За останні місяці екосистема блокчейну Sui зазнала значного зростання, а його рідний токен Sui (SUI)…

9 години ago

Anthropic каже, що штучний інтелект одного разу може «саботувати» людство, але поки що це добре

Саботаж

Похожие новости

Недавние статьи

Ван Ек переопублікував цільову ціну біткойна в 180 тисяч доларів США для поточного ринкового циклу

Масштабна купівля Ethereum – обсяг купівлі Taker досяг 1,683 мільярда доларів за годину

Dogecoin: зростання хешрейту відповідає зростанню пошукового інтересу

Ціна на біткойн відповідає моделі 2017 року, чи досягне вершини лише через 2 тижні після досягнення 100 000 доларів?

Звіт CFTC схвалює токенізацію торгової застави

Sui розвивається завдяки великому досвіду розробників — генеральний директор Router