Дебют Antropic найпотужніший AI все -таки на тлі “свистя”

Разное

Фірма «Штучний інтелект» Anthropic розпочала останні покоління своїх чатів на тлі критики щодо поведінки тестування, яка могла б повідомити деяких користувачів владі.

22 травня антропік оприлюднив Claude Opus 4 та Claude Sonnet 4, стверджуючи, що Клод Опус 4 є його найпотужнішою моделлю досі: “І найкраща модель кодування у світі”, в той час як Клод Соннет 4 є значним оновленням від свого попередника, “надаючи вищі кодування та міркування”.

Фірма додала, що обидва оновлення-це гібридні моделі, що пропонують два режими-“майже нестагові відповіді та розширене мислення для більш глибоких міркувань”.

Обидві моделі AI також можуть чергувати міркування, дослідження та використання інструментів, як -от веб -пошук, для вдосконалення відповідей.

Антропік додав, що Claude Opus 4 перевершує конкурентів в орієнтирах агента кодування. Він також здатний постійно працювати на складних, тривалих завдань, “значно розширюючи те, що можуть зробити агенти AI”.

Antropic стверджує, що чат-ббот досяг 72,5% на суворий орієнтир програмного забезпечення, перевершивши GPT-4.1 OpenAI, який набрав 54,6% після запуску у квітні.

Клод V4 орієнтири. Джерело: антроп

Пов’язано: OpenAi ігнорував експертів, коли він випустив надмірно приємний чатгпт

Основні гравці індустрії ШІ спрямовувались на “моделі міркувань” у 2025 році, що буде працювати методично через проблеми, перш ніж відповісти.

OpenAI ініціював зміну в грудні своєю серією “O”, а за ним відбулася Gemini 2.5 Pro з його експериментальною можливістю “глибокої думки”.

Клод щури при неправильному використанні при тестуванні

Перша конференція розробників Anthropic 22 травня була затьмарена суперечками та зворотною реакцією через особливість Claude 4 Opus.

Розробники та користувачі рішуче відреагували на розкриття, що модель може автономно повідомляти користувачів органам влади, якщо вона виявить “надзвичайно аморальну” поведінку, повідомляє VentureBeat.

У звіті цитується дослідник антропічного AI вирівнювання Сем Боуман, який написав на X, що чат “використовує інструменти командного рядка для зв’язку з пресою, контактних регуляторів, спробуйте заблокувати вас із відповідних систем або все вищезазначене”.

Однак згодом Боуман заявив, що “видалив попередній твіт про свистка, коли його витягують з контексту”.

Він уточнив, що ця функція трапилася лише в “тестувальних середовищах, де ми надаємо їй незвично вільного доступу до інструментів та дуже незвичних інструкцій”.

Джерело: Сем Боуман

Генеральний директор AI стабільності, Емад Моукко, сказав антропічній команді: “Це абсолютно неправильна поведінка, і вам потрібно це вимкнути – це масова зрада довіри та слизький нахил”.

Джерело
Оцініть автора
CryptoHamster.org
Додати коментар