Anthropic, компанія зі штучного інтелекту (ШІ) і «суспільно корисна» компанія, запустила Claude 2 11 липня, знаменуючи ще одну віху в році, сповненому, здавалося б, безупинного прогресу в зростаючому секторі генеративного ШІ.
Introducing Claude 2! Our latest model has improved performance in coding, math and reasoning. It can produce longer responses, and is available in a new public-facing beta website at https://t.co/uLbS2JNczH in the US and UK. pic.twitter.com/jSkvbXnqLd
— Anthropic (@AnthropicAI) July 11, 2023
Згідно з повідомленням у блозі компанії, Claude 2 демонструє покращення майже в кожній вимірюваній категорії. Можливо, найбільш заслуговує на увагу відмінностей між ним і його попередником те, як дослідники обговорюють свою роботу.
У дописі в блозі, що анонсує Claude 2, немає жодної згадки про порівняльний аналіз традиційного машинного навчання чи обчислювальні показники порівняно з подібними моделями. Натомість Anthropic безпосередньо протестувала Claude і Claude 2 у численних тестах, які мали відобразити реальні знання, навички татести розв’язування задач.
Claude 2 випередив свого попередника за всіма показниками в іспитах зі знання, програмування та інших іспитів і, згідно з Anthropic, навіть має хороші результати порівняно з середніми показниками для людей:
«Якщо порівняти зі студентами коледжу, які подають документи до аспірантури, Клод 2 набирає вище 90-го процентиля на іспитах з читання та письма GRE, а також середній абітурієнт з кількісних міркувань».
Варто зазначити, що багато експертів вважають, що порівняння між людьми та учасниками тестування зі штучним інтелектом неефективні через природу людського когнітивного мислення та ймовірність того, що набір навчальних даних великої мовної моделі містить тестову інформацію. По суті, тести, розроблені для людей, можуть насправді не «перевіряти» здатність штучного інтелекту міркувати або забезпечувати належну демонстрацію фактичних знань чи навичок.
Разом із запуском Claude 2 компанія Anthropic представила бета-версію веб-інтерфейсу «Talk to Claude», що забезпечує загальний доступ до чат-бота для користувачів із США та Великобританії.
За темою: як отримати високооплачувану роботу інженера швидкого штучного інтелекту
Cointelegraph провів коротке тестування нової версії, і, якщо говорити анекдотично, покращення помітні відразу. Клод 2 майже миттєво відповів на наші підказки чіткими, стислими відповідями.
За словами Anthropic, оперативний ліміт нової моделі становить 100 тисяч токенів, або приблизно еквівалент 75 000 слів. Інтерфейс користувача сайту вказує, що користувачі можуть завантажувати PDF, TXT, CSV і подібні документи для аналізу, однак ця функція не працювала під час нашого обмеженого тестування до публікації цієї статті.
Серед нещодавньої ейфорії навколо ринку криптовалюти Polkadot (DOT) вирізнявся одним із найефективніших активів, відзначивши зростання…
Останні дані в мережі показують, що ринок стейблкойнів наближається до нової віхи з точки зору…
Криптовалютні запаси Grayscale значно зросли протягом листопада, оскільки такі альткоїни, як Stellar і XRP, зареєстрували…
Worldcoin (WLD) за останній тиждень зріс майже на 40%, ненадовго випробувавши позначку в 3 долари.…
Біткойн увійшов у «параболічну фазу» ринкового циклу, оскільки аналітики вказують на локальну вершину понад 110…
Домінування біткойнів стало значним сигналом для інвесторів в альткоїни, які можуть спостерігати менші зростання криптовалют…