Категории: Разное

Нова модель Google Gemini AI домінує в тестах, перемагаючи GPT-4o та Claude-3

У світі тестів генеративного штучного інтелекту з’явилася нова найкраща модель — Gemini 1.5 Pro.

Попередній чемпіон, ChatGPT-4o від OpenAI, був нарешті перевершений 1 серпня, коли Google тихо запустила експериментальний випуск своєї останньої моделі.

Останнє оновлення Gemini надійшло без помпи і наразі позначене як експериментальне. Але він швидко привернув увагу спільноти штучного інтелекту в соціальних мережах, оскільки почали надходити повідомлення про те, що він перевершує своїх конкурентів за результатами тестування.

Еталонні показники штучного інтелекту

ChatGPT від OpenAI є стандартним носієм генеративного ШІ з моменту запуску GPT-3. Його остання модель, GPT-4o, і його найближчий конкурент, Claude-3 від Anthropic, протягом останнього року чи близько того з незначною конкуренцією переважали більшість інших моделей у більшості поширених тестів.

Джерело: Large Model Systems Organization.

Один із найпопулярніших бенчмарків називається LMSYS Chatbot Arena. Він перевіряє моделі на різноманітні завдання та призначає загальну оцінку компетентності. GPT-4o отримав 1286 балів, а Клод-3 — 1271 бал.

Попередня версія Gemini 1.5 Pro набрала 1261. Але експериментальна версія (Gemini 1.5 Pro 0801), випущена 1 серпня, набрала цілих 1300 балів.

Це вказує на те, що він загалом більш потужний, ніж його конкуренти, але контрольні показники не обов’язково є точним відображенням того, що може і чого не може зробити модель ШІ.

Ажіотаж громади

Без глибших порівнянь ми вступаємо в еру, коли ринок чат-ботів штучного інтелекту достатньо зрілий, щоб запропонувати кілька варіантів. Зрештою, кінцеві користувачі вирішують, яка модель штучного інтелекту їм найкраще підходить.

Як не дивно, останню версію Gemini викликала хвиля захоплення, а користувачі соціальних мереж назвали її «шалено хорошою». Один Redditor пішов так далеко, що написав, що це «виходить на 4° з води».

Наразі незрозуміло, чи стане експериментальна версія Gemini 1.5 Pro стандартною в майбутньому. Хоча на момент публікації цієї статті вона залишається загальнодоступною, той факт, що вона знаходиться на етапі раннього випуску або тестування, вказує на те, що модель може бути скасована або змінена з міркувань безпеки чи узгодження.

За темою: Google оголошує про підвищення безпеки та прозорості в моделях AI

Anna Kuznetsova

Недавние статьи

CleanSpark повідомляє про зростання хешрейту на 187%.

Відповідно до неаудованого звіту за фінансовий рік, опублікованого 4 жовтня, біткойн-майнер CleanSpark за останні 12…

3 години ago

Криптодружній ігровий гігант Tencent розглядає можливість викупу Ubisoft: звіт

Повідомляється, що китайський технологічний та ігровий гігант Tencent і сім’я Гіллемот ведуть переговори про придбання…

3 години ago

FET під загрозою подальшого зниження? RSI сигналізує про стійкий ведмежий тиск

Нещодавня цінова дія малює ведмежу картину для FET, а індекс відносної сили (RSI) сигналізує про…

4 години ago

Звіт про робочі місця в США вказує на менше зниження ставок, що все ще позитивно впливає на BTC: Grayscale

Зак Пандл, керівник відділу досліджень Grayscale, сказав Cointelegraph, що сильні звіти про зайнятість у вересні…

4 години ago

Децентралізація біткойнів є питанням національної безпеки, — генеральний директор Auradine

Раджив Хемані, співзасновник і генеральний директор виробника чіпів для майнінгу Auradine, сказав Cointelegraph.Генеральний директор пояснив,…

4 години ago

Коефіцієнти Polymarket щодо того, хто з HBO вийде в ролі Сатоші Накамото, надає перевагу Лену Сассаману

Polymarket, платформа децентралізованого ринку прогнозів, наразі має американського комп’ютерника Лена Сассамана як найбільшого фаворита, який…

5 години ago