Категории: Разное

Нова модель Google Gemini AI домінує в тестах, перемагаючи GPT-4o та Claude-3

У світі тестів генеративного штучного інтелекту з’явилася нова найкраща модель — Gemini 1.5 Pro.

Попередній чемпіон, ChatGPT-4o від OpenAI, був нарешті перевершений 1 серпня, коли Google тихо запустила експериментальний випуск своєї останньої моделі.

Останнє оновлення Gemini надійшло без помпи і наразі позначене як експериментальне. Але він швидко привернув увагу спільноти штучного інтелекту в соціальних мережах, оскільки почали надходити повідомлення про те, що він перевершує своїх конкурентів за результатами тестування.

Еталонні показники штучного інтелекту

ChatGPT від OpenAI є стандартним носієм генеративного ШІ з моменту запуску GPT-3. Його остання модель, GPT-4o, і його найближчий конкурент, Claude-3 від Anthropic, протягом останнього року чи близько того з незначною конкуренцією переважали більшість інших моделей у більшості поширених тестів.

Джерело: Large Model Systems Organization.

Один із найпопулярніших бенчмарків називається LMSYS Chatbot Arena. Він перевіряє моделі на різноманітні завдання та призначає загальну оцінку компетентності. GPT-4o отримав 1286 балів, а Клод-3 — 1271 бал.

Попередня версія Gemini 1.5 Pro набрала 1261. Але експериментальна версія (Gemini 1.5 Pro 0801), випущена 1 серпня, набрала цілих 1300 балів.

Це вказує на те, що він загалом більш потужний, ніж його конкуренти, але контрольні показники не обов’язково є точним відображенням того, що може і чого не може зробити модель ШІ.

Ажіотаж громади

Без глибших порівнянь ми вступаємо в еру, коли ринок чат-ботів штучного інтелекту достатньо зрілий, щоб запропонувати кілька варіантів. Зрештою, кінцеві користувачі вирішують, яка модель штучного інтелекту їм найкраще підходить.

Як не дивно, останню версію Gemini викликала хвиля захоплення, а користувачі соціальних мереж назвали її «шалено хорошою». Один Redditor пішов так далеко, що написав, що це «виходить на 4° з води».

Наразі незрозуміло, чи стане експериментальна версія Gemini 1.5 Pro стандартною в майбутньому. Хоча на момент публікації цієї статті вона залишається загальнодоступною, той факт, що вона знаходиться на етапі раннього випуску або тестування, вказує на те, що модель може бути скасована або змінена з міркувань безпеки чи узгодження.

За темою: Google оголошує про підвищення безпеки та прозорості в моделях AI

Anna Kuznetsova

Недавние статьи

майнери криптовалюти в регіоні Техасу ERCOT тепер повинні повідомляти про потребу в електроенергії

Регулюючий орган Техаського комунального господарства прийняв правило, згідно з яким майнери біткойнів, які використовують мережу,…

4 години ago

Статки найбагатшої людини світу Ілона Маска досягли рекордних 348 мільярдів доларів

Генеральний директор Tesla і мільярдер у галузі технологій Ілон Маск тепер багатший, ніж будь-коли, його…

5 години ago

Комісія з цінних паперів та цінних паперів отримує рекордні 8,2 мільярда доларів США від примусових заходів, в основному від Terraform Labs

У 2024 фінансовому році Комісія з цінних паперів і бірж Сполучених Штатів встановила новий рекорд…

6 години ago

Децентралізована наука схожа на ранній DeFi у 2019 році: криптовалюта VC

Децентралізовані наукові протоколи (DeSci) — це те, де були децентралізовані фінанси (DeFi) у 2019 році…

7 години ago

Ціна XRP сягає 3-річного максимуму в 1,6 долара – 2 шляхи, як це можна зробити

Ціна XRP нещодавно підскочила до трирічного максимуму в 1,6 долара, що стало важливою віхою в…

8 години ago

Ліквідація криптовалюти сягає 470 мільйонів доларів, оскільки біткойн відновлюється, альткойни різко зростають

Біткойн впав після того, як 24 листопада не зміг подолати позначку в 100 000 доларів,…

8 години ago