Технологічний гігант Google офіційно випустив Gemini, свою останню модель штучного інтелекту, яка, за його словами, перевершила GPT-4 OpenAI.
6 грудня генеральний директор Google Сундар Пічаї та генеральний директор і співзасновник Google DeepMind Деміс Хассабіс оголосили про запуск Gemini в дописі в блозі компанії
Модель штучного інтелекту оптимізовано для різних розмірів і варіантів використання (Ultra, Pro, Nano) і створено як мультимодальну для розуміння та поєднання різних типів інформації.
Модель також вдосконалена в математиці та спеціалізованому кодуванні порівняно з OpenAI GPT-4, який не може виконувати математику.
Тим часом Google стверджує, що її версія Ultra забезпечує «найсучаснішу продуктивність» у 30 із 32 академічних тестів, які використовуються в розробці LLM (великої мовної моделі).
Крім того, за даними Google, він набирає 90% результатів тесту на розуміння багатозадачної мови (MMLU), що перевершує показники експертів.
Головний науковий співробітник Google Джефф Дін сказав, що Gemini Ultra є першою моделлю, яка «досягнула продуктивності людини-експерта на MMLU за 57 предметами з результатом понад 90%».
I’m very excited to share our work on Gemini today! Gemini is a family of multimodal models that demonstrate really strong capabilities across the image, audio, video, and text domains. Our most-capable model, Gemini Ultra, advances the state of the art in 30 of 32 benchmarks,… pic.twitter.com/sQfxBy9tpT
— Jeff Dean (@) (@JeffDean) December 6, 2023
Система також була розроблена з нуля для безперебійного аналізу тексту, зображень, аудіо та відео, що робить її на крок попереду своїх конкурентів.
«Ми розробили Gemini так, щоб він був мультимодальним із самого початку, — сказав Дін, а потім додав, — замість того, щоб починати з чисто текстової моделі, а потім прищеплювати візуальні та аудіокодери».
Gemini також має розширені навички програмування, включаючи генерацію високоякісного коду за допомогою AlphaCode 2, передової системи генерації коду. Він також може вирішувати складні проблеми програмування та співпрацювати з розробниками.
За словами експерта зі штучного інтелекту Роуена Чунга, Gemini Pro перевершив GPT-3.5 у шести з восьми тестів, «роблячи його найпотужнішим безкоштовним чат-ботом на ринку сьогодні».
За темою: IBM, Meta та інші створюють «AI Alliance» для просування розвитку ШІ
Для тих, хто хоче спробувати нову модель штучного інтелекту, налаштована версія Gemini Pro вже була розгорнута у версії ChatGPT від Google — відомої як Bard — згідно з Google.
«Це найбільше оновлення Bard з моменту його запуску. Він буде доступний англійською мовою в більш ніж 170 країнах і територіях, і ми плануємо розширити доступ до різних модальностей і підтримувати нові мови та місця в найближчому майбутньому», – заявили в компанії.
Gemini також з’являється на флагманському телефоні Google Pixel 8 Pro.
«Pixel 8 Pro — це перший смартфон, розроблений для роботи з Gemini Nano, який підтримує нові функції, такі як Summarize у додатку Recorder і розгортає Smart Reply у Gboard, починаючи з WhatsApp — наступного року буде більше програм для обміну повідомленнями», — йдеться у повідомленні.
У найближчі місяці його буде розгорнуто в інших продуктах і службах Google, таких як Пошук, Оголошення та Chrome.
Технічний гігант також почав експериментувати з Gemini, щоб забезпечити пошукову систему, що домінує в Інтернеті, щоб зробити пошук генеративним досвідом.
Google представив Gemini на початку цього року, рекламуючи його можливості та стверджуючи, що він буде потужнішим за ChatGPT.