«Вбивця GPT-4» Gemini від Google вийшов. Ось як ви можете його спробувати

Автор Victoria Lyapota На читання 3 хв Переглядів 31 Опубліковано 07.12.2023 Оновлено 07.12.2023

Технологічний гігант Google офіційно випустив Gemini, свою останню модель штучного інтелекту, яка, за його словами, перевершила GPT-4 OpenAI.

6 грудня генеральний директор Google Сундар Пічаї та генеральний директор і співзасновник Google DeepMind Деміс Хассабіс оголосили про запуск Gemini в дописі в блозі компанії

Модель штучного інтелекту оптимізовано для різних розмірів і варіантів використання (Ultra, Pro, Nano) і створено як мультимодальну для розуміння та поєднання різних типів інформації.

Модель також вдосконалена в математиці та спеціалізованому кодуванні порівняно з OpenAI GPT-4, який не може виконувати математику.

Тим часом Google стверджує, що її версія Ultra забезпечує «найсучаснішу продуктивність» у 30 із 32 академічних тестів, які використовуються в розробці LLM (великої мовної моделі).

Крім того, за даними Google, він набирає 90% результатів тесту на розуміння багатозадачної мови (MMLU), що перевершує показники експертів.

Головний науковий співробітник Google Джефф Дін сказав, що Gemini Ultra є першою моделлю, яка «досягнула продуктивності людини-експерта на MMLU за 57 предметами з результатом понад 90%».

I’m very excited to share our work on Gemini today! Gemini is a family of multimodal models that demonstrate really strong capabilities across the image, audio, video, and text domains. Our most-capable model, Gemini Ultra, advances the state of the art in 30 of 32 benchmarks,… pic.twitter.com/sQfxBy9tpT

— Jeff Dean (@) (@JeffDean) December 6, 2023

Система також була розроблена з нуля для безперебійного аналізу тексту, зображень, аудіо та відео, що робить її на крок попереду своїх конкурентів.

«Ми розробили Gemini так, щоб він був мультимодальним із самого початку, — сказав Дін, а потім додав, — замість того, щоб починати з чисто текстової моделі, а потім прищеплювати візуальні та аудіокодери».

Проілюстровано мультимодальні можливості Gemini. Джерело: X/@JeffDean

Gemini також має розширені навички програмування, включаючи генерацію високоякісного коду за допомогою AlphaCode 2, передової системи генерації коду. Він також може вирішувати складні проблеми програмування та співпрацювати з розробниками.

За словами експерта зі штучного інтелекту Роуена Чунга, Gemini Pro перевершив GPT-3.5 у шести з восьми тестів, «роблячи його найпотужнішим безкоштовним чат-ботом на ринку сьогодні».

Порівняння продуктивності Gemini та ChatGPT. Джерело: Google

За темою: IBM, Meta та інші створюють «AI Alliance» для просування розвитку ШІ

Для тих, хто хоче спробувати нову модель штучного інтелекту, налаштована версія Gemini Pro вже була розгорнута у версії ChatGPT від Google — відомої як Bard — згідно з Google.

«Це найбільше оновлення Bard з моменту його запуску. Він буде доступний англійською мовою в більш ніж 170 країнах і територіях, і ми плануємо розширити доступ до різних модальностей і підтримувати нові мови та місця в найближчому майбутньому», – заявили в компанії.

Gemini також з’являється на флагманському телефоні Google Pixel 8 Pro.

«Pixel 8 Pro — це перший смартфон, розроблений для роботи з Gemini Nano, який підтримує нові функції, такі як Summarize у додатку Recorder і розгортає Smart Reply у Gboard, починаючи з WhatsApp — наступного року буде більше програм для обміну повідомленнями», — йдеться у повідомленні.

У найближчі місяці його буде розгорнуто в інших продуктах і службах Google, таких як Пошук, Оголошення та Chrome.

Технічний гігант також почав експериментувати з Gemini, щоб забезпечити пошукову систему, що домінує в Інтернеті, щоб зробити пошук генеративним досвідом.

Google представив Gemini на початку цього року, рекламуючи його можливості та стверджуючи, що він буде потужнішим за ChatGPT.