Google випустив дві стабільні версії моделей API Gemini 1.5 для розробників, обіцяючи більшу продуктивність і нижчі витрати на створення додатків.
24 вересня Google оголосив про запуск стабільних версій Gemini 1.5 Pro (gemini-1.5-pro-002) і Gemini 1.5 Flash (gemini-1.5-flash-002). Порівняно з попередніми моделями 001, нові моделі Gemini, готові до виробництва, показали значні покращення у створенні коду, математиці, аргументації та аналізі відео, зокрема.
Gemini 1.5 Pro знижує фінансові бар’єри для розробників
Google знизив ціну на свою готову до виробництва модель Gemini 1.5 Pro більш ніж на 50%, заявивши, що втричі вищі ліміти швидкості та менша затримка, ніж у попередніх випусках експериментальних моделей.
Відповідно до приміток до випуску Google, обидві моделі Gemini 1.5 забезпечують значне збільшення фактичних даних і зменшують галюцинації моделі, слідування інструкціям, багатомовне розуміння 102 мовами, створення SQL, розуміння аудіо та документів.
Google зменшив довжину підсумкових даних для обох моделей і порадив розробникам продукту, що базується на чаті, запропонувати варіанти для збільшення можливостей розмови API.
За темою: Google Cloud запускає блокчейн-сервіс RPC, сумісний з Ethereum
З 1 жовтня ціни на Gemini 1.5 Pro API для підказок менше 128 000 токенів будуть знижені до 64% для вхідних токенів, 52% для вихідних токенів і 64% для інкрементних кешованих токенів.
«Щоб розробникам було ще простіше створювати за допомогою Gemini, ми збільшуємо ліміти платних рівнів для 1.5 Flash до 2000 об/хв і збільшуємо 1.5 Pro до 1000 об/хв з 1000 і 360 відповідно», — йдеться в повідомленні.
Google запускає експериментальну версію Gemini 1.5 Flash
Google також оголосив про запуск Gemini 1.5 Flash-8B, меншої експериментальної версії 1.5 Flash із нижчими показниками тестування. Це оновлення передбачає значне підвищення продуктивності як для текстових, так і для мультимодальних випадків використання.
Наразі всі версії доступні в Google AI Studio та Gemini API.
Тим часом, найбільший конкурент Google у сфері штучного інтелекту, OpenAI, почав розгортати свою функцію «Advanced Voice» для вибраних користувачів ChatGPT.
Розширений голосовий режим ChatGPT забезпечує швидше та інтуїтивніше людське спілкування з ШІ. У рамках нової функції OpenAI оприлюднив п’ять нових голосів: Arbor, Maple, SXol, Spruce і Vale, які є доповненнями до існуючих варіантів голосу Breeze, Juniper, Cove і Ember.