Google выпустила две стабильные версии моделей API Gemini 1.5 для разработчиков, обещая более высокую производительность и более низкие затраты на производство приложений.
24 сентября Google объявила о выпуске стабильных версий Gemini 1.5 Pro (gemini-1.5-pro-002) и Gemini 1.5 Flash (gemini-1.5-flash-002). По сравнению с предыдущими моделями 001 новые готовые к производству модели Gemini продемонстрировали, среди прочего, значительные улучшения в генерации кода, математических расчетах, рассуждениях и видеоанализе.
Google снизил цену на свою готовую к производству модель Gemini 1.5 Pro более чем на 50%, заявив при этом в три раза более высокие ограничения скорости и меньшую задержку, чем у старых экспериментальных моделей.
Согласно примечаниям к выпуску Google, обе модели Gemini 1.5 обеспечивают значительный выигрыш в действительности и уменьшают галлюцинации модели, следование инструкциям, многоязычное понимание на 102 языках, генерацию SQL, а также понимание аудио и документов.
Google сократил длину обобщения для обеих моделей и посоветовал разработчикам продуктов на основе чата варианты расширения диалоговых возможностей API.
Связанный: Google Cloud запускает RPC-сервис блокчейна, совместимый с Ethereum
С 1 октября цены API Gemini 1.5 Pro для приглашений менее 128 000 токенов будут снижены до 64 % для входных токенов, 52 % для выходных токенов и 64 % для инкрементных кэшированных токенов.
«Чтобы разработчикам было еще проще создавать с помощью Gemini, мы увеличиваем ограничения скорости платного уровня для 1,5 Flash до 2000 об/мин и увеличиваем 1,5 Pro до 1000 об/мин с 1000 и 360 об/мин соответственно», — говорится в объявлении.
Google также объявила о выпуске Gemini 1.5 Flash-8B, уменьшенной экспериментальной версии 1.5 Flash с меньшими показателями тестов. Это обновление включает значительное повышение производительности как в текстовых, так и в мультимодальных сценариях использования.
Все версии в настоящее время доступны в Google AI Studio и Gemini API.
Тем временем крупнейший конкурент Google в области искусственного интеллекта, OpenAI, начал внедрять функцию «Расширенный голос» для выбора пользователей ChatGPT.
Расширенный голосовой режим ChatGPT обеспечивает более быстрое и интуитивно понятное человеческое общение с искусственным интеллектом. В рамках новой функции OpenAI представила пять новых голосов: Arbor, Maple, SXol, Spruce и Vale, которые являются дополнением к существующим вариантам голосов Breeze, Juniper, Cove и Ember.
Соучредитель Ethereum Виталик Бутерин внимательно следит за развитием событий в блокчейне Celo и поддержал недавнюю…
Golem, децентрализованная вычислительная сеть, в своем недавнем отчете рассмотрела текущие проблемы сообщества после перевода более…
Косово делает следующий шаг в повышении финансовой грамотности в сфере криптовалют, поскольку местные финансовые лидеры…
Polygon разместит Assetera, первый в Европе регулируемый вторичный рынок токенизированных реальных активов (RWA) на основе…
Глобальный банковский конгломерат Societe Generale заключил партнерское соглашение с Bitpanda, чтобы превратить криптовалюту и стейблкоины…
Компания OpenAI, занимающаяся искусственным интеллектом, начала внедрение своей долгожданной функции «Расширенный голос» для избранных пользователей…