Категории: Новости

Новые обновления OpenAI расширяют голосовые и зрительные возможности ИИ

Разработчик искусственного интеллекта OpenAI вступил в октябрь с несколькими обновлениями своих моделей, помогая своим моделям искусственного интеллекта лучше общаться и улучшать распознавание изображений.

1 октября OpenAI представила четыре обновления, в которых представлены новые инструменты, призванные облегчить разработчикам создание моделей искусственного интеллекта.

Оно говорит!

Одним из основных обновлений является API Realtime, который позволяет разработчикам создавать голосовые приложения, созданные искусственным интеллектом, с помощью одной подсказки.

Инструмент, доступный для тестирования, поддерживает мультимодальные возможности с малой задержкой путем потоковой передачи аудиовходов и выходов, обеспечивая естественные разговоры, аналогичные расширенному голосовому режиму ChatGPT.

Раньше разработчикам приходилось «сшивать» несколько моделей, чтобы создать такой опыт. Аудиовход обычно необходимо полностью загрузить и обработать перед получением ответа, что означает более высокую задержку для приложений реального времени, таких как голосовые разговоры.

По теме: Apple и Google будут использовать ИИ для сохранения доминирования — ARK Invest Кэти Вуд

Благодаря возможности потоковой передачи Realtime API разработчики теперь могут обеспечить мгновенное и естественное взаимодействие, во многом похожее на голосовых помощников. API работает на GPT-4, выпущенном в мае 2024 года, который может обрабатывать аудио, изображение и текст в режиме реального времени.

ИИ теперь ясно видит

Еще одно обновление включает в себя инструмент тонкой настройки для разработчиков, позволяющий им улучшить реакцию ИИ, генерируемую на основе изображений и текстового ввода.

По словам разработчика, точные настройки на основе изображений позволяют искусственному интеллекту лучше понимать изображения, что, в свою очередь, расширяет возможности визуального поиска и обнаружения объектов. Этот процесс включает в себя обратную связь от людей, которые приводят примеры хороших и плохих ответов.

В дополнение к обновлениям голоса и видения OpenAI также внедрила «дистилляцию модели» и «быстрое кэширование», которые позволяют меньшим моделям учиться на более крупных и сокращать затраты и время на разработку за счет повторного использования уже обработанного текста.

Расширенные возможности моделей являются ключевым преимуществом, поскольку основная часть доходов OpenAI поступает от предприятий, создающих свои собственные приложения на основе технологии OpenAI.

По данным Reuters, OpenAI прогнозирует, что в следующем году ее выручка вырастет до $11,6 млрд по сравнению с $3,7 млрд в 2024 году.

Victoria Lyapota

Автор, являюсь внимательным наблюдателем тенденций и новых идей в области криптовалют и блокчейн технологий. Слежу за последними новостями и развитиями в этой области и готов анализировать и интерпретировать их для читателей. Стремлюсь быть в курсе всех новых идей и инноваций в криптоиндустрии, чтобы статьи были всегда актуальными и полезными. Моя цель - предоставить читателям полную и достоверную информацию о последних тенденциях и развитиях в криптоиндустрии. Считаю, что быть внимательным к тенденциям и новым идеям - важный аспект моей работы как автора, поскольку позволяет мне предоставлять читателям самую свежую и актуальную информацию в этой быстро развивающейся области.

Недавние статьи

Lamborghini представляет автомобили в играх Web3 вместе с Animoca и партнерством Motorverse

Производитель автомобилей класса люкс Automobili Lamborghini анонсировал платформу Web3 под названием Fast ForWorld, которая позволит…

4 часа ago

Будет ли израильско-иранский конфликт толкать биткоин дальше? Аналитики обсуждают

Цена биткоина резко упала до $60 164 во вторник после усиления геополитической напряженности на Ближнем…

4 часа ago

Ava Protocol, партнер Sony Soneium по автоматизации блокчейна без кода

Ava Protocol, поставщик инфраструктуры Web3, заключил партнерское соглашение с Soneium, блокчейном второго уровня от Sony…

4 часа ago

Ончейн-денежный фонд Франклина Темплтона запускается на блокчейне Aptos

Фонд Aptos и глобальный гигант по управлению активами Франклин Темплтон объявили об интеграции Фонда государственных…

5 часов ago

Городской министр Великобритании продвигает блокчейн-золотые облигации, несмотря на опасения правительства

Городской министр Соединенного Королевства Тулип Сиддик выступил за введение позолоты на основе блокчейна, формы государственных…

5 часов ago

Стейблкоины теперь составляют 43% объема криптовалютных операций в странах Африки к югу от Сахары: Chainaанализ

Транзакции со стейблкоинами в настоящее время составляют почти половину общего объема транзакций в странах Африки…

5 часов ago