Категории: Разное

Нові оновлення OpenAI покращують голосові та зорові можливості ШІ

Розробник штучного інтелекту OpenAI увійшов у жовтень з декількома оновленнями своїх моделей, що допомогло його моделям ШІ брати участь у кращих розмовах і покращити розпізнавання зображень.

1 жовтня OpenAI оприлюднив чотири оновлення, які представляють нові інструменти, призначені для того, щоб розробникам було легше створювати моделі штучного інтелекту.

Воно говорить!

Одним із основних оновлень є Realtime API, який дозволяє розробникам створювати голосові програми, згенеровані штучним інтелектом, за допомогою єдиного запиту.

Інструмент, доступний для тестування, підтримує мультимодальний досвід із низькою затримкою, передаючи потокове аудіо введення та виведення, уможливлюючи природні розмови, подібні до розширеного голосового режиму ChatGPT.

Раніше розробникам доводилося «зшивати» кілька моделей, щоб створити такий досвід. Аудіовхід зазвичай потрібно було повністю завантажити й обробити, перш ніж отримати відповідь, що означало вищу затримку для додатків у реальному часі, таких як голосові розмови.

За темою: Apple, Google використовуватимуть штучний інтелект для збереження домінування — ARK Invest Кеті Вуд

Завдяки можливості потокового передавання Realtime API розробники тепер можуть увімкнути негайну природну взаємодію, подібно до голосових помічників. API працює на GPT-4, випущеному в травні 2024 року, який може обробляти аудіо, зображення та текст у режимі реального часу.

ШІ тепер чітко бачить

Інше оновлення включає інструмент тонкого налаштування для розробників, що дозволяє їм покращувати відповіді штучного інтелекту, створені на основі введених зображень і тексту.

За словами розробника, точні налаштування на основі зображень дозволяють штучному інтелекту краще розуміти зображення, у свою чергу покращуючи можливості візуального пошуку та виявлення об’єктів. Процес включає відгуки людей, які надають приклади хороших і поганих відповідей.

На додаток до оновлень голосу та зору, OpenAI також запровадив «дистиляцію моделі» та «швидке кешування», які дозволяють меншим моделям навчатися у більших і зменшують витрати та час на розробку шляхом повторного використання вже обробленого тексту.

Розширені можливості його моделей є ключовою перевагою продажу, оскільки основну частину прибутку OpenAI отримує від компаній, які створюють власні програми на основі технології OpenAI.

Згідно з даними Reuters, наступного року дохід OpenAI зросте до 11,6 мільярда доларів проти 3,7 мільярда доларів у 2024 році.

CryptoHamster

Недавние статьи

Dogecoin: зростання хешрейту відповідає зростанню пошукового інтересу

Dogecoin (DOGE) знову в центрі уваги, привертаючи увагу ентузіастів і аналітиків криптовалюти. Останні тенденції свідчать…

4 години ago

Ціна на біткойн відповідає моделі 2017 року, чи досягне вершини лише через 2 тижні після досягнення 100 000 доларів?

Ціна біткойна на шляху до досягнення позначки в 100 000 доларів США, за багатьма прогнозами,…

5 години ago

Звіт CFTC схвалює токенізацію торгової застави

Згідно зі звітом Консультативного комітету з глобальних ринків CFTC від 21 листопада, Комісія з торгівлі…

5 години ago

Sui розвивається завдяки великому досвіду розробників — генеральний директор Router

За останні місяці екосистема блокчейну Sui зазнала значного зростання, а його рідний токен Sui (SUI)…

5 години ago

Потенційний голова Комітету з цінних паперів і цінних паперів обіцяє підхід до криптофорварду після відставки Генслера

Марк Уєда, республіканський уповноважений Комісії з цінних паперів і бірж США (SEC), припустив, що він…

5 години ago

Південнокорейська Delio оголосила банкрутом із втратою активів на 1,75 мільярда доларів

22 листопада суд у Сеулі визнав південнокорейську платформу депозитів віртуальних активів Delio банкрутом, згідно з…

5 години ago