Нарешті OpenAI запускає «Розширений голосовий режим» для вибору користувачів ChatGPT

Разное

Після кількох затримок, як повідомляється, пов’язаних із безпекою та тонким налаштуванням, довгоочікуваний «Розширений голосовий режим» (AVM) OpenAI для ChatGPT тепер доступний в альфа-версії для вибраних користувачів.

Функція AVM була анонсована та продемонстрована ще в травні. Це дозволяє користувачам вести розмову в режимі реального часу з моделлю штучного інтелекту ChatGPT через модуль синтезу технічної мови.

Пам’ятаєте Duplex?

Ті, хто знайомий із цією концепцією, напевно, пам’ятають оголошення Google у 2018 році про те, що «дуплексний» сервіс ШІ буде доступний «незабаром». На заході для розробників IO компанія продемонструвала систему штучного інтелекту, здатну дзвонити компаніям від вашого імені, щоб планувати зустрічі в режимі реального часу з людьми.

Основна ідея, за словами Google, полягала в тому, що штучний інтелект буде достатньо надійним, щоб впоратися з випадковими розмовами та підтвердити правильну інформацію.

Зрештою проект Duplex було закрито, але його спадок, очевидно, живе в ChatGPT OpenAI.

Розширений голосовий режим

AVM підтримує спілкування в реальному часі, яке намагається імітувати обговорення між людьми. ChatGPT відповідає на запити користувачів людським голосом із природним ритмом. Користувачі можуть переривати чат-бота на півслові, і він, ґрунтуючись на демонстрації, може стежити за сказаним.

Компанія запускає функцію в обмеженій альфа-версії, щоб продовжити оцінку її можливостей і наслідків для безпеки. Незважаючи на те, що травневі демонстрації були вражаючими, були деякі моменти з помилками, і неважко уявити сценарії, коли технологія може бути використана не за призначенням.

Джерело: OpenAI.

Відповідно до OpenAI, безпека була першочерговою турботою компанії. У публікації на X, оголошуючи про запуск цієї функції, компанія написала:

«Ми протестували голосові можливості GPT-4o з понад 100 зовнішніми червоними командами на 45 мовах. Щоб захистити конфіденційність людей, ми навчили модель говорити лише чотирма попередньо встановленими голосами та створили системи для блокування виходів, які відрізняються від цих голосів. Ми також запровадили огорожі, щоб блокувати запити на насильницький або захищений авторським правом вміст».

Відповідно до OpenAI, розгортання AVM уже почалося, і воно продовжуватиметься з додаванням нових користувачів «на постійній основі». Компанія очікує, що ця функція стане доступною для всіх абонентів Plus восени.

За темою: OpenAI призупиняє голос ChatGPT, звинувачений у імітації Скарлетт Йоханссон

Джерело
Оцініть автора
CryptoHamster.org
Додати коментар