Категории: Новости

Microsoft учит GPT-4 автономному использованию Android

Заставить ChatGPT работать автономно в пределах операционной системы оказалось непростой задачей по многим причинам, но команда, состоящая из ученых из Microsoft Research и Пекинского университета, возможно, нашла секретный соус.

Команда провела исследование, чтобы определить, почему модели больших языков (LLM) искусственного интеллекта (ИИ), такие как GPT-4, не справляются с задачами, требующими манипулирования операционной системой.

Современные системы, такие как ChatGPT, работающие на GPT-4, устанавливают эталон для генеративных задач, таких как составление электронного письма или написание стихотворения. Но заставить их действовать в качестве агентов в общей среде представляет собой серьезную проблему.

Традиционно модели ИИ обучаются исследовать посредством обучения с подкреплением в виртуальной среде. Разработчики ИИ использовали модифицированные версии популярных видеоигр, таких как Super Mario Bros. и Minecraft, чтобы «обучить» модели таким концепциям, как самостоятельное исследование и поиск целей.

Но операционные системы — это совершенно другая площадка для моделей ИИ. Для агентов выполнение функций внутри ОС часто представляет собой мультимодальную задачу, требующую обмена информацией между различными компонентами, программами и приложениями.

Вообще говоря, подход к обучению с подкреплением требует проб и ошибок. Однако любой, кто слишком много раз ввел свой пароль неправильно или забыл, какие ярлыки работают и в каких приложениях знают, данные могут легко быть потеряны при использовании такого подхода в среде операционной системы.

Связанный: Триггер ChatGPT доволен ядерным оружием, ИИ SEGA 80-х, TAO выросло на 90%: AI Eye

Исследователи работали с различными LLM, включая Llama2 70B с открытым исходным кодом Meta и GPT-3.5 и GPT-4 OpenAI. Согласно исследованию, ни один из них не показал особенно хороших результатов.

Согласно документу команды, это связано с тем, что в настоящее время задача превышает возможности сегодняшнего ИИ:

«Во-первых, пространство действий обширно и динамично.… Во-вторых, реальные задачи часто требуют взаимодействия между приложениями, что требует от агентов LLM дальновидного планирования. В-третьих, агентам необходимо найти оптимальные решения, соответствующие ограничениям пользователей, таким как проблемы безопасности и предпочтения».

Чтобы найти способ преодолеть эти проблемы, исследователям сначала нужно было понять, почему LLM не смогли манипулировать операционными системами, в то время как некоторые модели ИИ были способны на сверхчеловеческие подвиги, такие как победа над всеми желающими в шахматы и го.

Команда разработала новую среду обучения под названием AndroidArena, которая позволила магистрантам изучить среду, аналогичную ОС Android. Затем, после создания задач тестирования и системы эталонного тестирования, они определили отсутствие четырех ключевых способностей: понимание, рассуждение, исследование и размышление.

Хотя объем работы был специально предназначен для выявления проблемы, в ходе исследовательского процесса команда фактически нашла «простой» метод, позволяющий повысить точность модели на 27%.

По сути, команда предоставила модели автоматизированную информацию о количестве попыток, которые она предприняла ранее, и о том, что она пробовала во время этих попыток. Это решило проблему отсутствия «рефлексии» за счет встраивания памяти в подсказки, используемые для ее запуска.

Это направление исследований может оказаться важным в поисках лучшего ИИ-помощника.

CryptoHamster

Вперед Франклин Темплтон присоединяется к гонке ETF Ethereum »

Назад « Гэри Генслер ответил законодателям США по поводу ложного твита SEC о биткоин-ETF

Оставить комментарий

Опубликовано

CryptoHamster

10 месяцев ago

Недавние статьи

Новости

Бычьи признаки для Cardano: эксперт прогнозирует целевую цену в $6 по мере роста покупательского давления

Cardano (ADA), в настоящее время занимающая девятое место по величине криптовалюты, стала одной из лучших…

3 часа ago

Новости

Резервный банк Индии расширяет платформу трансграничных платежей

Резервный банк Индии (RBI) стремится расширить свою платформу трансграничных платежей, которая позволит осуществлять мгновенные расчеты,…

5 часов ago

Новости

Соотношение покупок/продаж биткоин-тейкеров на основных биржах резко возрастает — кто покупает?

Цена Биткоина несколько остыла, изо всех сил пытаясь достичь столь желанной отметки в 100 000…

10 часов ago

Новости

NFT рекордный еженедельный объем продаж в размере 158 миллионов долларов США, во главе с Ethereum и Bitcoin

Невзаимозаменяемые токены (NFT) сохранили относительно высокий еженедельный объем продаж, несмотря на небольшое снижение по сравнению…

12 часов ago

Новости

Австралия консультируется по поводу принятия системы отчетности ОЭСР по криптовалютам

Австралия выпустила консультационный документ с просьбой предоставить информацию о применении международного стандарта отчетности для криптовалютных…

13 часов ago

Новости

Цена Ethereum повторяет бычью модель «мегафона» 2017 года – почему возможна цена в 10 000 долларов

Цена Ethereum сформировала ключевую техническую модель, напоминающую ту, которая наблюдалась в 2017 году, когда криптовалюта…

16 часов ago