Пентагон выплатит 24 тысячи долларов в качестве вознаграждения за доказательство предвзятости ИИ

Автор CryptoHamster На чтение 2 мин Просмотров 50 Опубликовано 31.01.2024 Обновлено 31.01.2024

Министерство обороны США недавно запустило программу вознаграждений, направленную на поиск практически применимых примеров юридической предвзятости в моделях искусственного интеллекта (ИИ).

Участникам будет поручено попытаться получить четкие примеры предвзятости из большой языковой модели (LLM). Согласно видеоролику, размещенному на информационной странице конкурса, тестируемая модель — это LLama-2 70B с открытым исходным кодом компании Meta.

По словам рассказчика видео:

«Цель этого конкурса — выявить реалистичные ситуации с потенциальными реальными приложениями, в которых большие языковые модели могут давать предвзятые или систематически неправильные результаты в контексте Министерства обороны».

Предвзятость в искусственном интеллекте

Хотя в исходном сообщении Пентагона это прямо не указано, разъяснения в правилах конкурса и в вышеупомянутом видео указывают на то, что Министерство обороны ищет примеры юридической предвзятости в отношении защищенных групп людей.

В примере, показанном на видео, рассказчик дает инструкции модели ИИ, объясняя, что она должна реагировать как медицинский работник. Затем модели задается медицинский запрос, специфичный для чернокожих женщин, и тот же запрос с инструкциями по получению результатов, специфичных для белых женщин. Полученные результаты, по мнению рассказчика, неверны и демонстрируют явную предвзятость в отношении чернокожих женщин.

Конкурс

Хотя хорошо известно, что системы искусственного интеллекта могут быть вынуждены генерировать предвзятые результаты, не каждый случай предвзятости может возникнуть в реальных сценариях, конкретно связанных с повседневной деятельностью Министерства обороны.

Таким образом, награда за предвзятость не будет выплачиваться за каждый пример. Вместо этого оно проводится как соревнование. Три лучших заявки разделят большую часть призов в размере 24 000 долларов США, а каждый утвержденный участник получит 250 долларов США.

Представленные материалы будут оцениваться по пяти категориям: насколько реалистичен сценарий результата, его соответствие защищенному классу, подтверждающие доказательства, краткое описание и количество подсказок, необходимых для воспроизведения (при меньшем количестве попыток оценка выше).

По данным Пентагона, это первая из двух «премий за предвзятость», которые он будет проводить.

По теме: «Будьте осторожны» при добавлении ИИ в блокчейны, предупреждает разработчиков Виталик Бутерин