Категории: Разное

Нове дослідження стверджує, що можливості ChatGPT погіршуються з віком

Чат-бот ChatGPT на основі штучного інтелекту OpenAI, схоже, погіршується з часом, і дослідники, здається, не можуть зрозуміти причину.

У дослідженні від 18 липня дослідники зі Стенфорда та Каліфорнійського університету в Берклі виявили, що новітні моделі ChatGPT стали набагато менш здатними надавати точні відповіді на ідентичну серію запитань протягом кількох місяців.

Автори дослідження не змогли дати чіткої відповіді, чому погіршилися можливості чат-бота ШІ.

Щоб перевірити, наскільки надійні різні моделі ChatGPT, троє дослідників, Лінцзяо Чен, Матей Захарія та Джеймс Зоу, попросили моделі ChatGPT-3.5 і ChatGPT-4 вирішити серію математичних задач, відповісти на делікатні запитання, написати нові рядки коду та провести просторові міркування на основі підказок.

https://twitter.com/james_y_zou/status/1681519439613956099?ref_src=twsrc%5Etfw

Згідно з дослідженням, у березні ChatGPT-4 був здатний ідентифікувати прості числа з точністю 97,6%. У тому ж тесті, проведеному в червні, точність GPT-4 впала лише до 2,4%.

Навпаки, попередня модель GPT-3.5 покращила ідентифікацію простих чисел за той самий проміжок часу.

За темою: Гері Генслер з SEC вважає, що штучний інтелект може посилити свій режим примусу

Коли справа дійшла до генерації рядків нового коду, можливості обох моделей суттєво погіршилися між березнем і червнем.

Дослідження також виявило, що відповіді ChatGPT на делікатні запитання — з деякими прикладами, що показують акцент на етнічній приналежності та статі — пізніше стали більш лаконічними у відмові відповідати.

Попередні ітерації чат-бота надавали докладні аргументи, чому він не міг відповісти на певні делікатні запитання. Однак у червні моделі просто вибачилися перед користувачем і відмовилися відповідати.

«Поведінка «того самого» [великої мовної моделі] служби може суттєво змінитися за відносно короткий проміжок часу», — пишуть дослідники, відзначаючи необхідність постійного моніторингу якості моделі ШІ.

Дослідники рекомендували користувачам і компаніям, які покладаються на послуги LLM як компонент у своїх робочих процесах, запровадити певну форму аналізу моніторингу, щоб забезпечити оперативну роботу чат-бота.

6 червня OpenAI оприлюднив плани створити команду, яка допомагатиме керувати ризиками, які можуть виникнути в результаті суперінтелектуальної системи штучного інтелекту, що, як очікується, з’явиться протягом десятиліття.

AI Eye: штучний інтелект, навчений на AI-контент, божевільний, чи Threads є лідером втрати даних AI?

Alexander Zhdanov

Недавние статьи

Щотижневий обсяг продажів NFT становить 158 мільйонів доларів США, на чолі з Ethereum, Bitcoin

Незамінні токени (NFT) зберігали відносно високий тижневий обсяг продажів, незважаючи на незначне зниження порівняно зі…

4 години ago

Австралія проводить консультації щодо прийняття системи звітності щодо криптовалюти ОЕСР

Австралія опублікувала консультаційний документ із запитом щодо застосування міжнародного стандарту звітності щодо криптовалютних активів.Міністерство фінансів…

6 години ago

Ціна Ethereum повторює бичачу модель «Мегафон» з 2017 року – чому 10 000 доларів можливі

Ціна Ethereum сформувала ключову технічну модель, що нагадує ту, що спостерігалася в 2017 році, коли…

9 години ago

Cantor Fitzgerald погодився придбати 5% акцій Tether за 600 мільйонів доларів: звіт

Повідомляється, що фірма фінансових послуг Cantor Fitzgerald погодилася придбати 5% акцій емітента стейблкойнів Tether у…

10 години ago

Провідний аналітик стверджує, що новий ATH XRP вже не за горами

Криптовалютний ринок кипить активністю щодо XRP, і серед інвесторів існує консенсус щодо того, що його…

10 години ago

Ведмежа тривога: біткойн на рівні 100 тис. доларів США викликає психологічний опір

Незважаючи на підвищені очікування, що ціна біткойна досягне позначки в 100 000 доларів США, криптовалютний…

12 години ago