Дослідники з Google оприлюднили свої плани щодо нової моделі дифузії в часі та просторі під назвою Lumiere, яка перетворюватиме текст або зображення на створене штучним інтелектом (ШІ) реалістичне відео з можливістю редагування за запитом.
Lumiere створено для зображення «реалістичного, різноманітного та узгодженого руху» через те, що він називає своєю «архітектурою Space-Time U-Net». Це миттєво генерує всю тривалість відео за один прохід моделі.
https://twitter.com/hila_chefer/status/1749972800243212364?ref_src=twsrc%5Etfw
Люм’єр навчався на наборі даних із 30 мільйонів відео та текстових підписів, хоча не було жодної згадки про джерело відеоданих – гаряча тема у світі штучного інтелекту та авторського права. На даний момент модель може генерувати 80 кадрів зі швидкістю 16 кадрів в секунду.
Користувачі X називали цю розробку від Google «неймовірним проривом», «найсучаснішим» і навіть припускали, що генерація відео «зійде з розуму» наступного року.
Googles new video model Lumiere can stylize motion by looking at a single image, and it looks pretty good.
Generative video is gonna get crazy this year you guys
pic.twitter.com/x1hNxpdHXR
— Nick St. Pierre (@nickfloats) January 24, 2024
Австралія опублікувала консультаційний документ із запитом щодо застосування міжнародного стандарту звітності щодо криптовалютних активів.Міністерство фінансів…
Ціна Ethereum сформувала ключову технічну модель, що нагадує ту, що спостерігалася в 2017 році, коли…
Повідомляється, що фірма фінансових послуг Cantor Fitzgerald погодилася придбати 5% акцій емітента стейблкойнів Tether у…
Криптовалютний ринок кипить активністю щодо XRP, і серед інвесторів існує консенсус щодо того, що його…
Незважаючи на підвищені очікування, що ціна біткойна досягне позначки в 100 000 доларів США, криптовалютний…
Avalanche (AVAX) зробив значний крок, подолавши вирішальний рівень опору та злетів понад 20% менш ніж…