๐—œ๐—น ๐—ฑ๐—ถ๐˜ƒ๐—ฎ๐—ฟ๐—ถ๐—ผ ๐—ฑ๐—ฒ๐—น๐—นโ€™๐—œ๐—” ๐˜€๐—ถ ๐˜€๐˜๐—ฎ ๐—ฟ๐—ถ๐—ฑ๐˜‚๐—ฐ๐—ฒ๐—ป๐—ฑ๐—ผ ๐˜€๐—ฒ๐—บ๐—ฝ๐—ฟ๐—ฒ ๐—ฑ๐—ถ ๐—ฝ๐—ถรน ๐—น๐—ฎ ๐—–๐—ถ๐—ป๐—ฎ ๐˜€๐—ถ ๐—บ๐˜‚๐—ผ๐˜ƒ๐—ฒ ๐—ฎ ๐—ฝ๐—ถ๐—ฒ๐—ป๐—ผ ๐—ฟ๐—ถ๐˜๐—บ๐—ผ. ๐—ข๐—ด๐—ป๐—ถ ๐—ฝ๐—ผ๐—ฐ๐—ต๐—ถ ๐—ด๐—ถ๐—ผ๐—ฟ๐—ป๐—ถ ๐—ฎ๐—ฝ๐—ฝ๐—ฎ๐—ถ๐—ผ๐—ป๐—ผ ๐—ป๐˜‚๐—ผ๐˜ƒ๐—ถ ๐—ฟ๐—ถ๐˜€๐˜‚๐—น๐˜๐—ฎ๐˜๐—ถ ๐—ฎ๐—น๐—นโ€™๐—ฎ๐˜ƒ๐—ฎ๐—ป๐—ด๐˜‚๐—ฎ๐—ฟ๐—ฑ๐—ถ๐—ฎ ๐—ป๐—ฒ๐—น ๐—ฐ๐—ฎ๐—บ๐—ฝ๐—ผ ๐—ฑ๐—ฒ๐—น๐—นโ€™๐—œ๐—” ๐—ฝ๐—ฟ๐—ผ๐˜ƒ๐—ฒ๐—ป๐—ถ๐—ฒ๐—ป๐˜๐—ถ ๐—ฑ๐—ฎ๐—น๐—น๐—ฎ ๐—–๐—ถ๐—ป๐—ฎโ€”๐—ฝ๐—ผ๐˜๐—ฒ๐—ป๐˜‡๐—ถ๐—ฎ๐—น๐—บ๐—ฒ๐—ป๐˜๐—ฒ ๐—ฝ๐—ถรน ๐—ฟ๐—ฎ๐—ฝ๐—ถ๐—ฑ๐—ถ ๐—ฒ ๐—ฝ๐—ผ๐˜๐—ฒ๐—ป๐˜‡๐—ถ๐—ฎ๐—น๐—บ๐—ฒ๐—ป๐˜๐—ฒ ๐—บ๐—ถ๐—ด๐—น๐—ถ๐—ผ๐—ฟ๐—ถ.

๐—–๐—ผ๐˜€๐—ฎ ๐—ฑ๐—ฒ๐˜ƒ๐—ถ ๐˜€๐—ฎ๐—ฝ๐—ฒ๐—ฟ๐—ฒ:

โžœ Generazione video all’avanguardia โ€“ 30 miliardi di parametri, fino a 204 fotogrammi e ricostruzione video ad alta fedeltร  con compressione spaziale 16×16 e temporale 8x.
โžœ Architettura AI avanzata โ€“ Utilizza encoder di testo bilingue (inglese e cinese), DiT a piena attenzione 3D e ottimizzazione Video-DPO per migliorare la qualitร  e ridurre gli artefatti.
โžœ Leader nei benchmark โ€“ Supera i modelli open-source e commerciali su Step-Video-T2V-Eval, spingendo oltre i confini della creazione video alimentata dall’AI.

You can try it here: https://yuewen.cn/videos

Github: https://github.com/stepfun-ai/Step-Video-T2V



Paper: https://arxiv.org/abs/2502.10248