-
W.A.L.T:通过扩散模型生成逼真视频的AI模型
近日,谷歌与李飞飞的斯坦福团队携手推出了基于Transformer的视频生成模型W.A.L.T。该模型利用因果编码器和窗口注意的变压器架构,成功将图像和视频压缩到一个共享的潜在空间,实现了联合训练和生成。这一创新性的模型不仅在已建立的视频和图像生成基准测试上取得了SOTA,还展示了在文本到视频生成任务中的卓越性能。 这种方法有两个关键的设计决策。首先,它使用因果编码器共同压缩图像和视频,使其在统一…- 26
- 0
李飞飞
云图NFT持续分享全球最新优质Al内容,每天更新,欢迎收藏
标签
李飞飞-共 0 个作品
今日上传
0个作品