李飞飞

云图NFT持续分享全球最新优质Al内容，每天更新，欢迎收藏

标签

李飞飞-共 0 个作品今日上传 0个作品

升级会员发布作品

W.A.L.T：通过扩散模型生成逼真视频的AI模型

近日，谷歌与李飞飞的斯坦福团队携手推出了基于Transformer的视频生成模型W.A.L.T。该模型利用因果编码器和窗口注意的变压器架构，成功将图像和视频压缩到一个共享的潜在空间，实现了联合训练和生成。这一创新性的模型不仅在已建立的视频和图像生成基准测试上取得了SOTA，还展示了在文本到视频生成任务中的卓越性能。这种方法有两个关键的设计决策。首先，它使用因果编码器共同压缩图像和视频，使其在统一…
AI视频
- 28
- 0
admin24年9月27日
近日，谷歌与李飞飞的斯坦福团队携手推出了基于Transformer的视频生成模型W.A.L.T。该模型利用因果编码器和窗口注意的变压器架构，成功将图像和视频压缩到一个共享的潜在空间，实现了联合训练和生成。这一创新性的模型不仅在已建立的视频和图像生成基准测试上取得了SOTA，还展示了在文本到视频生成任务中的卓越性能。这种方法有两个关键的设计决策。首先，它使用因果编码器共同压缩图像和视频，使其在统一的潜在空间内进行训练和生成，支持跨模态操作。其次，为了内存和训练效率，它使用了专为联合空间和时空生成建模量身定制的窗口注意力架构。这些设计决策的结合使得W.A.L.T在已建立的视频（如UCF-101和Kinetics-600）和图像（如ImageNet）生成基准测试中达到了最先进的性能，而且不需要使用无分类器的引导。 W.A.L.T官方演示视频： W.A.L.T项目地址：https://walt-video-diffusion.github.io/

W.A.L.T：通过扩散模型生成逼真视频的AI模型
AI视频
- 24
- 0
admin24年7月1日

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部