-
M2UGen-腾讯发布的多模态音乐生成模型
M2UGen是什么? M2UGen是一个多模态音乐理解和生成模型的项目。该项目利用大型语言模型的能力,结合MU-LLaMA模型、MosaicML的MPT-7B-Chat模型、BLIP图像字幕模型和VideoMAE字幕模型,生成音乐相关的数据集,并使用M2UGen模型进行音乐生成和理解。 M2UGen可以做什么? M2UGen模型具有以下功能: 文本到音乐生成:根据给定的文本生成相应的音乐。 图像到…- 43
- 0
音乐理解
云图NFT持续分享全球最新优质Al内容,每天更新,欢迎收藏
标签
音乐理解-共 0 个作品
今日上传
0个作品