PhotoMaker是什么?
PhotoMaker是一个由南开大学和腾讯PCG实验室开发的人工智能系统,通过一种称为Stacked ID Embedding的方法,将同一身份的多张输入图像编码成一个ID嵌入,作为生成图像的统一表示,生成逼真的人类照片。
PhotoMaker具有高质量和多样化的生成能力,可以根据文本提示生成逼真的照片,并在保留身份属性的同时进行风格化处理、将艺术作品或旧照片中的人物带入现实、改变年龄或性别以及进行身份混合。
PhotoMaker可以做什么?
PhotoMaker具有以下功能:
- 生成逼真照片:PhotoMaker可以根据文本提示生成逼真的人物照片,使得生成的照片与给定的描述相符合。
- 保留身份属性的风格化处理:除了生成逼真的照片外,PhotoMaker还可以在保留身份属性的同时进行风格化处理,使得生成的照片具有不同的艺术风格或特定的视觉效果。
- 将艺术作品或旧照片中的人物带入现实:通过将艺术作品、雕塑或旧照片作为输入,PhotoMaker可以将过去的人物带入现实,为他们生成照片。这为将历史人物或艺术作品中的人物重新呈现在现实世界中提供了可能。
- 改变年龄或性别:通过简单地替换类别词(如男性和女性),PhotoMaker可以实现改变人物的年龄或性别,同时保持原始身份的特征。
- 身份混合:如果用户提供不同身份的图像作为输入,PhotoMaker可以将不同身份的特征融合在一起,形成一个新的身份。用户可以通过控制输入图像池中身份图像的比例或通过调整提示权重来调整混合比例。
PhotoMaker主要特点
- 几秒钟内快速定制,无需额外的 LoRA 培训。
- 确保令人印象深刻的 ID 保真度、提供多样性、有前途的文本可控性和高质量的生成。
- 可以作为适配器与社区中的其他基础模型以及 LoRA 模块进行协作。
PhotoMaker效果示例
生成的写实效果
风格化生成效果
注意:仅更改基本模型并添加 LoRA 模块以获得更好的风格化
如何使用PhotoMaker?
论文:https://huggingface.co/papers/2312.04461
GitHub:https://github.com/TencentARC/PhotoMaker
PhotoMaker提供了若干个体验demo,点击一下即可在线体验:
https://huggingface.co/spaces/TencentARC/PhotoMaker
https://huggingface.co/spaces/TencentARC/PhotoMaker-Style