当前位置:
首页AI视频DragGAN是什么? 最近,一个名为DragGAN的AI 图片编辑工具爆火,它实现了点击鼠标、拖动关键点就能达到Photoshop的效果。对比之下,使用Photoshop等工具时候,需要具备相对专业的技能才能灵活,精确地控制单个对象的位置,形状,表达或排列。 简单的说,DragGAN使用户能够在图像上确定一个点,就能改变图片结构和整个像素。它与其他流行的生成AI图像工具(如Dall-E和Midjourney)有很大的区别,后者虽然能够通过文本提示生成特定的图片,但无法精确输出所需的姿势或布局。 据了解,DragGAN新模型由MIT、谷歌、马普所等机构联手打造,该项目相关论文已入选SIGGRAPH2023,研究人员展示了一种控制GAN进行图像处理的新方法。 DragGAN可以做什么? 简单拖拽就能实现图片编辑 只要处理的图片与GAN训练数据集的类别匹配,DragGAN就可以处理逼真的图像。这些类别包括动物、汽车、人、细胞和景观。 论文示例展示了在一个简单的界面中,用户可以将他们在图像中定义的点拖动到所需的位置,就是实现图片编辑。例如,让猫咪闭上眼睛,让狮子转头并张开它的嘴,或将汽车转换为另一种模型。 DragGAN 还提供了遮罩功能,允许用户突出显示他们希望更改的图像的特定部分,而其余部分保持不变。 该团队表示:“通过DragGAN,任何人都可以通过精确控制像素的位置来变形图像,从而操纵不同类别的姿势、形状、表情和布局。” DragGAN研究论文还强调了该工具的最大优势,界面的简单性和直观性。在几秒钟内,用户可以掌握功能,而无需弄清楚底层技术。 未来,如果将DragGAN 与AI图像生成工具搭配使用,用户将能够实现更接近他们心目中的图像的输出。 如何使用DragGAN? Hugging Face地址:https://huggingface.co/papers/2305.10973 官方demo:https://vcai.mpi-inf.mpg.de/projects/DragGAN/ Github:https://github.com/XingangPan/DragGAN