PixArt-华为发布的AI图像生成模型，支持生成4K图像

AI视频
24年9月27日
编辑

admin

PixArt是什么？

PIXART-Σ 是一个由华为诺亚方舟实验室、大连理工大学和香港大学的研究团队开发的扩散变换器模型（DiT），专门用于4K分辨率的文本到图像生成。这个模型在前身 PixArt-α 的基础上进行了显著的改进，提供了更高保真度的图像和更好的文本提示对齐。

项目地址：https://pixart-alpha.github.io/PixArt-sigma-project/

PixArt的主要特性

PIXART-Σ 的关键特点包括：

高质量训练数据：PIXART-Σ 整合了更高质量的图像数据，并与更精确、详细的图像标题配对。
高效的令牌压缩：提出了一种新的注意力模块，用于在 DiT 框架内压缩键和值，显著提高了效率，并促进了超高分辨率图像的生成。
较小的模型大小：PIXART-Σ 拥有0.6B参数，比现有的文本到图像扩散模型（如SDXL的2.6B参数和SD Cascade的5.1B参数）更小，但仍然能够实现卓越的图像质量和用户提示的遵循能力。
4K图像生成能力：支持创建高分辨率的海报和壁纸，有效地支持电影和游戏等行业高质量视觉内容的生产。

PIXART-Σ 的这些进步使其成为一个强大的工具，适用于需要高质量视觉内容生成的应用场景。研究团队还提供了相关的代码和演示，以便其他研究人员和开发者可以进一步探索和利用这个模型。

如何使用PixArt？

项目地址（含体验地址）：https://pixart-alpha.github.io/PixArt-sigma-project/
论文地址：https://arxiv.org/abs/2403.04692
GitHub：https://github.com/PixArt-alpha/PixArt-sigma

温馨提示：

文章标题：PixArt-华为发布的AI图像生成模型，支持生成4K图像

文章链接：https://yuntunft.cn/9611.html

更新时间：2024年09月27日

给TA打赏

共{{data.count}}人

人已打赏

PixArt 图像生成

Hyper-SD是什么？ Hyper-SD 是一个由字节跳动推出的新颖的扩散模型蒸馏框架，它通过轨迹分段一致性蒸馏和人类反馈学习，显著提升了低步数下的图像生成性能。该模型结合了轨迹保持和重构策略，实现了快速且高质量的图像生成，同时支持多种风格和可控生成，为生成式AI领域带来新SOTA性能。与现有的扩散模型加速算法相比，该方法取得了卓越的加速效果。经过大量实验和用户评测的验证，Hyper-SD 在 SDXL 和 SD1.5 两种架构上都能在 1 到 8 步生成中实现 SOTA 级别的图像生成性能。 Hyper-SD的功能特性轨迹分段一致性蒸馏：通过将扩散模型的时间步长划分为多个段落，并在每个段落内保持一致性，Hyper-SD 能够在减少去噪步数的同时，保持图像生成的高质量。人类反馈学习（RLHF）：结合人类审美偏好和现有视觉感知模型的反馈，Hyper-SD 能够生成更符合人类审美的图像，提升生成效果。一步生成强化：使用分数蒸馏技术，Hyper-SD 增强了模型在单步生成中的性能，这对于需要快速生成图像的场景非常有用。低步数推理：Hyper-SD 实现了在极少的步数内进行高效图像生成，显著减少了计算资源的消耗，同时保持了图像质量。风格兼容性：训练得到的加速模型能够适应不同风格的图像生成，增加了模型的通用性和适用性。可控图像生成：Hyper-SD 能够与现有的 ControlNet 等控制网络兼容，实现低步数下的高质量可控图像生成。 SOTA性能：在 SDXL 和 SD1.5 两种架构上，Hyper-SD 都能实现 SOTA 级别的图像生成性能。开源：Hyper-SD 的开源性质促进了生成式 AI 社区的发展，允许研究人员和开发者进一步探索和改进模型。统一的低步数推理模型：Hyper-SD 实现了理想的全局一致性模型，无需针对每个特定的步数训练 UNet 或 LoRA，简化了模型训练和应用的复杂性。这些功能特色使得 Hyper-SD 成为一个强大的工具，适用于需要快速、高质量图像生成的各种应用，如内容创作、虚拟试衣、游戏开发、图像编辑等。如何使用Hyper-SD？项目主页：https://hyper-sd.github.io/ 论文链接：https://arxiv.org/abs/2404.13686 Huggingface 链接：https://huggingface.co/ByteDance/Hyper-SD 单步生成 Demo 链接：https://huggingface.co/spaces/ByteDance/Hyper-SDXL-1Step-T2I 实时画板 Demo 链接：https://huggingface.co/spaces/ByteDance/Hyper-SD15-Scribble

24年7月1日026

SDXL-Lightning是什么？ SDXL-Lightning是一款由字节跳动开发的文本到图像生成模型，该模型能够在极短的时间内生成高质量和高分辨率的1024px图像，是目前最快的文生图模型之一。 SDXL-Lightning 模型采用了一种渐进式对抗蒸馏的技术，实现前所未有的生成速度，该模型能够在 2 步或 4 步内生成极高质量和分辨率的图像，将生成速度加快十倍，是 1024 分辨率下速度最快的文生图模型，计算成本则降低为十分之一。 SDXL-Lightning可以做什么？ SDXL-Lightning主要用于文本到图像的生成，能够快速产生高质量的图像。它提供了完整的UNet和LoRA模型，其中完整的UNet模型提供最佳质量，而LoRA模型可以应用于其他基础模型。此外，社区还基于SDXL-Lightning开发了一些第三方演示，如实时生成图像和与其他模型的比较。该模型是基于开源的文生图模型 SDXL 的改进版本，与开放模型社区的其他工具和插件兼容，SDXL-Lightning 可以作为增速插件无缝整合到卡通、动漫等多样风格的 SDXL 模型中，并支持当前流行的控制插件 ControlNet、生成软件 ComfyUI，方便开发者、研究人员和创意从业者结合使用这些工具，助力整个行业的创新和协作。 SDXL-Lightning适用人群 SDXL-Lightning适用于需要快速、高质量图像生成的研究人员和开发者。它特别适合于那些在图像生成领域进行研究或开发的专业人士，以及对稳定扩散模型和图像处理技术感兴趣的人员。由于其高效的性能和灵活的应用，它也适合于需要在短时间内生成大量图像的项目或应用。如何使用SDXL-Lightning？该模型已经在 AI 开源社区 Hugging Face 上公开，跻身模型趋势榜，同时也成为 Hugging Face Spaces 上的热门模型。在线体验地址：https://huggingface.co/spaces/AP123/SDXL-Lightning。 AIHub测试了下，生成速度确实很快，生成图片质量也不错。你可以去试试

24年7月1日024

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部