华为发布图像生成模型PixArt-\Sigma 可直出4K图像-佐伊科技

华为发布图像生成模型PixArt-\Sigma 可直出4K图像

rmltwz • 2024年3月8日下午12:01 • 科技 • 阅读 0

站长之家（ChinaZ.com）3月8日消息:华为近日发布了一项名为 PixArt-Sigma 的图像生成模型，该模型采用了 DiT 架构，可以直接生成4K 分辨率的图像。相比于其前身 PixArt-alpha，PixArt-Sigma 在图像保真度上有了明显的提升，并改善了与文本提示的一致性。

项目地址:https://top.aibase.com/tool/pixart

PixArt-Sigma 的一个关键特点是其训练效率。借助 PixArt-alpha 的基础预训练，它通过整合更高质量的数据，从"较弱"的基线逐步演变为"较强"的模型，这个过程被称为"弱到强训练"。

PixArt-Sigma 的进步主要体现在两个方面:高质量的训练数据和高效的 Token 压缩。PixArt-Sigma 结合了更高质量的图像数据，配对更精确和详细的图像标题，同时在 DiT 框架内提出了一个新的注意力模块，可以压缩键（Key）和值(Value)，显著提高效率，促进超高分辨率图像的生成。

由于这些改进，PixArt-Sigma 以较小的模型规模（6亿参数）实现了优于现有文本到图像扩散模型(如 SDXL(26亿参数)和 SD Cascade(51亿参数))的图像质量和用户提示遵从能力。此外，PixArt-Sigma 能够生成4K 图像，为创建高分辨率海报和壁纸提供了支持，有效地增强了电影和游戏等行业中高质量视觉内容的制作。

本文来源于网络。发布者：rmltwz，转转请注明出处：https://www.rmltwz.com/132640.html

华为发布图像生成模型PixArt-\Sigma 可直出4K图像

相关推荐

歌手2024什么时候播出,歌手2024开始录制了吗

螺蛳粉还能放心吃吗,螺蛳粉虽臭却很美味，如果经常吃，身体会有3个“损害”

暴雪游戏回归国服 账号数据不丢！三步教你轻松找回

珍爱网负责人被约谈,深圳市市场监管局：第一时间约谈珍爱网负责人

苹果推出可在网页端浏览的 Vision Pro 应用程序商店

L6全系取消空气悬挂有何影响 理想回应：差距不大

发表回复

暴雪游戏回归国服账号数据不丢！三步教你轻松找回

L6全系取消空气悬挂有何影响理想回应：差距不大