微比恩 > 信息聚合 > 给力!南开团队刷新图像生成模型质量和速度!浪潮信息AIStation支撑

给力!南开团队刷新图像生成模型质量和速度!浪潮信息AIStation支撑

2024-09-24 15:33:00来源: 美通社

北京2024年9月24日 /美通社/ -- 只要输入提示文字,大模型就能给我们高度拟真、准确的图像,相信很多人已经体验到这种前沿且酷炫的图像创作方式,这背后其实是能力强大的图像生成模型做支撑。 目前诸如Sora等前沿图像生成模型,基于的主体架构都是Diffusion Transformer(DiT)。DiT可以将生成模型扩展到更大的模型规模,从而实现高质量的图像生成。然而更大的模型规模导致训练成本飙升,为此,南开大学计算机学院研发了Masked Diffusion Transformer(MDT)图像生成模型,相比DiT训练速度提升10倍以上,实现了ImageNet Benchmark上1.58的FID score,再次刷新SOTA图像生成质量和学习速度。相关论文已在计算机视觉顶级会议ICCV 2023(计算机视觉国际大会)发表。 MDT开发和训练的背后需要强大的AI算力资源支持,为了建设满足MDT开发和训练需求的AI算力平

关注公众号