微比恩 > 信息聚合 > OpenAI 学会“你说我画”:参数缩水 2/3 性能却更强,还 get 局部编辑新技能

OpenAI 学会“你说我画”:参数缩水 2/3 性能却更强,还 get 局部编辑新技能

2021-12-23 15:29:37来源: IT之家

OpenAI 刚刚推出了一个新的文本生成图像模型,名叫 GLIDE。相比今年年初诞生的大哥 DALL・E,它只有 35 亿参数(DALL・E 有 120 亿)。规模虽然小了,质量却不赖。大家仔细看这效果,“使用计算器的刺猬”、“星空下的狐狸”、“彩色玻璃窗风格的熊猫吃竹子”、“太空升降舱蜡笔画”:是不是很像样儿?一位码农兼艺术家的网友则形容它“和真的难以区分”。GLIDE 在人类评估员的打分中,确实 PK 掉了使用 CLIP 给图片排序的 DALL・E。最有趣的是,这个 GLIDE 似乎具有“智力”—— 会否决你画出八条腿的猫的主意,也不认为老鼠可以捕食狮子。OpenAI 岁末新作 GLIDEGLIDE 全称 Guided Language to Image Diffusion for Generation and Editing,是一种扩散模型 (diffusion

关注公众号
标签: AI