微比恩 > 信息聚合 > Yann LeCun朝“世界模型”理论迈一步,Meta开源“像人一样学习”的图像模型 | 最前线

Yann LeCun朝“世界模型”理论迈一步,Meta开源“像人一样学习”的图像模型 | 最前线

2023-06-16 17:39:15来源: 36氪

文 | 周鑫雨编辑 | 苏建勋六根手指、机器猫圆手……手部细节一直是图像生成式AI的盲区。用Midjourney生成的图,手部有6根手指。而如今,这一图像生成的阿喀琉斯之踵有望被Meta破解。6月14日,Meta 推出了I-JEPA(Image Joint Embedding Predictive Architecture, 图像联合嵌入预测架构),实现无需手动变换图像对额外知识进行编码的情况下,生成基于世界常识的图像。这一研究由纽约计算量子物理中心研究院Anna Dawid,以及图灵奖获得者Yann LeCun共同提出——I-JEPA也被视作继LeCun提出“世界模型(World Model)”构想后,第一个卓有成效的进展。从自回归到世界模型为何图像生成模型普遍难以精确生成手部?其根本原因在于以自回归为框架的模型缺乏对现实世界的常识。在自回归框架下,模型利用当前的上文信息对下文信息进行预测。应用至图像生成领

关注公众号
标签: 开源 Meta