微比恩 > 信息聚合 > Yann LeCun朝“世界模型”理论迈一步，Meta开源“像人一样学习”的图像模型 | 最前线

Yann LeCun朝“世界模型”理论迈一步，Meta开源“像人一样学习”的图像模型 | 最前线

2023-06-16 17:39:15来源: 36氪

文 | 周鑫雨编辑 | 苏建勋六根手指、机器猫圆手……手部细节一直是图像生成式AI的盲区。用Midjourney生成的图，手部有6根手指。而如今，这一图像生成的阿喀琉斯之踵有望被Meta破解。6月14日，Meta 推出了I-JEPA（Image Joint Embedding Predictive Architecture, 图像联合嵌入预测架构），实现无需手动变换图像对额外知识进行编码的情况下，生成基于世界常识的图像。这一研究由纽约计算量子物理中心研究院Anna Dawid，以及图灵奖获得者Yann LeCun共同提出——I-JEPA也被视作继LeCun提出“世界模型（World Model）”构想后，第一个卓有成效的进展。从自回归到世界模型为何图像生成模型普遍难以精确生成手部？其根本原因在于以自回归为框架的模型缺乏对现实世界的常识。在自回归框架下，模型利用当前的上文信息对下文信息进行预测。应用至图像生成领

阅读原文