微比恩 > 信息聚合 > 比GPT-4o更早,最强实时多模态模型来了,8人团队6个月搞定

比GPT-4o更早,最强实时多模态模型来了,8人团队6个月搞定

2024-07-05 12:46:02来源: 钛媒体

文 | 乌鸦智能说6月底,GPT-4o宣布跳 票,语音 功能推迟一个月发布。 没想到,成果却突然被别人“截胡“了。昨天,来自法国A I实验室kyutai放 出首个实时原生多模态Moshi,不仅效果堪比GPT-4o,还是开源模型。从效果演示来,Moshi可以随时聆听和实时交谈,表达自然、流畅,甚至还能模仿快乐、悲伤等70种不同情绪和说话风格。不仅如此 ,Moshi还可以进行角色扮演,能用海盗身份给你讲一个冒险故事。更厉害的是,这个开源实时语音多模态模型是8人团队,仅仅花了半年的时间训练出来的。Moshi各种炸裂演得到了LeCun、Karpathy等AI大佬的转发。到底Moshi有多强?快来一起看看吧!表达超自然,情感理解能力强从官网进入(https://moshi.chat/?queue_id=talktomoshi),设置默认,不需要验证,仅输入一个邮箱,用户就可以开始体验。当你进入到对话界面,5分钟的限

关注公众号