微比恩 > 信息聚合 > 云知声推出山海多模态大模型：实时生成文本、音频和图像

云知声推出山海多模态大模型：实时生成文本、音频和图像

2024-08-26 13:56:12来源: IT之家

云知声推出山海多模态大模型：实时生成文本、音频和图像

图片地址：https://img.ithome.com/newsuploadfiles/2024/8/365bc0f5-a4a6-4a91-a3b5-1204ede42c3b.jpg?x-bce-process=image/format,f_auto

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲ 云知声山海助手微信小程序IT之家获悉，山海多模态大模型有如下特点：实时秒回，自由插话：与现实对话中人类的响应时间相似；支持对话随时打断，用户可在对话中任意插话感知情绪，表达情绪：通过语音文本判断用户情绪，还能捕捉用户语音的语气、节奏和音调等微妙变化，感知对方情绪状态音色自由切换：根据用户的个性化需求，自由切换音色；学习用户的音色、风格，复刻用户声音视觉场景理解：“看见”周围环境，结合图像和文字，提供易于理解的总结图像生成，构筑个性艺术：根据用户指令创建视觉内容，提供符合个性化需求的定制画面

关注公众号

标签：大模型

提示：支持键盘“← →”键翻页

上一篇高德地图 iOS 版更新 15.0.0 大版本：性能全面提升，北斗卫星无网导航、卫星求救等

下一篇罗永浩名下限制消费令均已解除，此前称已还债 8.24 亿元

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片