智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。可以理解为人类与机器间通过自然语言完成信息传递的技术。语音交互的完整流程,如下图所示。通常,根据距离远近语音交互场景可分为两种:近场语音场景:通常通过按键激活,例如智能手机等便携设备。远场语音场景:通常通过唤醒词激活,例如智能音箱等固定设备。远场语音场景下,在产品策略上通常会采取两种方案,以提高唤醒的准确率:将唤醒词的音节长度增加到 4 音节。这是因为音节越长,唤醒的准确率就会越高。比如:“小兴小兴”的唤醒准确率远高于“小兴”。白天只对唤醒词做本地校验,夜间则再增加云端二次校验。这是唤醒速度和准确率间的平衡策略。白天用户更看重响应速度,发生偶尔的误唤醒用户能理解或接受,这时候仅由本地的唤醒检测模块进行快速检测,保证 700 ms 内快速响应用户。晚上睡觉时用户对误唤醒是零容忍的,这时候就要偏重唤醒的准确度,将本地检测过的语音上传到云端进行二次确认,再决定本地
跟机器语音交互的时候到底发生了什么?
2022-12-05 18:34:05来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Snap 发布第 5 代 Spectacles AR 眼镜:集成 OpenAI 多模态 AI 模型,支持语音控制2024-09-18 08:58:57
- 打击网络谣言:上海警方将反谣语音植入共享单车,日均播放约 240 万次2024-09-08 18:53:45
- “国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布,号称中文效果比 GPT-4o 更出色2024-09-06 18:59:42
- 三星宣布将 Bixby 语音助手引入 BESPOKE AI 家电,语音控制更智能2024-08-26 14:15:58
- 百度地图《黑神话:悟空》同款导航语音开启预约2024-08-21 14:34:07
- 大众捷达汽车推送 JettaOS 01.21 系统更新:新增语音控车、音乐氛围灯律动等功能2024-08-20 16:35:02
- 卡萨帝 100 英寸艺术电视壁画 M70 亮点公布:星闪指向遥控、科大讯飞语音识别,参考价 31999 元2024-08-20 17:03:32
- 大疆 Neo 无人机宣传材料曝光:支持手柄操控、兼容 FPV 眼镜、新增语音指令2024-08-20 07:25:32
- 小米 AI 百宝箱功能本周末开启内测推送:支持惊喜壁纸、截图摘要、游戏语音辅助等功能2024-08-14 17:45:36
- 绿米 Aqara 风琴智能窗帘电机 C4 发布:双电机驱动 / 支持语音控制2024-08-14 11:34:51