汽车的人机交互模式从早期的机械式物理按键到电子遥控,现在发展到集语音、按键、手势、视觉等多模交互形态,其中,语音交互是目前智能网联汽车的标配,本文就车载语音交互做个初步梳理。
一、语音交互流程
虽然在日常的用车过程中,通过唤醒词→发出指令→车机反馈这样一个流程进行语音交互已经习以为常,但是整个语音交互的流程其实并不像用户感知的这样简单,下面以用户一句语音交互请求为例,说明汽车语音交互整体链路和流程:
具体的流程示意图如下:
其中,语义理解(NLU)和语音合成(TTS)需要借助人工智能模型,这里的AI能力调用方式可以有2种方式:车端本地AI能力、云端AI能力。
车端本地AI能力的优点是在无网络或弱网络情况下也能实现用户语音交互的需求,但是由于是本地化部署方式,成本偏高,后续的更新维护只能借由OTA方式进行升级;
云端AI能力的优点是性能和效果更优秀,且调用成本低,维护升级比车端更加便捷。但是,对于汽车的网络通讯环境稳定有一定要求,否则会语音交互出现问题,造成不好的用户体验。
二、语音交互目前的核心应用场景
语音交互极大的解放了驾驶员的注意力,让越来越多的操作变得简单快捷,目前语音交互在座舱中的核心应用场景如下:
根据语音交互的主从关系,还分为被动语音交互和主动语音交互,目前大多数语音交互均是围绕被动语音交互在各个应用场景中的落地,而主动语音交互目前还未进行深入的场景发掘,目前主要是应用在驾驶提醒中,比如行车未系安全带等。不过,随着被动语音交互的逐渐普及,语音交互的产品亮点开始向主动语音交互拓展,尤其借助人工智能和用户的行车大数据做智能化的提醒建议,例如:
评价一个语音交互体验的好坏,主要是喊的醒、听的懂、做得到。这也是人与人交流中的基本状态,而车载语音交互目前主要的问题还是集中在:
1. 唤醒不及时(误唤醒)
日常用车中,可能并不是单一交互行为在发生,更多的是多种交互方式的组合使用。对于语音交互,可以结合触控,形成语音+触控,提升交互操作的准确性:
语音+视觉:交互更直观,便于任务判断。
语音+手势:驾驶操控更简洁自然。
五、语音交互的走向思考
语音交互应更多的由被动语音交互转为主动语音交互,甚至全主动语音交互,用户进行确认即可,毕竟选择题比问答题更好做也更容易处理。
频繁的在车内进行被动语音交互是个比较诡异的事情,尤其是有不太熟悉的人在车内,并且每当发起语音交互时,车内的人总是不约而同的沉默,挺尴尬的,让我想到了”小声点,影响到我使用TNT了“,不过车内还是相对封闭有隐私感。对于营运车辆,我几乎没有听到过一次语音交互,可能就是司机和乘客之间并不熟悉,偶尔来几句车机语音交互挺怪的。
我自己到目前,用的最多的语音交互就是导航和听歌,因为这两者都是需要打字查询,过程相对来说比较繁琐,其他情况我只有在新鲜感阶段才会用用语音交互。
与其让用户发出指令进行交互,不如将绝大多数适应场景的交互直接由车机发起,比如,上车准备触发,问一句”今天目的地是哪里“,毕竟,这样更自然。
车机根据驾驶者的驾驶数据和说话内容,结合场景推送,形成面向用户的主动语音交互,是目前语音交互更值得探索的区域。
本文由 @芜湖小fly 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务