未来的汽车,不仅仅是一个出行设备,还将是一个移动终端,不仅有物理按键,还有智能语音、手势识别或生物识别,颠覆使用者体验。然而,要想真正实现智能语音交互,识别准确、响应快速并不简单。仅仅从我们发出语音指令,到最后汽车做出动作,短短一两秒内,智能语音控制系统便要经过语音识别、语义理解、联动执行及反馈用户这几个步骤。
为抢占智能网联汽车制高点,广汽在智能语音控制领域进行了前瞻性的技术规划和布局。依托科大讯飞在语音领域的优势,广汽把语音控制引入到汽车,用户只需要说说话,就能启闭发动机、开闭灯光、控制雨刮、调节座椅等——语音就像一张无形的网深入汽车控制领域,为用户带来愉悦的用车体验。
语音超智能,云计算做后盾
相信大家都有类似的用车经历,在嘈杂环境中,坐在驾驶座会听不清旁边同伴说的话。当然,如果人听不清楚可以再说一遍,但人机沟通的智能语音控制系统又是如何解决这一难题呢?
事实上,智能语音控制系统在车上使用有其特殊性。在嘈杂环境中,语音控制源可能被噪音包围,这就要求系统具有声源识别、噪声抑制、回声消除等能力,让用户的指令被系统最大化识别。
为此,广汽使用专用降噪模块,根据用户说话和环境噪音的频率,剔除不需要的声音,大大提升系统语义识别率,且远高于同行业水准。
不过,准确识别语音指令,还只是智能语音控制的第一步。如果你要通过“请导航到××”、“拨打电话××”这种标准格式和系统对话,那这只能叫“语音输入法”,这种“指令式语音”远远算不上人工智能。
智能语音控制的另一个难点,是语义理解,其背后考验的是人工智能程度。
如果你说“我饿了”,导航立刻为你推荐附近餐馆,这可以算是初级人工智能。而传祺智能语音控制系统,已经可以做到这些,甚至连“好热啊”都能理解,会主动为用户打开空调。用户完全可以用日常语言和系统对话,就像聊天一样自然。
这套系统的语义理解技术和“云”离不开关系,“云”可以简单理解为计算机集群的海量数据,人工智能系统按照一套逻辑程序,在“云”海中寻找最准确的答案,还要迅速推送出来和用户沟通,这是“聊天式语音”的核心技术。尤其是,当被使用的人工智能系统覆盖的领域越广,对数据和运算能力越饥渴。
基于此,广汽联合科大讯飞在场景数据积累、场景模型训练、深度学习技术、优化算法等方面做了极大的努力,最终在汽车应用领域的大数据有了丰富储备。
所以,当用户说出“好热啊”,系统便能迅速进行语义分析,并扩展到汽车应用领域,执行相应动作。这背后,正是云平台级别的计算力。
让机器学会思考,说话做事一起抓
当智能语音控制系统听懂了你说什么、想干什么之后,接下来就轮到了联动执行。
语音的语义识别和联动执行,其实是两个不同的研究领域。前者专注于语音理解和资讯筛选,比如用户说“我要听流行音乐电台”,系统会给出满意的答案,传祺智能语音控制系统也具备这类型的功能,比如查询天气、播报新闻等。
联动执行又是另一个领域,比如用户要调整座椅位置,需要座椅控制模块和语音控制系统打通融合,这又是另一番智能,二者之间的融合联动也很复杂。
所以,不要小看用户一句“好热啊”,传祺智能语音控制系统不但要分析语义,还要做出打开空调通风的动作。为此,广汽在车身控制领域的开放和逻辑做了很多软件优化。
值得一提的是,传祺智能语音控制系统还率先实现了业界“连续对话”的语音技术。
比如,用户可以对雨刮、空调、座椅等常用功能进行连续调节,当用户连续说出“我很热,风大一些”时,传祺智能语音控制系统将通过联动执行技术,连续做出开启空调、调大风量的两个动作,而不必每次重新唤醒语音控制系统。
这样的连续对话,可以说是人工智能的又一进阶,这意味着机器不仅能听懂、会思考、快行动,还能用多核脑思考问题。
在即将上市的传祺新车型上,用户将体验到传祺智能语音控制系统带来的便利。超前的技术储备和布局,是广汽作为行业领先品牌的强大支撑,除了传统技术领域,在智能控制领域,广汽同样走在前列。