人机交流无阻碍,识别率95%以上,近百家合作厂商,思必驰AIOS还有合成语音

2016-03-30
驾驶过程中的导航、娱乐、周边搜索等,动动嘴就行了

据市场信息服务公司J.D Power and Asscciates的调研数据显示,56%的用户更倾向于选择声控的导航体系。但纵观整个车载市场,大多数厂商依然围绕导航为核心或者局部语音控制,这种系统在车辆行驶过程中存在连续性操作、稳定性差等问题,对驾驶者而言存在极大的安全隐患。

07年成立于英国剑桥的思必驰,是一家为智能硬件产品提供语音交互技术和解决方案的公司。去年10月,推出人工智能对话操作系统—AI OS(Artificial Intelligence Speech Operating System),很好地弥补了传统语音交互在自然语音和语言交互上的缺失。

AIOS 系统让车载智能硬件从“听话”到“懂话”

思必驰研发的AIOS 是一种可定型智能交互中间系统,能够提供完整的语音对话交互逻辑。可运行于主流操作系统之上的操作系统,支持Android、QNX、 Linux、OpenWrt等,内置思必驰先进的智能对话语音交互技术。

在应用场景上AIOS拥有以下三大优势:

1、语意理解 自然交互

基于车载场景下的深度学习的语意计算,并通过基于上下文的环境信息辅助理解,识别率高达95%以上。

同时AIOS特有回声消除算法,能够在识别错误时随时打断并纠正,支持多轮交互和复杂指令的逐步沟通,支持自然语言对话交互。

2、集成语音识别、合成技术

语音识别系统,能够屏蔽车内发动机、路噪等干扰,抗噪性大幅提高。同时其语音合成技术,能够让为用户提供声源个性化定制。

思必驰创始人高始兴告诉创业邦(微信搜索关注:ichuangyebang),目前提供了包括海霞等人的合成语音供用户选择。

3、支持唤醒词定制

AIOS提供唤醒词定制服务,基于实际场景的大数据深度学习开发,唤醒词定制仅需3~4周,在保证误唤醒率极低的情况下,提供非常准确的语音唤醒。

高始兴称,“AIOS在车载市场的应用,不仅仅是体现在对声源的清晰辨别,它的核心在于交互系统的人性化设计,进一步懂话的同时更多的是对话语的理解,它使整个驾驶过程更轻松、更有味道。”

目前AIOS已经集成打电话,导航,周边搜索,音乐,天气,FM收听等诸多功能,基本涵盖日常使用场景的所有交互需求。

高始兴称,AIOS自去年10月推出以来,目前合作厂商已近百家,包括整机厂商及方案商(如易图、威仕特、艾米、诺威达等),合作类型包括了车机、智能后视镜、HUD等。2016年,AIOS将开发用于智能家居、机器人等的应用版本。

语音交互技术是智能汽车产业落地的重要一环

众所周知,语音交互技术是实现智能汽车落地的重要环节之一,车载环境下,语音识别有着无法替代的优势。

在人机交互过程中,尽可能减少对驾驶员注意力的消耗是汽车智能化的必要标准,而成熟的AI技术将意味着人与物之间的交流非常顺畅。

思必驰AIOS系统在车载硬件中的应用,让语音交互实现从“听”到“懂”的质变,降噪、声源识别、语音即时打断更正等技术的加入,驾驶过程中人机交互更具人性化、趣味性。

据高始兴介绍,AIOS的设计不仅仅是从用户的角度来打造更好的人机交互体验,对于开发者而言,上层应用运行于AIOS之上,只需实现对应领域的抽象接口上,即可快速拥有系统级的统一语音对话交互能力。高兴始称,这样以来,AIOS能有效缩短开发者的时间,提高开发者效率并降低开发成本,同时允许开发者依需求任意定制UI。这将对加速汽车智能化普及起到推动作用。

但高也坦白,目前语音交互技术在汽车智能化进程中仍然面临一定的挑战:

1、降噪技术:

驾驶过程中难免伴随发动机声噪、路噪、音噪等,语音识别在驾车环境的抗噪问题仍是一个痛点。高称,目前思必驰AIOS已经能很好地解决这个问题。

2、声源定位:

对声源角度的判断,这需要的不仅仅是软件层面,也需要硬件、模组方面的技术来解决声源问题。

3、产品设计层面的逻辑关系方面:

智能车载硬件的麦克风、喇叭、结构布局和录音收音效果的关系是一个很大的挑战。

其实,实现汽车智能化不仅仅是语音技术方便需要不断完善,主动安全方面同样占据重要地位,尤其对车道保持、防疲劳提醒等技术有更高的要求。

高始兴告诉创业邦(微信搜索关注:ichuangyebang),这是好事,在这一过程中也会加速像思必驰这样的语音交互公司、人脸识别公司等在技术上的创新乃至革新、以及产业化的落地。

从整个市场来看,语意理解虽然还处于初级阶段,但已经达到可用阶段,在智能硬件领域完成控制、搜索等功能将不在话下。高兴始称,未来车载生态一旦建立,车载社交,视频、语音、拍摄沿途风景和视频技术都将陆续实现,汽车的自动化场景应用将更加完善。

未来车联网、汽车智能的渗透率还将不断提升,对人机交互的需求非常大,从发展的角度来看,最专注、最专业的公司将脱引而出成为最终的胜利者。

思必驰在语音识别、语音合成、语义理解、声纹识别、对话管理、音频分析等方面均有深厚技术积累。目前已将语音识别-理解-合成-上下文理解等结合在一起,形成交互闭环。成立至今,先后获得联想、启迪、DCM等知名VC投资,并先后获得剑桥大学商业计划奖、剑桥大学Downing基金、英国政府研发基金、国家电子发展基金、重点科技支撑计划以及各类领军企业基金。