科大讯飞刘俊峰:智能汽车中的人机语音交互的下一步 - ITS文库 - 智慧交通网 ITS114.COM|领先的智能交通门户网站
  • 首页 > ITS百科 > ITS文库 > 正文

    科大讯飞刘俊峰:智能汽车中的人机语音交互的下一步

    2017-01-09 17:14:01 来源:www.its114.com 评论:
    分享到:

      2016年11月16~18日,由国家科技部高新技术发展及产业化司、国家科技部高技术研究发展中心指导,中国智能交通协会主办、中国汽车工程研究院承办、公安部交通管理科学研究所、重庆长安汽车股份有限公司和北京易华录信息技术股份有限公司协办的“2016’第十一届中国智能交通年会”,在重庆悦来国际会议中心举办,本次大会有100多场演讲,1500余人与会。在17日的智能网联汽车技术发展论坛上,科大讯飞股份有限公司智能汽车业务部总经理刘俊峰发表《智能汽车中的人机语音交互的下一步》的主题演讲,本文为中国智能交通协会提供的速记整理稿,未经演讲者本人审核,特此鸣谢中国智能交通协会。

      刘俊峰:尊敬的各位专家、各位新老朋友,大家下午好!在接下来的时间里,我来给大家介绍下科大讯飞在智能信息化方面的发展。

      最近一段时间,人工智能领域不断有新概念迸发出来,大致是三个概念:深度学习、大数据和人机效应。深度学习算法不断挖掘数据中隐藏的内容和属性;大数据积累得越多,就会为样本量和模型提供更准确的资源;人机效应让算法在还不成熟的时候投入到应用方向,更多的人使用会将算法的精准度进行校正。从计算智能到感知智能,计算智能机器已经比人的计算能力越来越强了。

      感知智能就是给机器装上了眼睛、耳朵让它能听到、看到,感觉到,进一步认识物体以及世界。我们形容一个人聪明就是能听会说、耳聪目明,想得多、有知识、表达到位,而人工智能的趋势就是人在不断进化之中的语言力量。7万年之前,猿人到智人的发展期间是没有语言的。7万年到现在,我们认为自己的祖先都是非洲的智人,语言在其中起了非常大的作用,最初的头上着火、河边有狮子这样的表达,为人和人之间的信息传递形成了基础。女性喜欢八卦,八卦的过程往往是信息传递的过程,而这个过程中的语言就形成了社群。社群最开始的规模可能是几十上百人,然后形成社会,最后发展为国家。

      表达自己的意图和自己做的梦,慢慢地语言成为了人传递文化、传递信息、形成国家的基石。语言是民族的象征、文化的代表,语音交互在人工智能领域是关键的一环。从能听会说到能理解思考,人都是这样形成的,孩子的成长从说话开始,然后逐渐表达自己的意图,逐渐被理解。语音交互已成为全球人工智能产业的焦点,MIT的报告里明确已表明语音交互会变成人机交互的关键。

      很多智能手机上都有讯飞语音助手以及各种定制的输入法,我们在汽车上每年的语音装备量已经超过了100万,还有教育、医疗、法院等等领域。我们希望能够通过语音单点技术解决人机交互不便和信息传递不安全的问题,希望用语音和人工智能解决资源不均衡等等社会问题。

      有人会提讯飞的产业布局非常大,其实是没有办法拒绝任何一个行业对语音交互的需求所致。2011年,全球首发的讯飞语音云平台就是为了解决中小开发者在智能终端APP上进行语音交互、语音朗读的需要,经过6年的发展,终端激活量已经超过了9亿部。不止手机,国内现在70%的机器人语音交互解决方案也都是讯飞提供的。再如医疗、法院的语音解决方案数量已经达到了9亿,中小开发伙伴已经有23万个。这样的数据量和用户语音使用的高频度,使得讯飞的帐户系统逐渐累计起来。而且从英语到中文,再到印第语,讯飞的算法都是顶尖的。

      2013年迄今,宝马、奔驰、大众、丰田等自主品牌和国际厂商在算法精准度以及优化方面已经形成了更好效果的快速迭代基础技术。口语翻译很难做得十分精确,2014年的英中翻译比赛,美国拿了冠军。2015年的中英语音翻译,这个原来日本是世界第一的项目,最后还是我们得了冠军。

      怎样在复杂环境下让机器能够听得清说话,陈教授带回来的核心技术经过研究院不断优化迭以后,可以保证任何人都可以清楚地被听见。我们还参加了由谷歌承办的全球性前端算法的比赛,事实上让机器听见、听懂,基本技术已经完全具备了。

      我们提出了两大产业发展战略,其一是移动终端,以键盘和触摸为主的人工交互时代一定会到来;其二是人工智能技术,各种大数据智能学习技术一定会像语音一样,很方便的使用到,真正地改变生活,改变世界。汽车已经成为家、公司之外的第三较长时间的生活空间,而未来的汽车一定会联网化,会跟家和工作环境形成互联关系。生活是连续的,我们现在在尝试把车与家里、办公室的设备如空调连接起来,同步信息,这样会给汽车带来更深的智能化。

      在注意到智能网联针对自动驾驶的描述时,很多人都会忽略人车交互的问题。未来自动驾驶的车辆上,硬按键已不符合需求,通过触摸屏或者手机发送命令,让汽车像人一样来服务。人是服务的中心,真正要服务好人就要做好人机交互,让智能车有更多的使用价值和社会价值。

      车的感知越来越灵敏、越来越理解人、越来越聪明、越来越贴心。这样一个设备应该存在在两个虚拟角色,一个司机和一个管家或者秘书。工作10年的秘书对你的熟悉程度是很深入的,你说要吃饭他会找你熟悉的地方。这样的秘书正是我们希望利用讯飞在云计算、大数据、用户理解的基础上逐渐实现的。现在很多交通事故发生的根源在于分心,可能是你打电话、玩手机或者按了FM导致的。在中国的环境下,我对于全场景无人驾驶汽车还是保持谨慎态度,但在这个国家里,可以先解决人车交互的安全性和智能性问题。

      国内对于项目管理和产品的落地一定会越来越重视,我们希望通过十几年在汽车语音交互领域的经验真正做出让用户舒适的产品。我们最终实现了,产品在现在也量产了。现在研究车上的用户行为,慢慢转化车内语音交互的关键点,用户的小事都可能是大事。

      用户在车上用两步就能找到一首歌,一个电台,或者查油量是否合理,是否有安全隐患。不能让用户学机器说话,用工程师的思维按层级,结构式地对车讲话。用户用的一定是自然语言,而自然语言的程度取决于算法的强弱。

      在显示搜索结果时,列表会有很多属性和信息,这些属性和信息受很多条条款款的限制,现在我们打通了一些应用方和搜索结构的限制。为了满足个性的用户需求,保证交互界面可以接受自然语言,我们打通了很多内容服务商,进行大数据合作,大数据既包括车身数据还包括用户数据。这样的汽车可能需要5-8年才能出来,2016年之前推动语音服务,2017年实现主动交互。

      我们希望在汽车上的交互能让你感觉到像真正的人一样,谢谢大家,讲的不好多多担待!

  • 关键字: 科大讯飞 智能汽车
  •    责任编辑:逐梦女孩
  • 每周新闻精选

  • 关于我们
  • 联系我们
  • 广告赞助