你好,游客 登录 注册 发布搜索
背景:
阅读新闻

科大讯飞胡郁演讲实录:人工智能是这个时代最伟大的魔法师

[日期:2016-11-24] 来源:雷锋网   作者: [字体: ]

雷锋网按:9月份锤子的发布会结束后,科大讯飞股票应声上涨,成为罗永浩相声专场的最大赢家。

这其中有一些运气的成分,但在这种运气之前,讯飞已经做了很多铺垫工作。科大讯飞在2014年就发布了中国的人工智能品牌“讯飞超脑”,在2015年,讯飞超脑在更自然的人机交互、更高效的知识管理和更智能的推理学习上都有了很大的进步,经过2016年一年的努力,讯飞又带了了什么新的进展?

以下是科大讯飞轮值总裁胡郁在科大讯飞年度发布会上的演讲,雷锋网(公众号:雷锋网)有删改。

 

 

人工智能在将来的5到10年,就像我们现在的水、电和互联网一样,在我们的生活中成为我们的必需品。我们看到其实人工智能已经要改变我们很多的方面,比如说我们人机交互方式,人与人之间交流的方式,出行的方式,教育、医疗,改变我们很多的方面,毫不夸张的说,人工智能是这时代最伟大的魔法师。

今年,我们给大家带来了什么黑科技呢?下面就让我们来一一呈现一下。

去年12月21号的(科大讯飞年度)发布会上,我们发布了在世界上具有引领作用的AIUI。人和机器的交互中最重要的一点是什么?是输入信息。当你们要聊天的时候,你们第一个想到的是要输入,在2010年,讯飞的第一次互联网的发布会上,我们就发布了讯飞语音输入法,从此引领了整个中国在手机输入法方面潮流。在过去的6年过程中,我们可以看到我们的输入法已经拥有了超过了4亿的用户,每个月月活超过了一个亿。而且,我们现在也使我们在手机上(语音)输入的速度达到了一个极致的速度——每分钟400个字,而且最近我们的输入的准确成功率已经达到97%——当然了,这不是我说的,这是我们今天在座的一位贵宾锤子科技的创始人罗永浩同志前段时间给大家亲自展示的。

但是,我们将进入一个新的时代,我们进将进入物联网时代,在万物互联的时代中,是不是还是所有的情况下,我们都可以在智能手机上这样输入呢,手机是不是万物互联中间唯一的我们接触到的终端呢?

其实我们可以看到,随着我们进入到万物互联的时代,我们和电视机、智能家电、车载产品、机器人、玩具之间面临着许多新情况,比如说,我们在跑步的过程中我们需要和我们的耳机亲密的交流,很多情况下我们甚至看不到屏幕;你跟你的机器人谈的过程中,很多时候它是没有屏幕的。更多的时候,我们不仅仅需要输入文字,可能还需要输入图像。

那么在万物互联的时代下,我们的输入到底要发生什么样的变革呢?下一种可能到底是什么样的呢?

一、输入法

下面就请我们拥有4亿用户的手机输入法的产品经理大人,我们略显羞涩的小帅哥翟吉博给大家展示一下在物联网时代输入的魅力,有请。

雷锋网按:翟吉博登台,演示了拍摄识别手写的一段文字(原理是OCR,光学字符识别),文字为“我现在有点紧张,发布会结束后,我晚上请大家吃饭”,系统全部识别出来了;并且通过手势识别等体感技术在“晚饭”前添加了时间。

接下来完成了一大段语音输入,并且通过语音去精准修改了其中一部分内容。在改动其中一个人名之后,系统自动把其余地方出现过的人名也作了修正。

那么让我们来看一下刚才在我们展示的万物互联输入法过程中,我们到底用了哪些的核心技术?首先得益于我们讯飞在世界上最领先的离线手写输入的引擎,我们现在可以让各种各样的智能设备识别我们手写下的文字,同时,在没有触摸屏的情况下,用上帝赐给我们的自然的双手,完成了我们完整的输入过程,再结合上我们语音的输入的快捷性,可以看到,在万物互联的时代,将来你面对你的电视机、机器人、玩具、VR设备,我们都可以采用这种方式实现我们输入的功能。

二、语音转文字

刚才我们看到了,其实,人工智能改变了我们和机器之间的交互,特别是输入,那么机器人工智能,将怎么改变我们人和人之间的交流呢?我相信大家在这场发布会上全程都已经注意到了,自去年12月21号,我们首次在国际上展示了我们同屏的语音转文字的技术以后,应该讲这几年来我们发展非常快。

最新一年,我们又取得了哪些进展呢?我们可以看到在这个过程中,我们的输入的准确率应该讲更高了,我们的输入的反应速度更快了,不知道大家要注意到没有,在跟前一年的相比,我们整个字(符)出现的时间要比原来更便捷,在线的这种情况下那么我们的系统可以达到97%的正确率,在离线的机器上现在也能做到95%,应该讲这是一个非常高效的系统。

那么不仅仅在系统性能上,我们得到了很大的提高,针对不同的行业我们做了大量的定制工作,大家在屏幕上看到的一种是可以直接装在您的会议系统机架上的专业的工控机,它不仅仅可以提供会议记录的功能,而且它能够对话角色自动的进行分离;另外一种,就是我们在外出办公的时候用的一个便携式专用听写笔记本电脑,那么现在你带着他可以实现会议纪要的及时出稿。

我们在很多的行业进行了深度的定制,举个例子,在公安司法方面,那么我们跟最高法进行了深度的合作,那么现在的庭审记录用我们这套系统可以极大地提高庭审效率,那么我们可以把整个庭审的效率提高30%以上,原来做一项庭审需要3个小时的时间来处理庭审结果,现在只需要5分钟;原来一个上午能处理3个案件,现在一个上午能处理5到6个案件,应该讲极大的提高了效率。现在包括中央办公厅、国务院办公厅、最高法、最高检和中央宣传部都采用了我们的会议听见系统,类似这样的定制的系统已经越来越多的用在这各种各方面的行业用上。

三、翻译

今年我们还有一个非常大的变化,所有的听写的结果是为了便于大家之间的交流,那么我们的交流不建议于在我们中国的国内这些同志之间,国际友人间也非常需要交流,在我们出国旅游的时候,我们要需要实时地和国际的友人进行交流,那么今天我们也带来了科大讯飞的一个真正的黑科技,给你一个小型的设备,你就可以随时利用科大讯飞的听见便携翻译机和我们的国际友人进行互译,现在支持中英维三语。我们请一位漂亮的国际友人上台和我们一起分享一下,这个创新性产品的精彩之处。

雷锋网按:胡郁和一位国际友人在分别讲中文和英文的情况下完成了对话,他们手中的小型设备可以实时地把胡郁的中文翻译成英文,又把对方的英文翻译成中文,速度很快,几乎没有什么延时。

4月26号,习近平总书记去视察特大讯飞的过程中还专门的鼓励我们要真正能够把语音翻译做到一带一路和我们海上丝绸之路的建设中间去,那么现在我也高兴地告诉大家,作为安徽省援疆项目的一个重点,现在我们的中维的翻译系统已经非常好的服务于我们现在很多援疆干部与现场的维族同胞之间的交流上。

告诉大家一个好消息,经过这么多年的发展,我们也推出了讯飞的实时的网上的服务系统,通过网站和APP的形式给大家来提供服务,大家只要把你的各种格式的语音音频文件传输到我们的网站或者APP上,你就可以得到精确准确的文字结果,而且它后面还提供人工服务的功能——对于一些质量确实有很大问题,短时间内机器解决不了的录音,我们也可以用人工种包的服务帮你来解决。我们相信,那么通过讯飞听见,我们所听既所见,而且让我们的沟通无国界。

四、智能家居

这两年特别热的一个概念是什么?智能家居。我们去年推出了AIUI,使智能家居的这种设备更好的能够与我们进行交互,我们已经有超过3000家的合作伙伴,这3000多家厂商已经推出了1000多种各种各样的产品,有台灯,有机器人,也有智能家电,有各种各样的设备,在这个过程中,最重要的是电视,可以看到在讯飞推出电视的这个产品——我们叫讯飞电视助理,现在已经占据了整个市场80%以上的市场份额,所有的著名的电视品牌的厂商,包括我们的机顶盒厂商,包括我们的运营商和广电,都与我们建立了非常紧密的合作关系。

我们刚才提到的交互技术融汇了我们多年以来在这个领域深度的一种积累,我们可以看到语音的识别率已经超过了97%,而且关键是它响应速度,很多人一开始看到这演示的时候,会说整个的识别和处理是不是就在机顶盒上进行,但是我可以非常确定告诉大家:整个过程都是在我们的云端进行处理的。更加神奇的地方,大家可能注意到了,不管是对其中电影名还是演员还是其中各种细化的内容,我们的语音都可以进行紧密的结合(雷锋网按:比如这首歌很好听,叫什么名字;我要看“今年”的喜剧电影),这其实给我们揭示了将来语音搜索的一种概念,那么针对家庭场景的语义,我们做了将近1万种的各种不同的设计,而且它还在不断持续增长过程中。

大家都知道,我们所有人在用智能设备过程中,不是为了体验,而是使用语音操作,我们不是为了便捷,我们是为了享受后面的不断的资源、服务,还有各种各种的应用,那么现在的整个讯飞的电视语音助手,有非常丰富的应用和海量的内容,它不仅仅可以检索后台的上千万部的刚才看到的影片,还可以对接到我们现在的商城,可以在上面进行购物,甚至你可以在上面叫一个肯德基,这一切都为我们将来自然的家庭生活打开了一个新的窗口,可以看到电视机只是一个展示类型而已,那么将来我们在智能家居里面,我们在VR上,我们在各种各样的智能家电,都可以实现类似刚才的操作,可以说,我们的智能家庭不仅更懂你,而且更懂生活。

五、自动驾驶

刚才讲过了,智能家电是我们生活中一个非常必备的情况,但是,最近最热的是什么,也是我们中国人现在富起来的标志,就是我们的汽车,我记得我在2004年去德国的柏林的时候,我非常惊讶于德国柏林满头整个街上都是大大小小汽车,但是现在我们看可以看到,我们中国的汽车只会更大,不会更小,只会更多,不会更少,但是当前的汽车其实也面临很大的变革,共享经济、锂电池和新能源电池给,尤其是自动驾驶,为我们汽车带来了更多智能更多机器人的感觉。

但是有一天,李德毅院士曾经跟我说过说,如果有一天,我们的汽车都自动驾驶了,以上去以后它自动就开了,默无声息,你不会觉得瘆的慌吗?我后来一想确实很有道理,那么,汽车是不是应该跟我们进行交流呢?如果你上一辆自动驾驶汽车,它说hi,今天你要去哪里?也许这样的感觉更好,那么在过去的10年过程中,我们用我们的智能语音技术,和很多的汽车厂商建立了非常紧密的联系,特别是科大讯飞的AIUI发布以后,现在全世界有30多个国内外厂商和我们建立联系,超过100个车型现在正在用我们的讯飞语音交互技术。

那么在这些过程中,最近3年包括奔驰、雷克萨斯、大众、通用,他们都在世界上进行了关于中文的语音交互的这么一个测试,每一次科大讯飞都能够拔得头筹。在这个基础上我们瞄准了汽车里面的应用,我们最新推出了基于AIUI的车载交互系统飞鱼,它有一些非常突出的功能,第一个就是降噪,所以我们现场没有汽车的噪声,但是,我们可以看到在已装机的上百万台的车里面,我们都提供了非常高质量的语音识别的效果,所有的过程都是非常的自然,不需要再去按键,或者是口头的打断,如果你想打断汽车的说话,随时可以,这就让我们有非常自然的用户体验。更加重要的是我们在整个全场景上进行了深度的整合,相比去年我们的AIUI的系统我们可以看到今年,我们车载系统跟系统的深度整合又上了一个新的台阶,围绕在车载环境下的主要的8项功能:包括智能导航、在线娱乐、故障提醒、车身控制,所有的这些功能都进入了深入的调整,针对我们现在整理出来的100多项的汽车生活的场景和500多项的汽车业务属性,我们进行了多达5000多种不同参数的语义层面的整合。

我们在各个方面包括我们的知识图谱方面的工作很好地支撑我们和各种业务上的这种标志性单元,这种概念的融合的处理,这也标志着我们的深度神经网络用于自然源处理其实达到一个非常高的高度。我们刚才在家庭里面看到的一样,那么其实,我们的飞鱼助理不仅仅是为了让你体验这种美好的用户感觉的,更重要的是我们在车里面到底需要什么?为了让我们的车里的生活更加丰富多彩,我们和中国移动、网易、携程、大众点评、美团建立了深度的连接,在你在车里面可以随时谁地用这些服务。

六、机器人

那么应该说刚才,在庆峰的报告中也提到了我们的工作正在越来越多的被机器人所代替,那么这两年我相信一个最热的领域是机器人领域。我有一个好消息和一个坏消息,好消息是我们不断的用我们的技术促进了我们现在服务机器人在语音交互方面的能力,相信在座的今天来的各个机器人创业公司小伙伴一定非常高兴。那么坏消息是什么呢?坏消息就是,根据德勤的分析报告,我们的越来越多的工作机会将会被机器人所代替,这已经是个不可逆转的发展趋势,那么现在的科大讯飞的AIUI系统已经支持超过3000家的合作伙伴,各种各样的活动伙伴,他们用我们的语音交互在各种各样的服务里面进行合作,但是我要提醒大家的是所有的服务机器人都需要一个客户服务的功能

在过去的十几年过程中,我们语音最大的一个应用就是用在客户服务,大家已经感觉到越来越多的银行、电信,他们后台的呼叫中心已经被替换成机器自动服务,在过去的十几年过程中,我们可以看到科大讯飞针对1万种的语音自动服务的产品进行了优化,而且我们现在已经占领了80%以上的市场份额,每日接听电话的数量达到了200万次,并且我们还节省了25%的人力开销,那么利用这种非常先进的客户服务的能力,跟我们刚才讲到的AIUI的系统和各种智能服务机器人的组件进行结合,我们也推出了最新的服务机器人:营业厅服务机器人,就是我们的晓曼骑士。

不要看晓曼机器人这个名字里面有个小字,他的名头可挺大的,在4月26号,他也受到了习近平总书记的亲自接见。这是我们打造的一个服务机器人的标杆,它能够给你进行自由的对话,它能够识别你的身份。在核心技术方面,科大讯飞已经用我们自身的技术力量和整合力量,为所有的服务机器人能够提供一个很好的交互平台;在渠道方面,因为科大讯飞在银行、运营商、教育领域有非常强的渠道,我们也非常乐意和我们的机器人的合作伙伴一起为各种各样的场景打造不同形态的机器人;在资本层面,科大讯飞其实也在进行一些战略方面的布局和投资,已经和政府层面上进行联合的战略布局。

我们相信,将来的大家还注意到,其实我们的展台上也有各种各样形式的机器人,我相信将来我们在不同场合我们所需要的机器的形态是完全不一样的,俗话说萝卜青菜各有所爱,每一个人,每一个单位都能够找到自己最心仪的机器人的形态,那么我们坚定地相信,科大讯飞一定能为每一个机器人,提供一颗AIUI的大脑。

七、教育

那么讲完了机器人,我们回到我们主要的一些运营的行业,教育。去年我们12月21号的发布会上,我们发布了讯飞超脑在认知计算,在自动阅卷方面的进展以后,最近一年,我们应该讲好讯连连,首先看一下英文的作文,我们都知道原来传统英文老师,因为作业非常难以批改,一般一个月才布置一次,而且每一次他只能给你一个分数,并不能给你细致的指出英文作文里面有哪些点你做的事不好的,但是利用我们讯飞超脑的自动作文评阅系统,我们现在可以对不同的类型的错误都能给你指出来,而且给你一个精确的评分。对于中文其实也是一样的,那么对于中文的作文,我们也可以把里面详细的内容,都给你指出来。

这个教育系统的表现形式很多样,但是总体的原则就是通过在学习过程中采集信息,对学生的学习状况进行自动化评测,分析盲点弱点,从而做个性化的题库推送给学生,获得因材施教的结果。这样一来,教学的销量提高30%,学生作业负担下降40%。我们和很多学校都达成了合作。

我们可以看到,声音将会带来我们的生活带来不一样的感觉,每一天的变化都会促进变革。

科大讯飞的使命就是让机器能听会说、能理解会思考,板凳能坐十年冷,厚积薄发,我们希望能用中国的核心技术,结合中国现在的优势,抓住国际产业变革的千载难逢的机会,用我们的技术和创业热情,用人工智能改变人类社会。

收藏 推荐 打印 | 录入:admin | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款