你好,游客 登录
rss订阅 手机访问 
语音识别
业界 | 最初语音识别率只有60%,如今坐拥5亿用户,这款AI产品是怎么做到的?
很多人说,相比技术人员的匮乏,人工智能领域更迫切需要新型产品经理。进而我们也开始琢磨,什么才是人工智能产品?启动一个 AI 类产品必要因素有哪些?新型产品经理必备的素质是什么?技术之外,那些被我们忽略的挑战又是什么?如何用产品创新跑赢技术变迁速度?
日期:今 19:07 作者:
学界 | 批训练、注意力模型及其声纹分割应用,谷歌三篇论文揭示其声纹识别技术原理
声纹识别技术在谷歌的诸多产品中有着重要应用。除了安卓手机目前所独有的声纹解锁功能外,谷歌的家庭语音助手 Google Home 也能通过声纹识别支持多用户模式,从而针对不同用户提供个性化服务。当你向 Google Home 查询自己的日程时,Google Home 会根据声纹判断出是你,而非其他也可能使用该设备的家庭成员在进行查询,并从你的日历中提取数据。这种多用户模式,是 Amazon E...
日期:11月09日 作者:
学界 | 新研究将GRU简化成单门架构,或更适用于语音识别
Yoshua Bengio 领导的一个团队近日在 arXiv 上发布了一篇论文,介绍了他们通过修改门控循环单元(GRU)提升语音识别效果的研究进展。据介绍,这项研究是修改 GRU 方面的进一步研究进展,提出了一种可能更加适合语音识别的架构。机器之心对本论文进行了摘要介绍。另外,本研究相关的实验代码也已发布在 GitHub 上。
日期:10月09日 作者:
【Python成为高收入国家增长最快的语言】开发者生态系统十大语言
【新智元导读】本文根据Stack Overflow流量分析了Python及其他一些编程语言的发展情况,同时也对高收入国家与非高收入国家的情况进行了对比。英文原文来自stackoverflow.blog,以下是译文。
日期:09月18日 作者:
机器学习原来如此有趣:如何用深度学习进行语音识别

语音识别正在 「入侵」 我们的生活。我们的手机、游戏主机和智能手表都内置了语音识别。他甚至在自动化我们的房子。只需50美元,你就可以买到一个Amazon Echo Dot,这是一个可以让你订外卖、收听天气预报、甚至是买垃圾袋的魔术盒,而这一切你只需要大声说出:
Aleax,给我订一个pizza!
Echo Dot 在2015年的圣诞假期...
日期:09月15日 作者:
【专访微软黄学东】0.1%,0.2%与0.3%,语音识别军备竞赛中小数点差距有何意义
【新智元导读】微软语音识别研究团队在黄学东的带领下,去年将语音识别的单词错误率降至5.9%,又在最近降至5.1%。在本次专访中,我们讨论了语音识别错误率百分之几的小数点在研究和实际应用上的意义。黄学东认为,从研究角度来说,这个意义十分重大,即便是0.1%的差距,无论是运算量还是时间,耗费都是巨大的。
日期:09月13日 作者:
NLP入门之语音模型原理

这一篇文章其实是参考了很多篇文章之后写出的一篇对于语言模型的一篇科普文,目的是希望大家可以对于语言模型有着更好地理解,从而在接下来的NLP学习中可以更顺利的学习.
1:传统的语音识别方法:
这里我们讲解一下是如何将声音变成文字,如果有兴趣的同学,我们可以深入的研究.
首先我们知道声音其实是一种波,常见的MP3等都是压缩的格式,必须...
日期:09月13日 作者:
专栏 | 极限元语音算法专家刘斌:基于深度学习的语音生成问题
深度学习在 2006 年崭露头角后,近几年取得了快速发展,在学术界和工业界均呈现出指数级增长的趋势;伴随着这项技术的不断成熟,深度学习在智能语音领域率先发力,取得一系列成功的应用。本文将重点分享近年来深度学习在语音生成问题中的新方法,围绕语音合成和语音增强两个典型问题展开介绍。
日期:09月12日 作者:
嘈杂环境也不怕!印度智能语音识别应用Liv.ai甚至能将方言转为文本
印度班加罗尔的一家人工智能公司开发出了一款能将语音输出为文本的语音识别应用。
日期:09月09日 作者:
请回答2005:为何它成了中国互联网关键一年?
中国互联网的2005年,在精英和草根之间徘徊,在教堂和市集中摇晃。
日期:09月06日 作者:
语音识别技术里程碑:错误率降至5.1%,超过专业速记员
编者按:语音识别是众多研究团队和企业正在努力攻克的技术高地,有关识别准确率的竞争和比较从未停止。去年,微软率先实现语音识别系统5.9%的低错误率,在Switchboard对话语音识别任务中已经达到人类对等的水平。
日期:09月06日 作者:
语音识别的前世今生 | 深度学习彻底改变对话式人工智能
在过去几年中,人们在人工智能和深度学习领域的突破,让语音识别的探索跨了一大步。市面上玲琅满目的产品也反映了这种飞跃式发展,例如亚马逊Echo、苹果Siri 等等。本文将回顾语音识别技术领域的最新进展,研究促进其迅猛发展进程的元素,并探讨其未来以及我们距离可以完全解决这个问题还有多远。 背景:人机交互
日期:09月06日 作者:
智能语音交互:阿里的研究和实践
云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲。本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出。
日期:09月06日 作者:
谷歌开源语音命令数据集,帮助开发者搭建基础的语音交互
谷歌的工程师们经常被问到这么个问题:
怎么上手用深度学习做语音识别或其它音频识别,比如关键词或指令?
虽然,现在出现了些很优秀的开源语音识别系统,比如 Kaldi,就能把神经网络作为其中的一个模块。但其高度复杂性,让它们并不适合作为解决简单任务的指南。更重要的是,对于新手而言,免费、可公开获取的数据集并不多,经过预处理的、或适合于简单的关键词...
日期:08月25日 作者:
如何利用AI、语言学做出国内首个中文分级阅读系统?
在一批在线教育试水者当中,赵梓淳带领的考拉阅读有点不太一样。
日期:08月22日 作者:
  • 1/14
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • ...
  • 14
  • »
内容分类