你好,游客 登录 注册 发布搜索
背景:
阅读新闻

阿里巴巴10万字巨著写双11背后的故事,揭秘6大人工智能技术

[日期:2017-01-04] 来源:新智元  作者: [字体: ]

  【导读】阿里技术团队的新书《不一样的技术创新--阿里巴巴2016双11背后的技术》近日面世,第7章——人工智能包含以下内容:基于深度强化学习与自适应在线学习的搜索和推荐算法研究;颠覆传统的电商智能助理-阿里小蜜技术揭秘;深度学习与自然语言处理在智能语音客服中的应用;数据赋能商家背后的黑科技; 探索基于强化学习的智能推荐之路;DNN在搜索场景中的应用。新智元获授权后带来第7章全部内容,带你深入了解阿里巴巴人工智能技术实力。

  2016年12月28日,经过3个月的精心策划和准备,阿里技术团队的新书《不一样的技术创新--阿里巴巴2016双11背后的技术》最终呈现在大家面前。这27篇共计10万余字凝聚了阿里工程师的智慧和创造力的的技术干货,在2017新年到来之际终于面世。

  此书全面阐述阿里双11背后的技术实践与创新,包含基础设施、存储、中间件、云计算、业务架构、大数据、认知计算与人工智能、交互技术及安全等技术领域。

  全书目录

  第一章 基础设施

  1.1 万亿交易量级下的秒级监控

  1.2 双11背后基础设施软硬结合实践创新

  1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的

  第二章 存储

  2.1 永不停止的脚步——数据库优化之路

  2.2 AliCloudDB--双11商家后台数据库的基石

  第三章 中间件

  3.1 万亿级数据洪峰下的分布式消息引擎

  第四章 电商云化

  4.1 17.5W秒级交易峰值下的混合云弹性架构之路

  4.2 集团AliDocker化双11总结

  第五章 业务架构

  5.1 内容+:打造不一样的双11

  5.2 双11交易核心链路的故事

  5.3 千亿访问量下的开放平台技术揭秘

  5.4 智慧供应链

  5.5 菜鸟双11“十亿级包裹”之战

  第六章 大数据

  6.1 双11数据大屏背后的实时计算处理

  6.2 双11背后的大规模数据处理

  6.3 突破传统,4k大屏的沉浸式体验

  第七章 人工智能

  7.1 基于深度强化学习与自适应在线学习的搜索和推荐算法研究

  7.2 颠覆传统的电商智能助理-阿里小蜜技术揭秘

  7.3 深度学习与自然语言处理在智能语音客服中的应用

  7.4 数据赋能商家背后的黑科技

  7.5 探索基于强化学习的智能推荐之路

  7.6 DNN在搜索场景中的应用

  第八章 交互技术

  8.1 VR电商购物

  8.2 淘宝直播在双11的互动实践

  8.3 2016双11前端突破

  8.4 Weex 双11会场大规模应用的秒开实战和稳定性保障

  8.5 双11晚会背后的技术

  点击文末“阅读原文”,可查看全书内容。

  第7章——《人工智能》(部分)

  1.基于深度强化学习与自适应在线学习的搜索和推荐算法研究

  作者:灵培、霹雳、哲予

  淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应,而淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性。因此,要让搜索引擎对不同特点的用户作出针对性的排序,并以此带动搜索引导的成交提升,是一个极具挑战性的问题。传统的Learning to Rank(LTR)方法主要是在商品维度进行学习,根据商品的点击、成交数据构造学习样本,回归出排序权重。LTR学习的是当前线上已经展示出来商品排序的现象,对已出现的结果集合最好的排序效果,受到了本身排序策略的影响,我们有大量的样本是不可见的,所以LTR模型从某种意义上说是解释了过去现象,并不一定真正全局最优的。针对这个问题,有两类的方法,其中一类尝试在离线训练中解决online和offline不一致的问题,衍生出Counterfactural Machine Learning的领域。另外一类就是在线trial-and-error进行学习,如Bandit Learning和Reinforcement Learning。

  在之前我们尝试了用多臂老虎机模型(Multi-Armed Bandit,MAB)来根据用户反馈学习排序策略,结合exploration与exploitation,收到了较好的效果。

  后来更进一步,在原来的基础上引入状态的概念,用马尔可夫决策过程对商品搜索排序问题进行建模,并尝试用深度强化学习的方法来对搜索引擎的排序策略进行实时调控。

  实际上,如果把搜索引擎看作智能体(Agent)、把用户看做环境(Environment),则商品的搜索问题可以被视为典型的顺序决策问题。Agent每一次排序策略的选择可以看成一次试错(Trial-and-Error),把用户的反馈,点击成交等作为从环境获得的奖赏。在这种反复不断地试错过程中,Agent将逐步学习到最优的排序策略,最大化累计奖赏。而这种在与环境交互的过程中进行试错的学习,正是强化学习(Reinforcement Learning,RL)的根本思想。

  本文接下来的内容将对具体的方案进行详细介绍。

  2.颠覆传统的电商智能助理-阿里小蜜技术揭秘

  作者:海青

  阿里小蜜是电子商务领域的智能私人助理,基于阿里海量消费和商家数据,结合线上、线下的生活场景需求,以智能+人工的模式提供智能导购、服务、助理的拟人交互业务体验。

  在跨终端、多场景领域支持多轮交互、多模交互(文本、语音和图像)和问题推荐预测;

  支持多模型(文本模型、客户模型、语音识别和图像识别)识别客户意图;

  支持多领域识别和路由分流;

  阿里小蜜整体体系图如下:

  通过1年多阿里小蜜在阿里业务体系内的不断尝试和摸索,今年在电子商务生态圈范围内,在基于千牛的买卖家生态圈、基于钉钉的企业生态圈上,我们将阿里小蜜进行平台化开放,同时赋能给我们商家和企业用户。未来我们期望通过不断的领域数据和技术模型的积累,能够在阿里其他生态圈(例如:阿里云)逐步进行开放,赋能更多电子商务生态圈领域。

  阿里小蜜平台结构图如下:

阿里小蜜在各个领域系统示例截图:

  3.深度学习与自然语言处理在智能语音客服中的应用

  作者: 余慈

  95188电话的支付宝热线目前已经用纯语音交互流程全面代替了传统的按键流程,这个我们称之为“蚁人”的智能语音客服会根据用户的描述判断用户的意图,从而为不同需求的用户提供快速的直达服务,或者直接推送自助解决方案,或者发现是属于紧急问题而直接转给对应业务线的人工客服处理。智能语音客服流程目前日均处理话务占整体话务数的91%,覆盖上百类业务线以及上千类问题,以超过70%的问题识别准确率日均成功为客服分流话务上万通,极大节省了客服人力资源,缩短话务高峰期的用户等待时间,提升了用户体验。在双11当天蚁人处理超过20万通电话,为双11业务提供强有力的支持。

  蚁人流程的交互如下:

  用户拨打95188,按1进支付宝

  系统会提示用户用一句话描述所遇到的问题

  用户在电话里描述他(她)想要解决的问题,比如支付宝密码忘记了等

  系统会把用户语音输入转成文本,然后调用问题识别模块

  对话管理模块(DM)根据识别结果有不同的路径:

  识别出用户要求人工客服,或者需要人工处理的业务类(例如安全问题),就会转到所对应的业务线的客服处理。

  识别出的业务可以自助解决,系统就会播放TTS给用户:“我想您遇到的问题是XXXX,请说’正确’,或者’错误’”。

  识别失败,会进入多轮交互流程,进一步向用户提问并获得回答以帮助问题识别。

  系统识别用户在确认阶段的反馈,如果用户肯定了问题,就会推送自助方案到支付宝手机端,并提示用户。如果用户否定,那么会把用户转到人工客服处。

  智能语音客服的核心功能是根据与用户的交互信息判断出用户的来电目的,也就是交互步骤#4中的问题识别模块。问题识别模块允许通过与用户的多轮交互来更准确地判断用户所遇到的业务问题。引入多轮交互流程因为,如果用户只有一次描述问题的机会,下列几个因素的影响往往会导致单轮问题识别无法做出准确的判断:

  智能客服的意图判断引擎是基于文本的,而现有的语音转文本技术的字错误率基本上高于10%,特别是对于一些环境噪音比较大的电话语音数据,ASR识别错误会比较大地影响单轮问题识别模型的准确率。

  用户的表达能力差异化。部份用户难以一次性地准确,完整地描述他(她)的意图,信息量的不足会使得单轮问题识别模型的识别困难。

  即在有很人性化的引导语的情况下,现有系统的统计数据证明仍然有相当大比例的用户(约30%)在面对机器人客服时仍然以“喂”,“你好”等传统对话方式开始交互, 而不会按系统引导语的提示来描述意图,导致无效描述。

  我们训练了3个DNN,它们之间互相协作来完成整个问题识别流程:

  单轮交互问题识别模型:以用户的初始问题描述(如“我的支付宝账号登录不上去了”)为输入执行分类任务,分类目标是1000个业务问题。

  多轮交互问题识别模型:以与用户的全部对话数据(如“用户:我花呗开通不了啊”,“系统:您是卖家吗”,“用户:是的”)为输入执行分类任务,分类目标与单轮交互问题识别模型相同,也是1000个业务问题。

  问题预测模型:当问题识别结果的置信分不高于设定的阀值时,系统会认为用户描述信息量不足,问题预测模型就会从问题库里挑选出对分类最有帮助的问题向用户询问,并收集用户的回答用多轮交互问题识别模型来再次判别。

  4.数据赋能商家背后的黑科技

  作者:空望

  1)实时偏好识别

  服务市场的用户访问频次低,识别用户的实时偏好有助于更准确的匹配用户需求。实时偏好包括实时商品偏好和实时类目偏好两个维度,使用时间衰减累计+用户实时访问反馈调整的方式来构建用户实时偏好模型。在实际使用时,根据历史累计的数据选取TopN产生实时偏好。

  2)匹配召回

  服务市场搜索召回面临问题:搜索无结果、搜索结果相关性不高以及搜索结果不够优质。针对上述问题,使用核心词抽取和query扩展对原query进行语义分析和补充。包括:基于语义embedding对搜索词进行自适应分词和向量化表示;为保证核心词与原query语义相似,综合语义单元的类目分布熵、与原query的邻接熵,与原query类目匹配度进行核心词抽取;为了扩大query召回,根据用户搜索补充了与原query相关的其他搜索核心词。补充后的搜索词大幅降低了搜索无结果率,搜素点击率和转化率也得到明显提升。个性化推荐召回以实时商品偏好,实时类目偏好,近期搜索,历史订购商品为基础,配合相似商品,搭配商品,类目优质商品进行扩大召回,从而构建个性化推荐的优质多样的商品池。

  3)模型排序

  个性化推荐的模型排序部分负责对召回的商品池结合当前商家店铺和商家行为特征进行个性化排序针。对特定的排序模型组装合适的模型特征(包括单一特征,组合交叉特征,以及ID类特征等),然后根据CTR/CVR模型生成预测分数;同时结合商家订购服务的特点,以及推荐多样性等策略的考虑,对分数进行重排。

  5.探索基于强化学习的智能推荐之路

  作者:朱仙

  基于强化学习的全链路优化

  在第一阶段的工作中,我们基于传统监督学习建模的方式,在一定程度上提升了单一场景的引导成交和客单价。但总体上来讲,模型上仍然不够优雅智能,用户在成交链路上的行为序列特性并没有在模型上体现。

  事实上,在电商的个性化推荐中,存在一条典型的交易链路,它能基本刻画一个用户完成一次购买行为所经历的路径环节。比如用户在首页闲逛时可能会对某个商品发生兴趣,然后点击进去查看商品的详情,或加购、或收藏;当用户下定决心购买后,会到达付款完成页,之后又可能会查看订单详情、物流信息等,直到最后确认收货。

  这些页面都有相应的推荐场景,在购买前通过推荐辅助促进用户的决策过程;用户完成某个宝贝购买后,全力捕捉用户的购物热情,继续通过合理的推荐让用户继续购买更多的宝贝。整个交易链路的核心就是最大力度的引导用户成交,实现全链路成交的累积最大化。

  所以我们就继续考虑能否采用类MDP的方式,进行更为合理智能的全链路优化建模,即在用户每一个当前的链路状态,推荐引擎可以依据一定的策略,输出相应的推荐行为,然后根据用户的反馈交互,对策略进行迭代更新,从而最终逐步学习到最优的推荐策略。换句话讲,也就是强化学习的建模优化思想。

  然而与搜索等场景不同的是,商品的个性化推荐对用户来讲是一个“Soft Need”,很多时候购物的目的性并不是非常的明确。一个宝贝的成交,可能会跨多天,决策周期较长。并且在购买决策的过程中,用户会经常性的在多个异构的推荐页面场景中进行跳转,情况也较搜索更为复杂。

  6.DNN在搜索场景中的应用

  作者:仁重

  搜索排序的特征分大量的使用了LR,GBDT,SVM等模型及其变种。我们主要在特征工程,建模的场景,目标采样等方面做了很细致的工作。但这些模型的瓶颈也非常的明显,尽管现在阿里集团内部的PS版本LR可以支持到50亿特征规模,400亿的样本,但这对于我们来说,看起来依然是不太够的,现在上亿的item数据,如果直接使用id特征的话,和任意特征进行组合后,都会超出LR模型的极限规模,对于GBDT,SVM等模型的能力则更弱,而我们一直在思考怎么可以突破这种模型的限制,找到更好的特征;另外,及时LR模型能支持到上亿规模的特征,在实时预测阶段也是有极大的工程挑战,性能与内存会有非常大的瓶颈。

 

  所以我们第一考虑到的是降维,在降维的基础上,进一步考虑特征的组合。所以DNN很自然进入了我们的考虑范围。再考虑的是如果把用户行为序列建模起来,我们希望是用户打开手淘后,先在有好货点了一个商品,再在猜你希望点了一个商品,最后进入搜索后会受到之前的行为的影响,当然有很多类似的方法可以间接实现这样的想法。但直接建模的话,LR这类的模型,很难有能力来支持这类特征,所以很容易就想到了RNN模型。

收藏 推荐 打印 | 录入:admin | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款