你好,游客 登录
背景:
阅读新闻

国际运筹管理专家叶荫宇:相辅相成的运筹学与深度学习

[日期:2017-07-15] 来源:机器之心  作者: [字体: ]

深度学习的快速发展让更多人了解了数学和计算机科学如何能帮助决策,然而实际上,利用算法帮助运营、策略乃至战略层面的决策并不是一个新概念,这是一门在计算机技术之前就已经诞生的学科:运筹学。

近日,机器之心对国际杰出的运筹学专家,美国斯坦福大学管理科学与工程系及计算数学工程研究院的叶荫宇教授进行了采访。叶荫宇教授凭借其在线性规划(LP)、半定规划(SDP)内点算法(Interior Point Algorithms)上的研究获得了运筹管理学领域的最高奖项——冯·诺依曼理论奖,他也是唯一一位获此殊荣的华人科学家。在采访中,我们和叶教授谈了谈运筹学的发展与现状,运筹学和深度学习的关系,以及运筹学在产业中的实际应用。

运筹学,一门关于如何做决策的科学

机器之心:能否简介一下运筹学学科?它专注于解决哪些问题?

叶荫宇:从历史上来说,运筹学就是一门关于如何做决策的科学。从上世纪 40 年代末、50 年代初,二次世界大战之后,美国很多数学家、经济学家开始研究如何将数学应用于实际决策。例如,在第二次世界大战中,战略物资调运问题演变成了运筹学中的运输问题(transportation problem),研究怎么调运最合理、最快、最节省。逐渐地,衍生出了一个叫运筹学(operations research)的学科。

运筹学这个翻译很好,因为学科的本质是关于如何做运营(operations)。企业的决策中有战略(strategy)决策、策略(policy)决策,然而细化到每一天,你必须进行众多运营决策。你需要实际地去调动车辆等资源,规划货物运到哪里,走什么路径等等。这些运营层面的问题又繁琐又复杂,科学家研究,是否有一套科学的方法来帮助人们来制订这一套策略,就形成了所谓运筹的学问。后来随着经济学的发展,研究者发现马尔可夫决策它也可以用来做策略,后来再发展,发现其他内容也可以做战略,例如博弈论。所以运筹学其实包括了很多内容,你去看冯·诺依曼奖的获奖名单,其中有搞经济的、搞数学的、搞工程的甚至还包括 AI 的开创人之一 Herbert Simon。

简单来说,运筹学就是帮助解决实际问题的科学,它是一个比较落地的科学。它不是数学、物理这些基础学科,而是试图将基础学科的结果落地并产生效益的科学。

机器之心:关于决策制定,是不是只要目标得到了很好的优化就意味着我们得到了好的算法?

叶荫宇:构造目标函数本身就是一门艺术,很多问题本来就是多目标的。实际上对于目标效果也有很多判别标准。运筹学也解决一类问题,追求找到帕累托最优(Pareto optimal),即如果想改进一个目标一定要以牺牲其他目标为代价。至少要找到这个标准,才能说找到了一个好的结果。要不然两个目标都可以同时提高,我的结果一定不是最优的。

优化决策从根本上来说还是一个辅助系统,真正的目标还是要管理人员自己来确定。我们为医生提供辅助方案也是这样。因为人的行为不能完全数学化,因此在判断决策的好与坏上,有些问题上机器不能完全取代人。

运筹学与深度学习的双向促进与挑战

机器之心:提到博弈,很容易联想到机器学习中非常热门的一个概念,增强学习(reinforcement learning)。它和运筹学之间有怎样的联系呢?

叶荫宇:Reinforcement learning 是机器学习角度的叫法,它的基础学科其实是马尔可夫决策。在运筹学中,我们将其称为马尔可夫链、马尔可夫过程、马尔可夫决策过程。

一个不断重复的马尔可夫过程,是可以写成线性规划的。线性规划就有对应算法,需要找到平稳策略(stationary policy),给出每个区间里的最优策略。马尔可夫决策又分是跟自然对弈还是跟人对弈,又有零和博弈(zero-sum game)等等。总之,马尔可夫决策过程中涉及了运筹学中非常深的理论,又成为了增强学习最基础的理论。例如,AlphaGo 涉及的价值(value)、策略(policy),都是在马尔可夫决策论中提出的基本概念。价值就是我走这一步后虽然不知道会发生什么,但我期待的价值是多少。我的策略就是根据我现在要采取的行动马上得到的价值加上期待的价值,选一个最优化的。以前运筹学必须掌握所有数据,而深度学习研究了期待的价值到底长什么样子,然后做一个近似马尔可夫决策。增强学习中有一个比较有名的算法叫策略迭代法(policy iteration),这个算法长期以来没有理论上的分析结果,但是实际上有广泛的应用。四、五年前我们给了一个证明,证明了算法确实有效,即在多少步之后一定可以完成。这个工作得了 SIAM 每三年一次的奖。策略迭代法本身已经有四、五十年了,但是从来没有人给证明。现在 AI 也是这样,很多算法非常有用,但是理论上怎么解释,能不能在数学上给一个公理化的证明,还是不确定的。

机器之心:现在用机器学习解决很多问题时,仍然需要根据结果调整参数,而不清楚优化算法的原理。那么,如果有了算法的理论基础,能否更好提升模型的性能?

叶荫宇:我觉得这可以拆解为两个问题。一个是深度学习模型的参数,还有一个是算法的参数。模型的参数控制模型的效果,算法的参数控制如何快速学习到参数。现在两方面都是黑箱。模型方面,直观上来看,增加了层数的模型一定比线性回归效果好。但是除此之外能否总结其他规律?比如把优化问题变成凸规划、非凸规划问题。我们现在的所有算法只能保证收敛到局部最优解,但是为什么效果还是很好?算法方面,除了步长、正则化因子(regularizor)之外,另一个很重要的参数是初始值。因为问题是非凸的,初始解选择决定能否找到比较好的最优解。如果初始解不好的话,你就会被卡在某一个地方,调整不过来。

我觉得,在算法方面,非凸规划如何调整参数还有一些理论可依,在模型方面,现在只能说是一门艺术,科学还解释不了。这个问题还是很重要,因为现在人们经常能看到一些非常好的结果,却忽略了为了将它调整出来在背后所花的一年、好几个月的巨大人力成本。现在算法很快,但是参数调整的时间比解的时间长得多。在某种意义上来说,目前,深度学习这部分还处于比较实证的(empirical)、 实验的(experimental)阶段。每一个模型都非常定制化,只能解某一个问题。我们仍然需要花一些时间,来理解多层神经网络。

机器之心:深度学习非常热,很多做理论的人都去做实践了,您如何看待这种现象?

叶荫宇:我觉得这要看个人偏好和个人能力,理论和实践都很重要。把深度学习的优化算法用于学习过程中解决实际问题也很重要,而选择做理论是要耐得住寂寞的。

比如说刚才我举的例子,策略迭代法在马尔可夫决策过程中非常重要,你给出了一个证明,然而很多做实际模型的人并不在乎,他们会说,你证明不证明我都会用这个方法。这就看你对于这件事情的价值的认知了,对知识分子来说,我们认为给出理论解释的过程是一种脑力乐趣,可能几十年过去后,AI 不是那么火了,但是你证明的东西不会过时。它是一个真理,它还在那里。

我 82 年去美国的时候也差一点做 AI,当时那一波 AI 热潮叫专家系统,语言叫 lisp,致力于把所有场景列出来,用 what if 语句进行设计。那一波红了几年就消失了,因为即使把场景找出来,数据也没那么多。

机器之心:现在的一大趋势是认为在将来,现实世界所有的问题都能转化为数学形式,然后通过程序和算法去解决。您是否认同这种观点呢?

叶荫宇:这就是大数据的力量了。所谓大数据,是说某一现象的数据多到一定程度之后就量化了、连续化了、可以用数字代表了。数字能代表,数学就能发挥作用了。AI 也是因为数据多了才能学到好的算法。有了量化数据之后,就能应用规划模型这种数据驱动的决策模型。我认为,一定程度上确实可以说所有的决策问题都可以用某一个数学公式/函数描绘。有效益函数,而且比较连续化,哪怕有离散变量,也可以单独处理。

AI 能够真正对经济和生活方式起作用,就是因为数据大了之后,我不再需要为每一个具体问题费很多脑筋,就能提出可供参考的规律。我们最开始认为只有供需可以用这套理论,后来发现博弈也可以用,定价也可以用,严格来说原来营销专家拍脑袋定的,现在都可以交给数学来定了。

机器之心:您认为运筹学和深度学习的关系是什么?它们在解决各类问题上各有优劣还是需要相互配合?

叶荫宇:个人认为从现实生活到决策过程中有两个阶段:一是如何从现实生活中获得比较标准的数据,这是深度学习大有可为的地方,现实生活中虽然有很多现象,很多原始数据,实际上需要通过分析才能得到有效数据。运筹是你把数据给我,我把最优解给你,它不考虑数据的真实性。这是第二个阶段,如果你优化所需的数据是给定的,运筹比较擅长去找解。但是怎样保证 A 和 B 是准确的,这个以前的运筹并不考虑,认为这是统计的问题。然而实际上这都是一条决策链上不可缺少的部分。而一旦有了数据,从数据到决策的过程中,运筹有很多现成的高效的模型,比如说选址模型。AI 花了很大功夫建立从原始数据直接到决策的端到端模型,然而其实深度学习和运筹学是可以是相辅相成的。

机器之心:很多深度学习的模型基于运筹学理论基础,那么反过来,深度学习对运筹学会有哪些促进?

叶荫宇:AI 对运筹学的促进是非常明显的。可以说是促进也可以说是挑战,因为他们给我们带来了一些新动力。举个例子,电力系统的电力平衡决策是运筹学经典应用场景。之前我们每天得到明天对电力需求的预测,然后以天为单位进行决策计划,每天晚上把明天所需的发电机等资源调度好就可以了。但是 AI 发展了之后,预测效率大幅提高,模型可以以小时为单位完成需求预测,这也就需要运筹的计划在一个小时内完成。这就是 AI 对运筹学提出的挑战。我觉得不需要把 AI 看成威胁,深度学习和运筹学是互相依存的,他们是一个生态链上关注重点不同的学科。AI 可以帮助我们很多。

AI 给我最大的一个启发是要开发定制化工具。以前运筹学的研究者总是希望找到一个算法,可以解所有的问题,比如说线性规划里,单纯形法、内点法,都要求一定要在多少时间内,能够解所有的问题。AI 对我的启发是,说不定这个算法可以再分类,变得更定制化一些。与其试图找通用的、万能的工具,不如找到对某一个问题最有效的方法,因为说不定所谓万能的工具并不存在。AI 就是针对一个非常特定的问题不断地调整,实现一个很好的效果,这对如何利用模型解决实际问题很有启发。

从行业未来到从业者的探索路径

机器之心:运筹学领域未来的突破口会在哪里?

叶荫宇:运筹学领域有很多问题从理论上始终没解决,比如说单纯形法,我们到现在也不是很理解它的工作机制。不过有未解决问题也说明这个领域的生命周期还很长。实践证明,我们确实需要进一步深入研究。很多非凸问题的最优解寻找,至今也没有有效的算法。包括深度学习,也是一个黑箱,靠针对专门问题做定制和通过实验进行调整才能做好。

另外就是解决数据不可能准确的问题。准确率再高的预测也永远有误差,在这种情况下,如何做出最优的决策,需要我们引进一些鲁棒性和风险控制、来避免极端策略。

最后很多数据变化得速度太快,需要我们在线(online)而不是静止地进行决策,线性规划现在在这方面已经有一些进步了。

机器之心:您作为杉数科技首席科学顾问,现在主要致力于将运筹学投入哪些商业领域的应用呢?

叶荫宇:我们现在主要集中对算法依赖性很强的领域,其中很大一块是零售和供应链。

供应链管理说起来是很老的名词了,但 20 年之前在美国学术界还是很流行的问题。现在很多制造迁移到了中国,调配、运输、储存、选点,都是需要解决的问题。现在对于运筹学的一个利好消息是,零售商越来越庞大,一个公司可以掌握全链,这样就为优化提供了很好的条件。以前我们采用的方法如果不被上下游采纳,工作就无法开展。

举个例子,阿里所谓的「新零售」概念,核心就是供应链。从最源头的如何定价,到后来的如何储存和调配,都是我们关注的重点。再详细一些,具体问题有仓储、货物摆放、货物提取等等。现在很多大公司都在使用机器人,搭建无人仓储。我们国家的机器人开发的很好,每个机器人功能很强,但是缺乏统一管理。就好像一支球员个人能力很强的球队,缺乏战术部署,因此打不好球。机器人自己做得再好,也不保证彼此能够协调好,一起把任务完成。运筹学比较强调,在有几百个机器人的环境下,如何减少碰撞,进行路径规划,分配任务。这样的管理软件在我们国家还比较少。

无人车也存在同样的问题,无人车做出来之后,如何进行控制和管理?并不是说做出了无人车交通就好了。如何同时调动上百万辆车,这就是杉数要解决的问题:为企业提供一个统一的、智能的、用于管理协调的平台工具。

除此之外,我们也涉及金融高频交易、健康等领域。把在美国半成熟、成熟的 SAAS 都能转化到中国来。中国的优势是越来越公开的数据和更多愿意做尝试的人。

机器之心:最后,您对希望从事人工智能工作的年轻人有哪些建议?

叶荫宇:深度学习现阶段有点像中医,工作的效果很好,但是不知道机制,也不是百分百有效。但是就像中医一样,即使不是立刻就把理论基础搞清楚,也不影响应用。

但我确实有担心,大家过度重视人工智能以致于变成实验员了。年轻人可以很容易从网上找到很多算法,然后一个一个试,只顾着埋头调黑箱,而不了解全局逻辑。我希望年轻人对各个学科多一些了解,比如统计、运筹和基本的数学。在这些离 AI 非常近学科里获得一定的基础和广阔的视野,再来做应用,可能就比较得心应手。

收藏 推荐 打印 | 录入:admin | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款