你好,游客 登录
背景:
阅读新闻

开展机器学习的十个建议

[日期:2017-09-20] 来源:企业网  作者: [字体: ]

机器学习(ML)正在迅速成为识别具有前瞻性的首席信息官的试金石。在未来十年内,未能采用机器学习进行产品开发或业务运营的公司将承担落后于更多灵活的竞争对手的风险。这是根据奥斯利Dan Olley的说法,他是RELX集团科学和健康信息部门爱思唯尔(Elsevier)的首席技术官,近年来,他提高了组织对ML技术的采用。

上个月Olley在科罗拉多斯普林斯举办的CIO100研讨会上向观众介绍说:“我从根本上认为我们正处于机器学习的转折点,并将在未来十年内改变与数字世界的互动方式。我们将越来越多地用机器做出决定。”

这是一个合理的假设。计算能力的增长,算法和训练模型的日益复杂以及看似无限的数据来源促成了人工智能(AI)的重大创新。人工智能包括机器可以模仿人类思维行为的任何技术,比如ML的子领域,其中基于统计的算法自动化知识工程。谷歌、亚马逊、百度等公司正在向人工智能和机器学习投入更多的钱。此外,麦肯锡全球研究所(McKinsey Global Institute)认为,这些发展带来的创业活动是2016年投资的三倍,介于260亿美元至390亿美元之间。

是时候采用人工智能和机器学习了

据麦肯锡称,在技术部门以外的人工智能的采用大多处于早期的试验阶段,很少有公司大规模部署。尚未将大规模人工智能技术作为核心业务的公司不确定是否能得到期望的投资回报率。但是,Olley在爱思唯尔的机器学习工作已经帮助制药的客户发现了药物并向临床医生提供了相关的医疗信息,他这类使用案例在人才管理、销售和市场营销、客户支持等领域都比比皆是。

如果想要建立竞争优势,或者至少保持领先优势,首席信息官们最好跟上这些新兴技术的发展速度。Olley说:“这是你现在开始着手的事情。”

从未见过人工智能算法的组织如何展开数据科学或机器学习?Olley和Gartner提供以下建议。

1.了解数据科学的适用范围

你有一个在组织中利用数据科学和机器学习的想法,但你如何去实现呢?首先,你不需要将数据科学和机器学习的运作集中化。事实上,将数据科学和机器学习嵌入到每个部门,包括销售、营销、人力资源和财务都是有意义的。Olley建议首席信息官们尝试一些在爱思唯尔有效的东西,他将数据科学家与软件工程师或肿瘤学专家集结在一起,他们在受到Spotify模型所启发的敏捷小分队中构建产品。

Olley说:“我们已经将数据科学团队组建在产品管理团队和业务部门中,但我们将它们作为一个分会集结起来,并指定一个人来带领。我们确实尽可能让数据科学家来处理这个问题,因为我们认为这是更好地扩大整个组织的方式。”

2.开始

您不需要执行五点计划来建立数据科学企业,也不需要构建闪亮的机器学习产品的框架。 Gartner说你应该在需要特定的人工智能技术进行学习的不同业务领域促进小型实验,而不是光想着投资回报率。Olley说:“如果你还没有开始的话我完全建议你开始,因为你的竞争对手已经开始了”。

3.像对待金钱一样对待你的数据

在以数据作为燃料推动任何人工智能 / 机器学习工作的情况下,首席信息官必须管理数据,保护数据并对此着迷,像对待金钱一样对待数据。Olley说:“你的首席财务官不会让这些账户散落在整个公司。他们也不会说,‘我认为今年的收入已经有这么多了。’”

4.停止寻找完美人才

Olley说:数据科学家往往是数学和统计学方面的高素质人士,善于发现数据的洞察,而不一定是能够编写算法和制作产品的软件工程师。然而说起来容易做起来难,因为企业经常寻求独角兽般候选人,他们是大师级统计学家,高段位的软件工程师和某个工业领域的大师,比如卫生保健或金融服务行业领域,Olley说:“我听说有一个人这样描述,‘我想要一位有数学博士学位的软件工程师,他也是一名训练有素的临床医生,如果他们在肿瘤专业也有专长就更有用了。’”Olley讽刺地补充说他认识“这三个人”。

5.建立数据科学培训课程

并不是每个从事数据科学的人都是数据科学家,或者需要黑带的技术段位。Olley说:“你不会找到这么多这样的人,所以你要努力培养他们。”Olley指出他让一个人来负责提高他的IT人员在数据科学中的技能,Elsevier还利用Coursera来助力,Olley建议首席信息官至少要创建概率和统计学的进修课程,候选人必须通过最终考试来证明自己的能耐,Gartner建议你发现人工智能知识和人才的缺口并制定培训和招聘计划以扩建你的能力。

6.认可数据科学和机器学习平台

跟上了人工智能和机器学习的速度的企业,或者不确定如何解决数据科学问题企业可以将数据丢进数据科学平台(如Kaggle)中。数据科学家、统计学家、数学家、软件程序员和其他喜欢解决棘手问题的团队可以一起在企业的业务挑战上展开竞争。

7.注意“派生数据”

如果你要与合作伙伴分享你的算法,那么他们就会看到你的数据。他表示,这让爱思唯尔这样的信息学公司很不安,爱思唯尔热衷于保护其数据,它将其视为竞争优势。Olley说:“你的数据就是新的货币。你必须在策略上了解你想要保留的东西、你乐于分享的东西和像金钱一样对待的东西。”

8.不要总是试图解决整个问题

保健机构可以试着建立一种取代所有全科医生的算法,患者在没有提前很多天预约的情况下很难找他们就诊。或者可以通过编写算法来解决问题的一小部分,至少可以辨别一个人是否只需要阿司匹林还是要更严重的治疗。Olley说:“解决问题的一小部分,获取更多的数据,随着时间的推移而增建。”

9.不要过分考虑你的数据模型

Olley表示:获得正确的训练集比完善数据模型更重要。不要用数据放任任何人,这可能导致数据模型不正确。Olley说:“最大的挑战是向人们展示可能性的艺术,并真正把人们解放出来,以考虑这些东西可以做什么,然后将其扩展。”

10.在人工智能方面教导首席执行官和董事会

这么说,你们就是有前途的数据科学领航。根据Gartner的说法,作为首席信息官,你应该提倡以人工智能和机器学习作为影响首席执行官颠覆市场并重塑现有业务模式的策略的手段。毕竟,成功的机器学习操作可能是你的组织未来成功的关键。

收藏 推荐 打印 | 录入:Cstor | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款