你好,游客 登录
背景:
阅读新闻

新闻和人工智能的结合,我们担心的绝不应是工作

[日期:2016-12-26] 来源:36氪  作者: [字体: ]

  正如蒸汽机会取代马匹成为动力来源一样,人工智能作为新的生产力,也将给各行业带来翻天覆地的变化。

新闻和人工智能的结合,我们担心的绝不应是工作

  编者按:本文来自微信公众号”刺猬公社“(ID:ciweigongshe),作者刘晨阳,36氪经授权发布。

  从没有任何一个时代比如今这般更让媒体人如履薄冰,内部变革困难重重、外部环境动荡更迭、核心生产力更存在被彻底颠覆的可能性。正如海水覆盖着千沟万壑,让水面平静蔚蓝一样,在社会环境看似平缓的变化下,同样掩盖着无数的阵痛、失败和探索。

  但我们相信,任何影响社会的变革和进步,必然会发生在生产力和产业的深入结合上,这一定律也适用于新闻行业。为此,我们做了关于人工智能 News的专题报道,希望通过观察人工智能在新闻领域的应用,引起自己和读者对当下的环境的思考。

  在该专题的前两篇中(1:在人工智能和新闻的结合上,国外媒体已经飞起来了? 2:在人工智能和新闻的结合上,国内媒体到底做得怎么样了?),我们将国内外的媒体和科技公司在AI+News的具体操作上进行了呈现。这是该专题的第三篇,也是最后一篇,希望我们能将AI+News的结合讲清楚,并让读者和我们自身免于“只缘身在此山中”的狭隘,看到源头的变化。

  近日,哈佛尼曼新闻实验室发布了一年一度的传媒行业走向预测,预测中出现了关于事实核查、VR新闻、个性化推送等的关键词。这个致力于研究新闻行业最前沿趋势的实验室,在新一年的预测中依旧给予技术与新闻的结合及其影响极高的比重,换句话说,每一个关键词,都离不开技术的发展给新闻带来的影响。

  人工智能和新闻的结合,从2012年开始进入大众视野后,热度只增不减。人工智能和新闻的结合与人工智能技术本身的发展紧密相关。技术驱动生产力的提升,再将其应用在具体行业中的逻辑,在人工智能行业中也不例外。

新闻和人工智能的结合,我们担心的绝不应是工作

关键词“人工智能+新闻”的百度指数趋势图

  在前两篇系列报道中,刺猬君将国内、国外的媒体和科技公司在AI+News上的探索进行了呈现,国内的应用主要体现在简单的体育、财报新闻写作和新闻分发上,而国外则在人工智能辅助新闻生产上做了更多尝试。趋势体现的是必然变化,未来人工智能和新闻结合的速度与深度,将更多地受到行业中原有从业者的影响。

  人工智能和新闻结合,究竟是什么?

  当国内、国外各大科技公司在种种场合为“人工智能”背书,2016年初人机围棋大战引得人声鼎沸,苹果Siri、微软小冰、Google Allo、百度度秘等“人工智能管家”接连不断出现时,对大多数读者来说,“人工智能”作为噱头的成分远大于实际影响。但人工智能到底是什么?恐怕没有多少人能给出准确的回答。

  Wiki百科中对人工智能阐述如下:

  人工智能(英语:Artificial Intelligence, 人工智能)亦称机器智能,是指由人工制造出来的系统所表现出来的智能。通常人工智能是指通过普通电脑实现的智能。该词同时也指研究这样的智能系统是否能够实现,以及如何实现的科学领域。

  高盛在12月中旬发布的《2016年人工智能生态报告》中则更友好地给出了解释:

  人工智能是制造智能机器、可学习计算程序和需要人类智慧解决问题的科学和工程。通常地, 它们包括自然语言处理和翻译,视觉感知,模式识别,决策制定等,但应用的数量和复杂性在快速增长。

  简单地概括,人工智能就是人类尝试将自我智能抽象、机械化,并应用于日常生产的一门科学技术。

  卡尔·马克思在《资本论》中给出过这样的观点:“社会劳动生产力,首先是科学的力量”;“大工业把巨大的自然力和自然科学并入生产过程,必然大大提高劳动生产率”。人工智能应用于具体行业,是人类将自我进化的“自然力”和“自然科学”应用于生产过程的体现。以往人们从水、风、太阳,甚至飞鸟、鱼等中汲取灵感应用于生产过程,借其解决能源利用问题并通过飞机和潜艇延伸自己的触达领域。如今当科学技术发展到一定阶段,机器对信息和环境的处理能力达到一定水准时,生产力的提升便需要人类从更高级的自然生物——人类自身中获得启示。

新闻和人工智能的结合,我们担心的绝不应是工作

莱特兄弟制造的第一架飞机“飞行者一号”

  典型地,人工智能中的一个重要分支为机器学习,神经网络在机器学习中充当一种模拟人类大脑的计算机体系结构,它由聚合的连接节点组成,如人类大脑中的神经元般可以解决更复杂的问题并从中学习。人类对自我神经网络的认识决定了机器学习技术能够达到的水平。

  也即,人工智能是一门科学技术,这项科学技术将尝试把人的能力赋予机器(软、硬件),成功应用人工智能的领域将能极大地提升生产力,并带来包含生产要素在内的衍生变化。

  新闻行业自然不例外。

  人工智能和新闻结合的三要素:人才、数据和“基建”

  在人工智能进入新闻行业之前,各类技术和新闻的结合其实产生了良好的化学反应,其中最典型的就是计算机。如今常被提及的数据新闻和精确新闻学就是计算机辅助报道( Computer-Assisted Reporting, CAR)在新时期的体现——如今的数据新闻比起20世纪70年代的CAR而言,更加强调利用计算机发掘信息的内在价值,而非简单地在报道中使用计算机。

  这听起来和人工智能有些相似,机器+记者。但需要注意的是,数据新闻(或CAR、传感器新闻等)和人工智能和新闻的结合有着本质不同,在数据新闻的使用场景中,计算机作为一种工具,在记者的使用下,帮助其完成新闻资料采集和最终呈现。选题、思路、操作手法、呈现方式等都由记者决定,计算机是辅助记者完成报道的工具,是记者手、眼、腿的延伸。而在人工智能+News的使用场景中,从素材收集、筛选、分析、成文,甚至最后的内容分发,都由人工智能来完成:

  新闻线索搜集:Facebook的Chatbots、Buzzfeed的Buzzbot;

  数据搜集+新闻写作一条龙:美联社(AP)与科技公司AutomatedInsights(简称人工智能)公司合作的机器写作平台Wordsmith、《华盛顿邮报》的写稿机器人Heliograf;

  算法排版:《卫报》由算法生成的报纸“#Open001”;

新闻和人工智能的结合,我们担心的绝不应是工作

《卫报》由算法生成的报纸

  新闻事实核查:《华盛顿邮报》的“Truth Teller”、 英国事实检查机构 Full Fact的监控系统;

  内容分发:Buzzfeed、Pulse、今日头条、天天快报、一点资讯……

  从新闻线索搜集到写作到事实核查,每一个环节都有人工智能的深度参与;接线员、记者、编辑、卖报亭……每一个角色都可以借由人工智能开发的软件或系统扮演。

  在以往的所有尝试中我们能看出,人工智能已经可以和新闻生产的所有环节进行结合,最为关键也是难以解决的,便是“智能”的程度。香港科技大学计算机系主任及大数据研究院院长杨强在2016年腾讯网媒体大会上给出了人工智能在新闻行业发展的5个相关要素:

  数据量是否足够多、边界够不够清晰/问题定义得够不够清楚、外界的反馈够不够好、计算资源是不是足够、有没有跨界人才。

  这五个问题其实可以囊括进三个类别:数据、“基建”和人才。它们同样是推进人工智能本身发展的关键因素。

  数据是人工智能的关键,也是最重要的要素,数据的数量和质量会共同决定人工智能的发展水平。好的一面是,全球持续增长、无所不在的互相联系的设备、机器和系统产生的非结构化数据的数量呈现出了巨大的增长。一般情况下,拥有的数据越多,神经网络就变得越有效率。这意味着随着数据量的增长,机器语言可以解决的问题的数量也在增长。移动设备、物联网、云端处理等技术的成熟带来了比之前更多的可利用的数据。

  硬件和基础设施软件也是发展人工智能所必需的。硬件代表的计算能力是人工智能发展的基本条件。而近年几大云服务商的“下沉运动”和Google、Facebook甚至苹果的“开源运动”,不仅让云计算供应商能够将他们的产品扩展到 AI 基础设施中,也让开源(TensorFlow,Caffe,Spark 等)成为 AI 软件创新的主要驱动力。高盛在2016年《人工智能生态报告》中给出的观点认为,“为了促进 AI 技术的应用,大型云供应商将继续开放基础架构资源,这将限制利润创造的潜力”,但这也正是人工智能能够获得较大发展的根本。

新闻和人工智能的结合,我们担心的绝不应是工作

  在人才上,人工智能(特别是深度学习)的难度很大,人才目前较为稀缺。杨强提到的人才更偏重于跨界人才,既具备机器学习的知识技能,又了解对应行业的状态,这种复合型人才是人工智能和具体行业结合时最为需要的——人的经验可以帮助机器更快更有效地学习,节省成本。但随着技术和工具的成熟,在市场强烈需求和显著的社会转型下,人才可能变得不再是瓶颈。

  记者应该担心被人工智能取代吗?

  人工智能在被付诸“实践”的过程中,所到之处往往草木皆兵,不论是金融还是新闻领域,关于人工智能取代人类的声音总是不绝于耳。这种担心并不是空穴来风。

  高盛在2016年关于人工智能的生态报告中提到,就目前的表现而言,“人工智能和机器学习带来的自动化及效率提升在普遍各领域都缩减了约 0.5%-1.5%的劳动工时。”这意味着,在生产单件产品所需劳动工时越长的或生产数量越大的领域,人工智能发挥的作用越大。而在人工智能发挥作用越大的领域,人工智能在该产业的应用也势必会更多、更深入。低附加值领域,人类的工作将更容易被人工智能替代。

  但人工智能要想达到能够取代人类的程度,还需要一定的时间。

  如今的大多数深度学习是监督的或半监督的,这意味着用于训练模型的所有或部分数据必须由人标记。深度学习效果与大数据集紧密相关,过大的数据集会阻碍模型拟合,反而不利于机器学习。利用原始未标记的数据来训练模型的无监督机器学习,依旧是目前人工智能机器学习中的最高追求。

  这也是刺猬君在该系列文章的第二篇中就给出的观点:“现阶段人工智能的所有新闻实践背后都离不开人类,无论是简单的模板内容填充还是海量数据抓取、新闻自动化核查还是聊天机器人互动,其背后都需要人类设计智能系统和人工训练机器人。在未来很长一段时间里,人工智能与新闻业的结合更多的将是交互式的结合。”

  而至于人类彻底被人工智能取代的问题,几次工业革命都给出了较好的回答:生产力的革新势必产生淘汰,但人们在技术革新后依旧会找到新的工作,在可见的未来,因人工智能被应用而带来的大范围失业不会出现。

  那么问题来了,如果失业不是人们应该担心的问题,什么才是真正的威胁?

  数据寡头。

  一个简单的逻辑在于,当人工智能成为生产力时,数据就成为了重要的生产要素,但它并非可以自由流动的要素。掌握数据的主体,就掌握了核心生产要素。

  当生产要素由劳动力、土地、资金构成时,资本家们通过贩卖黑奴、圈地运动、侵略或者淘金来攫取资源获得利润,而当生产要素变为数据时,掌握大量数据的科技公司则会拥有足以形成壁垒的天然优势:当人们的各类场景都可以被数据化时,这也意味着人们的任何行为、甚至人类本身也可以被数据化。每人每天都会产生大量数据,但这些财富的所有权并不是用户本身,而是科技公司。如果没有符合发展规律的法律及时保证数据分享和公开能维持在安全阈值内,数据寡头带来的危害将难于预料。

新闻和人工智能的结合,我们担心的绝不应是工作

近日又实力秀刷一波存在感的斯诺登

  白宫在当地时间12月20日发布的《人工智能未来发展计划》中也提到,“赢者通吃的信息技术市场特性,意味着只有少数人会把控整个市场。如果劳动生产率的提高不能转化为工资的增长,那么人工智能所带来的巨大的经济收益就只能为少数人增加财富。”

 

  想必这也是Trump上台后主动约谈Facebook、Google等几家科技公司的主要目的吧。

收藏 推荐 打印 | 录入:admin | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款