《Science》杂志：机器学习究竟将如何影响人类未来的工作？

人工智能、机器学习相关技术已经多次刷新了人们对于「计算机能做什么」的认知，那么紧接着的一个问题就是「计算机会不会替代人类的工作」。李开复就曾经多次在公开场合表示人工智能会取代许多人类工作，而这也已经引起了一定的忧虑和讨论。近日，《Science》杂志也发表了一篇长文，从几个不同角度详细阐述了机器学习对于未来人类工作的影响。

在过去的几十年中，数字计算机已经改变了几乎所有经济部门的工作。由于机器学习（ML）的发展加快了自动化的步伐，我们正处于一个更大、更迅速转变的开始阶段。然而，虽然很明显 ML 是一种「通用技术」，就像蒸汽机和电力一样，产生了大量新的创新和能力，但关于 ML 系统擅长的任务并没有广泛的共识，ML 对劳动力和经济的具体影响的预期也没有达成一致。在本文中，我们讨论了 ML 对劳动力的关键影响，参考了目前这一代 ML 系统可以做和不可以做的事情。工作中的一部分可能是「适合 ML」（SML），但这些相同工作中的其他任务并不适合 ML 的标准；因此，ML 对就业的影响比一些人所强调的简单的替代和替换更为复杂。虽然目前 ML 对经济的影响相对有限，而且我们并没有像有的人宣称的那样面临即将到来的「工作的终结」，但 ML 对经济和未来劳动力的影响却是深远的。

任何有关 ML 可以做什么、不可以做什么、以及可能对经济产生哪些影响的讨论，首先应该认识到两个广泛的基本考虑因素。第一，我们离通用人工智能还很远；第二，机器不能完成人类的全部任务。此外，虽然创新总体上对收入和生活水平的提高是重要的，特别是 ML 之前的第一波信息技术（IT）系统创造了数万亿美元的经济价值，但技术进步也是造成工资不平等的重要因素，尽管造成不平等的因素有很多，比如全球化程度加深，但由于 ML 的巨大而迅速的变化潜力，可能对经济影响造成很大的破坏性，既产生赢家，也产生输家。这将需要政策制定者，商业领袖，技术人员和研究人员的高度重视。

当机器自动执行特定工作或流程中的适合 ML 的任务时，剩下的不适合 ML 的任务可能会变得更有价值。此外，机器将增强人的能力，使全新的产品、服务和流程成为可能。因此，即使在部分自动化的工作岗位内，对劳动力需求的影响既可能是负面的，也可能是正面的。虽然更广泛的经济影响是复杂的，但与 ML 能力接近的任务上，对劳动力需求更有可能下降，而作为这些系统补充的任务劳动力的需求可能增加。每当 ML 系统跨越一个门槛，在某个任务上比人类更具成本效益时，企业家和管理者为了利润最大化，将越来越多地寻求用机器替代人类。这将影响整个经济，提高生产力，降低价格，转移劳动力需求，重组行业。

我们知道的多于我们所能言说的

正如哲学家波拉尼所说，我们知道的，多于我们所能言说的。认识一张脸、骑自行车和理解言语都是人类非常清楚怎么做的任务，但是我们反思自己如何去做的能力却很差。执行起来轻而易举的任务要整理成正式规则却很难，很多时候我们根本做不到。因此，在 ML 之前，波拉尼的悖论限制了通过编程计算机自动完成的任务种类。但是今天，在许多情况下，ML 算法已经使得训练计算机系统比我们手动编程更精确和更有能力。

一直到近几年，创建一个新的计算机程序都需要涉及劳动密集型的手工编程过程。但是，这个昂贵的过程正日益被增强，或者被一个更加自动化的、在适当的训练数据上运行的 ML 算法流程所取代。这种转变的重要性体现在两个两方面：在越来越多的应用程序中，这种模式可以产生比人类程序员更精确和可靠的程序（例如人脸识别和信用卡欺诈检测）；其次，这种模式可以大大降低创建和维护新软件的成本。降低了成本，减少了实验的障碍，并能够探索潜在的计算机化任务，鼓励发展计算机系统，实现许多类型的常规工作流程的自动化，减少或消除人为干预。

在过去的 6 到 8 年里，ML 在这方面的进展尤其迅速，这在很大程度上是因为大量的训练数据，这些数据量足够大，以至于可能捕捉到非常有价值且以前未被注意到的规律，可以在 ML 算法的处理能力范围内进行检查或理解。当有足够多的训练数据集时，ML 有时生成的计算机程序表现胜过人类。（例如皮肤病诊断、围棋、检测潜在的信用卡欺诈）。

算法的改进也是 ML 进展的关键，包括深度神经网络（DNN）和更快的计算机硬件。例如，Facebook 已经都从基于短语的机器翻译模式转换到深度神经网络，每天进行的翻译超过 45 亿次；用于图像识别的 DNN 降低了 ImageNet 上的错误率，ImageNet 是一个包含 10000 多类标注图像的大型数据集，错误率从 2010 年的超过 30％下降到现在的不到 3％；同样，自 2016 年 7 月以来，DNN 帮助语音识别错误率从 8.4％提高到 4.9％。图像和语音识别率达到 5％的阈值非常重要，因为这几乎接近人类在面对类似数据时的错误率。

自动推进的自动化

要产生一个定义明确的学习任务，以便应用 ML 算法，必须要有充分的说明任务、性能指标和训练过程。在大多数实际应用中，要学习的任务与某些目标功能相对应，例如输入医疗患者健康记录，输出患者诊断的功能，或者从自动驾驶汽车的传感器接收输入，然后输出正确的转向命令。最常见的训练过程类型是由目标功能的输入 - 输出对组成的数据（例如与正确诊断配对的医疗记录）。然而获取真实训练数据在许多领域都很困难，如精神病诊断，招聘决策和法律案例。

成功的商业应用的关键步骤，通常包括精确识别要学习的功能；收集和清洗数据以用于训练 ML 算法；通过工程数据特征来选择哪些数据可能有助于预测目标输出，并且收集新的数据以弥补原始特征的不足；尝试不同的算法和参数设置，以优化学习分类器的准确性；并将提供的学习系统嵌入到日常业务运营中，从而提高生产力；如果可能，持续获取更多训练样本。

测量未来自动化程度非常相关的方法是「学徒学习法」，其中人工智能程序作为学徒，通过观察人类的决定来进行学习，并将其作为额外的训练样本。这种方法产生了新的商业模式。

训练学徒模仿人为决策让机器可以从它所协助的多个人的综合数据中进行学习，这导致机器可能最终超过训练它的团队中的每个个体的表现。不过，其学到的专业知识可能仍受到团队成员的技能水平和相关决策变量的可用性的限制。但是，在计算机可以访问独立数据来确定最佳决策（基本事实）的情况下，有可能改进人的决策，从而帮助人类提高自己的绩效。例如，在从皮肤病学图像中对皮肤癌进行医学诊断时，将随后的活检结果作为训练的标准可以产生比人类医生更高诊断准确度的计算机程序。

什么是最适合 ML 的任务

尽管近来 ML 系统的进步令人印象深刻，但它们并不适用于所有的任务。当前的成功浪潮在很大程度上取决于被称为监督学习的范式，通常使用 DNN（深度神经网络）。在非常适合这种用途的领域，ML 非常强大。但是它的能力也比人的决策范围要窄的多，也比人的决策更脆弱，而且这种方法对许多任务是完全无效的。当然，ML 的技术还在继续进步，DNN 之外的其他方法可能更适合不同类型的任务。我们下面给出 8 个关键评判标准，以区分适合 ML 的任务和不适合 ML 的任务。

1、明确定义的输入和输出

其中包括分类（例如，区分不同品种狗的图像或根据癌症的可能性标注医疗记录）和预测（例如分析贷款申请以预测未来违约的可能性）。不过，虽然 ML 系统可以根据统计上的相关性来预测与输入（X）有最大关联的输出（Y），但可能无法学习如何判断因果关系。

2、存在、或者能够创建规模巨大、带有成对的输入输出的数字化数据集

可用的训练样本越多，学习就越准确。 DNN 的显着特征之一是在许多领域内的表现似乎并不会在样本超过一定数量之后就停止增长。在训练数据中捕获所有相关输入特征尤为重要。尽管 DNN 原则上可以表示任意函数，但是计算机很容易模仿和延续训练数据中存在的不需要的偏差，解决方法是通过聘用专人来标记部分数据或创建全新的数据集，或通过模拟相关的问题设置来创建。

3、该任务提供明确的反馈，具有明确的目标和指标

当我们能够清晰的描述目标，哪怕不能确定实现目标的最佳过程，ML 也能很好的运作。这就像早期的自动化方法，获取个体输入输出决策的能力虽然允许学习模仿这些个体，但可能不能得到最佳的系统最性能，因为人类本身也无法做出完美的决策。因此，明确界定全系统绩效指标（例如，优化整个城市的交通流量而不是特定路口）为 ML 系统提供了一条黄金标准。当训练数据按照这种黄金准则进行标注时，ML 就特别有用，因为确定了预期的目标。

4、不需要基于丰富背景知识的很长的逻辑或推理链

ML 系统在学习数据中关联性方面非常强大，但是当任务需要依赖计算机没有的常识或背景知识或复杂计划时，ML 系统的效率较低。ML 在电子游戏中表现出色，这些游戏需要快速反应，并提供即时反馈，但当游戏中最佳选择取决于记忆以前事件的时间和未知背景知识时，效率就会降低，例外是围棋和象棋这样的游戏，因为这些非物理的游戏可以以非常精确的速度进行快速模拟，因此可以自动收集数百万个完全自我标记的训练样本。但是，在大多数现实世界中，我们无法做到完美的模拟。

5、没有必要详细解释如何做出决策

大型神经网络通过微妙地调整多达数亿个数字权重来学习做出决定。解释这种决定对人类来说很困难，因为 DNN 与人类的思维系统不同。目前的系统在这个方面相对较弱。例如，虽然计算机可以诊断特定类型的癌症或肺炎，甚至比专家医生更准确，但与人类医生相比，它们解释为什么以及如何作出诊断的能力较差。对于许多感性的任务，人类也很难解释，例如，如何从所听到的声音中识别出单词。

6、容错性，不需要最佳的解决方案

几乎所有的 ML 算法都是从统计和概率上推导出解决方案。因此，很难将其训练到 100％的准确度。即使是最好的语音、物体识别和临床诊断计算机系统也会犯错（和人一样）。因此，对学习系统误差的容忍是制约这样的系统应用的重要标准。

7、学习的现象或功能不应该随着时间的推移而快速变化

一般来说，只有当需要处理的数据和训练的数据分布是类似的结构，ML 算法才能很好地工作。如果这些分布随着时间而改变，则通常需要重新训练，因此成功取决于相对于新训练数据获取率的变化。

8、没有特别的灵巧性，身体技能或流动性要求

在处理非结构化环境和任务中的物理操作时，机器人与人类相比仍然笨拙。这不是 ML 的缺点，而是机器人技术自身的局限性。

机器学习对工作的影响

计算机通过生成式设计方法设计的换热器

之前 ML 对 IT 的影响主要在于一些常规、高度结构化和重复性的任务。这也是劳动力需求下降的一个原因。未来，更广泛的任务将被机器自动化或增强。这包括人类无法解释的任务，但是简单地根据过去的趋势进行推断将是错误的，需要一个新的框架。

一项工作中通常包含许多不同的但相互关联的任务。在大多数情况下，这些任务中只有一部分适用于 ML，而且可能是传统的技术不容易自动化的任务。例如，训练 ML 系统可以帮助律师对案件的相关文件进行分类，但是在访谈潜在的证人或制定策略时使用 ML 就很困难。类似地，ML 系统在阅读医学图像方面取得了迅速的进展，在某些应用中表现超过了人类。然而，与其他医生交流、以及与患者交流和安慰患者的潜在情绪困扰的等任务，都不适合 ML 方法，至少不适合现有的 ML 系统。

这并不是说所有涉及情商的任务都 ML 系统都无法实现。销售和客户互动的某些方面就非常合适。例如，销售人员和潜在客户之间的大量在线聊天记录可以用简单聊天机器人替代，以识别哪些常见的询问最有可能带来销售。也有公司使用 ML 来识别来自视频中人们的微妙情绪。

另一个领域是涉及创意的任务。在旧的计算模式中，需要事先精确地规定一个过程的每个步骤。机器没有任何「创造性」的空间，不能想出如何解决特定问题。但 ML 系统是经过专门设计的，使机器可以自己找出解决方案。所需要的不是预先详细定义过程，而是需要明确规定所需解决方案的性质，并有一个合适的模拟器，以便 ML 系统可以探索可用替代方案并准确评估其性能。例如，设计复杂的新设备在一直是人类比机器更擅长的任务。但是生成式设计软件可以为热交换器等物体提供新的设计，比任何人设计的都能更有效地满足所有的要求（例如重量，强度和冷却速率）外观和触感。

这是「创意」吗？这取决我们如何定义。但以前人类的一些「创造性」任务在未来几年将日益自动化。当最终目标可以被很好地规定并且解决方案可以被自动评估时，这种方法运行良好。因此，我们可以预见这些任务越来越受到自动化的影响。与此同时，人类在更明确界定目标方面的作用将更加重要，这意味着科学家，企业家和那些能够提出正确的问题的人的作用将会增加。

ML 期待人类工作的六个经济因素

有许多非技术因素会影响 ML 对未来工作的影响。具体而言，ML 对劳动力需求和工资的总体影响可以归类为六个不同经济因素：

1、替换

基于 ML 创建的计算机系统可以直接在某些工作中取代人类，降低任何给定的输出产量所需的人力。

2、价格弹性

通过机器学习实现自动化可以降低完成任务的成本，这会导致总支增加或减少，取决于需求的价格弹性。例如，如果弹性小于 -1，则价格下降导致购买数量的比例增加，总支出（价格乘以数量）将增加。例如，随着技术在 1903 年以后降低了航空旅行的价格，这类旅行的总支出增加了，就业也随之增多。

3、互补性

任务 B 对于另一个自动化的任务 A 来说可能很重要，甚至是不可或缺。随着 A 的价格下降，对 B 的需求将会增加。通过类比，随着计算自动化的程度提高，对程序员的需求增加了。技能也可以是其他技能的补充。例如，人际交往能力与分析能力是一种互补关系。

4、收入弹性

自动化可能会改变人群的总收入。如果一个商品的收入弹性不为零，这又会改变对某些商品类型的需求，以及生产这些商品所需任务的需求。就像随着总收入的增加，美国人花在餐馆的钱也越来越多。

5、劳动力供给的弹性

随着工资的变化，从事该项工作的人数也会变化。如果有许多人已经具备了必要的技能（例如驾驶汽车进行乘车服务），那么供给就具有相当的弹性，即使需求增加（或下降）很多，工资也不会上涨（或下降）很多。相反，如果技能很难获得，比如成为数据科学家，那么需求的变化将主要体现在工资上而不是就业上。

6、重新设计业务流程

任何一组不同类型和数量的劳动力，资本和其他投入与产出联系起来的生产函数不是固定的。企业家，管理人员和员工不断努力重塑相关流程。当面对新技术时，他们将通过设计或机缘巧合改变了生产过程，并找到更有效的方法来进行产量。这些变化可能需要一段时间，而且往往能够节约昂贵的投入，增加需求弹性。同样，随着时间的推移，个人可以通过学习新技能或换新工作，来表示对于高工资的认可和回应，这样会增加相关的供给弹性。

结语

由于需要改变生产流程、组织设计、商业模式、供应链、法律甚至文化环境，所以技术的采用和推广往往需要几年或几十年的时间。这种互补性在现代企业和经济中是无处不在的，并且具有相当大的惯性，从而放慢实施新技术不乏。例如，将自动驾驶卡车整合到城市街道上可能需要改变交通法规，责任规则，保险等，因此需要在多个维度上进行补充性修改，应用需要更长的时间来影响经济和劳动力、法规、交通流量等，而将呼叫中心人员切换到虚拟助理可能只需要对业务过程或客户体验进行相对较少的重新设计。

随着时间的推移，另一个因素变得越来越重要：新商品，新服务，新任务和新流程会出现。这导致全新的任务和工作，从而可以改变上述关系的程度和标志。从历史上看，随着一些任务的自动化，释放的劳动力会重转移到新的商品或服务，进入到更有效的生产过程中。这种创新比增加资本、劳动力或资源投入，更能提高总体收入和生活水平。 ML 系统可以通过自动化来加速符合上述标准的许多任务。

随着越来越多的数据进去线上并汇集起来，以及发现哪些任务应该由 ML 实现自动化，我们将更迅速地收集数据以创建更强大的系统。与我们以及掌握的解决方案不同，许多 ML 自动化任务的解决方案都几乎可以立即在全世界传播。我们可以期待未来的企业软件系统都将嵌入ML系统，自动化的成本将进一步降低。

近期监督学习系统的浪潮已经产生了相当大的经济影响。 ML 进一步发展，最终影响的范围和规模可能会超过或内燃机或电力等通用技术。这些进步不仅直接提高了生产力，而且更重要的是，引发了机器、商业组织乃至整个经济的创新浪潮。在技能，资源和基础设施等方面作出正确的互补性投资的个人、企业和社会得到了蓬勃发展，更好地理解每种类型 ML 的具体适用性及其对具体任务的影响，对于理解 ML 带来的经济影响至关重要。