来自 Web前端 2020-05-07 05:42 的文章
当前位置: 网上澳门金莎娱乐 > Web前端 > 正文

机器学习因果推理

时间: 2019-08-31阅读: 149标签: 机器

图片 1

人工智能先驱、贝叶斯网络之父、美国计算机科学家 Judea Pearl 在最近的一篇论文中解释了基于数据统计的机器学习系统的一些局限性。要理解“为什么”,并回答“如果……会怎样”之类的问题,我们需要某种因果模型。在社会科学领域,尤其是流行病学中,一种名为“结构因果模型”(SCM)的革命性数学框架已经被广泛采用。Pearl 介绍了这种模型可以处理的七个任务,虽然这些任务对于关联机器学习系统来说有些遥不可及。

新智元报道

三层式因果模型层级

编辑:张佳

因果模型理论所揭示的一个有用见解是根据每个类能够回答的问题类型对因果信息进行分类。这种分类形成了三层式的结构,只有当层级 j(j = i)的信息可用时才能回答层级 i(i = 1,2,3)的问题。

图灵奖得主、“贝叶斯网络之父”Judea Pearl最新力作《为什么:关于因果关系的新科学》中文版出版啦!新智元值此之际,与中信出版社合作开展免费赠书活动!如果你对相关关系和因果关系的问题感到疑惑,这本书将给你答案。

最低(第一)层被叫作关联(Association),它涉及由裸数据定义的纯统计关系。大多数机器学习系统运行在这一层上。

一个多世纪以来,科学家一直信奉“相关关系不意味着因果关系”这句统计断论,造成了闭口不谈因果关系的局面。今天,这一禁忌终于被打破。

第二层被叫作干预(Intervention),不仅涉及到能看到什么,还涉及你可能采取的行动(干预措施)有哪些影响。我认为增强学习系统是运行在这个层上(例如,“如果我把骑士移到这个方格会怎样?”)。增强学习系统倾向于在定义良好的环境中运行,而干预层也包含了更多的开放性挑战。作为例子,Pearl 提了一个问题:“如果我们将价格翻倍,将会发生什么?”

图灵奖得主、“贝叶斯网络之父”Judea Pearl最新力作《为什么:关于因果关系的新科学》(The Book of Why:The New Science of Cause and Effect)在整个科学界掀起一场“因果革命”。作者提出了一套全新的科学方法论——因果关系模型。借助因果关系的视角,作者重新阐述了人类认知和科学文明的发展史。

这些问题无法单独从销售数据中得到解答,因为它们涉及客户行为的变化(对新的价格作出反应)。

好消息是,这本巨着的中文版出版啦。值此之际,新智元与中信出版社合作开展免费赠书活动,回馈新智元新老读者——免费赠送6本《为什么:关于因果关系的新科学》。

我个人认为,如果销售数据可以显示出先前价格上涨所带来的影响,那么很可能可以基于销售数据构建一个预测模型。Pearl 的反驳论点是,除非我们能够准确地复制之前价格达到当前价格两倍时的市场条件,否则我们无法真正知道客户会做出怎样的反应。

图片 2

最上面一层被称为反事实(Counterfactual),解决的是“如果……会怎样”问题。当规模很小时,序列到序列生成模型就能够解决问题。我们可以“重放”序列的开头,修改下一个数据值,然后查看输出会发生什么变化。

具体活动参与、赠送方式见文末)

这些层构成了层次结构,介入性问题无法从纯粹的观察性信息中得到回答,而反事实性问题无法从纯粹的介入性信息中得到回答(例如,我们无法对已经接受了药物的受试者重新进行实验,以便知道如果不为受试者提供药物会怎样)。在层级 j 回答问题的能力意味着我们也可以回答层级 i(=j)的问题。

“贝叶斯网络之父“Judea Pearl

这种层次结构及其所包含的形式限制解释了为什么基于关联的机器学习系统无法推理动作、实验和因果解释。

Judea Pearl现加州大学洛杉矶分校计算机科学教授,被誉为“贝叶斯网络之父”。2011年,Judea Pear获得图灵奖,奖励他在人工智能领域的基础性贡献,他提出概率和因果性推理演算法,彻底改变了人工智能最初基于规则和逻辑的方向。

结构因果模型

图片 3

结构因果模型(SCM)结合了图形建模、结构方程、反事实和介入逻辑。

Judea Pearl被授予图灵奖

我们可以使用这些工具正式表达因果问题,以图解和代数形式编纂我们现有的知识,然后利用数据来估计答案。此外,当现有知识状态或现有数据不足以回答我们的问题时,这个理论会警告我们,然后建议其他知识或数据来源,让问题变得可回答。

目前,现年83岁的Judea Pearl已出版3本关于因果关系科学的经典着作,分别为《启发法》、《智能系统中的概率推理》和《因果论:模型、论证、推理 》。

SCM“推理引擎”将假设(以图形模型的形式)、数据和查询作为输入。

Judea Pearl同时也是美国国家科学院院士,IEEE智能系统名人堂第一批10位入选者之一。他还获得过多项顶级科学荣誉,包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。

例如,下图显示 X(例如服用药物)对 Y 具有因果效应(例如恢复),第三变量 Z(例如性别)影响 X 和 Y。

所有这一切都源于一个简单的问题:为什么?

这让我想起了我在贝叶斯决策方面看到的模型。

这本书将要讲述的故事会围绕一门科学展开,这门科学改变了我们区分事实与虚构的方式,但目前,它仍处于大众的视野之外。这门新科学非常重要,其已经影响到了日常生活的种种重要的方面,并且还有可能进一步扩大影响范围,覆盖从新药开发到经济政策制定,从教育和机器技术人到枪支管制乃至全球变暖等重大问题的探索和解决。值得注意的是,尽管这些问题涉猎的领域广泛多元并且完全不具可比性,但这门新科学仍然成功将它们全部纳入一个统一的框架,这在20年前是根本不可能实现的。

有三个输出:

这门新科学并没有一个时髦的名字,Judea Pearl简单地称之为“因果推断”,它本身也并不是什么高科技。因果推断力图模拟的理想技术就存在于我们人类自身的意识之中。数万年前,人类开始意识到某些事会导致其他事的发生,并且改变前者就会导致后者的改变。没有其他物种领悟到了这一点,更别说达到我们所理解的这种程度。由这一发现,人类这一物种创造出了有组织的社会,继而又建立了乡村和城镇,直至创建了我们今天所享有的科技文明。所有这一切都源于我们的祖先提出了这样一个简单的问题:为什么?

Estimand 是一个数学公式,根据假设提供从任何可用假设数据中回答查询的方法。Estimate 是查询的答案,以及置信度的统计估计。一组拟合指数(Fit Indices)用于衡量数据与假设的兼容程度。如果编码的假设没有任何可测试的含义,则该集合为空。

因果推断正是关于这个问题的严肃思考。它假设人类大脑是大自然有史以来为处理因果知识而设计出的最先进的工具。我们的大脑存储了海量的因果知识,而在数据的辅助下,我们可以利用这些知识解决当代社会所面临的最紧迫的问题。一个更宏伟的目标是,一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”。这个智能机器人将会为我们发现未知的现象,解开悬而未决的科学之谜,设计新的实验,并不断从环境中提取更多的因果知识。

如果在给定模型假设的情况下无法回答查询,则将其声明为“无法识别”。

但在冒险推测未来发展之前,了解迄今为止因果推断这门科学所取得的成就至关重要。本书将深入探讨它是如何改变了几乎所有依赖数据信息的学科中研究者的思维模式,以及它将如何改变我们的生活。

所幸的是,我们已经开发出有效且完整的算法来确定可识别性,并为各种反事实查询和各种数据类型生成估计。

因果关系之梯——观察、干预、反事实

本文由网上澳门金莎娱乐发布于Web前端,转载请注明出处:机器学习因果推理

关键词: