AI何时被创造?

||分析

强人工智能似乎是本周的主题。凯文鼓at.妈妈琼斯认为到2040年,AIS将像人类一样聪明。卡尔史密斯《福布斯》和“小姐。“在经济学家在这个时间线上似乎和德拉大致一致。摩西·瓦迪,世界杂志主编大多数阅读计算机科学杂志预测“在2045台机器将能够做出人类可以做的任何工作,那么人类可以做的工作很大一部分。”

但预测ai比许多人认为更困难。

要探索这些困难,让我们从2009年开始bloggingheads。电视谈话在Miri研究员之间金宝博娱乐Eliezer Yudkowsky.麻省理工学院的计算机科学家斯科特Aaronson,优秀的作者自德谟克利特以来的量子计算.在那个对话中,Yudkowsky问道:

对我来说似乎很明显,在[一到十年的几十年]我们将建立一个足够聪明的AI才能改善自己,并[它会]在智力上“向上”然后,当它耗尽的可用途径时,它将是一个“超级化”[相对]给我们。你觉得这很明显吗?

Aaronson回答说:

我们可以建造比我们更聪明的计算机,这些计算机还可以建造更聪明的计算机,直到我们达到智能的物理极限,我们可以建造对我们来说就像我们对蚂蚁一样的东西所有这些都符合物理定律,我找不到一个原理的原因,它最终无法实现……

我们主要不同意的是时间尺度......几千年[AI之前]对我来说似乎更合理。

这两个估计——几十年和“几千年”——有着截然不同的政策含义。

如果在接下来的几十年里,AI将取代人类在历史方向盘上的好机会,那么我们最好把手套放在上面金宝博娱乐 确保此事件具有积极而不是负面影响。但是,如果我们非常有信心,AI距离几千年来,那么我们现在无需担心AI,我们应该专注于其他全球优先事项。因此,似乎“何时会创建AI?”是一个很高的问题信息价值为我们的物种。

让我们花点时间回顾一下预测工作完成了,看看我们可能会何时创建AI的结论。

预测AI的挑战

专家委托

也许我们可以问问专家?天文学家很擅长预测日食,甚至能提前几十年或几个世纪预测。技术发展往往比天文学更混乱,但也许专家们仍然可以给我们一个范围我们可以期待人工智能的建成?这个方法叫做专家启发式

有几个人在AI或计算机科学中进行了调查的关于他们的AI时间表的专家。不幸的是,这些调查中的大多数患有相当强烈的抽样偏见,因此对我们的目的并不是很有帮助。1

我们应该预计重要的专家擅长预测AI,无论如何吗?作为阿姆斯特朗和索塔拉(2012)指出,数十年来对专家绩效的研究金宝博娱乐2建议预测AI的第一次创建正是我们应该期望专家展示的那种任务较差的性能 - 例如因为反馈不可用,因此输入刺激是动态而不是静态。Muehlhauser&Salamon(2013)添加,“如果你会创建AI的肠道,那可能是错误的。”

话虽如此,专家们在调查中Michie(1973)-比其他调查更具代表性的样本3.-做的很好.当被要求估计“[计算机]在成人人类水平上表现出智力的时间表时,”最常见的反应是“超过50年”。假设(因为大多数人这样做)AI将不会到达2023年,这些专家将是正确的。

不幸的是,“超过50年”是一个广泛的时间框架,包括“几十年来自现在”和“现在几千年。”So we don’t yet have any evidence that a representative survey of experts can predict AI within a few decades, and we have general reasons to suspect experts may not be capable of doing this kind of forecasting very well — although various aids (e.g. computational models; see below) may help them to improve their performance.

我们将如何创建AI时,我们如何预测?

趋势推断

许多人试图通过推断各种趋势来预测人工智能的首次诞生。像凯文鼓文奇(1993)基于他对硬件趋势的AI预测(例如,摩尔定律).但在一个2003年重印在他的文章中,Vinge指出了这种推理的不足之处:即使我们获得了足够的人工智能硬件,我们可能也无法解决软件问题。4.正如罗宾·汉森提醒我们,“AI采用软件,而不仅仅是硬件。”

也许我们可以推断软件进展的趋势?5.有些人通过询问今天的软件可以匹配的人类能力比例,以及机器“追赶”的速度如何估计一段时间。6.不幸的是,目前尚不清楚如何分开“人类能力”的空间,也不是每个能力的重要性。此外,软件进步似乎适合并开始。7.可能的例外计算机象棋进展在我看来,没有哪一种软件发展趋势能像摩尔定律在计算机硬件领域所起的作用那样,持续几十年。

另一方面,泰特罗克(2005)他指出,至少在他的关于政治权威预测的大型纵向数据库中,简单的趋势推断很难被击败。举一个人工智能领域的例子:1989年世界计算机国际象棋锦标赛上,大卫·利维(David Levy)问参赛者,一个国际象棋程序什么时候能打败人类世界冠军,他们的估计往往是不准确的悲观。8.尽管事实上,电脑国际象棋已经显示了规律和可预测的进展,在那20年。那些用天真的趋势外推法预测这一事件的人。库兹韦尔1990)几乎精确地答案正确的答案(1997年).

因此,值得搜索(a)进程可预测到推断的措施,以及哪个(b)对该测量的给定水平鲁棒地意味着强大的ai到达。但是,对于我的知识,这尚未完成,并不清楚趋势推断可以告诉我们大量的AI时间表,直到这样一个论点,并做得很好。

扰乱

更糟糕的是,一些事件可能会显著加速或减缓我们朝着人工智能的发展,我们不知道哪些事件会发生,也不知道会以什么顺序发生。例如:

  • 摩尔定律的终结.摩尔法的“串行速度”版本于2004年突破,需要飞跃到并行处理器,这对软件开发人员提出了大量的新困难(Fuller & Millett, 2011).摩尔定律中最经济的公式,计算每一美元,一直维持到现在,9.但目前尚不清楚这种情况是否会持续更久。Mack 2011.;esmailzadeh等人,2012).
  • 低挂果实的消耗.进展不仅是努力的职责,也是进步的难度。有些字段看到每个连续发现的难度增加的模式(Arbesman 2011.).人工智能领域的新进展可能需要付出比以前多得多的努力。对于人工智能的许多部分来说,情况显然是这样的,例如自然语言处理(2012年戴维斯).
  • 社会崩溃.政治,经济,技术或自然灾害可能导致社会崩溃,在此期间,AI的进步将基本上被停滞(波斯纳2004;Bostrom和ćirković2008).
  • 不感兴趣查尔默斯(2010)哈克(2012A)认为我们对AI的进展中最有可能的“速度凹凸”将是不愿意.随着人工智能技术变得越来越强大,人类可能会质疑创造比自己更强大的机器是否明智。
  • 认知神经科学的突破.用今天的工具,很难推断人类智能背后的认知算法(Trappenberg 2009).然而,新的工具和方法可能使认知神经科学家解释人类的大脑如何实现自己的智力,这可能允许AI科学家在硅中复制这种方法。
  • 人类增强人类增强技术可以使科学家通过认知增强药物更有效(Bostrom和Sandberg 2009),脑电脑界面(Groß2009),以及基因选择或认知增强工程。10.
  • 量子计算.量子计算已经克服了其早期障碍的一些(Rieffel和Polak 2011)但是,预测量子计算是否会对机器智能的发展有显着贡献,但它仍然难以预测。量子计算的进展取决于特别是不可预测的突破。此外,似乎也可能是,即使构建,量子计算机也会为特定应用提供戏剧性的加速(例如,搜索未分区的数据库).
  • 发展激励措施的折价点.的推出Sputnik.1957年,展示了向公众飞行的可能性。这一事件引发了美国与苏联之间的空间比赛,并导致两个政府的空间项目的长期资金。如果有一个“Sputnik时刻如果人工智能能让公众和政府明白,比人类更聪明的人工智能不可避免,那么就可能出现一场“强人工智能”竞赛,尤其是考虑到人工智能竞赛的获胜者可能会获得非凡的经济、技术和地缘政治优势。11.

很大的不确定性

鉴于这些考虑因素,我认为“何时创建ale时,”何时会创造出来的问题?“是这样的:

我们无法自信地在接下来的30年里进入,我们无法自信它需要超过100年,并且任何人都有信心的人假装太多了解。

有多自信才算“自信”?比方说70%。也就是说,我认为70%的信心认为人工智能不到30年是不合理的,我认为70%的信心认为人工智能超过100年也是不合理的。

该声明承认我无法预测AI,但它也会将我的概率分布限制在“AI创造年份”相当多。

我认为上述考虑证明了我的概率分布上的这些约束,但我还没有详细说明我的推理。这就需要更多的分析,我无法在此陈述。但我希望我至少总结了这个主题的基本考虑,那些与我有不同概率分布的人现在可以在我这里的工作基础上尝试证明他们。

如何减少我们的无知

但是,我们不能满足于宣布无知。承认自己的无知是重要的一步,但这只是一步第一个的一步。我们下一步应该是减少我们的无知如果我们能够,特别是对于我们整个物种的命运具有巨大战略性的高价值问题。

我们如何提高我们的长期预测性能?霍洛维茨&泰特洛克(2012)根据自己的实证研究和预测培训,提供有关该主题的一些建议:金宝博娱乐12.

  • 显式量化:“成为长期期货的更好校准评估师的最佳方式是养成制定量化概率估计,可以客观地评分长时间的准确性。显式量化可以实现明确的准确性反馈,可以实现学习。“
  • 路标未来:通过特定情景思考如果这些方案“附带明确的诊断路标,那些决策者可以用来衡量他们是否正在朝向或远离一种场景......伪造的假设将高飞场景抽象带回地球。”13.
  • 利用聚合:“平均预测往往比广大多数个人预测更准确,以计算平均值......[预报员]还应该习惯于[IARPA预测锦标赛中的一些更好的预测王牌]已经进入:将他们的预测与分组平均值,加权平均算法,预测市场和金融市场进行比较。“看Ungar等人(2012)对于某些聚合 - 利用ACE锦标赛的结果。

许多预测专家都补充说,在制定高度不确定的预测时,它通常有助于分解现象进入许多部分并对每个部件进行预测。14.作为Raiffa(1968年)succinctly put it, our strategy should be to “decompose a complex problem into simpler problems, get one’s thinking straight [on] these simpler problems, paste these analyses together with a logical glue, and come out with a program for action for the complex problem” (p. 271). MIRI’s不确定的未来是这类简单的玩具模型,但更复杂的计算模型-如那些成功用于气候变化建模的模型(Allen等人,2013) - 可以生产,并与其他预测技术集成。

我们应该预料到人工智能的预测是困难的,但我们不必如此作为当我们今天时,无知的AI时间表。

确认

我感谢Carl Shulman,Ernest Davis,Louie Helm,Scott Aaronson和Jonah Sinick对这篇文章的有用反馈。


  1. 第一的,Sandberg&Bostrom(2011)在2011年的一次人机智能学术会议上,收集了35名参与者对人工智能时间轴的预测。参与者被问及他们认为人工智能建成的可能性分别为10%、50%和90%是哪一年,假设“没有全球性灾难阻碍进步”。35名受访者中有5人对人类水平的人工智能永远无法实现表示了不同程度的信心。根据其他30名受访者的观点计算得出的中位数为:2028人表示“有10%的可能”,2050人表示“有50%的可能”,2150人表示“有90%的可能”。第二,Baum等人(2011)在2009年一次关于机器智能的学术会议上调查了21名参与者,并发现了与桑德伯格&博斯特罗姆(Sandberg & Bostrom, 2011年)相似的估计。第三,Kruel (2012)截至2013年5月7日,他通过电子邮件采访了34人,讨论了人工智能的时间线和风险,其中33人可以被认为是人工智能或计算机科学领域的某种“专家”(理查德·卡里尔是一位历史学家)。在这33位专家中,有19位对克鲁尔关于人工智能时间表的问题提供了完整、定量的回答:“假设有利的政治和经济发展,而且没有全球性灾难阻碍进步,到哪一年,你会认为人工智能的发展有10%/50%/90%的可能性,在科学、数学、工程和编程方面与人类大致相当(或者更好,也许不均衡)?”对于这19位专家,10%、50%和90%的估计分别是2025年、2035年和2070年(电子表格)在这里).第四,班布里奇(2005),调查参与者对“纳米生物信息 - Cogno”技术趋同的3次会议,发现了2085年为“计算能力和科学知识”的中位数估计,以建造在功能上相当于人类大脑的机器。“然而,这四次调查中的参与者是不成比例的HLAI爱好者,这引入了一个显着的抽样偏见。讨论的AI预测数据库阿姆斯特朗和索塔拉(2012)可能也面临着类似的问题:那些认为人工智能即将到来而不是遥远的人更有可能对人工智能做出公开预测。
  2. 尚托(1992);Kahneman和Klein(2009年)
  3. 另一项调查在AI @ 50会议在2006年。当被问及“什么时候计算机才能模拟人类智能的各个方面?””,41%“超过50年”,另外41%的人说“永远不会。”不幸的是,许多调查参与者不是AI专家,而是参加会议的大学生。此外,问题的措辞可能引入了偏见。可能是经常给予的“从不”的回答,因为一些参与者采取了“人类智力的各个方面”,包括意识,而且许多人对机器可以意识的想法有哲学反对。如果他们已经被问到了“何时会在几乎所有的工作中替代人类?”,我怀疑“从不”的答案会很不常见。至于我自己,我不接受任何原则上的任何原则反对意见。为了回复这些异议中最常见的,看Chalmers(1996),ch。9,和Chalmers(2012)
  4. 尽管,Muehlhauser&Salamon(2013)他指出:“在智能软件已经编写完成的环境中:全脑模拟(WBE),硬件外推可能是一种更有用的方法。因为WBE似乎主要依赖于显微镜和大规模皮质模拟等现有技术的放大,WBE可能在很大程度上是一个“工程”问题,因此它的出现时间可能比其他类型的人工智能更容易预测。”然而,它是特别困难的预测WBE,而我们甚至没有一个概念的证明通过一个简单的有机体,如秀丽隐杆线虫大卫Dalrymple正在努力。此外,将需要大量的神经科学进展(桑德伯格&博斯特罗姆2011年),这样的进展可能比硬件推断更难预测。
  5. 我不确定是什么一般软件进度的度量就像这样,尽管我们可以确定当地的软件进度的例子。例如,Holdren等人(2010)注意:“在许多领域,算法导致的性能提升甚至由于处理器速度增加而大大超过了巨大的性能增益...... [例如,优化专家,专家,观察到使用的基准生产计划模型线性编程将在1988年删除82年,使用当天的计算机和线性编程算法来解决。十五年后 -​​ 2003年 - 这个同样的型号可以在大约1分钟内解决,改善约4300万。从中,大约1,000的因素是由于加工速度增加,而大约43,000的因素是由于算法的改进!Grötschel还引用了1991年至2008年间混合整数规划的大约30,000的算法改进。“Muehlhauser&Salamon(2013)另外一个例子:“例如,IBM的深蓝色在1997年在世界冠军加里克拉多克水平上播放国际象棋,每秒约1.5万亿指令(提示),但一个名为Deep Junior的程序,在2003年使用0.015个提示。因此,国际象棋算法的计算e FFI效率仅在六年内增加了100倍(理查兹和肖2004).” A third example is塞蒂等人(2012),通过单一突破改善了20个级别的概率验证方法的效率。另一方面,人们可以很容易地找到非常的例子慢的进步(2012年戴维斯).
  6. 例如,请参见好(1970)
  7. 是我写的早些时候他说:“计算能力的增长是可以预测的,但对于人工智能来说,你可能需要基本的数学洞察力,而这他妈的很难预测。1900年,大卫·希尔伯特提出了这个问题23个未解决的问题在数学。想象一下,试图预测这些问题何时会得到解决。”这些问题有些很快就解决了,有些需要几十年才能解决,还有许多还没有解决。甚至希尔伯特的问题解决的顺序也很难预测。根据Erdōs&graham(1980),p。7.那“Hilbert lectured in the early 1920’s on problems in mathematics and said something like this: probably all of us will see the proof of the Riemann hypothesis, some of us… will see the proof of Fermat’s last theorem, but none of us will see the proof that √2√2是超越的。“事实上,这些结果以相反的顺序提出:朱萨明曾几年以后证明最后一年后,Fermat在1994年被诉讼证明的最后定理,并且黎曼假设仍未被证明或反驳。
  8. 根据Levy&Newborn(1991)13名被试猜测1992-1995年,28名被试猜测1998-2056年,1名被试猜测“从不”。在猜测1998-2056年年份的28人中,有11人猜测的是2010年或更晚的年份。
  9. 正如Fuller & Millett (2011年,p。81)注意,“当我们谈论缩放计算性能时,我们隐含地意味着增加我们为我们花费的每一美元购买的计算性能。”我们大多数人真的不关心我们的新电脑是否有更多的晶体管或其他结构;我们只想要它做更多的事情,更便宜Kurzweil(2012),ch。10,脚注10显示“每秒每秒计算每秒1,000美元”,从1900到2010年增长,包括几个数据点连续的速度摩尔定律的版本在2004年失效了。Chris Hallquist从英特尔和其他来源收集的2006-2011年“每美元每秒指令数”数据证实了这一趋势的延续在这里).因此似乎是计算每一美元摩尔定律的形式持续不减,至少现在。
  10. 这里可能是一个可能的突破迭代胚胎选择.看到米勒(2012年(第9章)以获取详情。
  11. 然而,有趣的是,美国在该期间没有追求非凡的经济,技术和地缘政治优势,核武器的唯一拥有者。此外,值得注意的是,暴力和侵略在整个人类历史中稳步下降(Pinker 2012.).
  12. Tetlock(2010)补充了另一个建议:“对抗性合作”(Mellers等,2001).Tetlock解释说:“核心思想很简单:竞争对手认识和政治营地将提名专家汇集在一起​​,以达成他们对朝鲜或赤字减少或全球变暖的同意 - 然后弄清楚如何至少解决一个子集他们的事实纠纷。争议者需要指定,如果各种商定的实证测试是以一种方式制作,那么每一方都会“欠”另一方的信仰变化是多少。When adversarial collaboration works as intended, it shifts the epistemic incentives from favoring cognitive hubris (generating as many reasons why one’s own side is right and the other is wrong) and toward modesty (taking seriously the possibility that some of the other side’s objections might have some validity). This is so because there is nothing like the prospect of imminent falsification to motivate pundits to start scaling back their more grandiose generalizations: ‘I am not predicting that North Korea will become conciliatory in this time frame if we did x — I merely meant that they might become less confrontational in this wider time frame if we did x, y and z — and if there are no unexpected endogenous developments and no nasty exogenous shocks.'”Tetlock(2012),灵感来自Gawande(2009年)他还试探性地建议在预测中使用核对表:“情报界已经开始为分析师开发绩效评估核对表,推动他们更系统地思考自己的思维方式。金宝博官方但据我们所知,它尚未采取关键的下一步,即对照独立的现实世界业绩标准(如当前评估和未来预测的准确性)检查检查清单的有效性。我们在[ACE] IARPA预测比赛中的经验使我们谨慎乐观地认为,下一步是可行的和可取的。”
  13. 但是,让我们不要在这个任务的困难上愚弄自己。好(1976)声称在计算机国际象棋中达到人类水平的表现是人类水平人工智能的一个良好标志,他写道:“一个具有特级大师力量的计算机程序将把我们带向(机器超智能)的ace。”当然,情况并非如此。今天我们可能会对这个预测窃笑,但是古德在1976年的预测有多错误呢?
  14. 例如。阿姆斯特朗和索塔拉(2012);MacGregor(2001);Lawrence等(2006)