人工智能领域有多大?(初步结果)

||分析

与乔纳·辛尼克合著。

人工智能的领域有多大,过去又有多大?

这个问题与AGI安全策略中的几个问题有关。举两个例子:

  • 人工智能预测.一些人通过观察每个日历年的研究成果来预测人工智能的进展。金宝博娱乐但随着人工智能的进步,(1)人工智能资金,(2)质量调整研究年(QARYs)和(3)计算能力比日历年更相关。金宝博娱乐1为了使用这些指标来预测未来的人工智能进展,我们需要知道过去不同时期需要多少美元、QARYs和计算周期来产生迄今为止观察到的人工智能进展。
  • 利用分.如果大多数人工智能研究金宝博娱乐资金来自相对较少的资产者,或者如果大多数研究由相对较少的研究团体产生,那么这些可能代表了高价值的杠杆点,通过这些点,一个人可能会影响整个领域,例如,更关心人工智能的长期社会后果

出于这些原因,MIRI最近调查了人工智能领域的当前规模和过去的增长。这篇博客文章总结了我们的初步发现,旨在为未来对该主题进行更深入的研究提供一个“快速而粗糙”的平台。金宝博娱乐

首先,我们尝试使用如下指标来量化该领域的规模和过去的增长

  • 许多研究人员金宝博娱乐
  • 的期刊
  • 出版数量
  • 数量的会议
  • 多的组织
  • 为AI研究获得了着名的奖项金宝博娱乐
  • 量的资金

解释这些数字很困难,而且它们可能比研究的对象水平研究提供的信息少得多,但这些数字仍然有一些相关性:金宝博娱乐

  • 为了研究增长,我们可以查看统计数据中的年增长率,并将其与其他衡量人工智能进展的指标相结合,从而估算出未来中期人工智能研究的数量。金宝博娱乐
  • 为了研究当前AI领域的规模,我们可以查看与计算机科学(CS)相关的定量指标。2,并将这些内容与当前CS领域的整体规模相结合,从而告知玩家AI所取得的整体进展。

我们能够收集的数据提供相对于CS字段的大小的AI字段大小的体面图像,但它们不足以支持强大的结论,并保证更多的调查。除非另有说明,否则请参阅电子表格“人工智能领域目前的规模和过去的增长来获取这篇博客文章所基于的原始数据。

AI领域的大小

根据各种指标,人工智能的研究似乎只占计算机科学(金宝博娱乐CS)研究的10%.然而,所使用的指标主要用于研究金宝博娱乐数量而不是研究金宝博娱乐质量,因此可能是测量已投入有多少QARYS的弱代理。也就是说,对于AI工作授予大约10%的CS研究奖项的事实可能表明,CS和AI的研究质量金宝博娱乐类似。

我们从那里获得了许多有关数字微软学术搜索(Mas)。MAS允许人们在标题下搜索:

  • 计算机科学
  • 人工智能
  • 自然语言和言语
  • 机器学习和模式识别
  • 计算机视觉

人们根据是否将后三个学科(以下称为“同源学科”)计算为人工智能得到不同的数字。下面,我们为单独归入“人工智能”类别的项目和归入“人工智能”类别的项目提供数据。在一个同源学科的标题下。

许多研究人员金宝博娱乐

MAS给出了计算机科学、人工智能和人工智能相关学科的作者数量,但这些数据并没有像发表数量数据那样反映已完成的研究数量。金宝博娱乐3.

IEEE计算智能协会具有~ 7000名成员和IEEE计算机协会具有~ 85000会员,所以第一个会员是第二个会员的8%。

其他一些相关的数字(没有画出一个连贯的画面):

  • 根据美国有26700名计算机和信息科学研究人员。金宝博娱乐
  • ACM人工智能特别兴趣小组(SIGAI)具有“超过1000名会员。”
  • 国际神经网络学会INNS拥有“超过2000名会员”。

的期刊

MAS列出了1360种计算机科学期刊,其中106种与人工智能有关,172种与人工智能或人工智能相关的学科有关,分别占8%和13%。4

出版数量

在2005年至2010年期间,在MAS的“CS”标题下的出版物中,约10%被列入“AI”,约20%被列入“AI”或其同源学科之一。5如果你查看1990年到1995年,1995年到2000年以及2000年到2005年的出版物,你会发现大致相同的百分比。6在谷歌Scholar中搜索“计算机科学”和“人工智能”,你会发现后一种搜索的点击量大约是前一种搜索量的30%,7这可能意味着人工智能研究的数量明显超过CS研究的10%,但是一些包含“人工智能金宝博娱乐”的论文不是人工智能研究,一些计算机科学的论文可能不包含“计算机科学”。

数量的会议

MAS列出了CS中的3519个“top conferences”和AI中的361个“top conferences”,前者的数量约为后者的10%。AI或相关学科有561个“顶级会议”,即CS会议数量的16%。8

多的组织

微软学术搜索列出了11338个CS组织和7125个AI组织,占63%。如果将相关学科计算为AI, AI组织的数量为21802个,是CS组织的192%。9孤立地拍摄,这表明AI研究的数量远远大于10%。金宝博娱乐

“组织数量”似乎比“出版物数量”更弱,所以应该打折。金宝博娱乐然而,AI组织与CS组织的比率比我们所看到的其他比率要高得多,这是一个谜题。也许这种差异来自于CS社区和AI社区有着不同的文化规范。或者,也许MAS对组织的统计不如对出版物的统计一致。

人工智能研究与CS研究的著名奖项金宝博娱乐

ACM图灵奖:六项奖项中有六个奖项为AI研究授予,所以总数的13%。金宝博娱乐10

Nevanlinna奖:为期8次奖品中的一项,为AI工作授予,因此总数的12.5%。但是,1986年颁发了AI工作的奖品,这是很久以前的奖项。11

量的资金

2011年,美国国家科学基金会(NSF)收到了6.36亿美元用于CS研究(通过金宝博娱乐CISE).其中,1.69亿美元去了信息与智能系统。金宝博官方IIS有三个项目:网络人类系统(CHS)、信金宝博官方息集成与信息学(III)和鲁棒智能(RI)。如果大约三分之一的资金用于这些项目,那么5600万美元将用于鲁棒情报公司,也就是CS总资金的9%。(CISE的一些资金可能已经用于IIS之外的人工智能工作——也就是说,通过ACICCF,或中枢神经系统-但乍一看,通过CISE提供的非iis AI资金看起来微不足道。)

美国CS研究的其他主要资金来源包括金宝博娱乐ONR美国国防部高级研究计划局和一些公司(微软,谷歌,IBM等),但我们还没有调查这些资金来源。我们也没有调查美国以外的国家。资金来源。

人工智能领域的发展

我们没有对人工智能研究人员数量的增长率进行足够深入的调查,从而做出有意义的估计。金宝博娱乐然而,所有领域的科学家和工程师数量的增长速度可能作为一个很弱的人工智能或CS增长率的代理度量。

例如,1995年至2005年间经合组织国家的科学和工程研究人员年增长率似乎约为3.3%金宝博娱乐,对应于23年的倍增时间。12这需要与研究人员的平均生产力(以每个研究人员的专利、每个研究人员的培训时间、每篇论文的合作作者数量以及被引用的论文数量来衡量)正在下降的迹象并金宝博娱乐列看待。13信息和智能系统(IIS)的NSF预算一般增加了自1996年以来每年的4%至20%,2003年一金宝博官方次性百分比达到60%,总增加了1530%在1996年至2011年之间。14“强大的情报”是本预算涵盖的三个项目领域之一。根据MAS的数据,在1965年至1995年期间,人工智能领域的出版物数量每5年增长100%以上,但在1995年至2010年期间,每5年增长约50%。人们在机器学习和模式识别方面也看到了类似的趋势。15

进一步研究的注意事项金宝博娱乐

关于这一主题的金宝博娱乐未来研究可能会挖掘得更深入,并得出更可靠的结论。我们在这里的目的是为未来的研究打下一些基础。金宝博娱乐考虑到这一点,以下是未来研究人工智能领域当前规模和过去增长情况的研究人员需要注意的事项:金宝博娱乐

  • 如果被引用的论文是更新的,这可能意味着进展更快。另一方面,它也可能意味着“赶时髦”,人们可能需要在某种程度上区分这两者。
  • Scopus、Web of Science、MS学术检索和科学引文索引(SSI)等引文数据库可以用于分析引文模式。16
  • 引文数量的一些噪声源是:(a)期刊编辑要求提交论文的作者增加对同一期刊其他论文的引用,以提高该期刊的影响因子;(b)作者过度引用自己的论文,以增加他们的引文数量。17

感谢Sebastian Nickel收集数据,感谢Carl Shulman提供反馈。


  1. 另一个重要的输入指标是从其他领域引进的理论进展,例如从统计学的方法。
  2. 它也值得注意下列。假设源S可用于生成用于与AI的Q1的数量Q1的估计E1和与CS有关的估计E2。然后E1和E2可以夸大或低估Q1和Q2(分别)。让E1和E2与Q1和Q2不同的因素是F1和F2。我们对F1和F2没有良好的估计,但如果我们计算比率1(e1)/(e2),我们得到[(q1)/(q2)] * [(f1)/(f2)]。数量(F1)/(F2)比F1更接近F1为1,因为引导E1偏离Q1至给定度的一些因素也将引导E2偏离Q2以偏离Q2至类似程度。所以(E1)/(E2)更接近(Q1)/(Q2)(以相对术语)比E1为Q1(相对术语)。
  3. MAS显示,CS有160万作者,AI有26万作者,占16%。如果把人工智能和相关学科的作者数量加起来,这个数字会上升到39%。然而,有些作者在多个学科上发表文章(例如,作者可能同时发表人工智能和机器学习方面的文章)。
  4. 细胞B96到B100电子表格
  5. 一些论文可能被归入多个类别,因此不清楚是10%的数字更有代表性,还是20%的数字更有代表性。
  6. 表的左上角为A2电子表格
  7. 谷歌学者结果:

    搜索词“计算机科学”(加引号)会得到265万个结果
    “人工智能”-> 1,710,000
    “机器智能”-> 65.5万

    自2013年以来
    搜索词“计算机科学”(引用)产生99,600个结果
    “人工智能”——> 32,300
    “机器智能”-> 11,600

    2012年
    搜索词“计算机科学”(引用)产生163,000个结果
    “人工智能” - > 52,500
    “机器智能”-> 22,600

    2011年
    搜索词“计算机科学”(在引号中)会得到24.7万个结果
    “人工智能”——> 66100
    "机器智能" -> 23000

  8. 细胞B27到细胞B31电子表格
  9. 细胞B119到细胞B123电子表格
  10. 年度图灵奖首次颁发于1966年(最后一个奖项是2012年),至今已有46个奖项。其中6份是关于人工智能相关研究的成果,即:金宝博娱乐
    1969年,马文·明斯基
    •1971年,约翰·麦卡锡
    •1975年Newell&Simon
    •1991 Robin Milner(机器辅助证明构造)
    1994年爱德华·费根鲍姆和拉杰·雷迪
    •2010 Leslie Valiant(大概是正确学习)
    •2011年朱迪亚珍珠
    46个奖项中有8个颁给2人,另外2个颁给3人,所以总共有58个获奖者,其中8个是人工智能相关成就奖。
  11. 奈凡林纳奖自1982年以来每4年颁发一次;到目前为止是8次。
  12. 美国国家科学基金会(NSF)。科学与工程指标:2010年第3章。科学与工程劳动力

    在20世纪60年代早期,一位著名的科学历史学家,德里克·j·德·索拉·普莱斯(Derek J. de Solla Price),在历史上很长一段时间里,考察了科学的发展和科学家的数量,并在一本名为《科学》(science)的书中总结了他的发现科学从巴比伦(1961)。通过大量的实证测量(大多数超过300年),普莱斯发现,科学和科学家的数量往往每15年翻一番,高质量的科学和科学家的指标往往增长较慢(每20年翻一番),而低质量的科学和科学家的指标往往增长较快(每10年)。根据Price(1961)的说法,这种长期指数增长的一个含义是“所有在世的科学家中有80%到90%现在还活着。”这一见解源于这样一种可能性:过去45年(这一时期翻了三倍)的大多数科学家仍然在世。普莱斯对这些增长模式的许多含义很感兴趣,但他特别感兴趣的是这种增长不可能无限期地持续下去,科学家的数量将达到“饱和”。普莱斯在1961年就担心市场饱和已经开始。

    最近几个时期科学家和工程师数量的增长率与Price过去几个世纪的估计有何不同?表3显示了在一段时间内美国和世界其他地方的S&E劳动力的一些测量数据的增长率。在这些指标中,美国劳动人口中拥有S&E博士学位的人数的年平均增长率最低,为2.4%(如果这个增长率继续下去的话,在31年里翻了一番)。在美国,在S&E行业工作的博士学位持有者的数量以年均3.8%的速度增长(如果继续增长,20年内翻了一番)。S&E没有全球个人数量,但经济合作与发展组织(OECD)成员国的“研究人员”数量以平均每年3.3%的速度增长(如果继续下去,23年金宝博娱乐翻了一番)。大多数发展中国家的科学家和工程师人口数据非常有限,但经合组织对中国研究人员的数据显示,中国科学家和工程师的平均年增长率为10.8%(如果继续的话,8年内翻了一番)。金宝博娱乐所有这些数字都与S&E劳动力的持续增长超过一般劳动力的增长率基本一致。

  13. 下面是一些关于每个研究者生产力下降的参考资料。金宝博娱乐我们的感谢Gwern用于编制文章中的许多科学停滞不前
    弗里茨•马克卢普。美国知识的生产和分配北京:清华大学出版社,1962年
    •她,保罗。无规模效应的内生增长,美国经济评论,1998年12月,88,1290-1310
    •特曼,《电气工程教育简史》,IEEE的诉讼程序1998年8月,86 (8),1792-1800
    •Adams, James D., Black, Grant C., clemons, J.R., and Stephan, Paula E. Scientific Teams and Institutional collaboration: Evidence from U.S. Universities, 1981-1999, NBER Working Paper #10640, 2004年7月
    •琼斯(2006),时代和伟大的发明
    •琼斯(Benjamin F。知识的负担和文艺复兴时期人的死亡:创新越来越难了吗?国家经济研究局工作论文#11360,2005
    •国家研究委员会,金宝博娱乐准时到博士:研究科学与工程博士学位延长时间北京:科学出版社,1990
    Tilghman,雪莉(椅子)等。生命科学的早期发展趋势北京:中国科学院出版社,1998年
    •朱克曼,哈里特和默顿,罗伯特。《科学中的年龄、老化和年龄结构》,罗伯特·默顿,科学社会学芝加哥:芝加哥大学出版社,1973,497-559
    •克罗宁等人,2004可见的、不可见的和看不见的工作:20世纪化学合作模式,美国信息科技学会杂志(2)
    •格罗斯曼,杰里。数学研究协作图的发展,金宝博娱乐Congressus Numerantium, 2002, 158, 202-212
    •克罗宁,布莱斯,肖,黛博拉和拉巴利,凯瑟琳。《数千人:20世纪的合著者和次合著者合作》,刊载于《心理学和哲学文学》学术期刊,美国信息科技学会杂志, 2003, 54(9), 855-871
    •麦克道尔(John)和梅尔文(Melvin)。合著的决定因素:经济学文献分析,《经济学与统计学评论》1983年2月,65,155-160
    •哈德逊,约翰。经济学多篇论文的趋势,经济展望杂志,1996年夏季,10,153-158
    •大卫·拉邦和罗伯特·托利森。知识合作,政治经济学杂志2000年6月,108,632 -662
    2010•琼斯。科学的发展,科学政策如何?
    •《苏联的崩溃和美国数学家的生产力》,作者:乔治·j·博尔加斯(George J. Borjas)和柯克·b·多兰(Kirk B. Doran), NBER工作论文No. 17800, 2012年2月

  14. 见表中左上角的A367电子表格
  15. 表的左上角为A2电子表格
  16. 2008年的一项研究比较了PubMed、Scopus、Web of Science和谷歌Scholar,并得出结论:“PubMed和Google Scholar免费访问......] Scopus提供大约20%的覆盖范围,而不是科学网站,而谷歌学者则提供不一致的准确性结果。PubMed仍然是生物医学电子研究中的最佳工具。金宝博娱乐Scopus涵盖了更广泛的期刊范围[...],但目前有限于最近的文章(1995年后发布)与科学网络相比。Google Scholar一般来说,可以帮助甚至最晦涩的信息检索,但它的使用是受到不足的,较少的更新,引用信息的使用。“Larsen & von Ins (2010)声称SSI的覆盖率一直在下降。
  17. 以下是关于引用的一些警告,作为质量的衡量标准:Wilhite和Fong(2012):“......影响因素仍然是学术界”量化科学质量“的主要方式。影响因素的一个副作用是他们为编辑为胁迫作者创造的激励,为他们的日记添加引文。强制自我引用在同行评审过程中不指的是正常引用方向,意味着改进纸张。强制性的自我引用是指(i)毫无疑问的要求缺乏归因;(ii)没有任何建议对特定文章,作者或需要审查的工作组;(iii)只指导作者从编辑的日记中添加引文。“和Storbeck (2012):“[程度]的操纵是惊人的。例如,according to figures published by the Managing Editor of the ‘Review of Finance’, the impact factor of the ‘Journal of Banking and Finance’ – the fourth worst offender according to the study by Wilhite and Fong – dwindles if self-citations are excluded. While the raw impact factor of the journal is 2.731, the one without self-citations is just 0.748.”

你喜欢这个帖子吗?你可以享受我们的另一个分析的帖子,包括: