2013年回顾:战略与解释研究——机器智能研究所金宝博娱乐

这是我个人和定性的第三部分2013年MIRI的自我回顾，我开始回顾MIRI 2013年的研究活动。金宝博娱乐所谓“研金宝博娱乐究活动”，我指的是主要针对研究人员的外展工作三种类型Mir金宝博娱乐i进行的研究：

陈述研究金宝博娱乐旨在巩固和澄清已经完成的战略研究或尚未得到足够清晰或简捷解释的友好AI研究，例如。”金宝博娱乐情报爆炸:证据与导入“ 和 ”稳健合作:友好AI研究的案例研究金宝博娱乐(我认为这是一种“研究”形式，因为它通常需要大量的研究工作来清金宝博娱乐晰地解释观点，引用相关资源等)。
战略研究金宝博娱乐旨在澄清未来的可能展开，现在我们可以做些什么来向未来发展到良好的结果，涉及比展示研究更加小说思想和建模 - 但是，区分是模糊的。金宝博娱乐看到如。”智力爆炸微观经济学“ 和 ”我们是如何预测人工智能的?还是无法预测．”¹
友好的人工智能研究金宝博娱乐旨在解决似乎最相关的技术子问题，以设计一个稳定的、自我改进的、具有人文价值的人工智能挑战。这往往涉及把哲学问题变成数学问题，再把数学问题变成工程问题。看到如。”用于自修改AI的贴片代理“ 和 ”囚犯困境中的强大合作．”

我将在这篇文章中回顾MIRI的战略和说明性研究;金宝博娱乐我对MIRI 2013年友好人工智能研究的回顾将在未来的文章中发表金宝博娱乐．在这篇文章的其余部分，我通常不会去区分哪些文章是“说明性”的，哪些是“战略性”的，因为它们大部分是两种类型的。金宝博娱乐

2013年战略和展示研究金宝博娱乐

2013年，我们的职业战略和展示研究由4个论文由Miri，4个杂志，4个章节，4章在同行评审的书中出版，金宝博娱乐9章，深入分析博客帖子，14篇短暂的分析博客文章16面试与领域专家。
我认为这些努力在很大程度上完成了他们的目标目标，但2013年我们学会了如何在未来更有效地完成这些目标的大量巨大。特别是…
专家访谈似乎是实现一些目标的最有效方式。
我们应该专注于写下已知的东西(“说明性研究”)，并描述开放式研究问题，而不是自金宝博娱乐己进行大型战略研究项目其他人可以检查它们。

我们在2013年做了什么?为什么

下面我列出了构成MIRI公众形象的作品²2013年战略和展示研究。金宝博娱乐

MIRI直接发表论文4篇：（1）Yudkowsky的“智力爆炸微观经济学，“^3.（2）Sotala＆Yampolskiy的“对灾难性AGI风险的回应:调查，“(3)格蕾丝的”六个领域的算法进展(4) Fallenstein & Mennen’s。预测AGI：我们知道这么少的时候我们能说什么？”
4 journal-targeted论文，其中两个出版，其中两个仍然被目标期刊审议：（1）Shulman＆Bostrom的“认知增强的胚胎选择(2) Armstrong等人的奔向悬崖(3) Yampolskiy & Fox的人工综合情报安全工程，“⁴（4）Muehlhauser＆Bostrom的“为什么我们需要友好的ai．”⁵
一本同行评议的书里的4章从斯普林克叫奇点假设：科学和哲学评估．Miri工作人员写了三章：“情报爆炸:证据与导入，“”智力爆炸和机器伦理和“友好的人工智能”。⁶另外一章是由当时的miri研究助理Joshua Fox合著的:金宝博娱乐人工智能与人类心理模型．” MIRI also contributed two short replies to other chapters, one reply by Yudkowsky and another by Michael Anissimov.⁷
9深入“分析”博客帖子:(1)索塔拉的“道德关注科学家的简史，“（2）kaas'”贝叶斯调整不会破坏存在的风险慈善机构， <尤多考斯基的(3)>机器人、人工智能和失业问题“和（4）”帕斯卡尔的麻瓜，和Muehlhauser (5)AGI影响专家和友好的AI专家，“（6）”何时会创建AI？“，（7）”安全关键系统的透明度金宝博官方(8)“我们如何有效地规划未来的几十年?(初步结果)、和(9)。决策者将如何处理AGI?(初步结果)．”
14短分析博客文章:尤多考斯基的(1)五个论文，两个lemmas和几个战略意义“(2)”在关键事件W发生后，他们仍然不会相信你“(3)”经济增长放缓的地球是否更有可能出现固定资产投资?，和(4)。对Pascal的赌注进行半理性甚至更糟糕，和Muehlhauser (5)友好的AI研究是有效的利金宝博娱乐他主义，“（6）”什么是情报？“，（7）”美国国际集团是什么?”,(8)”AI风险和安全心态(9)“数学证明改善但不保证安全，安全和友善(10)”Richard Posner谈论AI的危险，“（11）”Russell和Norvig的友好AI，“（12）”从哲学到数学再到工程，“（13）”智能放大和友好的AI，“和（14）”模型组合和调整．”
16次对领域专家的采访:(1)詹姆斯•米勒德盛集团公司面临的异常激励，(2)罗马Yampolskiy人工智能安全工程，(3)尼克Beckstead论远现的重要性，（4）Benja Fallenstein关于Löbian的自修改系统障碍，(5)金宝博官方Holden Karnofsky.关于透明研究分析，(6)金宝博娱乐斯蒂芬·许认知基因组学，(7)Laurent Orseau.人工通用智能，(8)保罗·罗森博客关于认知架构，（9）本Goertzel写到AGI作为一个领域，(10)哈迪Esmaeilzadeh在黑暗的硅，（11）BAS SteuneBrink.关于自我反思程序设计，(12)马库斯·施密特关于新生物技术的风险，(13)罗宾·汉森严肃的未来主义，(14)Greg Morrisett.关于安全可靠的系统，(15)金宝博官方斯科特阿拉尼昂论哲学的进步，和(16)约瑟夫城市机器学习和自动推理。⁸
一般记录和转录关于有效利他主义的谈话，与其他有效的利他主义运动成员：有效利他主义和流动效应．

MIRI的工作人员对战略性和说明性研究的价值和目的有不同的看法。金宝博娱乐就我个人而言，我支持或开展上述研究活动的目的是:金宝博娱乐⁹

测试我们的假设并且试着去理解那些不同意我们的人的观点。例子：“我们如何有效地规划未来几十年？”，“政策制造者将如何处理AGI？”，Greg Morrisett采访。
学习新事物可以为有关存在风险和友好人工智能的战略行动提供信息。例子: Hadi esmailzadeh采访和Josef Urban采访的“六个领域的算法进展”。
让其他研究人员更容易贡献金宝博娱乐对具有战略意义的问题进行少量的初步研究，或者解释如何更深入地研究超级智能战略中的一个开放性问题。例子:《智能爆炸微观经济学》、《六个领域的算法进步》、《我们如何有效地规划未来几十年?》
与可能有一天贡献的研究人员建立关系金宝博娱乐战略性，展示或友好的AI研究。金宝博娱乐例子：许多面试。
解释小“拼图”，有助于Miri典型的观点关于存在风险和友好的AI。例子人工智能什么时候会被创造?、“数学证明可以改进，但不能保证……”以及尼克·贝克斯特德的采访。

这些努力在多大程度上实现了目标?

我们有尚未实现测量我们的战略和陈述研究努力的定量方法符合他们旨在的目标。金宝博娱乐¹⁰目前，我只能分享我的主观、定性印象，这是基于我自己的推理，以及我与一些密切关注我们研究的人的几次对话，在给他们看了前一节近乎完整的草稿之后。金宝博娱乐

再保险:目标(1)．很难找到廉价而有力的证据来证明我们的假设。因此，针对这一目金宝博娱乐标在2013年进行的研究要么微弱地证实了我们的一些假设(如Greg Morrisett访谈)¹¹)，或者只能迈出一小步，为我们的假设提供良好的检验(例如，“我们如何有效地规划未来几十年?”以及“政策制定者将如何处理AGI?”)。

再保险:目标(2)．同样，也很难找到廉价的证据来有力地确定一个重要战略变量的价值(例如AI时间线，AI起飞速度，或“收敛乐器值“思想思想设计空间”。因此，旨在学习金宝博娱乐新事物的研究通常仅提供小更新（对我们，无论如何），例如，关于摩尔定律的前景（牵引艾迪Esmaeilzadeh采访）和关于当前的自动数学推理状态（Josef城市访谈）。

对于难以获得关于人工智能长期未来的额外高概率比证据，我自己的反应是:

好吧，好消息是，人类似乎已经抓住了关于未来机器的大多数低悬垂的水果，这不是15年前的情况。坏消息是，单独的低悬垂的水果并不明确我们的目标赢得．但由于赌注真的很高，我们只需要接受长期预测是困难的，然后更加努力．我们需要获取更多的研究人员涉及的研究人员金宝博娱乐可以制作更多的研究，我们必须准备好接受它可能需要10个博士学位的工作，在我们获得关于一个有关战略相关变量的2：1贝叶斯更新之前。Also, it’s probably good to “marinate” one’s brain in relevant fields even if one isn’t sure which specific updates one will be able to make as a result, because filling one’s brain with facts about relevant fields will likely improve one’s intuitions in general about those fields and adjacent fields.¹²

再保险:目标(3)．我不知道MIRI 2013年的战略和说明性研究对其他研究人员有多大用处，但这种效果通常需要几年的时间才能实现。金宝博娱乐¹³我对这项工作持乐观态度，使他人能够进一步研究，因为这就是事情通常在其他研究领域工作，而且我看不到金宝博娱乐思考过度理智策略将是任何不同的。

再保险:目标(4)．是的，许多面试与有用的域名专家建立了新的关系。

再保险:目标(5)．同样，我在这里没有很好的衡量效果的方法，但是我经常收到来自社区成员的评论，“这样和那样的帖子真的澄清了。”一些分析也被其他组织定期联系起来。例如,赠送和80000小时与我们联系在一起模型结合后在解释自己的研究策略时。金宝博娱乐

展望2014年

正如上面和我的业务回顾，我们仍然需要找到更好的方法来衡量我们的研究影响。金宝博娱乐一个合理的首次尝试测量技术将是调查我们希望以各种方式影响的人的子集，并询问我们的研究如何影响它们。金宝博娱乐

然而，即使在我们可以从改进的影响衡量中学习之前，我想我可以谈谈我在做战略和说明性研究中学到的东西，以及我们计划在2014年做什么不同的事情。金宝博娱乐

首先,采访领域专家是实现我的说明性和战略性研究目标的一种高效方式金宝博娱乐．每次面谈只需要几小时的工作人员时间，而典型的“短”分析员额成本为5至25人小时，典型的“深入”分析员额成本为10至60人小时。

2013年7月1日至12月30日，我们共发表了16篇领域专家访谈，平均每月2.66篇。2014年我打算平均每月发表4次或更多的采访。

第二,说明性研究往往比新的战金宝博娱乐略研究更有价值．Miri（与我们在FHI的合作者配合）有一个罕见的大积木的战略研究已经“完成”但不是金宝博娱乐清楚地解释任何地方。显然，解释已经完成的战略研究的努力比进行原始战略研究，然后进行原始战略研究金宝博娱乐还解释一下。

第三,我们可以通过与具有代表性的、我们想要影响的群体的智慧评论家进行对话，将说明性的(有时是战略性的)研究项目排序金宝博娱乐（例如，AI研究人金宝博娱乐员，兆慈善家），然后准备与其关切相关的着作。We can then dialogue with them again after they’ve read the new exposition, and see whether that particular objection remains, and if so why, and if not then what other objections remain — which can in turn inform our prioritization of future writings, and also potentially reveal flaws in our models.

第四，学生们想知道他们可以做的哪些研究项目会有助于澄清过度智能金宝博娱乐战略．不幸的是，经验丰富的教授还没有敲开我们的门来问我们他们可以研究和写哪些论文来阐明超级智能策略，但是很多金宝博娱乐研究生是。此外，我与研究生有几个谈话顾问他们说他们必须花很多时间帮助他们的学生找到好的项目，如果有人准备适合他们的学生和系里的研究项目提案，那将是很有帮助的。金宝博娱乐

此外,有一些这种策略的历史先例是有效的，即使是在年轻狭窄的超级智能策略领域。最明显的例子是尼克Beckstead，谁写了一个有用的哲学论文，以塑造远期的重要性，部分原因是与fhi.．JoãoLourenço目前正在撰写关于前景的哲学论文道德增强部分原因是与FHI和MIRI的对话。Jeremy Miller是关于普遍智力措施的论文项目的早期规划阶段，部分原因是与Miri的对话。我认为还有其他例子，但我还没有能够确认它们。

因此，在2014年，我们计划发布对研究项目的简短描述，可以告知SuperIntelligence策略。金宝博娱乐一旦尼克博斯特罗姆的人来说，这将更容易超智这本书出版了，所以我们可能会等到今年夏天。

第五，尼克·博斯特罗姆(Nick Bostrom)即将出版的关于机器超级智能的学术专著提供了一个独特的机会，让更多的研究人员参与到超级智能策略中来金宝博娱乐．因此，我们的一些“外展对潜在的战略研究人员”在2014年工作将包括帮助促进Bostrom的书籍。金宝博娱乐我们还计划发布这本书的阅读指南，以增加人们完成的频率，并从书中获益。

请注意，我所说的“MIRI的战略研究”或“超级智能战略研究”是一个聚焦于超级智能金宝博娱乐的子集赠送所谓的“战略原因选择研究金宝博娱乐“ 和东航可以称之为"导致优先级的研究金宝博娱乐．”↩
和往常一样，我们在2013年也做了一些重要的非公开的战略研究(至少现在还没有)，比如对尼金宝博娱乐克·博斯特罗姆(Nick Bostrom)即将出版的书的各种草稿进行了100多个小时的反馈超级智能:路径、危险、策略，在罗宾汉森的早期草案中有15个小时的反馈即将到来的关于全脑仿真的书，并为即将出版的MIRI出版物做了大量工作。↩
Yudkowsky将此标记为“友好的AI＃1中的开放问题”，但我将其分类为战略研究，而不是友好的AI研究。金宝博娱乐↩
在文章发表时，Joshua Fox是MIRI研究助理。金宝博娱乐↩
《为什么我们需要友好的人工智能》发表在2014年初的一期杂志上认为但它是2013年在网上发布的。↩
“友好的人工智能”这一章只不过是尤多科夫斯基早期著作“人工智能在全球风险中的积极和消极因素．”↩
这些章节是在2011年和2012年编写的，但在2013年之前没有在这本书中发表。↩
还有对尤德科夫斯基的两次简短采访:Yudkowsky在逻辑不确定性上“ 和 ”尤多考斯基说:“我们现在能做什么?”””↩
I have an additional goal for some of our outreach and research activities, which is to address difficult problems in epistemology, because they are more relevant to MIRI’s research than to (e.g.) business or the practice of “normal science” (in the Kuhnian sense). “Pascal’s Muggle” is one example. Also, some of our expository and strategic research doubles as general outreach, e.g. the popular interview with Scott Aaronson.↩
嗯，我们可以共享一些基本的Web流量数据。根据Google Analytics，页面（2013年战略或陈述研究），因为它们创建的最“独特的PageView”是：“何时会创建AI？”金宝博娱乐（〜15.5k），斯科特Aaronson采访（〜13.5k），哈迪Esmaeilzadeh采访（〜13.5k），“机器人，AI和失业反常见问题解答”（〜12k），“什么是智力？”(~5k), “Pascal’s Muggle” (~5k), “A brief history of ethically concerned scientists” (~4.5k), “Intelligence explosion microeconomics” (~3.5k), and “From philosophy to math to engineering” (~3.5k). Naturally, this list is biased in favor of articles published earlier. Also, Google Analytics doesn’t track PDF downloads, so we don’t have numbers for those.↩
例如:“Yes, I completely agree with [the]”。数学证明改善......“帖子”“和”我认为重新架构和重新编码事情几乎总是在与螺栓接近相比时赢得安全性。“↩
最后一点是我听取的动机的一部分有那么多非小说类有声书2013年9月以来。↩
“智能爆炸微观经济学”启用“六个域中的算法进展，”但仍然是这种情况美里不得不委托做“域的算法进展”。↩

2013年述评:战略与说明文研究金宝博娱乐

2013年战略和展示研究金宝博娱乐

我们在2013年做了什么?为什么

这些努力在多大程度上实现了目标?

展望2014年

搜索

浏览

订阅