所有Miri出版物

文章

杂志文章会议/车间论文书籍章节技术报告和工作报告

近期和即将发表的论文

艾豪林。2020.“概述建设安全高级AI的11个建议。“arxiv：2012.07532 [CS.LG]。

E Hubinger，C Van Merwijk，V Mikulik，J Skalse和S Garrabrant。2019年。“高级机器学习系统中学到的学习优化风险金宝博官方。“arxiv：1906.01820 [cs.ai]。

V Kosoy。2019。”授权强化学习:学习在一点帮助下避免陷阱在ICLR的安全机器学习研讨会上发表。

A Demski和S Garrabrant. 2019。”嵌入式机构arXiv: 1902.09469 (cs.AI)。

2018

S Armstrong and S Mindermann. 2018。”冬季的剃刀不足以推断不合理代理的偏好。“在神经信息处理系统的进步金宝博官方31.

D Manheim and S Garrabrant. 2018。”对古德哈特法的分类变体。“arxiv：1803.04585 [cs.ai]。

2017

R凯里。2018。”CIRL框架中的不可纠正性。“arxiv：1709.06275 [cs.ai]。在AAAI / ACM关于人工智能，道德和社会会议上呈现的论文。

Critch。2017。”朝向可协商强化学习:在帕累托最优顺序决策中转移优先级。“arxiv：1701.01302 [cs.ai]。

S garrabrant，t benson-tilsen，克里，n拍卖和j泰勒。2017年。“逻辑非全知问题的正式方法。“论文在第16次理论方面的理论和知识的理论方面。

2017. K Grace, J Salvatier, A Dafoe, B Zhang, O Evans。”人工智能什么时候会超越人类?来自人工智能专家的证据arXiv: 1705.08807 (cs.AI)。

v Kosoy。2017年。“使用不完整模型预测arXiv: 1705.04630 (cs.LG)。

苏亚雷斯和莱文斯坦，2020年。”大马士革死里逃生。“哲学杂志117（5）：237-266。此前在第14届年度正式认识论研讨会上。

e dudkowsky和n拍了。2017年。“功能决策理论：一种新的仪器理性理论。“arxiv：1710.05060 [cs.ai]。

2016

T benson-tilsen和n飙升。2016年。“形式化趋同的工具性目标。“纸在Aaai 2016 AI，伦理和社会研讨会上呈现。

克码。2019年。“Löb定理的一个参数化、资源受限的推广，以及开源博弈的一个鲁棒合作准则arXiv: 1602.04184 (cs: GT)。象征逻辑杂志84（4）：1368-1381。以前发表为“参数界Löb的定理和有界代理的强大合作。“

S garrabrant，t benson-tilsen，克里，n拍卖和j泰勒。2016年。“逻辑归纳arXiv: 1609.03543 (cs.AI)。

S garrabrant，t benson-tilsen，克里，n拍卖和j泰勒。2016年。“逻辑诱导（删节）。“Miri技术报告2016-2。

S Garrabrant，B Fallenstein，Demski和N拍卖。2016年。“归纳的一致性arXiv: 1604.05288 (cs: AI)。之前发表为“统一相干”。

S garrabrant，n拍卖和j泰勒。2016年。“无界时滞在线学习中的渐近收敛性。“arxiv：1604.05280 [CS：LG]。

v Kosoy和Appel。2020.“最优多项式时间估计:近似算法的贝叶斯概念arXiv: 1608.04112 (cs.CC)。即将在应用逻辑学报．

J Leike，J Taylor和B Fallenstein。2016年。“对真理问题的正式解决方案。“纸张在第32次人工智能下的不确定性会议上。

奥索和阿姆斯特朗。2016。”安全可中断的代理。“纸张在第32次人工智能下的不确定性会议上。

K Sotala。2016年。“为价值学习者定义人类价值。“纸在Aaai 2016 AI，伦理和社会研讨会上呈现。

J Taylor。2016年。“定量器：最大限度的替代品，可用于有限优化。“纸在Aaai 2016 AI，伦理和社会研讨会上呈现。

J Taylor，E Yudkowsky，P Lavictoire和Chitch。2016年。“高级机器学习系统对齐金宝博官方。“Miri 2016-1技术报告。

2015

B Fallenstein和R Kumar。2015.“HOL的证明生成反射:模型多态的应用。“在互动定理证明：第6届国际会议，ITP 2015，南京，中国，2015年8月24日至27日，诉讼。Springer。

b fallenstein和n飙升。2015.“Vingean反思:自我改进代理的可靠推理MIRI技术报告2015-2。

b expenstein，n飙升和j泰勒。2015.“Solomonoff Induction和AIXI的反射变型。“在AGI会议纪要2015．施普林格。之前发表为MIRI技术报告2015-8。

B Fallenstein，J Taylor和P Christiano。2015.“反思性奥卡尔：古典博弈论的基础。“arxiv：1508.04145 [cs.ai]。以前发布为2015-7 2015-7的Miri技术报告。以删节形式发布为“反思的神谕:人工智能博弈论的基础“ 在2015年LORI的诉讼程序．

S Garrabrant, S Bhaskar, A Demski, J Garrabrant, G Koleszarik, E Lloyd. 2016。”渐近逻辑不确定性与本福德检验arXiv: 1510.03370 (cs.LG)。论文发表于第九届人工通用智能大会。之前发表为MIRI技术报告2015-11。

K。2015。”亚利奥马尔会议：风险缓解的案例研究。“Miri技术报告2015-9。

K。2015。”leószilárd和核武器的危险：危险减缓的案例研究。“Miri 2015-10技术报告。

P LaVictoire。2015.“Miri研究中Löb的定理介绍金宝博娱乐MIRI技术报告2015-6。

N苏亚雷斯。2015。”对齐过度智能化与人类兴趣：一个注释的参考书目。“Miri 2015-5技术报告。

N苏亚雷斯。2015。”正式化现实世界模型的两个问题MIRI技术报告2015-3。

n拍了。2018。“价值学习问题。“在人工智能安全和安全．查普曼和大厅。此前曾在IJCAI 2016年人工智能伦理研讨会上发表，并作为MIRI 2015-4技术报告发表。

N Soares和B Fallenstein, 2015。”逻辑不确定性下推理问题MIRI技术报告2015-1。

N Soares和B Fallenstein, 2015。”走向理想化决策理论。“arxiv：1507.01986 [cs.ai]。以前发布为2014-7的Miri技术报告。以删节形式发布为“在确定性环境中形式化反可能推理的两次尝试“ 在AGI会议纪要2015．

K Sotala。2015.“安全自主ai的概念学习这是AAAI 2015伦理与人工智能研讨会上发表的论文。

2014

S Armstrong，K Sotala和Sóhéigeartaigh。2014年。“着名的AI预测的错误，见解和课程 - 以及他们对未来的意思。“实验与理论人工智能杂志26(3): 317 - 342。

MBárász，P Christiano，B Fallenstein，M Herreshoff，P Lavictoire和E Yudkowsky。2014年。“对囚犯困境的强大合作：通过可证明逻辑计划均衡”。(cs arXiv: 1401.5577。GT)．

T Benson-Tilsen。2014年。“UDT具有已知的搜索顺序MIRI技术报告2014-4。

n bostrom和e dudkowsky。2018。“人工智能的伦理。“在人工智能安全和安全．查普曼和大厅。先前发表在剑桥人工智能手册(2014)。

P Christiano。2014年。“非无所不知，概率推断和元化学MIRI技术报告2014-3。

B Fallenstein。2014。”概率逻辑的拖延工作报告。

B Fallenstein和N Soares, 2014。”自我改善时空嵌入式智能自我引用问题。“在AGI会议纪要2014．施普林格。

b expenenstein和n stiennon。2014年。“'响度'：在偏好关系的前瞻上技术简述。

P Lavictoire，B Fallenstein，E Yudkowsky，MBárász，P Christiano和M Herreshoff。2014年。“通过Löb定理求解囚徒困境中的程序均衡论文发表于AAAI 2014 Multiagent Interaction without Prior Coordination Workshop。

L Muehlhauser和N Bostrom, 2014。”为什么我们需要友好的AI。“思考13(36): 42-47。

L Muehlhauser和B Hibbard, 2014。”AI的探索工程。“ACM的通信57(9):尺码。

舒尔曼和博斯特罗姆，2014。”认知增强的胚胎选择:好奇心还是游戏规则改变者?“全球政策5(1): 85 - 92。

n拍了。2014年。“因果图中的贴片代理MIRI技术报告2014-5。

n飙升和b expenstein。2014年。“Botworld 1.1MIRI技术报告2014-2。

n飙升和b expenstein。2017年。“机器智能与人类利益相结合的代理基础:技术研究议程金宝博娱乐。“在技术奇点：管理旅程．施普林格。以前发布为2014-8的MIRI技术报告，根据“对齐的超明与人类利益对齐的超明：技术研究议程”。金宝博娱乐

N Soares, B Fallenstein, E Yudkowsky和S Armstrong. 2015。”易燃这是AAAI 2015伦理与人工智能研讨会上发表的论文。此前发表为MIRI技术报告2014-6。

e Yudkowsky。2014年。“分布允许平铺分阶段主观欧盟最大化器MIRI技术报告2014-1。

2013

一安排。2013年。“关于Newcomblike问题的决策算法比较工作报告。Miri。

S阿姆斯特朗，N博斯特罗姆和C舒尔曼。2015。”奔向悬崖:人工智能发展的一个模型。“艾和社会(DOI 10.1007 / s00146 - 015 - 0590 - 7): 1 - 6。之前发表为人类未来研究所技术报告2013-1。

P Christiano，e Yudkowsky，M Herreshoff和MBárász。2013年。“论概率逻辑中“真”的可定义性。“草案。Miri。

B Fallenstein。2013。”5- 10问题与Tiling Agents形式主义MIRI技术报告2013-9。

B Fallenstein。2013。”在参数化多态性的一个形式化中降低数学强度技术简述。Miri。

B Fallenstein。2013。”一系列无限的声音理论序列，每个都证明了下一个一致MIRI技术报告2013-6。

B Fallenstein和Mennen。2013年。“预测AGI:当我们知道这么少的时候，我们能说什么?“工作报告。Miri。

克朗。2013年。“六个域中的算法进展MIRI技术报告2013-3。

J哈恩。2013。”概率元素学中的科学归纳MIRI技术报告2013-4。

l muehlhauser。2013年。“智能爆炸常见问题解答工作报告。Miri。（超文本标记语言）

L Muehlhauser和L Helm, 2013。”智能爆炸和机器伦理。“在奇点假设．施普林格。

l muehlhauser和萨拉猴。2013年。“智力爆炸：证据和进口。“在奇点假设．施普林格。（Español.）（Français.）（意大利语）

L Muehlhauser和C Williamson, 2013。”理想的顾问理论和个人cev工作报告。Miri。

W Sawin和A Demski, 2013。”收敛于置信真值的可计算概率分布Π₁句子将不相信真正的π₂句子MIRI技术报告2013-10。

n拍了。2013年。“Fallenstein的怪物MIRI技术报告2013-7。

K Sotala和R Yampolskiy, 2014。”对灾难性的AGI风险的响应：调查。“Physica Scripta.90（1）：1-33。以前发布为2013-2的Miri技术报告。

N施奈尔。2013。”递归定义的逻辑理论是定义良好的MIRI技术报告2013-8。

R Yampolskiy和J Fox, 2013。”人工一般智能与人类心智模型。“在奇点假设．施普林格。

R Yampolskiy和J Fox, 2013。”人工通用智能安全工程。“Topoi32（2）：217-226。

E Yudkowsky。2013。”智能爆炸微观经济学。“Miri 2013-1技术报告。

E Yudkowsky。2013。”拖延悖论技术简述。Miri。

E Yudkowsky和M Herreshoff, 2013。”用于自我修饰的剪辑代理，以及呼吸障碍。“草案。Miri。

2012年

S阿姆斯特朗和K Sotala。2012年。“我们如何预测AI或未能。“在超越人工智能:人工梦．皮尔森:西波西米亚大学。

B Hibbard。2012年。“避免意外的ai行为。“在AGI会议纪要(2012)．施普林格。

B Hibbard。2012年。“决策支持安全AI设计。“在AGI会议纪要(2012)．施普林格。

l muehlhauser。2012年。“人工智能风险参考书目2012工作报告。Miri。

A Salamon和L Muehlhauser, 2012。”奇点峰会2011年研讨会报告工作报告。Miri。

C Shulman和N Bostrom。2012年。“人工智能有多难?进化的论点和选择的影响。“意识研究杂志19（7-8）：103-130。

K Sotala。2012。”人工智能、上传和数字思维的优势。“国际机械意识杂志4（1）：275-291。

k sotala和h valpola。2012年。“合并思维:大脑上传相关的群体思维场景。“国际机械意识杂志4(1): 293 - 312。

2011年

p de blanc。2011年。“人工代理价值系统中的本体论危机金宝博官方。“arxiv：1105.3821 [cs.ai]

D杜威。2011。”学习什么值得重视。“在AGI会议纪要2011．施普林格。

E Yudkowsky。2011。”复杂价值系统是实现有价值的期金宝博官方货需求。“在AGI会议纪要2011．施普林格。

2010年

J·福克斯和C·舒尔曼，2010。”超级智能并不意味着仁慈。“在ECAP 2010的诉讼程序．博士-小屋。

S KAAS，S Rayhawk，Salamon和P Salamon。2010年。“软件思维的经济含义。“在ECAP 2010的诉讼程序．博士-小屋。

萨拉蒙，S Rayhawk和J Kramár。2010年。“情报是多么可理解？“ 在ECAP 2010的诉讼程序．博士-小屋。

C舒尔曼。2010。”Omohundro的“基本AI驱动”和灾难性风险工作报告。Miri。

C舒尔曼。2010。”全脑模拟与超生物进化工作报告。Miri。

c shulman和桑德伯格。2010年。“软件有限奇点的含义。“在ECAP 2010的诉讼程序．博士-小屋。

K Sotala。2010年。“从主要是无害的文明威胁。“在ECAP 2010的诉讼程序．博士-小屋。

塔尔克隆。2010年。“连贯外推意志:机器伦理的元层面方法工作报告。Miri。

e Yudkowsky。2010年。“永恒的决策理论工作报告。Miri。

e yudkowsky，c shulman，萨拉猴，r nelson，s kaas，s rayhawk和t mccabe。2010年。“减少人工智能的长期灾难性风险工作报告。Miri。

2001 - 2009

P de Blanc, 2009。”普遍人工智能预期效用的融合arXiv: 0907.5598 (cs.AI)。

S Rayhawk，Salamon，M anissimov，T mccabe和R纳尔逊。2009年。“改变AI未来主义的框架：从讲故障的讲故事，高尺寸概率分布在ECAP 2009上发表的论文。

C Shulman和SAMBRONG。2009年。“军备控制和情报爆炸在ECAP 2009上发表的论文。

C Shulman，H Jonsson和N塔尔顿。2009年。“机器伦理和超级智能。“在AP-CAP 2009会议记录．东京大学。

C Shulman，N塔尔克隆和H jonsson。2009年。“结果论?机器伦理与道德分歧。“在AP-CAP 2009会议记录．东京大学。

e Yudkowsky。2008。“人工智能作为全球风险的积极和消极因素。“在全球灾难性的风险．牛津大学出版社。以删节形式发布为“友好的人工智能”奇点假设．（官话）（意大利语）（한국어）（Português.）（pусский.）

e Yudkowsky。2008。“认知偏见可能影响全球风险的判断。“在全球灾难性的风险．牛津大学出版社。（意大利语）（pусский.）（葡萄牙语）

E Yudkowsky。2007。”一般智力中的组织水平。“在人工通用智能(认知技术)．施普林格。

e Yudkowsky。2004年。“连贯的外推着工作报告。Miri。

E Yudkowsky。2001。”创造友好的AI 1.0:仁慈目标架构的分析和设计工作报告。Miri。

注册获取MIRI新技术成果的更新

每次有新的技术论文发表时都得到通知。

书

均衡不足：文明在哪里以及如何卡住

e Yudkowsky（2017年）

你应该什么时候认为你可以做点什么异常吗?当您尝试在特定区域倾销时，重要的是您对您的相对能力进行清醒的了解。这个故事只在那里结束，但是，如果你有幸居住在一起足够的文明。

Eliezer Yudkowsky不平衡对于任何质疑何时以及如何知道更好的人，并且比现状更好，这是一个尖锐而活泼的指导。yudkowsky与日常生活提示自由混合关于与日常生活提示的辩论，探讨我们（并且不能）期望发现系统性低效率，并利用它们的核心问题。金宝博官方

合理性：从AI到僵尸

e yudkowsky（2015）

当人类大脑尝试做事时，它们会遇到一些非常奇怪的问题。自我欺骗、确认偏见、不可思议的想法——当我们搬起石头砸自己的脚时，有时似乎我们的创造力是无限的。

地图和领土剩下的合理性：从AI到僵尸“武术”式的理性是什么样的?在这个系列中，Eliezer Yudkowsky解释了认知科学的发现，以及自然主义哲学的思想，这些有助于为理解MIRI的研究和一般地处理雄心勃勃的问题提供有用的背景。金宝博娱乐

比我们聪明：机器智能的兴起

阿姆斯特朗(2014)

当机器比人类变得更聪明的时候会发生什么？人类引导未来，不是因为我们是最强大的或最快的，而是因为我们是最聪明的．当机器比人类变得更聪明，我们将把它们递给方向盘。承诺 - 和危险 - 这些强大的机器是否存在？Stuart Armstrong的新书以清晰度和机智的方式导航这些问题。

面对智力爆炸

l Muehlhauser（2013）

在本世纪的某个时候，机器将超越人类的智力和能力。这一事件 - “情报爆炸” - 威尔是我们历史中最重要的事件，明智地导航它将成为我们所做的最重要的事情。

艾伦·图灵(Alan Turing)和I. J.致敬比尔·乔伊(Bill Joy)和史蒂芬·霍金(Stephen Hawking)提醒过我们这一点。为什么我们认为霍金和他的同伴们是正确的?我们能对此做些什么?

面对智力爆炸Muehlhauser试图回答这些问题。

汉森和尤多科夫斯基的ai - fom辩论

R Hanson和E Yudkowsky（2013年）

2008年底，经济学家罗宾•汉森(Robin Hanson)和人工智能理论家埃利泽•尤多科夫斯基(Eliezer Yudkowsky)就人工智能的未来进行了一场在线辩论，特别是关于普遍具有智能的人工智能是否能够非常迅速地提高自身的能力(也称为“foom”)。詹姆斯·米勒和卡尔·舒尔曼也为这场辩论提供了客座文章。

最初的争论发生在一系列的博客文章中，这些文章被收集在这里。这本书还包括2011年汉森和尤多科夫斯基就这个问题进行的一场现场辩论的文字记录，Kaj Sotala撰写的这场辩论的摘要，以及尤多科夫斯基撰写的2013年关于人工智能起飞动力学的技术报告(“智能爆炸微观经济学”)。

其他

188bet娱乐城

分析- MIRI在其博客上发布了一些最具实质性的研究。金宝博娱乐
谈话- Miri对其研究有关的主题采访了各种各样的研究人员和知识分子。金宝博娱乐

研究人员的资源金宝博娱乐

一个公共Biblatex文件．
一个公共Mendeley集团．
一个公共GitHub回购．