修正-机器智能研究所金宝博娱乐

以下是机器智能研究所(Machine Intelligence Research Institute)发布的一份不完整的论文清单，这些论文自首次发布以来经过了大量编辑金宝博娱乐。论文的排名是基于它们最初发布的年份。

2019

高级机器学习系统中学习型优化的风险金宝博官方

作者:Evan Hubinger, Chris van Merwijk, Vladimir Mikulik, Joar Skalse和Scott Garrabrant。

看到arXivv1(2019年6月5日)和v2(2019年6月11日)之间的差异。

嵌入式代理

作者:Abram Demski和Scott Garrabrant。

看到arXivv1(2019年2月25日)、v2(2020年8月25日)和v3(2020年10月6日)之间的差异。

本文基于2018年系列幻灯片和博客文章与更详细的笔记的变化．

2017

大马士革死里逃生

作者:Benjamin A. Levinstein和Nate Soares。(v1的作者:Nate Soares和Benjamin A. Levinstein)

v1 - 2017年3月18日:发表于2017年正式认识论研讨会(FEW)。
v2 - 2019年11月25日:编辑哲学杂志117:5。也可用在JPhil网站．

2016

逻辑归纳

作者:Scott Garrabrant, Tsvi Benson-Tilsen, Andrew Critch, Nate Soares, Jessica Taylor。

看到arXivv1(2016年9月12日)、v2(2016年9月19日)、v3(2016年10月2日)和v4(2017年12月13日)之间的差异。

逻辑归纳(简略)

(v1的标题:“逻辑归纳:删节版，初稿。”)

作者:Scott Garrabrant, Tsvi Benson-Tilsen, Andrew Critch, Nate Soares, Jessica Taylor。

v1 - 2016年8月6日:草案流传在线．
v2 - 2016年9月12日: MIRI技术报告2016-2。
v3 - 2016年9月12日:编辑。
v4 - 2016年9月19日:编辑。
2020年11月30日:编辑。

安全可中断的代理

作者:劳伦特·奥索和斯图尔特·阿姆斯特朗。

v1 - 2016年6月1日:发表于第32届人工智能不确定性会议。也可用在UAI网站上．
v2 - 2016年10月28日:非uai副本编辑。

2015

渐近逻辑不确定性与本福德检验

作者:Scott Garrabrant, Tsvi Benson-Tilsen, Siddharth Bhaskar, Abram Demski, Joanna Garrabrant, George Koleszarik, Evan Lloyd。(v1的作者:Scott Garrabrant, Siddharth Bhaskar, Abram Demski, Joanna Garrabrant, George Koleszarik, Evan Lloyd)

v1 - 2015年10月12日: MIRI技术报告2015-11;arXiv: 1510.03370 (cs.LG)。也可用在MIRI网站上．
v2 - 2016年6月12日:为AGI-16会议编辑。

价值学习问题

作者:内特·苏亚雷斯。

v1 - 2015年1月29日: MIRI技术报告2015-4。
v2 - 2016年3月5日:编辑并随后在IJCAI-16人工智能伦理研讨会上发表。转载于2018年人工智能安全与保障．

形式化现实世界模型的两个问题

作者:内特·苏亚雷斯。

v1 - 2015年1月22日: MIRI技术报告2015-3。
v2 - 2016年6月17日:编辑。

2014

机器智能与人类利益相结合的代理基础:技术研究议程金宝博娱乐

(v1和v2的标题:“将超级智能与人类利益相结合:技术研究议程”。)金宝博娱乐

作者:Nate Soares和Benya Fallenstein。(v1和v2的作者:Nate Soares和Benja Fallenstein。)

v1 - 2014年12月23日: MIRI技术报告2014-8。
v2 - 2015年6月25日:编辑《技术奇点:管理旅程(2017年5月出版)，并提前上线。
v3 - 2016年7月15日:编辑和重命名(以区别本议程与“高级机器学习系统对齐金宝博官方”议程)。纳入《技术奇点的版本。

2012

我们如何预测人工智能

作者:Stuart Armstrong和Kaj Sotala。

v1 - 2012年11月5日:出版于超越人工智能:人工梦．
v2 - 2017年10月3日如最初的发现是基于一个数据集错误．草稿上加了一条注释，提醒读者注意这一点。

2010

永恒的决策理论

作者:Yudkowsky以利以谢。

v1 - 2010年11月12日:工作报告。
v2 - 2018年5月4日:编辑。

修正