以下是机器智能研究所(Machine Intelligence Research Institute)发布的一份不完整的论文清单,这些论文自首次发布以来经过了大量编辑金宝博娱乐。论文的排名是基于它们最初发布的年份。
2019
高级机器学习系统中学习型优化的风险金宝博官方
作者:Evan Hubinger, Chris van Merwijk, Vladimir Mikulik, Joar Skalse和Scott Garrabrant。
看到arXivv1(2019年6月5日)和v2(2019年6月11日)之间的差异。
嵌入式代理
作者:Abram Demski和Scott Garrabrant。
看到arXivv1(2019年2月25日)、v2(2020年8月25日)和v3(2020年10月6日)之间的差异。
本文基于2018年系列幻灯片和博客文章与更详细的笔记的变化.
2017
大马士革死里逃生
作者:Benjamin A. Levinstein和Nate Soares。(v1的作者:Nate Soares和Benjamin A. Levinstein)
- v1 - 2017年3月18日:发表于2017年正式认识论研讨会(FEW)。
- v2 - 2019年11月25日:编辑哲学杂志117:5。也可用在JPhil网站.
2016
逻辑归纳
作者:Scott Garrabrant, Tsvi Benson-Tilsen, Andrew Critch, Nate Soares, Jessica Taylor。
看到arXivv1(2016年9月12日)、v2(2016年9月19日)、v3(2016年10月2日)和v4(2017年12月13日)之间的差异。
逻辑归纳(简略)
(v1的标题:“逻辑归纳:删节版,初稿。”)
作者:Scott Garrabrant, Tsvi Benson-Tilsen, Andrew Critch, Nate Soares, Jessica Taylor。
- v1 - 2016年8月6日:草案流传在线.
- v2 - 2016年9月12日: MIRI技术报告2016-2。
- v3 - 2016年9月12日:编辑。
- v4 - 2016年9月19日:编辑。
- 2020年11月30日:编辑。
安全可中断的代理
作者:劳伦特·奥索和斯图尔特·阿姆斯特朗。
- v1 - 2016年6月1日:发表于第32届人工智能不确定性会议。也可用在UAI网站上.
- v2 - 2016年10月28日:非uai副本编辑。
2015
渐近逻辑不确定性与本福德检验
作者:Scott Garrabrant, Tsvi Benson-Tilsen, Siddharth Bhaskar, Abram Demski, Joanna Garrabrant, George Koleszarik, Evan Lloyd。(v1的作者:Scott Garrabrant, Siddharth Bhaskar, Abram Demski, Joanna Garrabrant, George Koleszarik, Evan Lloyd)
- v1 - 2015年10月12日: MIRI技术报告2015-11;arXiv: 1510.03370 (cs.LG)。也可用在MIRI网站上.
- v2 - 2016年6月12日:为AGI-16会议编辑。
价值学习问题
作者:内特·苏亚雷斯。
- v1 - 2015年1月29日: MIRI技术报告2015-4。
- v2 - 2016年3月5日:编辑并随后在IJCAI-16人工智能伦理研讨会上发表。转载于2018年人工智能安全与保障.
形式化现实世界模型的两个问题
作者:内特·苏亚雷斯。
- v1 - 2015年1月22日: MIRI技术报告2015-3。
- v2 - 2016年6月17日:编辑。
2014
机器智能与人类利益相结合的代理基础:技术研究议程金宝博娱乐
(v1和v2的标题:“将超级智能与人类利益相结合:技术研究议程”。)金宝博娱乐
作者:Nate Soares和Benya Fallenstein。(v1和v2的作者:Nate Soares和Benja Fallenstein。)
- v1 - 2014年12月23日: MIRI技术报告2014-8。
- v2 - 2015年6月25日:编辑《技术奇点:管理旅程(2017年5月出版),并提前上线。
- v3 - 2016年7月15日:编辑和重命名(以区别本议程与“高级机器学习系统对齐金宝博官方”议程)。纳入《技术奇点的版本。
2012
我们如何预测人工智能
作者:Stuart Armstrong和Kaj Sotala。
- v1 - 2012年11月5日:出版于超越人工智能:人工梦.
- v2 - 2017年10月3日如最初的发现是基于一个数据集错误.草稿上加了一条注释,提醒读者注意这一点。
2010
永恒的决策理论
作者:Yudkowsky以利以谢。
- v1 - 2010年11月12日:工作报告。
- v2 - 2018年5月4日:编辑。