以下是机器智能研究所(Machine Intelligence Research Institute)发布的一份不完整的论文清单,这些论文自首次发布以来经过了大量编辑金宝博娱乐。论文的排名是基于它们最初发布的年份。


2019

高级机器学习系统中学习型优化的风险金宝博官方

作者:Evan Hubinger, Chris van Merwijk, Vladimir Mikulik, Joar Skalse和Scott Garrabrant。

看到arXivv1(2019年6月5日)和v2(2019年6月11日)之间的差异。

嵌入式代理

作者:Abram Demski和Scott Garrabrant。

看到arXivv1(2019年2月25日)、v2(2020年8月25日)和v3(2020年10月6日)之间的差异。

本文基于2018年系列幻灯片和博客文章与更详细的笔记的变化


2017

大马士革死里逃生

作者:Benjamin A. Levinstein和Nate Soares。(v1的作者:Nate Soares和Benjamin A. Levinstein)


2016

逻辑归纳

作者:Scott Garrabrant, Tsvi Benson-Tilsen, Andrew Critch, Nate Soares, Jessica Taylor。

看到arXivv1(2016年9月12日)、v2(2016年9月19日)、v3(2016年10月2日)和v4(2017年12月13日)之间的差异。

逻辑归纳(简略)

(v1的标题:“逻辑归纳:删节版,初稿。”)

作者:Scott Garrabrant, Tsvi Benson-Tilsen, Andrew Critch, Nate Soares, Jessica Taylor。

安全可中断的代理

作者:劳伦特·奥索和斯图尔特·阿姆斯特朗。


2015

渐近逻辑不确定性与本福德检验

作者:Scott Garrabrant, Tsvi Benson-Tilsen, Siddharth Bhaskar, Abram Demski, Joanna Garrabrant, George Koleszarik, Evan Lloyd。(v1的作者:Scott Garrabrant, Siddharth Bhaskar, Abram Demski, Joanna Garrabrant, George Koleszarik, Evan Lloyd)

价值学习问题

作者:内特·苏亚雷斯。

形式化现实世界模型的两个问题

作者:内特·苏亚雷斯。


2014

机器智能与人类利益相结合的代理基础:技术研究议程金宝博娱乐

(v1和v2的标题:“将超级智能与人类利益相结合:技术研究议程”。)金宝博娱乐

作者:Nate Soares和Benya Fallenstein。(v1和v2的作者:Nate Soares和Benja Fallenstein。)


2012

我们如何预测人工智能

作者:Stuart Armstrong和Kaj Sotala。

  • v1 - 2012年11月5日:出版于超越人工智能:人工梦
  • v2 - 2017年10月3日如最初的发现是基于一个数据集错误.草稿上加了一条注释,提醒读者注意这一点。


2010

永恒的决策理论

作者:Yudkowsky以利以谢。