嵌入式机构是Abram Demski和Scott Garrabrant的一篇文章,可在AI对准论坛上提供这里。作为一个较短版本的帖子也是如此手绘序列,以及一个轻微的重写版在arxiv

嵌入式机构于2018年首次发布,Arxiv版本在2019年初。2020年8月,Demski和Garrabrant大大更新了所有版本

我们包含以下链接和参考,按照相关主题/部分提出的顺序列出。


一般的

文本介绍-插图介绍---Miri博客后任-Lesswrong后记

进一步阅读:“安全心态和普通偏执狂“;“用于将机智与人类兴趣的代理基础


决策理论

文字版本-插图版本


嵌入式世界型号

文字版本-插图版本

进一步阅读:“艾基问题


强大的代表团

文字版本-插图版本

进一步阅读:“完全更新的尊重问题


子系统金宝博官方对齐

文字版本-插图版本