嵌入式代理是Abram Demski和Scott Garrabrant在AI Alignment Forum上的一篇文章在这里.还有一个更短的版本是手绘序列,以及一个稍微重写的版本在arXiv

Embedded Agency于2018年首次发布,随后于2019年初发布arXiv版本。2020年8月,Demski和Garrabrant大幅更新所有版本

我们在下面包含了链接和参考文献,按照它们在相关主题/部分出现的顺序列出。


一般

文本介绍- - - - - -说明介绍- - -米里博客后记- - - - - -LessWrong后记

进一步阅读:“安全心态和普通妄想症”;”将机器智能与人类兴趣相结合的代理基础


决策理论

文字版本- - - - - -插图版


嵌入式世界模型

文字版本- - - - - -插图版

进一步阅读:“AIXI的问题


强大的代表团

文字版本- - - - - -插图版

进一步阅读:“完全更新的顺从问题


子系统金宝博官方对齐

文字版本- - - - - -插图版