决策理论
决策理论和人工智能通常试图计算类似的东西
$ $ \暗流{\ \中\行动}{\ mathrm {argmax}} \ \ f (a), $ $
也就是说,最大化动作的某些功能。这倾向于假设我们可以把事情搞得足够复杂,把结果看作是行动的功能。
例如,AIXI将代理和环境表示为独立的单元,它们通过明确定义的i/o通道随时间进行交互,这样它就可以选择使奖励最大化的操作。
当代理模型为环境模型的一部分在美国,如何考虑采取其他行动就不那么清楚了。
例如,因为代理是小于环境,可以有代理的其他副本,或与代理非常相似的东西。这导致了有争议的决策理论问题,如孪生囚徒困境和纽科姆问题.
如果EMMY模型2和EMMY模型2具有相同的体验并运行相同的源代码,那么EMMY Model 1应该像她的决策一样行动,它立即转向两个机器人?根据您如何绘制“自己”周围的边界,您可能认为您可以控制两个副本的操作,或者只有自己的副本。
这是反事实推理问题的一个例子:我们如何评价像“如果太阳突然熄灭了怎么办”这样的假设?
- 反设事实
- 纽康姆式推理,即主体与自身的副本相互作用
- 更广泛地推理其他代理
- 勒索问题
- 协调问题
- 逻辑反设事实
- 逻辑更新