新报告:Botworld

||论文

机器人群体

今天MIRI发布了一份新的技术报告:Botworld 1.0”(pdf)最近的招聘内特·苏亚雷斯和本雅·法伦斯坦。这份报告是"有文化的" Haskell文件,可从米里的Github页面

苏亚雷斯解释了他的随行报告减少错误的文章,这也是讨论该报告的首选地点:

本报告介绍Botworld,这是一种细胞自动机,为研究自我修饰的个体提供了一个玩具般的环境。

传统的代理框架,例如在马尔科夫决策过程和Marcus Hutter的通用代理AIXI中使用的,将宇宙分割为一个代理和一个环境,它们只通过离散的输入和输出通道进行交互。

这种形式主义可能不适合真正的自我修改代理,它们嵌入在它们的环境中。事实上,主体/环境分离有点像笛卡尔二元论:任何使用这个框架来推理世界的主体都不会把自己作为环境的一部分来建模。例如,这样的代理将无法理解环境的概念,从而干扰其内部计算,例如通过热在代理的RAM中诱发错误。

直观地看,这种分离似乎不是一个致命的缺陷,而只是一个简化讨论的工具。我们应该能够从智能的形式模型中去掉这个“笛卡尔式”假设。然而,已经提出的具体的非笛卡尔模型(如Orseau和Ring关于嵌入时空的智能的形式主义,Vladimir Slepnev的无更新决策理论模型,以及Yudkowsky和Herreshoff的tile agents)与他们的笛卡尔模型有很大的不同。

Botworld宇宙是一个玩具的类型的例子,这些形式是为了思考:它提供了一个具体的世界包含代理商(“机器人”)的内部计算环境的一部分,并允许我们研究当笛卡尔代理人之间的障碍及其环境分解。《僵尸世界》允许我们在笛卡尔障碍相关的地方编写决策问题,编程实际代理,并运行系统。金宝博官方

事实证明,当代理嵌入到它们的环境中时,会出现许多有趣的问题。例如,源代码可读的代理可能会受到模拟代理并相应地选择其操作的实体的类似newcomb的问题。

此外,当非笛卡儿行动者试图实现对其未来行动的信心时,自我参照的某些障碍就出现了。其中一些问题是由尤多科夫斯基和赫里肖夫提出的;《僵尸世界》为我们提供了一个具体的环境,我们可以在其中研究它们。

《僵尸世界》的主要好处之一是具体化:当处理自我参照的抽象问题时,在一个完全指定的世界中看到一个具体的决策问题(“游戏”)通常是非常有用的,它直接显示了考虑中的障碍。《僵尸世界》让我们更容易看到这些障碍。

相反,Botworld也使其更容易可视化所建议的代理架构,这反过来也使其更容易可视化潜在的问题和探测架构的边缘情况。

最后,Botworld是一个沟通工具。我们希望Botworld能够帮助其他人理解自我修改代理的各种形式,通过给他们一个具体的方式来可视化这些正在实现的架构。此外,《僵尸世界》为我们提供了一种具体的方式来说明各种障碍,即通过执行出现障碍的《僵尸世界》游戏。

《僵尸世界》帮助我们更深入地了解了自我修改代理的各种形式以及它们所面临的障碍。我们希望《僵尸世界》也能帮助其他人更具体地理解这些问题。