关于有界Löb和有界代理的鲁棒合作的新论文

||论文

强有力的合作MIRI研金宝博娱乐究员Andrew Critch写了一篇关于囚徒困境中软件代理之间合作的新论文,可在arXiv获得:参数有界Löb的定理与有界代理的鲁棒合作。摘要写道:

Löb的定理和Gödel的定理对具有自参考能力的系统的行为做出了预测,这些系统使用无限的计算资源来编写和评估证明。金宝博官方然而,在现实世界中,能够自引用的系统将有有限的内存和处理金宝博官方速度,因此在本文中,我们引入了Löb定理的一个有效版本,该版本适用于给定这种有限资源的情况。这些结果对有限行动者的博弈论有很强的启示,这些有限行动者能够写出关于自己和其他人的证明,包括超越经典纳什均衡和相关均衡的能力,从而在囚徒困境中实现相互合作的方案均衡。Tennenholtz和Fortnow先前研究的合作程序均衡依赖于对程序平等的测试,这是一个脆弱的条件,而“Löbian”合作对对手的实现更加健壮和不可知。

Tennenholtz (2004)利用透明源代码证明了在囚徒困境中agent之间存在合作均衡。这表明,在经典博弈论中,相互背叛是理性的,这是一种普遍现象不能概括到代理对彼此的条件行为有强保证的设置。

然而,Tennenholtz版本的程序均衡只是建立了具有相同源代码的代理之间的理性合作是可能的。Patrick LaVictoire和MIRI的其他研究人金宝博娱乐员提供了额外的结果更有力的合作是可能的在不可计算的代理之间,有效地确定这类博弈的结果是可能的。然而,一些读者反对这些方法的无限大性质(例如,使用中止的神谕),并担心并非所有的结果都适用于有限的计算。

Critch的报告证明了有限代理存在稳健的合作均衡。在此过程中,Critch证明了Löb定理的一个新的推广,从而证明了Gödel的第二个不完备定理。Löb定理的这个参数版本适用于可以写成的证明n或更少的字符,其中参数n可以设置为任意数字。想了解更多关于这个结果意义的背景知识,请参见LaVictoire的“介绍Löb在MIRI研究中的定理金宝博娱乐”。

新的Löb结果表明,与无界代理面临的类似,有界代理在进行自我参照推理时面临障碍,而且也能获得一些相同的好处。重要的是,这个引理很可能允许我们用有限的例子而不是无限的例子来讨论许多其他的自我参照现象。


注册获取MIRI新技术成果的更新

每次有新的技术论文发表时都得到通知。