节省时间

||分析

注意:这是有限因子分解集的序言,我将在接下来的几周发布一个序列。太平洋时间本周日中午,我将做一个Zoom演讲(链接)介绍有限因子集,这是一个框架,我发现它在技术上和逻辑归纳法一样有趣。

更新5月25日:一个介绍有限因子分解集的视频和博客现在可用在这里.)


在过去的几年里,我的大部分研究动机都是试图节省时间的概念,例如,从决策理论问题所产生的金宝博娱乐所有奇怪的因果循环中节省时间。这篇文章希望能解释我为什么这么在乎时间,以及我认为需要修正的地方。

为什么时间吗?

我尽量简短地描述一下时间是因果关系.例如,在一个Pearlian Bayes网络中,您从较早的节点绘制到较晚的节点的边。在某种程度上,我们想要考虑因果关系,那么我们就需要理解时间。

重要的是,时间是学习和行为发生的基础.当特工们学习时,他们会随着时间的推移而学习。时间的流逝就像一种仪式机会被摧毁,知识被创造.我认为很多学习模式都被微妙地混淆了,因为它们是基于令人混淆的时间概念。

时间对于思考代理也是至关重要的。我对代理最好的简短定义是代理就是时间旅行.代理是一种机制,通过它,未来能够影响过去。代理为其行为的未来结果建模,并在这些结果的基础上选择行动。在这个意义上,结果原因这个动作尽管在标准的物理意义上,动作来得更早。

问题:时间很疯狂

时间出问题的主要原因是它“糊涂”。

关于纽科姆的问题,最令人困惑的是,我们想把我们的决定看作是在装满盒子之前做出的,尽管实际上它是在装满盒子之后做出的。这暗示着,除了物理时间之外,我们可能还想理解一些其他的“逻辑”时间。

然而,当我们尝试这样做时,我们遇到了两个问题:首先,我们不知道逻辑时间从何而来,或者如何学习它;其次,我们遇到了一些明显的时间循环。

我打算把第一个问题搁在一边,集中注意第二个问题。

要知道我们为什么会陷入时间循环,最简单的方法就是注意到,物理时间似乎至少和逻辑时间有一点纠缠。

想象一下,有人在运行一个纽科姆问题的物理模拟,并跟踪所有原子的所有细节。从这个角度来看,似乎有一种有用的感觉,即在代理人决定是一盒还是两盒之前,先填满盒子。然而,与此同时,这些原子组成了一个代理,它不应该做出决定,就好像它无力改变任何事情一样。

也许这里的解决方案是,想象有许多不同类型的“前”和“后”,“原因”和“结果”,等等。例如,我们可以说,从代理优先的角度来看,X在Y之前,但从物理优先的角度来看,Y在X之前。

我认为这是对的,我们想要把时间看作是许多不同的系统(希望是可以预测地相互联系的)。金宝博官方但我不认为这解决了整个问题。

考虑一对FairBot在开源囚徒困境中成功地执行了一次Löbian握手合作。我想说的是,每个agent的合作在某种意义上导致了其他agent的合作。我可以说,相对于每个主体而言,因果/时间顺序是不同的,但我认为在这个例子中,循环是结构的重要组成部分。(我甚至不确定我想要把时间的哪个方向与哪个代理联系起来。)

出于其他原因,我们也试图在我们的时间/因果关系中设置循环。例如,当在一个持续存在的系统中建模一个反馈循环时,我们可能会画出看起来很像贝叶斯网的结构,但不是金宝博官方无环的(例如,POMDP)。我们可以把它看作是另一个系统的投影它有一个额外的时间维度,但它仍然是一个有用的投影。金宝博官方

解决方案:抽象

我主要希望通过抽象来恢复一个连贯的时间概念并解开这些时间循环。

在主体根据结果来选择行为的例子中,我认为存在一个抽象的结果模型它先于行为的选择,先于实际的物理结果。

在纽科姆的问题中,我想说的是,在盒子被填满之前,有一个行为的抽象模型。

在开源囚徒困境中,我想说的是,在代理人员的实际程序跟踪之前,有一个抽象的合作证明。

所有这些都指向同一个方向:我们需要让结构的粗糙抽象版本出现在不同的时间,而不是相同结构的更精细版本。也许当我们正确地允许不同层次的描述在因果链中具有不同的联系时,我们便能够解开所有的时间循环。

但如何?

不幸的是,我们对时间最好的理解是Pearlian因果关系,而Pearlian因果关系并不适合抽象。

珀尔的贝叶斯网有很多变量,但当其中一些变量是其他变量的粗糙抽象版本时,我们就必须考虑到决定论,因为我们的一些变量是彼此的确定性函数;珀尔身上最好的部分与决定论格格不入。

但问题远不止于此。如果我们在确定性函数的方向上画一个箭头,我们将画一个时间箭头,从这个结构的更精细的版本到这个结构的更粗糙的版本,这与我们所有例子的方向相反。

也许我们可以避免从更细化的节点到更粗的节点绘制这个箭头,而是有一个从粗节点到细化节点的路径。然后我们可以复制粗节点的另一个副本在更细的节点的下游,不增加新的自由度。那么是什么阻止我们交换粗节点的两个副本呢?

总的来说,在我看来,Pearl还没有准备好让一些节点成为其他节点的抽象版本,我认为为了节省时间,需要修复这些问题。


讨论:LessWrong

你喜欢这个帖子吗?你可以享受我们的另一个分析的帖子,包括: