托马斯·鲍德·自行参考和代理技术内部机器情报研究所金宝博娱乐

托马斯·博兰肖像托马斯·博士，博士。他是丹麦技术大学DTU计算学院的副教授。

他正在研究逻辑和人工智能金宝博娱乐的研究，主要关注使用逻辑来模拟人类的规划，推理和解决问题。

特别感兴趣的是建立社会现象和社会智能的模型，目的是创建能够与人类和其他计算机系统进行智能交互的计算机系统。金宝博官方

卢克·穆罕沃斯：Bolander（2003）以及您的一些后续工作研究悖论自我参考在逻辑/计算代理的背景下，如例如那样。韦弗(2013)．您认为您对这些悖论的工作是否会对正在设计计算代理商的AI研究人员进行实际进口，或者您只是使用代理框架来探索自我引用的更哲学方面吗？金宝博娱乐

托马斯·博兰：首先，让我解释为什么我甚至开始在逻辑/计算代理的背景下学习自我引用。在我的博士学位我正在努力如何正式形式化代理人反应，即代表和推理自己的心理状态。其中一个主要动机是代理需要反思，以便在社会背景下理解自己的作用，例如，确保不要“妨碍他人”并理解如何帮助其他代理人来实现目标。另一种动机是，内省在学习方面是必不可少的：意识到一个人自己的知识和例程的缺点是蓄意的，目标导向的方法，以获得新的知识，提高问题解决技巧。

内省可以进入自己的知识，信仰，意图，计划等。在我的博士学位专注于知识。代表诸如在逻辑形式主义中的知识的命题态度可以通过谓词或模态运算符以两种明显的方式完成。在大多数逻辑设置中，谓词解决方案比模态运算符解决方案更具表现力，但具有高的效力，有时也会出现矛盾的句子，导致不一致。当在一阶谓词逻辑中将知识作为谓词形式化时，假设知识的理想化（公理）的理想化（公理）导致更加合理，导致琐碎的不一致（这是Montague的定理，见图。我参加自我指涉在里面斯坦福州百科全书的哲学)．不一致在这里出现，因为逻辑变得足够表达，以表达似是而非的自我指称的句子，关于知识，如“这句话是不知道的”。为了解决这个问题，我们可以采取以下几种可能的方法:1)使用非经典逻辑，例如副一致性逻辑;2)限制知识公理的集合或它们的适用性;3)选择模态算子方法。

在我的博士学位，我主要被认为是选项2.今天我的首选选择是3，使用模态逻辑而不是一阶谓词逻辑。选项3似乎是逻辑和AI社区中目前最优选的选择，基于模态逻辑的认知逻辑，颞抑制逻辑，动态认知逻辑的大量工作。那么为什么人们选择模态逻辑方法？嗯，一个原因肯定是为了避免刚才提到的自我引用和不一致的问题。另一个是模态逻辑方法通常具有较低的计算复杂性，这对于实际应用至关重要。所以从某种意义上说，要回答“这些悖论是否会对AI研究人员进行实际进口的问题，第一个答案可能是：他们已经拥有了。金宝博娱乐他们已经意识到了人们对这些问题没有出现的其他逻辑的关注。

但是，这个答案当然并不完全令人满意。模态逻辑方法解决自我引用问题的方式是通过选择甚至无法表达自引用句子的逻辑。所以下一个问题成为：我们会错过他们（自我参照句子）吗？他们是否在推理中具有重要作用，最终需要建立具有强大的内省能力的计算代理？这个问题更难回答。模态方法意味着知识发生明确分层。在模态方法上，可以拥有一阶知识（关于Ontic事实的知识），二阶知识（关于关于洋子事实知识的知识），三阶知识（关于二阶知识的知识）等，但没有定点允许知识陈述引用自己。然而，这种分层似乎是认知性的。从认知科学的研究中，特别是在所谓的虚假信仰任务中，众所周知，孩子们只开始汇在4岁左右的二阶知识，只有在7-8岁左右的三阶知识。． And even adults seldom reason beyond third-order or at most fourth-order. This seems to talk in favour of some kind of explicit stratification also in the case of humans, and with a fairly fixed limit on the depth of reasoning. This picture fits better with the modal approach, where the stratification is also explicit (modal depth/depth of models). Furthermore, in the modal approach it is more straightforward to mimic limits on the depth of reasoning. Of course, having a fixed limit on one’s depth of reasoning means that there will be certain problems you can’t solve, like泥泞的孩子拼图孩子比你的深度极限还多。但即使在这样的限制下，人类认知的经验表明，仍然有可能进行相当高级的社会认知和内省。

因此，可能遵循的自我参考问题可能遵循的选择非分层方法是在其他地区（例如，数学（设定理论，不完整定理）以及语义（真理理论）的基础之类的领域更相关用于计算代理人。然而，我仍然发现它有点令人惊讶，我更令人惊讶地接受一个明确的分层方法，提出了所谓的特定态度，而不是设定理论中的自我参考问题的解决方案：在设定的理论中，我找到了非分层的方法Zermelo-Fraenkel集理论比分层的方法更合理类型理论．但即使自我参照不会扮演着重要的实际作用计算代理商的发展,它可能会一直潜伏在形式的背景和影响人们的选择,以及以同样的方式起着重要的基础性作用在数学。

卢基：解决您在论文中讨论的代理内省的类型（粗略）的工作中的一些例子是什么，但使用模态逻辑方法来挑战或其他一些分层方法？

托马斯。我在论文中给出的大多数例子都涉及对知识或信念的量化，比如“我相信我的一些信念是错误的”或“我相信爱丽丝比我更了解X”。要量化运算符方法(模态逻辑方法)中的知识或信念，至少需要一阶模态逻辑。当我在博士学位后从谓词方法转向算子方法时，我本质上一直“下移”到命题模态逻辑，所以我不熟悉一阶或高阶模态逻辑在内思知识表示中的最新应用。我可以提供一些相关的参考资料，但都不是最近的。一种是本书中介绍的用模态知识算子扩展的情形演算知识基础的逻辑Levesque & Lakemeyer著(MIT出版社，2001)。另一个是书理性代理人的推理由Wooldridge（MIT Press，2000）。这两者都呈现了通过知识运营商在其中扩展一阶谓词逻辑的逻辑，并且他们调查这些逻辑的使用作为计算代理的基础。

我选择的“降级”命题模态逻辑并不是因为我不觉得无聊量化的信仰或,也好不重要,只是因为我开始变得非常感兴趣的动力学的知识,即,一个代理的知识如何变化,当执行一个动作或一个外生事件发生。对于能够构建具有高阶推理能力的规划代理的目标来说，这是必不可少的。我找到了一个完全符合我需求的逻辑框架，动态认知逻辑(DEL)。由于DEL主要是在命题模态逻辑的背景下研究的，这就是我目前工作的地方。据我所知，关于一阶动态认知逻辑的论文只有一篇"动态term-modal逻辑作者:Barteld Kooi。

卢基：在当前的工业或政府使用中，是否有自我反光计算代理（我们一直在讨论的排序）的例子，或者这项工作仍然发生在更有理论阶段？

托马斯。：我所知它仍然在理论阶段。然而，它的重要性也变得越来越欣赏到更多应用的AI研究人员。金宝博娱乐正如我以前的答案中所述，我现在正在研究认识的规划：规划代理商，具有更高秩序的推理能力（代理商推理自己和其他代理商）。自动化规划社区开始对此感兴趣。Bernhard Nebel是一个在自动化规划和机器人中是一个非常突出的人物，甚至被称为认知规划“下一个大事”。原因是规划形式和系统必须成为一般和表现力，足以应对在不确定环境中的机器人，以及包含其他金宝博官方代理（多种子体系统）的环境。这次要求在这种系统中呼吁认识到。金宝博官方

如果AI系统想要与人类进行有效的沟通和合作，那么社交智能在AI系统中的重要性也被越来越多的人认识到。金宝博官方这可能是在一些像医院机器人(例如拖船机器人，这对它的目前非常符合缺少社会智力[科林巴拉斯，新科学家)，智能个人助理，如iPhone上的Siri或Android上的谷歌Now，地震救援机器人必须与人类混合团队工作。

但是，将现有的内省和社交智能形式整合到规划系统中，然后将所有这些都嵌入到机器人中还处于起步阶段。金宝博官方到目前为止，最成功的尝试可能是Ron Petrick和他的合著者的社交机器人调酒师[Petrick & Foster, ICAPS, 2013]¹．去年夏天，他们在主要国际策划竞赛中获得了最佳纸张奖项，伊普普斯。他们的潜在逻辑形式主义是一阶认知逻辑（模态运营商方法）的受限制版本。逻辑以许多重要的方式限制，以便快速获取具有合理的计算性能的东西。内省和高阶推理的完整逻辑仍然是表达性的，无法计算可行，目前需要更多的工作来在表达性和计算效率之间找到最佳权衡，这将使高阶推理代理更具吸引力。应用研究人员和行金宝博娱乐业。

卢基：一般来说，您和同事如何使用哪种启发式使用，以决定如何在广泛的问题类别中进行理论研究，如“计算代理人的自我反思推理”，这可能是从实际应用中的10-30岁？金宝博娱乐如何决定哪些子标数进行工作，以及何时枢转到不同的子问题或不同的方法？在您的经验中，授予制剂是如何为那种工作提供资金？

托马斯。：由于我正在使用逻辑形式主义来试图捕捉“自我反思推理”，因此新的“理论”的任何发展都有许多标准和明确的步骤：1）您定义了合适的逻辑语言及其语义;2）您在逻辑（证明理论）内的推理中定义合适的计算;3）您可以举例说明您的形式主义可以捕捉自我反思推理的重要方面;3）您调查了逻辑的计算复杂性和相对表现力;4）您实现了Carmuli的推理，如果可伸缩性对于您的概念证明很重要，则优化它们。当然，在定义逻辑语言时有许多选择，但这通常是由具体示例驱动的：我希望能够表达这些句子或这些推理。或者，相反：我不希望我的语言能够表达这一点，因为已知导致不可审视或不可思议的不可思议。

例如，在我的新工作中，灵感来源一直是认知心理学中使用的虚假信仰任务来测试心理理论（汤姆）人类。心态理论是归因于精神状态的能力 - 信仰，欲望，意图等 - 对自己和他人。我的逻辑形式主义的目标是它可以强大地处理人类上使用的任何现有的假信念任务，以及一些适当的一般关闭。这实际上将研究活动推广到寻找适合以自然方式代金宝博娱乐表这种推理的逻辑。这条线可能是20-50岁，看看例如医院机器人有任何一种通用的心态，但这也是我们对思想理论的理解以及如何正式和计算机中代表它的理解。首先，我们需要了解这个概念，然后我们需要了解如何正式化它，然后我们需要驯服固有的计算复杂性，然后最后我们希望能够在实际应用中实现它。这是例如的过程。描述逻辑一直经历。描述逻辑是代表和推理术语知识的逻辑。今天推理的描述逻辑已经商业化并正在使用。在大型医疗数据库上，但显然是一个很长的过程，因为描述了逻辑的早期日期（描述逻辑实际上也是一种模态逻辑，更准确地是一种混合逻辑）。

当然，我们理论上我们在计算代理商中做出自我反思推理的风险绝不有任何实际影响。这可能就是为什么有些人从另一端开始，并坚持他们生产的所有东西都应该从一开始就使用，比如说，一个工作机器人。但是，如果这样做，就会面临另一组问题。在底层的概念和机制被完全理解之前，致力于机器人的实际实现常常会导致一些特别的解决方案，而远非通用和健壮的解决方案。例如，研究人员已经造出了能够通金宝博娱乐过某些错误信念任务的机器人，但他们只能通过一级错误信念任务，而且还不清楚该架构如何能够普遍化。

在补助金中，应用研究中总有更多的资金，而不是在理论/基础研究中。金宝博娱乐我不认为在计算代理商中获得理论上的理论工作的资助是比其他基础工作更容易或更难的。

卢基你给出的描述逻辑的例子，我认为它是在看到重要的商业应用之前几十年开发出来的?什么其他的例子,你知道的,那里有一些早期的理论工作受到相当抽象的动机(“在未来,我们希望系统做X-ish类型的事情,所以让我们构建一些玩具模型X和看到的事情……”),直到十年或更长时间后才商业化?金宝博官方

托马斯。：描述逻辑返回到80年代的开头。在表现力描述逻辑中描述的大型数据库上具有良好实际性能的高效推理员开始出现在00s的开头。这些表现力描述的推理仪器具有非常糟糕的最坏情况复杂性（例如，2exp），所以它已经令人印象深刻，令人惊讶，看看他们对大型数据库的规模程度如何。

关于其他例子，我认为AI中的大多数真正的新理论只有应用于玩具例子。此外，几乎所有的数学都属于“受到相当抽象动机的理论工作”的类别。如果你是如此。看看为现代3D电脑游戏构建物理引擎所需的所有数学，那么这一切都没有考虑到电脑游戏，而且大部分都是在没有任何应用的情况下开发。当然，在AI中，我们倾向于始终有一定的应用或一系列应用程序，并且我们的目标是从理论发展到商业化的缩短时间。物理引擎的示例是关于创建现实世界物理现象的数学模型，然后在计算机中实现这些模型。ai与此不同。AI也是关于创造我们现实的某些部分的数学模型，但在这种情况下，它是（人类）推理的数学模型。毫无疑问，达到这一目标涉及，就像物理发动机一样，从最具理论基础的各级到最申请的实现导向的东西的大量工作。

我认为摒弃任何一开始只适用于玩具的AI新理念是很危险的。这可能是必要的第一步，例如描述逻辑中的案例。但忘记可伸缩性，认为“这不关我的事”，也是同样危险的。如果您完全不担心可伸缩性和适用性，那么您肯定更有可能提出永远无法扩展或应用的想法。我最尊重金宝博娱乐的研究人员是那些帮助维持生计的人:有很强的应用知识和直觉的理论家，有很强的理论知识和应用新理论的兴趣的应用研究者。

卢基:谢谢,托马斯!

皮特里克和福斯特。计划在机器人调酒师域中的社交互动．冰淇淋2013.．可用幻灯片．↩

你喜欢这个帖子吗?你可以享受我们的其他谈话的帖子,包括:

托马斯鲍瓦·自我参考和代理人内省

搜索

浏览

订阅