新论文：“逻辑感应” - 机器智能研究所金宝博娱乐

MIRI正在发布一篇论文，介绍了一个新的减扣限制推理模型：“逻辑归纳，“斯科特盖拉德兰特·斯沃基·本森 - 蒂尔森，安德鲁·克克劳斯，我和杰西卡泰勒的撰写。读者可能希望从中开始删节版。

考虑一个推理员观察演绎过程（例如数学家和计算机程序员社区）的环境，并等待各种逻辑索赔的证明（例如ABC.猜想，或“这台计算机程序在其中有一个错误”），同时猜测哪些声明将成为真实。粗略地说，我们的论文提出了一种可计算（尽管效率低下）算法，其拆卸扣除，分配高主观概率，以便在可以生产上证明之前长时间可提供猜测和低概率。

该算法具有大量良好的理论属性。仍然粗略地说，该算法学会以尊重的方式分配对句子的概率任何逻辑或统计模式可以在多项式时间中描述。此外，它还在避免悖论时，它有关自己的信仰，并信任其未来的信仰。引用摘要：

这些属性和许多其他人都从一个单一的遵循逻辑归纳标准，这是一系列股票交易类比的动机。粗略地说，每个逻辑φ.与每股1美元的股票有关，如果φ.是真实的，没有什么，我们解释了逻辑上不确定推理的信仰状态作为一套市场价格，其中ℙ_N.（φ.）= 50％意味着当天N.，股票φ.可以从推理中购买或销售50¢。逻辑归纳标准说（非常大致），不应有任何多项式可计算的交易策略，具有有限的风险宽容，在该市场上赚取无限性的利润。

这种标准类似于用于支持理想推理的其他理论的“无荷兰书”标准，例如贝叶斯概率理论和预期的实用理论。我们认为，逻辑归纳标准可以为推理仪器提供类似的作用，捕获这些情况下的“良好推理”中的一些。

我们提供的逻辑归纳算法是理论而非实用的。它可以被认为是射线Solomonoff的归纳推理理论的对应物，这为理想管理提供了无明显的方法经验不确定性但没有对逻辑或数学句子的不确定性的推理方法。¹逻辑诱导关闭了这种差距。

满足逻辑归纳标准的任何算法都将表现出以下属性，等内容：

1。限制融合和限制一致性：逻辑电感器的信仰在极限中完全一致。（每种可怕的真正句子最终得到概率1，每种可怕的假句最终都会得到概率0，如果φ.可证明的意思ψ然后是概率φ.收敛到某种价值不高于概率ψ，等等。）

2。可加速诱导：逻辑电感器学会识别可以在多项式时间中识别的定理（或矛盾）中的任何模式。

◦考虑一系列由辉煌的数学家产生的猜想，例如ramanujan，这很难证明，但不断变成真实。逻辑电感器将识别此模式并开始为ramanujan的猜想高概率分配好，然后才能验证它们。

◦作为另一个例子，考虑在输入上的索赔顺序N.，这种长时间运行的计算输出0到9之间的自然数“如果这些声明都是真的，那么（粗略地讲）逻辑电感器学会尽可能快地为它们分配高概率。如果它们都是假的，则逻辑电感器学会尽可能快地分配低概率。从这个意义上讲，它学会易于预测计算机程序如何表现。

同样地，给定任何用于编写停止的计算机程序的多项式时间方法，逻辑电感器学会相信它们将尽可能快地停止，因为可以生成源代码。此外，给定任何用于写下计算机程序的多项式时间方法可删除未能停止，逻辑电感器学会相信，由于可以生成源代码，它们将无法快速停止。When it comes to computer programs that fail to halt but for which there is no proof of this fact, logical inductors will learn not to anticipate that the program is going to halt anytime soon, even though they can’t tell whether the program is going to halt in the long run. In this way, logical inductors give some formal backing to the intuition of many computer scientists that while the halting problem is undecidable in full generality, this rarely interferes with reasoning about computer programs in practice.²

3。仿射一致性：逻辑电感器学会尊重不同句子的真实值之间的逻辑关系，通常在可以证明句子之前很久。（例如，他们将学习“该计划输出3”和“该程序输出4”的任意程序是互斥的，通常在他们能够评估所讨论的程序之前。）

4.学习伪随机频率：面对足够的伪随机序列，逻辑电感器学会使用适当的统计摘要。例如，如果Ackermann（N.那N.）π的十进制扩展中的数字是难以预测的N.，逻辑电感将学会为索赔（Ackermann）分配约10％的主观概率（N.那N.）π的十进制扩展中的数字是7.“

5。校准和无偏见：在逻辑电感器分配〜30％的序列上，如果真理的平均频率会聚，则会聚到〜30％。事实上，在任何子率的真实融合的平均频率，没有有效的方法来寻找逻辑电感的信仰中的偏差。

6。科学归纳：逻辑电感器可用于进行序列预测，并且在这样做时，它们占主导地位通用的半释放。

7。在调理下关闭：该框架中的条件概率是明确定义的，并且有条件化的逻辑电感器也是逻辑电感器。^3.

8。内省：逻辑电感器以避免自我参考标准悖论的方式对自己的信仰有准确的信念。

例如，序列上的概率表示“我有概率小于50％N.天天“靠近50％并振荡伪装，因此没有多项式时间方法来判断是否N.一个略高于或略低于50％。

9。自信：逻辑电感器学会比目前的信仰相信他们未来的信念。这给予了一种正式的支持，即现实世界的概率特工通常在其未来的工业中经常相当自信，即使哥德尔的不完整定理在完全一般性中对反思性推理的影响很大。^4.

上述索赔一切都含糊不清;对于确切的陈述，请参阅本文。

斯科特盖拉德坦开发了逻辑归纳，努力解决我们的开放问题谈到六个月前。粗略地说，我们在逻辑不确定性下进行了两种不同的探索，以便在逻辑不确定性下进行良好的推理：识别模式中的模式（例如关于计算机程序的权利要求之间的互排差关系），以及识别逻辑索赔序列中的统计模式的能力（例如识别出π似乎漂亮伪随机的小数位）。既难以孤立也不太难以实现，但我们感到惊讶地发现，我们的简单算法与实现另一个实现另一个的简单算法相当不相容。逻辑电感器诞生于斯科特试图同时实现两者。^5.

我认为这一框架将有一个很好的机会，在元素，决策理论，博弈论和长期难以应变的难题问题中开辟了新的研究途径。我也谨慎乐观，他们将改善我们对决策理论和反事工程的理解，以及与AI相关的其他问题价值对齐。^6.

我们在线发布了一个谈话，有助于为我们在逻辑归纳的工作提供更多背景：^7.

编辑：对于更新的逻辑归纳，进入更多技术细节，请参阅这里。

“逻辑归纳“是一大堆的工作，无疑仍然有很多错误。我们非常感谢反馈：发送拼写错误，错误和其他评论errata@www.gqpatrol.com.。^8.

注册以获取新的Miri技术结果的更新

每次发布新技术文件时都会通知。

虽然不切实际，所罗门组织的诱导产生了在实践中表现良好的许多技术（集成方法）。新集合方法方向算法与所罗门组织诱导点的差异，这对于管理逻辑不确定性有用，以与现代集合方法相同的方式对于管理经验不确定性是有用的。↩
另见Calude和Stay's（2006）“大多数程序都停止快速或永不停止。“↩
因此，例如，可以通过在空理论上拍摄逻辑电感并在PEANO公理上调节逻辑电感来使PEANO算术中的逻辑电感器进行逻辑电感。↩
作为一个例子，想象一下，一个人问逻辑电感，“你的概率是多少φ.鉴于将来，您将要思考φ.可能？”非常粗略地说，电感会回答，“在这种情况下φ.很可能，即使它目前认为这一点φ.是不太可能的。此外，逻辑电感器以避免悖论的方式执行此操作。如果φ.是“在未来，我会思考φ.不到50％的可能性，“你问的现在，”你的可能性是什么φ.鉴于未来，您将相信≥50％可能是≥50％的人？“然后它的答案将“非常低”。然而，如果你问“你的可能性是什么φ.鉴于未来您的概率将是非常接近到50％？“然后它会回答，“非常接近50％”。↩
可以在此结果的早期工作智能代理基础论坛。↩
考虑设计AI系统以学习人类的偏好的任务（例如，金宝博官方合作逆钢筋学习）。通常的方法是将人类模拟作为贝叶斯的推理，试图最大限度地提高一些奖励功能，但这严重限制了我们即使在简化的环境中也要模拟人类非理性和错误分配的能力。逻辑归纳可以通过提供不了解（但最终最终学习）所有信仰的逻辑影响，帮助我们通过提供理想化的正式模型来解决这个问题。
例如，假设人类代理人使得（未裁量）失去象棋活动。一个AI系统金宝博官方编程，以了解人类从观察到的行为的偏好可能不应该得出结论通缉失去。相反，我们这种困境的玩具模型应该让人类可能是资源有限的并且可能无法推断出他们的移动的全面影响;我们的模型应该允许AI系统也意识到这一点，或者可以了解它。金宝博官方↩
从那个相对的部分部分幻灯片;从技术部分滑动。对于想要跳过技术内容的观众，我们将谈话的中间部分上传作为一个较短的独立视频：关联。↩
这Intelligence.org版本一般会比到期更新ARXIV版本。↩

新论文：“逻辑归纳”

注册以获取新的Miri技术结果的更新

搜索

浏览

订阅