Stuart Armstrong最近的AI控制头脑风暴

||新闻

Oxford_Stuart-ArmstrongMIRI最近资助了牛津大学的研究人员斯图尔特·阿姆斯特朗,让他金宝博娱乐独自休息,集思妙想人工智能控制的新思路。这次头脑风暴产生了16个新的控制理念,它们的实用性和润色各不相同。在过去的一个月里,他描述了每一个新想法,并将这些描述从他的索引文章中链接起来:新的(或多或少)AI控制理念

他还命名了每个AI控制想法,然后画了一张图来表示这些新想法之间的联系(非常粗略)。在下面的图片中,箭头Y→X可以表示“X取决于Y”,“Y对X有用”,“X在这个问题上对Y进行补充”,或者“Y启发了X”。划线部分是斯图尔特目前认为最重要或最完善的思想。

全新的AI控制理念

之前,斯图尔特开发了人工智能控制的思想效用无差异在MIRI的论文中发挥了作用可订正(Stuart是合著者)。他还开发了人为决策理论还有一些关于减少影响人工智能甲骨文人工智能.他为确保先进人工智能(例如:人工智能)产生良好结果的策略和预测挑战做出了贡献奔向悬崖我们如何预测人工智能.MIRI之前约他写一本短篇书,向大众介绍超级智能控制挑战,比我们聪明