2017年3月通讯

||新闻稿

金宝博娱乐研究更新

一般更新

  • 为什么AI安全?:快速摘要(最初在我们期间发布筹款机)致力于获得AI风险的案例,包括我们对我们方法的独特特征以及我们对该领域的目标的票据。
  • Nate Soares参加了“设想和解决不良AI结果,“在各种AI风险场景中达到Red-Team攻击者的事件,以防守者为防守者。
  • 我们还参加了AI安全战略撤退,由所应用的合理性的撤退。

新闻和链接

  • Ray Arnold提供了一个有用的列表普通人提供AI安全的方式
  • 来自Openai的新增功能:攻击机器学习对抗性示例
  • Openai研金宝博娱乐究员保罗Christiano解释了他对人类智慧的看法
    我认为我的大脑是由强大的加强学习代理驱动的机器。RL代理选择了想象的想法,存储和检索的回忆,在哪里引导我的注意力以及如何移动我的肌肉。

    说和审议的“我”是由此实施RL代理,但是不同的,具有不同的信念和欲望。我的思想是输出和输入RL代理,它们不是RL代理“从内部感觉。”

  • Christiano描述了三个方向和desiderata.为AI控制:可靠性和鲁棒性,奖励学习和审议和放大。
  • Sarah Constantin认为现有的技术不会扩展到人为的一般情报缺乏主要的概念突破。
  • 人类研究所的未来与存在风险研究的中心ran a“糟糕的演员和ai“ 作坊。
  • fhi是寻求实习生在钢筋学习和AI安全。
  • 迈克尔米尔福德争论脑电脑界面作为AI风险策略。
  • 开放慈善项目Hadgen Karnofsky解释了他为什么看到为什么对公众话语的好处更少比他习惯了。