2017年3月通讯

金宝博娱乐研究更新

IAFF的新新手：使感应良性的一些问题;纠缠均衡和双胞胎囚犯困境;决策理论的概括基础
AI影响新的影响：AI安全领域资金的变化;AI研究的资金金宝博娱乐
Miri 金宝博娱乐Research Courcle andrew Chritch已经开始在UC Berkeley的两年阶层人类兼容的AI中心，帮助在那里启动研究计划。金宝博娱乐
“使用机器学习来解决AI风险“：Jessica Taylor通过高度性能的ML系统走过六个潜在问题，通过六个潜在的问题解释我们的AAMLS议程（在视频和博客版本中）。金宝博官方

一般更新

新闻和链接

Ray Arnold提供了一个有用的列表普通人提供AI安全的方式。
来自Openai的新增功能：攻击机器学习对抗性示例。
Openai研金宝博娱乐究员保罗Christiano解释了他对人类智慧的看法：

我认为我的大脑是由强大的加强学习代理驱动的机器。RL代理选择了想象的想法，存储和检索的回忆，在哪里引导我的注意力以及如何移动我的肌肉。

说和审议的“我”是由此实施RL代理，但是不同的，具有不同的信念和欲望。我的思想是输出和输入RL代理，它们不是RL代理“从内部感觉。”
Christiano描述了三个方向和desiderata.为AI控制：可靠性和鲁棒性，奖励学习和审议和放大。
Sarah Constantin认为现有的技术不会扩展到人为的一般情报缺乏主要的概念突破。
人类研究所的未来与存在风险研究的中心ran a“糟糕的演员和ai“ 作坊。
fhi是寻求实习生在钢筋学习和AI安全。
迈克尔米尔福德争论脑电脑界面作为AI风险策略。
开放慈善项目Hadgen Karnofsky解释了他为什么看到为什么对公众话语的好处更少比他习惯了。