2019年12月通讯

2019年12月5日,|Rob Bensinger|时事通讯

从现在到12月底，美里的2019资金筹集活动是生活!查看我们的筹款帖子，了解我们过去一年和未来计划的更新。

我很高兴地宣布，我们最大的更新之一就是我们新雇了五名研究人员金宝博娱乐今年2月，我们还将邀请到第六位。有关详细信息,请参见研讨会和扩大规模在募捐帖子上。

此外，Facebook的“周二捐赠”配对机会是明天在第二天早上5:00 PT !看到投资银行部的文章有关如何配对你的捐款的详情。

其他的更新

我们最近雇佣的人，”学习优化带来的风险合著者Evan Hubinger描述道他会在MIRI做什么．另见Nate Soares的评论MIRI如何做到默认不披露．
巴克Shlegeris讨论EA驻场是一个拓展机会．
OpenAI版本安全的健身房，一组工具和环境，用于将安全约束合并到RL任务中。
茶是寻求实习生;申请截止日期为12月15日。

来自研究团队的想法金宝博娱乐

这个月，我尝试了一些新的东西:引用MIRI研究人员对最近人工智能安全文章的总结和想法。金宝博娱乐

我把名字省略了，这样就可以把它们看作是人们印象的快照，而不是明确的“啊，研究人员X相信Y!”金宝博娱乐请记住，这些只是我最近与之交谈过的员工的一小部分想法，绝非任何共识。

再保险透明是否有助于发现欺骗?-“对一个重要话题进行良好的讨论。马修·巴内特建议说，透明工具的任何弱点都可能使它变成一个有害的中间人，直接培训主管们发现欺骗可能是更可取的。
再保险Chris Olah对AGI安全的看法-“我非常同意Evan Hubinger的观点，收集不同的视角——不同的‘帽子’——是一件有用的事情。克里斯·奥拉对透明度的看法值得一看。显微镜人工智能的概念似乎很有用，Olah关于如何有效地改变ML领域的观点非常有趣。”
再保险定义AI有经验玩家-“斯图尔特·阿姆斯特朗试图在电线头和古德哈特的其他部分之间做出原则性的区分。”
再保险领先3年以上的情况有多普遍?对于AI进程模型来说，这似乎是一个非常有趣的问题。预期的提前时间和预期起飞速度的问题极大地影响了赢家通吃的动力学的合理性。”
再保险关于实施可纠正的稳健对齐的思考“Steve Byrnes提供了一个关于获得指针类型值的一些问题的很好的概述。”