更新
- Ramana Kumar和Scott Garrabrant认为AGI安全社区应该开始优先考虑“在没有人类模型的情况下工作良好的方法”:
从某种程度上说,人体建模是一个好主意,把它做得非常好是很重要的;既然这是个坏主意,那最好还是不要做。因此,在构思构建安全AGI的方法时,是否要进行人体建模是一个配置问题,应该尽早设置。
- 新的研究金宝博娱乐论坛帖子:博弈中的条件Oracle EDT均衡;Non-Consequentialist合作?;什么时候CDT可以荷兰预定?;CDT = = UDT美国东部时间
- 的MIRI暑期奖学金学生计划接受申请到三月底!MSFP是由MIRI和CFAR共同举办的一个为期两周的八月免费静修,目的是让人们尽快了解相关问题嵌入式代理培养与研究相关的技能和习惯,并调查该领域的未决问金宝博娱乐题。
- MIRI增长主管Colm Ó Riain,评论我们2018年的筹款活动进展如何。
- 从以利以谢Yudkowsky:“伴随着对抗性的抵抗和透明度,我的术语是‘保守主义’,或者试图保持所有东西都是插值而不是外推,这是现代ML可以探索的少数几个领域之一,我认为有潜力直接延续到严重的AGI安全。”
新闻和链接
- 埃里克·德雷克斯勒发布了他的一本书长度的人工智能安全提案:重构超级智能:综合人工智能服务作为一般智能.看到讨论彼得竟敢管,理查德的非政府组织,Rohin沙.
- 其他最近的人工智能对齐帖子包括Andreas Stuhlmüller认知因素和亚历克斯·特纳的通过可实现的效用保存来惩罚冲击,以及一大堆新的评论斯图亚特·阿姆斯特朗.