更新
- 新的研究金宝博娱乐文章:需要简化的首选项,简化的首选项足够了;Smoothmin和Personal Identity;人口伦理:订购折扣效用;人的价值理论;对抗性国际开发协会的具体建议
- MIRI已收到一套新的赠款来自开放慈善项目和伯克利存在风险倡议。
新闻和链接
- 来自DeepMind安全团队和亚历克斯·特纳:设计代理激励以避免副作用.
- 从戴魏:“充分优化的代理看起来是一致的”有三种可能是错误的;理解知情监督和IDA之间的类比有什么问题?;和人工智能风险的主要来源?
- 其他最近的评论还包括伊萨·赖斯(Issa Rice)的文章决策理论比较;保罗global的更现实的末日故事;和琳达Linsefors”勒索的博弈论.
- OpenAI的杰弗里•欧文(Geoffrey Irving)通过辩论描述了人工智能的安全性在FLI的AI Alignment播客上.
- 一个网络漫画的AI x风险概念:种子.