2019年10月通讯

最近的AI对准帖子：Evan Hubinger要求“最小的电路欺骗性吗？“，保罗基督教介绍了战略窃取假设和wei dai列出他的关于迭代蒸馏和扩增的困惑。另见rohin shah比较AI对齐的递归方法。
同样的胜利：a关于Lecun，Russell，Bengio，Zador等乐器融合的辩论。
FHI的Ben Gen Gen Garfinkel和Allan Dafoe认为国家之间的冲突倾向于展出“进攻性的防守缩放“。
Openai版本A.后续报告在GPT-2上，注意到几个群体“明确地采用了类似分阶段释放方法”到Openai。
Nvidia应用深度学习研究训练了一个似乎的模型金宝博娱乐基本上复制了GPT-2，5.6倍的参数，稍微更好的Wikitext困惑，略微更差的Lambada精度。本集团选出分享其培训和评估代码，但不是模型权重。
Openai.微调GPT-2对于纳入人体反馈的文本延续和摘要任务，注意到我们的动机是将安全技术移动到更接近“与人类交谈的机器的一般任务”，我们认为是提取有关人类价值观信息的关键。“