更新
- 本步伐总结了第二轮AI对准写作日帖子。
- zettelkasten方法:Miri研究金宝博娱乐员Abram Demski描述了一个注释的系统,对他的研究生产力产生了巨大的积极影响。金宝博官方
- Macaskill将写一个详细功能决策理论的批判;Abram Demski(1那2) 和马修坟墓评论中的回应。
新闻和链接
- 最近的AI对准帖子:Evan Hubinger要求“最小的电路欺骗性吗?“,保罗基督教介绍了战略窃取假设和wei dai列出他的关于迭代蒸馏和扩增的困惑。另见rohin shah比较AI对齐的递归方法。
- 同样的胜利:a关于Lecun,Russell,Bengio,Zador等乐器融合的辩论。
- FHI的Ben Gen Gen Garfinkel和Allan Dafoe认为国家之间的冲突倾向于展出“进攻性的防守缩放“。
- Openai版本A.后续报告在GPT-2上,注意到几个群体“明确地采用了类似分阶段释放方法”到Openai。
- Nvidia应用深度学习研究训练了一个似乎的模型金宝博娱乐基本上复制了GPT-2,5.6倍的参数,稍微更好的Wikitext困惑,略微更差的Lambada精度。本集团选出分享其培训和评估代码,但不是模型权重。
- Openai.微调GPT-2对于纳入人体反馈的文本延续和摘要任务,注意到我们的动机是将安全技术移动到更接近“与人类交谈的机器的一般任务”,我们认为是提取有关人类价值观信息的关键。“