想在参考课程“解决AI对齐问题”的“人民”?
我们现在有关于如何开始的指南根据我们对倾向于使研究群体成功的事物的经验。金宝博娱乐(也在AI对准论坛。)
其他更新
- Demski和Garrabrant对Miri的代理基金会研究的介绍,“金宝博娱乐嵌入式机构,“现在可以(以轻微编辑的形式)作为arxiv论文。
- 新研究帖金宝博娱乐子:渐变血淋于如何与古特哈进行互动?;“规范性假设”不需要复杂;MTG色轮如何解释AI安全性;Pavlov概括了
- 几个米西克群体正在扩展,正在寻找新成员加入。
- 我们的夏季研究员计划在3月31日接受应用程序。
- Lesswrong的网络版合理性:从AI到僵尸在lesswrong.com/rationality.现已完全更新以反映打印版地图和地区和如何实际改变主意,前两本书。(在这里公布。)
新闻和链接
- Openai的GPT-2模型显示各种语言任务的有意义进展。Openai补充道:
由于对尺度产生欺骗性,偏见或滥用语言的大语言模型的担忧,我们仅释放更小的GPT-2以及采样代码。我们不会释放数据集,培训代码或GPT-2模型权重。[...]我们相信我们的发布策略限制了可能选择[开源我们的结果]的最初组织集,并为AI社区提供更多时间讨论这些系统的影响。金宝博官方
- 边缘讨论Openai的语言模型与众不同Miri的披露政策为了我们自己的研究。金宝博娱乐查看其他讨论杰里米霍华德那John Seymour., 和Ryan Lowe.。
- AI影响总结了关于良好判断项目的良好预测实践的证据。
- 最近的AI对准想法和讨论:凯莉量化;菲尔坎在影响正规化方法;桑德斯HCH不仅仅是机械土耳其人和RL在迭代放大框架中;戴哲学难度(1那2);Hubinger On.归属普遍性;和埃弗蒂特了解具有因果影响图的代理激励。
- 开放慈善项目宣布其最大的拨款日期:5500万美元推出安全和新兴技术中心,华盛顿,D.C.认为坦克,早期关注“安全和人工智能的交叉点”。另见cst的许多人工作职位。