新论文:“学习优化的风险”

发布经过提起申请文件

Evan Hubinger,Chris Van Merwijk,Vladimir Mikulik,Joar Skalse和Scott Garrabrant有一个新的论文:“来自先进机器学习系统中学学的优化风险。”金宝博官方本文的摘要:我们分析了学习的优化类型,当学习模型(例如神经网络)本身是优化器 - 我们所指的情况......阅读更多 ”

2019年6月通讯

发布经过提起申请新闻稿

Evan Hubinger,Chris Van Merwijk,Vladimir Mikulik,Joar Skalse和Scott Garrabrant发布了“Mesa-Optimization”的前两个(五个)帖子:这个序列的目标是分析一个人的学习优化类型学习模型(如神经网络)本身是优化器 - 我们称之为...阅读更多 ”

2019年5月通讯

发布经过提起申请新闻稿

在本周的ICLR Safeml研讨会上更新Miri研究员Va金宝博娱乐nessa Kosoy的一篇新论文:“授权学习:学习避免陷阱有点帮助。”新研究帖金宝博娱乐子:学习“已知”信息,当信息实际上并不知道时;击败Goodhart和“最近的未包容战略”问题;难以察觉的奖励的加强学习长期未来的基金已宣布二十三个新...阅读更多 ”

新论文:“授权加固学习”

发布经过提起申请文件

Miri 金宝博娱乐Research Associatiate Vanessa Kosoy已经写了一篇新的论文,“委派加强学习:学会避免陷阱有点帮助。”Kosoy将在两周内在ICLR 2019 Safeml车间提出论文。摘要读:加强学习的最着名的遗憾范围是eopisodic或假设没有陷阱的环境......阅读更多 ”

2019年4月通讯

发布经过提起申请新闻稿

更新新的研究帖子:需要简金宝博娱乐化的首选项,简化偏好充分;平滑和个人身份;示例人口伦理:订购折扣效用;人类价值观理论;对抗艾达米丽的具体提案已经收到了一套新的慈善项目和伯克利存在风险倡议的新补助金。来自DeepMind安全团队和Alex Turner的新闻和链接:设计代理激励......阅读更多 ”

公开慈善项目和伯利的新助资

发布经过提起申请消息

我很乐意宣布,Miri已收到两大巨大的新补助金:来自开放慈善项目的两年补助金额为2,112,500美元。伯克利存在风险倡议的600,000美元批准。开放的慈善项目的补助金被授予其新委员会有效利他主义支持的第一轮赔偿金的一部分:......阅读更多 ”

2019年3月通讯

发布经过提起申请新闻稿

想在参考课程“解决AI对齐问题”的“人民”?我们现在有一个关于如何开始入门的指南,根据我们的经验倾向于使研究团体成功。金宝博娱乐(也是在AI对齐论坛上。)其他更新Demski和Garrabrant对Miri的代理基础研究,“嵌入式代理商”是......金宝博娱乐阅读更多 ”

Mirix的一个新的现场指南

发布经过提起申请消息

我们刚刚发布了Mirix组的实地指南,以及想要参与AI对准研究的其他人。金宝博娱乐Mirix是一个计划,Miri有助于涵盖想要在AI安全开放问题上工作的外部团体的基本费用。您可以启动自己的小组或查找有关的信息阅读更多 ”