MIRI高级研究员Sco金宝博娱乐tt Garrabrant有一个重要的新结果,“有限因子集”,他将在太平洋时间周日中午的一个在线演讲中公布。(放大环节。)关于结果的详细信息,请看Scott的新帖子“节省时间.”
在其他大新闻,MIRI刚刚收到有史以来最大的两笔个人捐款!以太坊发明者Vitalik Buterin向我们的研究项目捐赠了价值430万188betapp美元的ETH,而一位匿名的长期支持者捐赠了我们清算的MKR代币,金额高达1560万美金宝博娱乐元。后者的捐赠是有限制的,所以我们每年最多可以使用其中的250万美元,直到2025年,就像多年捐赠一样。
我们非常感谢两位捐赠者给我们的礼物,感谢他们支持我们的工作!
其他米里更新
- Mark Xu和Evan Hubinger使用"笛卡儿的世界模型”来区分“结果代理”(将效用分配给环境状态、内部状态、观察结果和/或行动)“结构代理”(优化“可能的决策函数集而不是可能的行动集”),以及“条件代理”(将环境状态映射到效用函数,而不是将它们映射到实用程序)。
- 在内部对齐障碍的层次, Abram Demski提出了三个“有争议的主张”:
- 最有用的定义是mesa-optimizer没有要求他们执行明确的搜索,与当前的标准相反。
- 成功缩小超人模型这可能是个坏消息。
- 有些版本的彩票假设似乎暗示了随机初始化的网络已经包含了欺骗性的代理。
- 尤多科夫斯基对两国关系的评论早期AGI系统的对准金宝博官方能力和能力.
新闻和链接
- 约翰·温特沃斯宣布一个项目检验自然抽象假设它断言“人类使用的大多数高级抽象概念都是‘自然的’”,因此“大量的架构将可靠地学习类似的高级概念”。
- Open Philanthropy的Joe Carlsmith问道:追求权力的人工智能是否存在风险?卢克米尔豪泽(Luke Muehlhauser)问道这是野外的危险转折(还在LessWrong).
- 来自DeepMind的安全研究人员:金宝博娱乐什么机制驱动Agent行为?,语言代理对齐,评价奖励功能的史诗式方法.此外,Rohin Shah提供了他的进入该领域的建议.
- 欧文·沈和彼得·哈斯总结近70篇论文模型透明性、可解释性和可解释性。
- 伊莱轮胎问道:我们如何为最后的关键时刻做准备?(我要补充一些警告:一些角色和场景意味着您将拥有少在AGI前夕的影响,今天可以有更大的影响。对一些人来说,“最后的关键时刻”可能是现在,而次要的努力在以后就不那么重要了。此外,如果没有明确的警告射击或火警.)
- 保罗·克里斯汀诺发起了一个新的组织,这将是他未来的重点:联合研究中心金宝博娱乐.了解更多关于克里斯汀诺的研究方法金宝博娱乐我的研金宝博娱乐究方法在他最近AMA.