美里更新
- Abram Demski区分了不同版本的“指向”人类价值的问题在人工智能对齐。
- 埃文Hubinger讨论“从已知优化中产生的风险”人工智能x风险研究播客金宝博娱乐
- 以利以谢Yudkowsky通过辩论和古德哈特定律对人工智能的安全性发表评论.
- 美里的支持者188betapp在“捐赠星期二”上捐了13.5万美元其中26%的人与Facebook匹配,28%的人与雇主匹配,共计207,436美元!MIRI还在12月底从TisBest Philanthropy获得了6624美元,主要是通过Ray Dalio的第二轮捐赠# RedefineGifting倡议。感谢你们所有人!
- 斯宾塞·格林伯格与安娜班子和邓肯Sabien在“清晰思考”播客上。
- 我们希望铁道部:以利以谢参加了关于《哈利·波特与理性方法》.
新闻和链接
- 理查德的非政府组织反映了他在有效的利他主义中所处的时代:
直到最近,我在做重大决定时都比较被动。这通常意味着只选择声望最高的默认选项,而不是制定一个具体的长期计划。这也让我从“消费者”的心态而不是“制作人”的心态去思考EA。当我觉得好像少了什么东西的时候,我常常想,为什么责任人没有做这件事;现在我也会问自己为什么没有这样做,并考虑自己承担责任。
部分原因是我已经在EA呆了很长时间了。但我认为我过去也高估了EA的成熟和组织性。事实上,我们是一个非常年轻的运动,我们在前进的过程中仍在编造很多东西。这使得积极主动变得更加重要。
另一个高度重视主动性的原因是,采取最标准的成功之路往往被高估了。在这方面,我的灵感来自我的一个朋友,她已经连续三次联系到她想去工作的一家机构,说服他们为她设立一个新职位。
- 非政府组织区分关于目标规范、正交性、工具收敛性、价值脆弱性和古德哈特定律的主张,这些主张基于它们是指训练时的系统还是部署时的系统。金宝博官方
- 康纳·莱希,《黑客学会信任,认为(在其他事情中)“GPT-3是我们最后的警告弹,以协调解决AGI对齐问题。(播客的版本。)我包括这个演讲,因为这是一个很好的演讲,而且这个话题值得讨论,尽管MIRI的工作人员并不一定赞同这个主张——而且以利以谢肯定会反对任何这样的主张对AGI来说,有些东西是火警.
- OpenAI安全研究人员包括金宝博娱乐Dario Amodei, Paul Christiano和Chris Olah离开OpenAI.
- OpenAI的DALL-E使用GPT-3生成图像,而剪辑展示了令人印象深刻的零镜头图像分类能力。Gwern Branwen评论在他的通讯。