alphago零和领域辩论

||分析

alphano零使用4个TPU,完全从神经网中建造,没有手工制作的功能,并不普拉斯对专家游戏或其他任何人,在自我发挥3天后达到超人级,并且是最强大的alphago版本。

架构已经简化。以前的alphago有一个策略网,该策略网预测了良好的播放,以及使用MCT的评估位置(随机概率加权播放到游戏结束时)喂养到SoundaHead的价值网络。alphago零有一个神经网,选择移动,这个网是由保罗 - 基督教风格训练的能力放大,播放游戏,以学习赢得胜利的新概率。

正如其他人也在评论一样,这在我看来是一个证据的一个要素,这些要素是对我和罗宾汉森的汉森地位的思想位置有利于yudkowskian的位置AI-FOM辩论

正如我回忆,正如我所知:

  • 汉森怀疑他称之为“建筑”是大部分大不了的大部分,而(汉森说)元素相比,如累积域知识,或由专业公司建造的专用组件,他预期的是服务AI的公司的生态公司经济。
  • 当我讨论如何看待我的人,就像人类的建筑改进,汉森回答说,这似乎就像一次性收益,允许文化积累知识。

我强调了Go知识的所有强大人体大厦,乔塞基和策略在几个世纪地区发挥了几个世纪,专家教授早期的孩子,完全被alphago零丢弃,随后的性能改进。当我理解汉斯论文时,这些强大的人类知识的建立,应该是距离多个领域的AI功能迅速增长一次。我说,“人类智慧是废话,我们积累的技能是废话,”这似乎被承认了。

同样,单一的研究实验室如DeepMi金宝博娱乐nd都不应该超越一般生态学,因为适应任何特定领域的AI应该需要通过市场生态学来开发许多组件,使这些组件可供其他公司提供这些组件。alphago零比这更简单。To the extent that nobody else can run out and build AlphaGo Zero, it’s either because Google has Tensor Processing Units that aren’t generally available, or because DeepMind has a silo of expertise for being able to actually make use of existing ideas like ResNets, or both.

在此应该突出显示能力增益的纯粹速度。我对Yudkowsky-Hanson辩论的大部分论点都是关于自我改善,并且当优化循环自身折叠时会发生什么。Though it wasn’t necessary to my argument, the fact that Go play went from “nobody has come close to winning against a professional” to “so strongly superhuman they’re not really bothering any more” over two years just because that’s what happens when you improve and simplify the architecture, says你甚至不需要自我改善获得看起来像Foom的东西。

是的,Go是一个封闭的系统,允许自我播放金宝博官方。它仍然采取了人类的几个世纪来学习如何玩它。也许是新的汉逊舷帆船免受快速能力增益,可以使环境有很多实证比特,应该非常难以学习,即使在AI思想的极限上足够快,可以在3天内吹过去几个世纪的人类学习;并且,人类已经了解了这些重要的比特,从而增加了几个世纪的知识积累,即使我们知道人类在人类拥有他们所需的所有经验比特时,人类需要几个世纪的AI学习;并且,AIS无法使用“架构”非常快速地吸收这些知识,即使人类使用架构将其互相学习。如果是这样,那么让我们记下这个新的世界破坏的假设(即,如果假设是假的话,世界结束)并且在寻找进一步证明这种假设可能是错误的。

alphago显然不是普通的ai。显然,人类会让我们比alphago更广泛,而alphago显然不是这样做。However, if even with the human special sauce we’re to expect AGI capabilities to be slow, domain-specific, and requiring feed-in from a big market ecology, then the situation we see without human-equivalent generality special sauce should not look like this.

为了另一种方式,我对我对递归自我改善的辩论进行了很多重视,并且在对人类智力的激情情报变化中的普遍性的显着跳跃。这并不意味着我们无法获得有关能力速度的信息没有自我提升。这并不意味着我们无法获得关于算法的重要性和普遍性的信息没有一般情报技巧。在我们甚至得到我所看到的好的部分之前,辩论可以开始满足于快速的能力。我不会预测alphaGo并损失金钱赌注,因为现实持有比在Yudkowsky-Hanson谱上的更极端的位置。

罗宾汉森回复。