1.1.2 人工智能的底层逻辑_从深度学习到图神经网络：模型与实践-QQ阅读中文历史网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

1.1.2 人工智能的底层逻辑

众所周知，人工智能（Artificial Intelligence, AI）的研究大致有三个派别：符号主义、联结主义[6]和行为主义。简单来说，符号主义主要是用公理和逻辑体系搭建一套人工智能系统。联结主义主张模仿人类的神经元联结机制来实现人工智能。行为主义认为，智能取决于感知和行动，环境的反馈有助于智能的提升。

不同的研究视角派生出不同的学术流派。然而，这些看似泾渭分明的主义，如果站在更高的抽象视角来审视，它们其实具有共同的特征——都是在研究事物间的关系（Relation）。

自2012年之后，以深度学习为代表的联结主义可谓风生水起，在计算机视觉、自然语言处理等领域均有广泛应用。如前所述，深度学习在很多领域取得的效果固然很好，但因为它属于典型的“端到端”黑盒模型，因此存在阿喀琉斯之踵（Achilles's Heel）——无法对预测的结果给出合理的解释。在探寻真理的路上，人们是不被允许在“知其然，不知其所以然”的非理性繁荣中徜徉太久的。要知道，追求因果，可能是人类保持心神安定的重要慰藉。

“天下无不散之筵席”，目前深度学习的技术红利收割已趋饱和，盛宴已过，诸神黄昏，需要纳入新的理论来突破AI的天花板。很多奋斗在科研第一线的科研人员很敏锐地意识到了这一点。2019年11月，在著名学术会议NeurIPS（Conference on Neural Information Processing Systems，神经信息处理系统大会）的主旨演讲上，图灵奖得主约书亚·本吉奥（Yoshua Bengio）借鉴著名心理学家卡尼曼提出的“系统1”（快速、直觉、无意识）和“系统2”（慢速、逻辑、有意识）的理念[6]，指出深度学习的未来应走向“系统2”。深度学习从“系统1”过渡到“系统2”如图1-3所示。

图1-3 深度学习从“系统1”过渡到“系统2”

以深度学习为代表的人工智能已在“听、说、看”等感知智能领域达到或超越了人类水准，但在需要外部知识、逻辑推理或领域迁移的认知智能领域还处于初级阶段。也就是说，深度学习的研究应从以感知智能为主，逐步向基于认知的逻辑推理方向演进。

显然，逻辑推理明显属于符号主义的研究范畴。被“慢待已久”的符号主义，似乎正酝酿着“冬天到了，春天还会远吗”的情绪表达。但怎样表达逻辑推理呢？除了传统的符号，图（Graph）也是一个颇有潜力的表达方式。

无独有偶，2020年，清华大学张钹院士在《中国科学》第9期撰文提议：我们应“迈向第三代人工智能”[7]。他认为，第三代人工智能发展的思路是：把第一代的知识驱动（符号智能）和第二代的数据驱动（感知智能）结合起来，通过协同利用知识、数据、算法和算力四要素，构造更强大的第三代AI（知识智能）。

清华大学唐杰教授在《人工智能下一个十年》主题报告中[8]给出了一个实现认知智能的探索路径：认知图谱=知识图谱+认知推理+逻辑表达。显然，图谱需要用图来表达。

英雄所见略同，2020年9月，在中国郑州召开的“第十六届全国高性能计算学术年会”上，陈左宁院士做了题为《人工智能进展对算力需求分析》的主题报告。在该报告中，陈左宁院士也认为，人工智能三大流派日趋融合，协同发展。她总结道：“人工智能的核心特征就是对‘关系’的研究。”“关系”的表现形式有三种：一是联结关系，比如，神经网络中神经元间的联结、反向传播算法中的梯度传播和进化算法中的变异；二是逻辑关系，如RNN（循环神经网络）中的循环连接及知识图谱中的推理关系；三是因果关系，如贝叶斯、决策树及强化学习中的控制连接。

我们常说“有人的世界，就有江湖”。与此类似，有“关系”的地方，就有图。万物之间皆有联系。如果说人工智能的核心特征之一就是“关系”，那么描述“关系”的首选工具会是谁呢？当然就是图！图作为一种通用的数据结构，可以很好地描述实体与实体之间的关系。

虽然深度学习的技术红利有“日薄西山”之势，但并不会“戛然而止”。按照科技哲学家凯文·凯利（Kevin Kelly）的观点来看，技术是另外一种“生命”，它拥有自己的“技因（Teme）”，为保持生命力，它会不断演化，从而达到技术自身的“适者生存”[9]。深度学习作为一项AI前沿技术，亦会如此[10]。

神经网络技术与图理论结合就塑造出了本书的主角之一——图神经网络（Graph Neural Networks, GNN），这是技术发展趋势的理性宣泄。我们可以认为，GNN是图在深度学习领域的“生根发芽”，也可以理解为，GNN是深度学习在图数据领域的“开疆拓土”。如此这般，便能大致勾勒出图神经网络的模样。