1.1.2 人工智能的底层逻辑
众所周知,人工智能(Artificial Intelligence, AI)的研究大致有三个派别:符号主义、联结主义[6]和行为主义。简单来说,符号主义主要是用公理和逻辑体系搭建一套人工智能系统。联结主义主张模仿人类的神经元联结机制来实现人工智能。行为主义认为,智能取决于感知和行动,环境的反馈有助于智能的提升。
不同的研究视角派生出不同的学术流派。然而,这些看似泾渭分明的主义,如果站在更高的抽象视角来审视,它们其实具有共同的特征——都是在研究事物间的关系(Relation)。
自2012年之后,以深度学习为代表的联结主义可谓风生水起,在计算机视觉、自然语言处理等领域均有广泛应用。如前所述,深度学习在很多领域取得的效果固然很好,但因为它属于典型的“端到端”黑盒模型,因此存在阿喀琉斯之踵(Achilles's Heel)——无法对预测的结果给出合理的解释。在探寻真理的路上,人们是不被允许在“知其然,不知其所以然”的非理性繁荣中徜徉太久的。要知道,追求因果,可能是人类保持心神安定的重要慰藉。
“天下无不散之筵席”,目前深度学习的技术红利收割已趋饱和,盛宴已过,诸神黄昏,需要纳入新的理论来突破AI的天花板。很多奋斗在科研第一线的科研人员很敏锐地意识到了这一点。2019年11月,在著名学术会议NeurIPS(Conference on Neural Information Processing Systems,神经信息处理系统大会)的主旨演讲上,图灵奖得主约书亚·本吉奥(Yoshua Bengio)借鉴著名心理学家卡尼曼提出的“系统1”(快速、直觉、无意识)和“系统2”(慢速、逻辑、有意识)的理念[6],指出深度学习的未来应走向“系统2”。深度学习从“系统1”过渡到“系统2”如图1-3所示。
图1-3 深度学习从“系统1”过渡到“系统2”
以深度学习为代表的人工智能已在“听、说、看”等感知智能领域达到或超越了人类水准,但在需要外部知识、逻辑推理或领域迁移的认知智能领域还处于初级阶段。也就是说,深度学习的研究应从以感知智能为主,逐步向基于认知的逻辑推理方向演进。
显然,逻辑推理明显属于符号主义的研究范畴。被“慢待已久”的符号主义,似乎正酝酿着“冬天到了,春天还会远吗”的情绪表达。但怎样表达逻辑推理呢?除了传统的符号,图(Graph)也是一个颇有潜力的表达方式。
无独有偶,2020年,清华大学张钹院士在《中国科学》第9期撰文提议:我们应“迈向第三代人工智能”[7]。他认为,第三代人工智能发展的思路是:把第一代的知识驱动(符号智能)和第二代的数据驱动(感知智能)结合起来,通过协同利用知识、数据、算法和算力四要素,构造更强大的第三代AI(知识智能)。
清华大学唐杰教授在《人工智能下一个十年》主题报告中[8]给出了一个实现认知智能的探索路径:认知图谱=知识图谱+认知推理+逻辑表达。显然,图谱需要用图来表达。
英雄所见略同,2020年9月,在中国郑州召开的“第十六届全国高性能计算学术年会”上,陈左宁院士做了题为《人工智能进展对算力需求分析》的主题报告。在该报告中,陈左宁院士也认为,人工智能三大流派日趋融合,协同发展。她总结道:“人工智能的核心特征就是对‘关系’的研究。”“关系”的表现形式有三种:一是联结关系,比如,神经网络中神经元间的联结、反向传播算法中的梯度传播和进化算法中的变异;二是逻辑关系,如RNN(循环神经网络)中的循环连接及知识图谱中的推理关系;三是因果关系,如贝叶斯、决策树及强化学习中的控制连接。
我们常说“有人的世界,就有江湖”。与此类似,有“关系”的地方,就有图。万物之间皆有联系。如果说人工智能的核心特征之一就是“关系”,那么描述“关系”的首选工具会是谁呢?当然就是图!图作为一种通用的数据结构,可以很好地描述实体与实体之间的关系。
虽然深度学习的技术红利有“日薄西山”之势,但并不会“戛然而止”。按照科技哲学家凯文·凯利(Kevin Kelly)的观点来看,技术是另外一种“生命”,它拥有自己的“技因(Teme)”,为保持生命力,它会不断演化,从而达到技术自身的“适者生存”[9]。深度学习作为一项AI前沿技术,亦会如此[10]。
神经网络技术与图理论结合就塑造出了本书的主角之一——图神经网络(Graph Neural Networks, GNN),这是技术发展趋势的理性宣泄。我们可以认为,GNN是图在深度学习领域的“生根发芽”,也可以理解为,GNN是深度学习在图数据领域的“开疆拓土”。如此这般,便能大致勾勒出图神经网络的模样。