数学上,嵌入(Embedding 或 Imbedding)是指一个数学结构经映射包含到另一个结构中。在图上,图嵌入(Graph Embedding)理念的基础是把一张图转换到向量空间,因为向量空间内可以实现更多的数学、统计学操作。这种转换实际上是把高维度数据抽象后映射到低维空间,同时保留一些属性,例如图的拓扑结构、点边关系等等。图嵌入算法常常是为下游任务而服务的,比如分类、链接预测等。
图嵌入是近几年来图计算领域中相当热门的研究方向,一方面是因为相当多的 AI 研究者将研究方向由深度学习、神经网络转为图嵌入、图神经网络,另一方面是工业界也越来越多地发现结合图嵌入可以获得更好的反欺诈或智慧营销的效果。
图嵌入类算法是个不断扩大的算法门类。图嵌入的主要方法之一是随机游走(Random Walk)。随机游走是指起始节点随机移动到一个邻居节点,并将该节点作为新的起点,如此循环执行若干步;重复执行若干次产生游走序列;产生的序列可作为样本输送到模型中进行训练,进而得到图上节点嵌入向量。