概述
总邻居数(Total Neighbors)是指两个节点所有不重复的邻居的总数。两个节点的总邻居数可以描述它们之间的紧密度。
基本概念
总邻居数
总邻居数算法计算两个节点各自邻居集合的并集大小,计算公式为:
其中,N(x)
和 N(y)
分别是节点 x
和 y
的邻居集合。TN(x,y)
值越大,代表两个节点越紧密;如果值为 0 意味着两个节点不紧密。
以上图为例,蓝色节点的邻居数为 3,红节点的邻居数为 4,但黄色、绿色两个节点重复出现在它们的邻居集合里,因此它们的总邻居数为 3 + 4 - 2 = 5
。
特殊处理
孤点、不连通图
孤点与图中任何其它节点之间没有边,本算法不计算孤点与任何节点的总邻居数,也不计算处于不同连通分量中的两个节点的总邻居数。
自环边
在计算邻居节点时,本算法会忽略所有自环边。
有向边
对于有向边,本算法会忽略边的方向,按照无向边进行计算。
结果和统计值
以下面的图为例,运行本算法:
算法结果:计算 3 号点与其他每个节点的总邻居数,返回 node1
、node2
、num
三列
node1 | node2 | num |
---|---|---|
3 | 1 | 3 |
3 | 2 | 6 |
3 | 4 | 5 |
3 | 5 | 3 |
3 | 6 | 5 |
3 | 7 | 3 |
算法统计值:无
命令和参数配置
- 命令:
algo(topological_link_prediction)
params()
参数配置项如下:
名称 |
类型 |
默认值 |
规范 | 描述 |
---|---|---|---|---|
ids 或 uuids | []_id 或 []_uuid |
/ | 必填 | 待计算的第一组节点的 ID 或 UUID;第一组的每个节点与第二组的每个节点组成点对进行计算 |
ids2 或 uuids2 | []_id 或 []_uuid |
/ | 必填 | 待计算的第二组节点的 ID 或 UUID;第一组的每个节点与第二组的每个节点组成点对进行计算 |
type | string | Adamic_Adar | Adamic_Adar 或 Common_Neighbors 或 Preferential_Attachment 或 Resource_Allocation 或 Total_Neighbors | 节点对紧密度度量方法,Adamic_Adar 或忽略代表 AA 指标,Common_Neighbors 代表共同邻居,Preferential_Attachment 代表优先连接,Resource_Allocation 代表资源分配,Total_Neighbors 代表总邻居数 |
limit | int | -1 | >=-1 | 需要返回的结果条数,-1 或忽略表示返回所有结果 |
算法执行
任务回写
1. 文件回写
配置项 | 各列数据 |
---|---|
filename | node1 ,node2 ,num |
示例:计算 3 号点和其他所有点的总邻居数,将算法结果回写至名为 tn 的文件
algo(topological_link_prediction).params({
uuids: [3],
uuids2: [1,2,4,5,6,7],
type: "Total_Neighbors"
}).write({
file:{
filename: "tn"
}
})
2. 属性回写
算法不支持属性回写。
3. 统计回写
算法无统计值。
直接返回
别名序号 |
类型 |
描述 | 列名 |
---|---|---|---|
0 | []perNodePair | 点对的紧密度 | node1 , node2 , num |
示例:计算 3 号点和 4 号点的总邻居数,将算法结果定义为别名 tn 并返回
algo(topological_link_prediction).params({
uuids: [3],
uuids2: [4],
type: "Total_Neighbors"
}) as tn
return tn
流式返回
别名序号 |
类型 |
描述 | 列名 |
---|---|---|---|
0 | []perNodePair | 点对的紧密度 | node1 , node2 , num |
示例:计算 1 号点和 5、6、7 号点的总邻居数,返回结果并按照紧密度降序排列
algo(topological_link_prediction).params({
uuids: [1],
uuids2: [5,6,7],
type: "Total_Neighbors"
}).stream() as neighbors
return neighbors order by neighbors.num desc
实时统计
算法无统计值。