修改密码

请输入密码
请输入密码 请输入8-64长度密码 和 email 地址不相同 至少包括数字、大写字母、小写字母、半角符号中的 3 个
请输入密码
提交

修改昵称

当前昵称:
提交

申请证书

证书详情

Please complete this required field.

  • Ultipa Graph V4

Standalone

Please complete this required field.

Please complete this required field.

服务器的MAC地址

Please complete this required field.

Please complete this required field.

取消
申请
ID
产品
状态
核数
申请天数
审批时间
过期时间
MAC地址
申请理由
审核信息
关闭
基础信息
  • 用户昵称:
  • 手机号:
  • 公司名称:
  • 公司邮箱:
  • 地区:
  • 语言:
修改密码
申请证书

当前未申请证书.

申请证书
Certificate Issued at Valid until Serial No. File
Serial No. Valid until File

Not having one? Apply now! >>>

ProductName CreateTime ID Price File
ProductName CreateTime ID Price File

No Invoice

以PageRank算法为例,该算法会对结果的正确性有哪些影响?

回答此问题
解决
wuxusheng2022-04-12


PageRank算法

2 个回答

  • 0 点赞

    请明确描述问题!

    apitlu 2022-04-12
    添加评论...

    取消
    提交
  • 2 点赞

    一步一步分析一下吧。
    首先,先了解一下PageRank算法。该算法是最知名的一种图算法,得名于谷歌的联合创始人 Larry Page,也是在互联网搜索引擎中进行网络排序的核心算法。

    图:Larry Page(拉里·佩奇

    其次,PageRank是最早被用在大规模分布式系统中的一种逻辑相对简单,容易实现分布式计算的图算法,因此所有的图数据库、图计算厂家都会提供该算法。

    最后,该算法的哪些方面需要格外注意?PageRank 算法逻辑虽然简单,但是还有很多细节需要把握,尤其是在基准测试中,一定要体现出来——例如其计算结果是否可以支持数据库回写、文件回写、流式返回、结果排序。因为在真正的商业化对标测试中,通常会有两点:

    必须对全量数据进行迭代计算;

    对结果进行排序,并返回 Top-N 的结果进行比对。

    以上两点缺一不可。我们发现有些系统竟然只对部分数据进行局部计算,这个直接违背了 PageRank 的全局迭代计算的算法本质,Neo4j 就是一个典型的例子,如果在算法调用传参中限定返回 1000,则它居然只计算 1000 个顶点的 PageRank 值,如果全量数据是 Twitter,这个结果100%是错误的,它相当于只进行了全量数据的四万分之一的计算。

    另外,结果是否支持排序,如果数据库不支持排序,就相当于把这个压力直接转移给了业务层(应用层),这个能力直接反映了一款图数据库的设计与实现能力。多数图数据库的基准测试中如果不提及这些问题,其结果的可信度则大打折扣。

    黎宇澄 2022-04-12
    添加评论...

    取消
    提交

你的回答:

提交
取消