GQL - 聚合函数 - 嬴图数据库

修改密码

提交

Change Email

Submit

修改昵称

当前昵称：

提交

基础信息

用户邮箱：

用户昵称：
手机号：
公司名称：
公司邮箱:

修改密码

申请证书

当前未申请证书.

申请证书

Certificate	Issued at	Valid until	Serial No.	File

Serial No.	Valid until	File

Not having one? Apply now! >>>

ProductName	CreateTime	ID	Price	File

ProductName	CreateTime	ID	Price	File

No Invoice

创建嬴图账号

我已阅读并同意隐私政策。

请勾选表示您已阅读并同意

已有嬴图账号？去登录！

忘记密码

重置密码

返回登录

聚合函数

概述

聚合函数对一组值进行计算，并返回单个值作为结果。

目前支持纵向聚合，即将来自不同行的一组值聚合成单个值。暂不支持横向聚合，即将来自分组列表值的一组值聚合成单个值。

DISTINCT

所有聚合函数支持使用集合量词DISTINCT在聚合前对值去重。

Null值

除count(*)外，所有聚合函数在计算时会忽略null值所在行。

示例图集

以下示例根据该图集运行：

avg()

计算一组数值的平均值。

语法	`avg(<values>)`
参数	名称	类型	描述
参数	`<values>`	数值	目标值
返回类型	`DOUBLE`

MATCH (n)
RETURN avg(n.score)

结果：

avg(n.score)
7.33333333333333

collect_list()

将一组值放入一个列表。

语法	`collect_list(<values>)`
参数	名称	类型	描述
参数	`<values>`	任意	目标值
返回类型	`LIST`

MATCH (n)
RETURN collect_list(n.title)

结果：

collect_list(n.title)
["Optimizing Queries","Efficient Graph Search","Path Patterns"]

count()

返回输入中的总行数。

语法	`count(<values>)`
参数	名称	类型	描述
参数	`<values>`	任意	目标值
返回类型	`UINT`

MATCH (n)
RETURN count(n)

结果：

count(n)
3

count(*)

count(*)返回中间结果表中的总行数。

对比以下两条查询，能发现仅在使用count(*)时将null值纳入计算范围：

FOR item IN [1, "a", "2", "b3", null]
RETURN count(item)

结果：

count(item)
4

FOR item IN [1, "a", "2", "b3", null]
RETURN count(*)

结果：

count(*)
5

count(DISTINCT)

可在count()中加入集合量词DISTINCT来返回输入中不同的行数。

FOR item IN [1, 1, "a", "2", "b3"]
RETURN count(DISTINCT item)

结果：

count(DISTINCT item)
4

max()

返回一组值的最大值。

语法	`max(<values>)`
参数	名称	类型	描述
参数	`<values>`	任意	目标值
返回类型	数值

MATCH (n)
RETURN max(n.score)

结果：

max(n.score)
9

FOR item IN [1, "a", "2.1", "b3"]
RETURN max(item)

结果：

max(item)
2

min()

返回一组值的最小值。

语法	`min(<values>)`
参数	名称	类型	描述
参数	`<values>`	任意	目标值
返回类型	数值

MATCH (n)
RETURN min(n.score)

结果：

min(n.score)
6

FOR item IN [3, "a", "0.2", "b2"]
RETURN min(item)

结果：

min(item)
0

percentile_cont()

计算一组数值的连续百分位数。

语法	`percentile_cont(<values>, <percentile>)`
参数	名称	类型	描述
	`<values>`	数值	目标值
	`<percentile>`	数值	Number between 0.0 and 1.0
返回类型	`DOUBLE`

percentile_cont()的计算步骤如下：

升序排列各值。
根据公式p = percentile × (n − 1) + 1计算百分位位置，其中n是非null值的总数。
利用线性插值法确定百分位数：
- 若p为整数，则位置p的对应点为百分位数。
- 若p为介于整数p1和p2之间的小数（p1 < p < p2），则在位置p1的值v1和位置p2的值v2之间插值，根据公式v1 + (p - p1) × (v2 - v1)计算百分位数。

FOR item IN [3, 9, 4, 7, 6]
RETURN percentile_cont(item, 0.4)

结果：

percentile_cont(item, 0.4)
5.2

FOR item IN [3, 9, 4, 7, 6]
RETURN percentile_cont(item, 0.5)

结果：

percentile_cont(item, 0.5)
6

percentile_disc()

计算一组数值的离散百分位数。

语法	`percentile_disc(<values>, <percentile>)`
参数	名称	类型	描述
	`<values>`	数值	目标值
	`<percentile>`	数值	Number between 0.0 and 1.0
返回类型	`DOUBLE`

percentile_disc()的计算步骤如下：

升序排列各值。
根据公式p = ceil(percentile × n)计算百分位位置，其中n是非null值的总数。
位置p对应的数值为百分位数。

FOR item IN [3, 9, 4, 7, 6]
RETURN percentile_disc(item, 0.4)

结果：

percentile_disc(item, 0.4)
4

FOR item IN [3, 9, 4, 7, 6]
RETURN percentile_disc(item, 0.5)

结果：

percentile_disc(item, 0.5)
6

stddev_pop()

计算一组数值的总体标准差。

stddev_pop(x_{1}, ..., x_{n}) = \sqrt{\frac{1}{n} \sum_{i_{= 1}}^{n} {(x_{i} - \overset{—}{x})}^{2}}

语法	`stddev_pop(<values>)`
参数	名称	类型	描述
参数	`<values>`	数值	目标值
返回类型	数值

MATCH (n)
RETURN stddev_pop(n.score)

结果：

stddev_pop(n.score)
1.24721912892465

stddev_samp()

计算一组数值的样本标准差。

stddev_samp(x_{1}, ..., x_{n}) = \sqrt{\frac{1}{n - 1} \sum_{i_{= 1}}^{n} {(x_{i} - \overset{—}{x})}^{2}}

语法	`stddev_samp(<values>)`
参数	名称	类型	描述
参数	`<values>`	数值	目标值
返回类型	`DOUBLE`

MATCH (n)
RETURN stddev_samp(n.score)

结果：

stddev_samp(n.score)
1.52752523165195

sum()

计算一组数值的总和。

语法	`sum(<values>)`
参数	名称	类型	描述
参数	`<values>`	数值	目标值
返回类型	`DOUBLE`

MATCH (n)
RETURN sum(n.score)

结果：

sum(n.score)
22

ID
产品
状态
核数
Shard 服务最大数量
Shard 服务最大总核数
HDC 服务最大数量
HDC 服务最大总核数
申请天数
审批日期
过期日期
MAC地址
申请理由
审核信息