本文翻译自官网,官网地址:(https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/)

GROUP BY子句通过用户自己制定的tags set或time区间,来将查询结果进行分组。

一、GROUP BY tags

GROUP BY 通过用户指定的tag set,来对查询结果进行分组。
语法:

SELECT_clause FROM_clause [WHERE_clause] GROUP BY [* | <tag_key>[,<tag_key]]
GROUP BY子句 意义
GROUP BY * 使用所有tag对查询结果进行分组
GROUP BY <tag_key> 使用指定tag对查询结果进行分组
GROUP BY <tag_key>,<tag_key> 使用指定的多个tag对查询结果进行分组,其中tag之间的顺序是无关的。

 :如果在sql中同时存在WHERE子句和GROUP BY子句,则GROUP BY子句一定要在WHERE子句之后!

Other supported features: Regular Expressions


GROUP BY tags 示例sql

  1. Group query results by a single tag

    上面的sql使用了MEAN函数,来对h2o_feet这个measurement中的location这个tag进行分组求平均值。
    注:在InfluxDB中,0纪元1970-01-01T00:00:00Z这个时间经常被用来表示timestamp的NULL值。如果你的查询中没有显示指定返回一个timestamp,比如上面在调用聚合函数时,就没有指定时间区间,因此InfluxDB最后返回0纪元来作为timestamp。

  2. Group query results by more than one tag

  3. Group query results by all tags


二、基础GROUP BY time intervals

GROUP BY time() 查询会将查询结果按照用户指定的时间区间来进行分组。
语法:

SELECT <function>(<field_key>) FROM_clause WHERE <time_range> GROUP BY time(<time_interval>),[tag_key] [fill(<fill_option>)]

基本的 GROUP BY time() 查询用法需要在SELECT子句中调用相关函数,并且在WHERE子句中调用time时间区间。

  • time(time_interval)
    在GROUP BY time()子句中的time_interval是个连续的时间区间,该时间区间决定了InfluxDB如何通过时间来对查询结果进行分组。比如,如果time_interval为5m,那么它会将查询结果分为5分钟一组(如果在WHERE子句中指定了time区间,那么就是将WHERE中指定的time区间划分为没5分钟一组)。
  • fill(<fill_option>)
    fill(<fill_option>) 是可选的。它可以填充那些没有数据的时间区间的值。 从 [GROUP BY time intervals and fill() ] (https://docs.influxdata.com/influxdb/v1.7/query_language/data_exploration/#group-by-time-intervals-and-fill) 部分可查看到关于这部分的更多信息。

    注:基本的GROUP BY time()查询通过当前InfluxDB数据库的预设时间边界来确定每个时间间隔中包含的原始数据和查询返回的时间戳。


基本用法示例sql

先看一个WHERE查询

下面的GROUP BY time(time_interval)示例是在上面的sql基础上进行改进的,sql为:

SELECT COUNT("water_level") FROM "h2o_feet" WHERE "location"='coyote_creek'     AND time >= '2015-08-18T00:00:00Z'     AND time <= '2015-08-18T00:30:00Z' GROUP BY time(12m)

查询结果:

该sql将h2o_feet表中tag=“coyote_creek”,且在'2015-08-18T00:00:00Z'和'2015-08-18T00:30:00Z'时间区间内的数据查询出来,并对其划分为每12分钟一组,对water_level值进行count计算。
注意:在查询结果中,时间区间是左闭右开的。拿第一行查询结果数据来说,2015-08-18T00:00:00Z表示的时间区间是[2015-08-18T00:00:00, 2015-08-18T00:12:00Z )


常见问题