通过条件查询可以查询到符合条件的数据,但如同要实现对字段的值进行计算、根据一个或多个字段对查询结果进行分组等操作时,就需要使用更高级的查询,MySQL提供了聚合函数、分组查询、排序查询、限量查询、内置函数以实现更复杂的查询需求。接下来将针对这些高级查询的知识进行讲解。
在实际开发中,经常需要做一些数据统计操作,例如统计某个字段的最大值、最小值、平均值等。像这样对一组值执行计算并将计算后的值返回的操作称为聚合操作,聚合操作一般通过聚合函数实现。使用聚合函数实现查询的基本语法格式如下。
SELECT [字段名1,字段名2,···,字段名n] 聚合函数 FROM 数据表名;
MySQL中常用的聚合函数如下:
COUNT(e) | 返回查询的记录总数,参数e可以是字段名或* |
SUM(e) | 返回e字段中值的总和 |
AVG(e) | 返回e字段中值的平均值 |
MAX(e) | 返回e字段中的最大值 |
MIN(e) | 返回e字段中的最小值 |
上面的聚合函数都是MySQL中内置的函数,使用者根据函数的语法格式直接调用即可。
接下来,通过一些例子学习聚合函数在数据统计中的使用。
为了方面演示,我把之前的员工表删了,又创建了一个员工表并插入了一些数据:
mysql> CREATE TABLE emp( -> empno INT PRIMARY KEY, -> ename VARCHAR(16), -> job VARCHAR(16), -> sal INT, -> bon INT -> ); Query OK, 0 rows affected (0.01 sec) mysql> DESC emp; +-------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+-------------+------+-----+---------+-------+ | empno | int | NO | PRI | NULL | | | ename | varchar(16) | YES | | NULL | | | job | varchar(16) | YES | | NULL | | | sal | int | YES | | NULL | | | bon | int | YES | | NULL | | +-------+-------------+------+-----+---------+-------+ 5 rows in set (0.00 sec)
表格介绍:
empno:员工编号
ename :员工姓名
job:职位
sal:工资
bon:奖金
插入语句:
mysql> INSERT INTO emp VALUES -> (9880,'张三','销售',3000,200), -> (9885,'李四','保洁',2500,100), -> (9775,'王五','销售',3500,500), -> (9900,'孙七','销售',2500,200), -> (9990,'周八','经理',7000,1000) -> (9770,'吴九','保洁',2500,null), -> (9888,'郑十','销售',3500,null); Query OK, 7 rows affected (0.01 sec) Records: 7 Duplicates: 0 Warnings: 0
表中的具体内容如下:
mysql> SELECT*FROM emp; +-------+--------+--------+------+------+ | empno | ename | job | sal | bon | +-------+--------+--------+------+------+ | 9770 | 吴九 | 保洁 | 2500 | NULL | | 9775 | 王五 | 销售 | 3500 | 500 | | 9880 | 张三 | 销售 | 3000 | 200 | | 9885 | 李四 | 保洁 | 2500 | 100 | | 9888 | 郑十 | 销售 | 3500 | NULL | | 9900 | 孙七 | 销售 | 2500 | 200 | | 9990 | 周八 | 经理 | 7000 | 1000 | +-------+--------+--------+------+------+ 7 rows in set (0.00 sec)
COUNT()函数用于检索数据表行中的值的计数,COUNT(*)可以统计数据表中记录的总条数,即数据表中有多少行记录。例如,想要使用SQL语句查询员工表中有多少个员工的记录。在查询时可以使用COUNT()函数进行统计,具体SQL语句及执行结果如下。
mysql> SELECT COUNT(*) FROM emp;
+----------+
| COUNT(*) |
+----------+
| 7 |
+----------+
1 row in set (0.00 sec)
由上述执行结果可以得出,数据表emp中有7条记录,也就是说员工表中有7个员工的记录。
COUNT()函数中的参数除可以使用*号,还可以使用字段的名称。两者不同的是,使用COUNT(*)统计结果时,相当于统计数据表的行数,不会忽略字段中值为NULL的行;如果使用COUNT(字段)统计,那么字段值为NULL的记录不会被统计。例如,想要使用SQL语句查询员工表中奖金不为NULL的员工个数,具体SQL语句及执行结果如下。
mysql> SELECT COUNT(bon) FROM emp; +------------+ | COUNT(bon) | +------------+ | 5 | +------------+ 1 row in set (0.00 sec)
由上述执行结果可以得出,数据表emp中奖金不为NULL的员工有5个。
如果字段中存放的是数值型数据,需要统计该字段中所有值的总数,可以使用SUM()函数。SUM()函数会对指定字段中的值进行累加,并且在数据累加时忽略字段中的NULL值。
例如,想要使用SQL语句查询员工表中员工奖金的总和。可以在查询时使用SUM()函数进行统计,具体SQL语句及执行结果如下。
mysql> SELECT SUM(bon) FROM emp; +----------+ | SUM(bon) | +----------+ | 2000 | +----------+ 1 row in set (0.00 sec)
上述SELECT语句使用SUM()函数对COMM字段中的值进行求和统计,执行结果中显示员工奖金总和为2000元。
如果字段中存放的是数值型数据,需要统计该字段中所有值的平均值,可以使用AVG()函数。AVG()函数会计算指定字段值的平均值,并且计算时会忽略字段中的NULL值。
例如,想要使用SQL语句查询员工表中员工的平均奖金。查询时可以使用AVG()函数进行统计,具体SQL语句及执行结果如下。
mysql> SELECT AVG(bon) FROM emp; +----------+ | AVG(bon) | +----------+ | 400.0000 | +----------+ 1 row in set (0.00 sec)
上述SELECT语句使用AVG()函数计算bon字段的平均值。由执行结果可以得出,bon字段的平均值为400.0000。AVG()函数在计算时会忽略bon字段中的NULL值,即只对非NULL的数值进行累加,然后将累加和除以非NULL的行数计算出平均值。
上面已经设置了是五个人有奖金,有两个是没有奖金的,奖金是空值,因此那两个人也不会计算入内。
如果想要统计所有员工的平均奖金,即奖金平均到所有员工身上,可以借助IFNULL()函数。
IFNULL(v1,v2)
上述格式表示,如果v1的值不为NULL,则返回v1的值,否则返回v2。例如,想要使用SQL语句查询所有员工的平均奖金。查询时可以调用AVG()函数和IFNULLO函数进行统计,先调用IFNULL()函数将bon字段中所有的NULL值转换为0,再调用AVG()函数统计平均值,具体SQL语句及执行结果如下。
mysql> SELECT AVG(IFNULL(BON,0)) FROM emp; +--------------------+ | AVG(IFNULL(BON,0)) | +--------------------+ | 285.7143 | +--------------------+ 1 row in set (0.00 sec)
上述SELECT语句在执行AVG()函数之前调用IFNULL()函数对bon字段中的值进行判断,如果是NULL值就转换成0返回;由执行结果并结合数据表中的数据可以得出,本次统计的平均奖金是所有员工的平均奖金。
MAX(函数用于计算指定字段中的最大值,如果字段的值是数值类型,则比较的是值的大小。例如,想要使用SQL语句查询员工表中最高的工资。查询时可以使用MAX()函数进行计算,具体SQL语句及执行结果如下。
mysql> SELECT MAX(sal) FROM emp; +----------+ | MAX(sal) | +----------+ | 7000 | +----------+ 1 row in set (0.00 sec)
上述SELECT语句使用MAX()函数获取了sal字段中最大的数值。
MIN()函数用于计算指定字段中的最小值,如果字段的值是数值类型,则比较的是值的大小。例如,想要使用SQL语句查询员工表中最低的工资。查询时可以使用MIN()函数进行计算,具体SQL语句及执行结果如下。
mysql> SELECT MIN(sal) FROM emp; +----------+ | MIN(sal) | +----------+ | 2500 | +----------+ 1 row in set (0.00 sec)
在上述代码中,使用MIN()函数获取了sal字段中最小的数值。
在对数据表中的数据进行统计时,有时需要按照一定的类别作统计。例如,财务在统计每个部门的工资总数时,属于同一个部门的所有员工就是一个分组。在MySQL中,可以使用GROUP BY根据指定的字段结果集进行分组,如果某些记录的指定字段具有相同的价值,那么分组后被合并为一条数据。使用GROUP BY分组查询的语法如下:
单独使用GROUP BY进行分组时将根据指定的字段合并数据行。例如,我们想要使用SQL语句查询员工表的职位有有哪几种,具体SQL语句及执行结果如下:
mysql> SELECT job FROM emp GROUP BY job; +--------+ | job | +--------+ | 保洁 | | 销售 | | 经理 | +--------+ 3 rows in set (0.00 sec)
在上述SELECT语句中,使用GROUP BY根据job字段中的值对数据表中的记录进行分组;从执行结果来看,员工的职位一共有三种。
如果分组查询时要进行统计汇总,此时需要将GROUP BY和聚合函数一起使用。例如,统计员工表各部门的薪资总和或平均薪资,可以使用GROUP BY和聚合函数AVG()、SUM()进行统计,具体SQL语句及执行结果如下:
mysql> SELECT job,AVG(sal),SUM(sal) FROM emp GROUP BY job; +--------+-----------+----------+ | job | AVG(sal) | SUM(sal) | +--------+-----------+----------+ | 保洁 | 2500.0000 | 5000 | | 销售 | 3125.0000 | 12500 | | 经理 | 7000.0000 | 7000 | +--------+-----------+----------+ 3 rows in set (0.01 sec)
在上述SELECT语句中,使用GROUP BY根据job字段中的值对数据表的记录进行分组,值相同的为一组,并计算出各个职位的总工资和平均工资。
3.GROUP BY和HAVING关键字一起使用
通常情况下GROUP BY和HAVING关键字一起使用,用于对分组后的结果进行条件过滤。例如,假如我们想要使用SQL语句查询员工表中的平均工资小于3000的部门编号及这些部门的平均工资。查询时可以使用GROUP BY和HAVING进行统计,具体SQL语句及执行结果如下:
mysql> SELECT empno,AVG(sal) FROM emp GROUP BY empno HAVING AVG(sal)<3000; +-------+-----------+ | empno | AVG(sal) | +-------+-----------+ | 9770 | 2500.0000 | | 9885 | 2500.0000 | | 9900 | 2500.0000 | +-------+-----------+ 3 rows in set (0.00 sec)
在上述SELECT语句中,使用GROUP BY根据empno字段中的值对数据表的记录进行分组,并且使用HAVING筛选平均工资小于3000的数据,最终返回了平均工资小于3000的部门编号及平均工资。
在MySQL中,HAVING 子句用于在 GROUP BY 子句后对聚合结果进行过滤。它通常与聚合函数(如 SUM(), COUNT(), AVG(), MAX(), MIN() 等)一起使用,以筛选满足特定条件的分组。
与 WHERE 子句不同,WHERE 子句在聚合之前对单个记录进行过滤,而 HAVING 子句在聚合之后对分组进行过滤。这一点不要弄错哦。
对数据表的数据进行查询时,可能查询出来的数据是无序的,或者其排列顺序不是用户期望的。如果想要对查询结果按指定的方式排序,例如对员工信息按姓名顺序排列等,可以使用ORDER BY对查询结果进行排序。查询语句中使用ORDER BY的基本语法格式如下。
SELECT*|{字段名1,字段名2,···} FROM 表名 ORDER BY 字段名1 [ASC | DESC], 字段名2 [ASC | DESC]......
在上面的语法格式中,ORDER BY后指定的字段名1、字段名2等是对查询结果排序的依据,即按照哪一个字段进行排序。参数ASC表示按照升序进行排序,DESC表示按照降序进行排序。
使用ORDER BY对查询结果进行排序时,如果不指定排序方式,默认按照ASC方式进行排序。例如,技术人员想要使用SQL语句查询员工表中职位为销售的员工信息,查询出的结果根据员工工资升序排列,具体SQL语句及执行结果如下:
mysql> SELECT * FROM emp WHERE job='销售' ORDER BY sal; +-------+--------+--------+------+------+ | empno | ename | job | sal | bon | +-------+--------+--------+------+------+ | 9900 | 孙七 | 销售 | 2500 | 200 | | 9880 | 张三 | 销售 | 3000 | 200 | | 9775 | 王五 | 销售 | 3500 | 500 | | 9888 | 郑十 | 销售 | 3500 | NULL | +-------+--------+--------+------+------+ 4 rows in set (0.00 sec)
上述SELECT语句使用ORDER BY对job字段值为销售的所有记录按照工资从低到高进行排序,即sal字段的值按升序排序。因为没有设置怎么排序,所以默认ASC升序排序。
要注意的是如果有字段中的值为NULL,那么NULL会被当做最小值进行排序,下面按照奖金对销售员工进行排序:
mysql> SELECT * FROM emp WHERE job='销售' ORDER BY bon; +-------+--------+--------+------+------+ | empno | ename | job | sal | bon | +-------+--------+--------+------+------+ | 9888 | 郑十 | 销售 | 3500 | NULL | | 9880 | 张三 | 销售 | 3000 | 200 | | 9900 | 孙七 | 销售 | 2500 | 200 | | 9775 | 王五 | 销售 | 3500 | 500 | +-------+--------+--------+------+------+ 4 rows in set (0.00 sec)
上述SELECT语句查询职位为销售的员工信息,并且根据员工奖金值进行升序排序。从执行结果可以看出,奖金值为NULL的员工信息排在第一位,说明排序时NULL被当作最小值。
ORDER BY可以对多个字段的值进行排序,并且每个排序字段可以有不同的排序顺序。例如,技术人员想要使用SQL语句查询员工表中工资为2500的员工所有记录,查询出的记录先按职位的升序排序,再按员工编号降序排序,具体SQL语b 句及执行结果如下。
mysql> SELECT * FROM emp WHERE sal=2500 ORDER BY job,empno DESC; +-------+--------+--------+------+------+ | empno | ename | job | sal | bon | +-------+--------+--------+------+------+ | 9885 | 李四 | 保洁 | 2500 | 100 | | 9770 | 吴九 | 保洁 | 2500 | NULL | | 9900 | 孙七 | 销售 | 2500 | 200 | +-------+--------+--------+------+------+ 3 rows in set (0.00 sec)
在上述SELECT语句中,查询sal字段工资为2500的所有记录,先将这些记录按照job字段的值升序排序,如果job字段的值相同,则按照empno字段的值进行降序排序。如果排序字段的值是字符串类型,则会按字符串中字符的ASCII码值进行排序。
上面的例子job字段后面没有设置排序,因此默认是升序,然后又给empno字段设置了降序,大家不要迷了啊。
mysql> SELECT * FROM emp WHERE sal=2500 ORDER BY bon DESC,empno DESC; +-------+--------+--------+------+------+ | empno | ename | job | sal | bon | +-------+--------+--------+------+------+ | 9900 | 孙七 | 销售 | 2500 | 200 | | 9885 | 李四 | 保洁 | 2500 | 100 | | 9770 | 吴九 | 保洁 | 2500 | NULL | +-------+--------+--------+------+------+ 3 rows in set (0.00 sec)
这个是两个字段都设置了排序,并且都是降序。
查询数据时,SELECT语句可能会返回很多条记录,而用户需要的记录可能只是其中的一条或几条。中的一条或几条。例如,在员工管理系统中,希望每一页默认展示10条员工信息,并且可以通过下拉框更改每页展示的员工信息数。MySQL中提供了一个关键字LIMIT可以指定查询结果从哪一条记录开始以及一共查询多少条信息。在SELECT语句中使用LIMIT的基本语法格式如下。
SELECT 字段名1,字段名2,..… FROM 数据表名 LIMIT [OFFSET,] 记录数;
在上面的语法格式中,LIMIT后面可以跟2个参数。第一个参数OFFSET为可选值,表示偏移量,如果偏移量为0则从查询结果的第一条记录开始,偏移量为1则从查询结果的第二条记录开始,以此类推。如果不指定OFFSET的值,其默认值为0。第二个参数“记录数”表示返回查询记录的条数。
例如,技术人员想要使用SQL语句查询员工表中工资最高的前3名的员工信息,查询时可以使用LIMIT进行限量,具体SQL语句及执行结果如下。
mysql> SELECT * FROM emp ORDER BY sal DESC LIMIT 3; +-------+--------+--------+------+------+ | empno | ename | job | sal | bon | +-------+--------+--------+------+------+ | 9990 | 周八 | 经理 | 7000 | 1000 | | 9775 | 王五 | 销售 | 3500 | 500 | | 9888 | 郑十 | 销售 | 3500 | NULL | +-------+--------+--------+------+------+ 3 rows in set (0.00 sec)
在上述SELECT语句中,首先使用ORDER BY根据字段sal的值对数据表中的记录进行降序排序,接着使用LIMIT指定返回第1~3条记录。
除了指定查询记录数,LIMIT还可以通过指定OFFSET的值指定查询的偏移量,也就是查询时跳过几条记录。
例如,我们要使用SQL语句查询员工表中工资第二名到第五名的员工信息。具体SQL语句及执行结果如下:
mysql> SELECT * FROM emp ORDER BY sal DESC LIMIT 1,4; +-------+--------+--------+------+------+ | empno | ename | job | sal | bon | +-------+--------+--------+------+------+ | 9775 | 王五 | 销售 | 3500 | 500 | | 9888 | 郑十 | 销售 | 3500 | NULL | | 9880 | 张三 | 销售 | 3000 | 200 | | 9770 | 吴九 | 保洁 | 2500 | NULL | +-------+--------+--------+------+------+ 4 rows in set (0.00 sec)
在上述SELECT语句中,先使用ORDER BY根据字段sal的值对数据表中的记录进行降序排序,然后指定返回记录的偏移量为1,查询记录的条数为4.执行结果跳过了排序后的第一条员工信息,返回工资前2~5名的员工信息。
这里和Python的索引有点像,可以联系理解一下,下标就像偏移量,都是从0开始。
下篇文章是MySQL中的内置函数的讲解。点个关注不迷路。