联合查询又称为多表查询,它的基本执行过程就是笛卡尔积
那么什么是笛卡尔积呢?
答:笛卡尔积就是将两张表放在一起进行计算,把第一张表的每一行分别取出来和第二张表的每一行进行连接,得到一个新的行。
举例说明笛卡尔积:
假设我们现在有两张表分别为学生信息表和班级信息表
现在我们把这两张表进行笛卡尔积操作:
笛卡尔积相当于乘法运算,列数是两个表列数之和,行数是两个表行数之积
注:笛卡尔积执行后产生的结果大多是无效的,此时我们就可以采用条件进行筛选
接下来我们就来试一下如何进行笛卡尔积操作:
首先创建两张表,分别为上述的学生信息表和班级信息表,创建完两张表后并给它们添加上述表中的内容
select * from student; +----+------+---------+ | id | name | classid | +----+------+---------+ | 1 | 张三 | 1 | | 2 | 李四 | 2 | | 3 | 王五 | 1 | +----+------+---------+
select * from class; +---------+-----------+ | classid | classname | +---------+-----------+ | 1 | 舞蹈班 | | 2 | 跆拳道班 | +---------+-----------+
然后对这两张表进行笛卡尔积操作
select * from student,class; +----+------+---------+---------+-----------+ | id | name | classid | classid | classname | +----+------+---------+---------+-----------+ | 1 | 张三 | 1 | 1 | 舞蹈班 | | 1 | 张三 | 1 | 2 | 跆拳道班 | | 2 | 李四 | 2 | 1 | 舞蹈班 | | 2 | 李四 | 2 | 2 | 跆拳道班 | | 3 | 王五 | 1 | 1 | 舞蹈班 | | 3 | 王五 | 1 | 2 | 跆拳道班 | +----+------+---------+---------+-----------+
上述的笛卡尔积执行后产生的结果大多数是无效的,此时我们就可以采用条件进行筛选
当 student 表中的 classid 和 class 表中的 classid 相等时,则这条数据是有效的数据
select * from student,class where classid = classid; ERROR 1052 (23000): Column 'classid' in where clause is ambiguous
如果直接用 classid = classid 则会报错,因为它无法分辨哪个classid 和 哪个 classid 进行比较
select * from student,class where student.classid = class.classid; +----+------+---------+---------+-----------+ | id | name | classid | classid | classname | +----+------+---------+---------+-----------+ | 1 | 张三 | 1 | 1 | 舞蹈班 | | 2 | 李四 | 2 | 2 | 跆拳道班 | | 3 | 王五 | 1 | 1 | 舞蹈班 | +----+------+---------+---------+-----------+
那么此时就可以采用 表名.列名 的方式进行区分
注:多表查询除了可以加上连接条件外,还可以加上其他条件
多表查询出来用 from 多个表加逗号分隔 来连接多个表外,还可以用 join on 来连接,还可以是 inner join on
join on 实现多表查询:
select * from student join class on student.classid = class.classid; +----+------+---------+---------+-----------+ | id | name | classid | classid | classname | +----+------+---------+---------+-----------+ | 1 | 张三 | 1 | 1 | 舞蹈班 | | 2 | 李四 | 2 | 2 | 跆拳道班 | | 3 | 王五 | 1 | 1 | 舞蹈班 | +----+------+---------+---------+-----------+
join 连接的是两个表,on 后面跟的是连接条件
inner join on 实现多表查询:
select * from student inner join class on student.classid = class.classid; +----+------+---------+---------+-----------+ | id | name | classid | classid | classname | +----+------+---------+---------+-----------+ | 1 | 张三 | 1 | 1 | 舞蹈班 | | 2 | 李四 | 2 | 2 | 跆拳道班 | | 3 | 王五 | 1 | 1 | 舞蹈班 | +----+------+---------+---------+-----------+
inner join on 其实跟 join on 一样,此处不做过多解释
from 多个表 和 join on 的主要区别:
from 多个表只能实现内连接
join on 既可以实现内连接也可以实现外连接
内连接 和 外连接的主要区别:
当连接的两个表里面的数据是一一对应的时候,内连接和外连接其实就没啥区别
当连接的两个表里面的数据不是一一对应的时候,内连接和外连接就有区别了
现在有两张表,分别为 student 学生表 和 score 成绩表:
select * from student; +----+------+ | id | name | +----+------+ | 1 | 张三 | | 2 | 李四 | | 3 | 王五 | +----+------+
select * from scoretable; +-----------+-------+ | studentId | score | +-----------+-------+ | 1 | 97 | | 2 | 86 | | 3 | 73 | +-----------+-------+
id 和 studentId 是一一对应的,所有内连接和外连接没什么区别
内连接:
select * from student,scoreTable where student.id = scoretable.studentId; +----+------+-----------+-------+ | id | name | studentId | score | +----+------+-----------+-------+ | 1 | 张三 | 1 | 97 | | 2 | 李四 | 2 | 86 | | 3 | 王五 | 3 | 73 | +----+------+-----------+-------+
外连接:
select * from student join scoreTable on student.id = scoretable.studentId; +----+------+-----------+-------+ | id | name | studentId | score | +----+------+-----------+-------+ | 1 | 张三 | 1 | 97 | | 2 | 李四 | 2 | 86 | | 3 | 王五 | 3 | 73 | +----+------+-----------+-------+
现在有两张表,分别为 student 学生表 和 score 成绩表:
select * from student; +----+------+ | id | name | +----+------+ | 1 | 张三 | | 2 | 李四 | | 3 | 王五 | +----+------+
select * from scoretable; +-----------+-------+ | studentId | score | +-----------+-------+ | 1 | 97 | | 2 | 86 | | 6 | 73 | +-----------+-------+
现在我们可以看到 student 中的 id 为 3 的在 scoretable 中没有对应的 studentId
内连接:
select * from student,scoreTable where student.id = scoretable.studentId; +----+------+-----------+-------+ | id | name | studentId | score | +----+------+-----------+-------+ | 1 | 张三 | 1 | 97 | | 2 | 李四 | 2 | 86 | +----+------+-----------+-------+
当进行内连接的时候因为student中的id为3 的和scoretable中的studentId为6的不匹配所以就被筛除了没有查询出来
外连接:
当两张表不是一一对应的时候,外连接又可以分为 左外连接 和 右外连接
左外连接:left join on
select * from student left join scoreTable on student.id = scoretable.studentId; +----+------+-----------+-------+ | id | name | studentId | score | +----+------+-----------+-------+ | 1 | 张三 | 1 | 97 | | 2 | 李四 | 2 | 86 | | 3 | 王五 | NULL | NULL | +----+------+-----------+-------+
左外连接会把左表的结果尽量显示出来,如果右表中没有对应的记录,就使用NULL填充
右外连接:right join on
select * from student right join scoreTable on student.id = scoretable.studentId; +------+------+-----------+-------+ | id | name | studentId | score | +------+------+-----------+-------+ | 1 | 张三 | 1 | 97 | | 2 | 李四 | 2 | 86 | | NULL | NULL | 6 | 73 | +------+------+-----------+-------+
右外连接会把右表的结果尽量显示出来,如果左表中没有对应的记录,就使用NULL填充
自连接:自己和自己进行笛卡尔积
自连接使用场景:当行与行进行比较时,就可以使用自连接,将行转成列进行比较
现在有两张表,分别为 scoretable 和 course
scoretable 表:
select * from scoretable; +-------+------------+-----------+ | score | student_id | course_id | +-------+------------+-----------+ | 70 | 1 | 1 | | 96 | 1 | 2 | | 97 | 1 | 3 | | 80 | 2 | 1 | | 92 | 2 | 2 | | 86 | 2 | 3 | | 91 | 3 | 1 | | 76 | 3 | 2 | | 77 | 3 | 3 | +-------+------------+-----------+
course 表:
select * from course; +----+------+ | id | name | +----+------+ | 1 | 语文 | | 2 | 数学 | | 3 | 英语 | +----+------+
现在我们要查询哪些同学的语文成绩比英语成绩低
首先自连接,将行转换成列:
select * from scoretable,scoretable; ERROR 1066 (42000): Not unique table/alias: 'scoretable'
自己跟自己连接名字不能重复
那表名不能重复,那还如何自连接呢?
答:可以起别名,起别名不光可以对列,还可以对表
select * from scoretable as s1,scoretable as s2;
自连接排列组合的时候会产生大量无效的数据,所有就需要指定连接条件
指定连接条件,将有效数据筛选出来:
select * from scoretable as s1,scoretable as s2 where s1.student_id = s2.student_id;
自连接的时候只有当 student_id 相等时才表示有效数据
添加条件,将左边表的语文成绩和右边表的英语成绩查询出来:
有效成绩查询出来后,就需要加上条件查询出左边的语文成绩和右边的英语成绩
select * from scoretable as s1,scoretable as s2 where s1.student_id = s2.student_id and s1.course_id = 1 and s2.course_id = 3; +-------+------------+-----------+-------+------------+-----------+ | score | student_id | course_id | score | student_id | course_id | +-------+------------+-----------+-------+------------+-----------+ | 70 | 1 | 1 | 97 | 1 | 3 | | 80 | 2 | 1 | 86 | 2 | 3 | | 91 | 3 | 1 | 77 | 3 | 3 | +-------+------------+-----------+-------+------------+-----------+
这样就将左侧的语文成绩查询出来了,右侧的英语成绩查询出来了
添加条件,将语文成绩比英语成绩低的同学查询出来:
接下来就要查询哪些同学的语文成绩比英语成绩低
select * from scoretable as s1,scoretable as s2 where s1.student_id = s2.student_id and s1.course_id = 1 and s2.course_id = 3 and s1.score < s2.score; +-------+------------+-----------+-------+------------+-----------+ | score | student_id | course_id | score | student_id | course_id | +-------+------------+-----------+-------+------------+-----------+ | 70 | 1 | 1 | 97 | 1 | 3 | | 80 | 2 | 1 | 86 | 2 | 3 | +-------+------------+-----------+-------+------------+-----------+ 2 rows in set (0.00 sec)
这样就把语文成绩比英语成绩低的学生信息查询出来了
子查询:把多个 SQL 组合成一个
在实际开发中,子查询得慎用。因为子查询可能会构造出非常复杂,非常不好理解的 SQL。
写代码一般要么追求可读性和可维护性,要么追求程序的运行速度
单行子查询:返回一行记录的子查询
student 表:
select * from student; +----+----------+------+ | id | class_id | name | +----+----------+------+ | 1 | 1 | 张三 | | 2 | 1 | 李四 | | 3 | 2 | 王五 | | 4 | 3 | 赵六 | | 5 | 2 | 王七 | +----+----------+------+
现在查询“张三”的同班同学,根据 class_id 进行查询
分开查询:
//查询出张三的class_id select class_id from student where name = '张三'; +----------+ | class_id | +----------+ | 1 | +----------+
//查询出来的张三的class_id为 1,再查询除了张三以外的class_id 为1的同学 select * from student where class_id = 1 and name != '张三'; +----+----------+------+ | id | class_id | name | +----+----------+------+ | 2 | 1 | 李四 | +----+----------+------+
单行子查询:
select * from student where class_id = ( select class_id from student where name = '张三') and name != '张三'; +----+----------+------+ | id | class_id | name | +----+----------+------+ | 2 | 1 | 李四 | +----+----------+------+
多行子查询:返回多行记录的子查询
scoretable 表:
select * from scoretable; +-------+------------+-----------+ | score | student_id | course_id | +-------+------------+-----------+ | 70 | 1 | 1 | | 96 | 1 | 2 | | 97 | 1 | 3 | | 80 | 2 | 1 | | 92 | 2 | 2 | | 86 | 2 | 3 | | 91 | 3 | 1 | | 76 | 3 | 2 | | 77 | 3 | 3 | +-------+------------+-----------+
course 表:
select * from course; +----+------+ | id | name | +----+------+ | 1 | 语文 | | 2 | 数学 | | 3 | 英语 | +----+------+
查询每位同学的“语文”“英语”课程的成绩信息
普通查询:
//首先查询出语文和英语成绩对应的id select id from course where name = '语文' or name = '英语'; +----+ | id | +----+ | 1 | | 3 | +----+
//再根据查询出来的语文英语对应的id,在 scoretable表中查询 select * from scoretable where course_id = 1 or course_id = 3; +-------+------------+-----------+ | score | student_id | course_id | +-------+------------+-----------+ | 70 | 1 | 1 | | 97 | 1 | 3 | | 80 | 2 | 1 | | 86 | 2 | 3 | | 91 | 3 | 1 | | 77 | 3 | 3 | +-------+------------+-----------+
多行子查询:
select * from scoretable where course_id in(select id from course where name = '语文' or name = '英语'); +-------+------------+-----------+ | score | student_id | course_id | +-------+------------+-----------+ | 70 | 1 | 1 | | 97 | 1 | 3 | | 80 | 2 | 1 | | 86 | 2 | 3 | | 91 | 3 | 1 | | 77 | 3 | 3 | +-------+------------+-----------+
合并查询:就是将两个查询结果集,合并成一个
在实际应用中,为了合并多个查询的执行结果,可以使用集合操作符 union,union all。使用UNION 和UNION ALL时,前后查询的结果集中,字段需要一致
union操作符
union操作符用于取得两个结果集的并集,当使用该操作符时,会自动去掉结果集中的重复行
course 表:
select * from course; +----+------+ | id | name | +----+------+ | 1 | 语文 | | 2 | 数学 | | 3 | 英语 | | 6 | 化学 | | 7 | 物理 | +----+------+
现在查询 id 小于等于 2 或者 name 为 "英文" 的课程信息
select * from course where id <= 2 union select * from course where name = '英语'; +----+------+ | id | name | +----+------+ | 1 | 语文 | | 2 | 数学 | | 3 | 英语 | +----+------+
看到这里大家可能有个疑问,明明可以用 or 也能实现,为什么还要用 union?
答:用 or 查询只能时来自于同一个表,如果用 union 查询可以时来自于不同的表,子要查询的结果列匹配即可,匹配就是列的类型一样、列的一样、列的名字一样
union all 操作符
union all 操作符用于取得两个结果集的并集,当使用该操作符时,不会去掉结果集中的重复行
select * from course where id < 3 union all select * from course where name = '数学'; +----+------+ | id | name | +----+------+ | 1 | 语文 | | 2 | 数学 | | 2 | 数学 | +----+------+