查询数据
完整的查询指令:
select select选项 字段列表 from 数据源 where 条件 group by 分组 having 条件 order by 排序 limit 限制
select选项
系统该如何对待查询得到的结果:
1、all 默认的,表示保存所有的记录;
2、distinct:去重,去除重复的记录,只保留一条(所有的字段都相同)
字段列表
有的时候需要从多张表获取数据,在获取数据的时候,可能存在不同表中有同名的字段,需要将同名的字段命名成不同名的; alias别名
基本语法: 字段名 [as] 别名;
from数据源
from是为前面的查询提供数据,数据源只要是一个符合二维表结构的数据即可。
单表数据
from 表名
多表数据
从多张表获取数据:
基本语法:from 表1,表2…;
结果:表的记录数相乘,字段数拼接
本质:从第一张表取出一条记录,去拼凑第二张表的所有记录,保留所有结果。得到的结果在数学上有一个专业的说法:笛卡尔积,这个结果除了给数据库造成压力,没有其他意义,应该尽量避免笛卡尔积。
动态数据
from后面跟的数据不是一个实体表,而是一个从表中查询出来得到的二维结果表。
基本语法:select from (select 字段列表 from 表) [as] 别名;
where子句
where子句用来从数据表获取数据的时候,然后进行条件筛选。
数据获取原理:针对表去对应的磁盘除获取所有的记录(一条条),where的作用就是在拿到一条结果就开始进行判断,判断是否符合条件;如果符合就保存下来,如果不符合直接舍弃(不放到内存中)
where是通过运算符进行结果比较来判断数据
group by子句
group by 表示分组的含义:根据指定的字段,将数据进行分组:分组的目标是为了统计。
分组统计
基本语法:group by 字段名;
错误:提示1055错误。only_full_group_by问题
先查看,然后修改。(暂时修改)
执行:
select version(), @@sql_mode;
再执行:
SET sql_mode=(SELECT REPLACE(@@sql_mode,'ONLY_FULL_GROUP_BY',''));
group by是为了分组进行数据统计的,如果只是想看数据显示,那么group by没什么意义:group by将数据按照指定的字段分组之后,只会保留每组的第一条记录。
利用一些统计函数(聚合函数):
count():统计每组中的数量,如果统计的目标是字段,那么不统计空NULL字段,如果为*代表统计记录。
avg():求平均值
sum():求和
max():求最大值
min():求在最小值
group_concat():为了将分组中指定的字段进行合并(字符串拼接)
多分组
将数据按照某个字段进行分组之后,对已经分组的数据进行再次分组
基本语法:group by 字段1,字段2;//先按照字段1进行排序,之后将结果再按照字段2进行排序,以此类推
分组排序
Mysql中,分组默认有排序的功能:按照分组字段进行排序,默认是升序
基本语法:group by 字段 [asc|desc],字段[asc|desc];//默认是asc升序 desc降序
回溯统计
当分组进行多分组之后,往上统计的过程中,需要进行层层上报,将这种层层上报统计的过程称之为回溯统计,每一次分组向上统计的过程都会产生一次新的统计数据,而且当前数据对应的分组字段为NULL
基本语法:group by 字段 [asc|desc] with rollup;
有多少层就会回溯多少个。
having子句
having本质和where一样,是用来进行数据条件筛选
having是在group by子句之后,可以针对分组数据进行筛选,但是where不行
where不能使用聚合函数:聚合函数是在用在group by分组的时候,where这个时候已经运行完毕。
having在group by分组之后,可以使用聚合函数或者字段别名(where是从表中取出数据,数据在表中只有字段名没有别名这一概念,别名是在数据进入到内存之后才有的)
强调:having是在group by 之后,groupby 是在where之后;where的 时候表示将数据从磁盘拿到内存,where之后的所有操作都是内存操作。
order by 子句
order by排序,根据校对规则对数据进行排序
基本语法:order by 字段[asc|desc];// asc 升序 默认 desc降序
order by和group by一样,也可以进行多字段排序:先按照第一个字段进行排序,再按照第二个字段进行排序,以此类推。
基本语法:order by 字段1 规则,字段2 规则…;//规则即 desc 和asc ,asc可以不写
limit子句
limit限制子句,主要是用来限制记录数来获取。
记录数限制
纯粹的限制获取的数量:从第一条到指定的数量。
基本语法:limit 数量;
limit通常在查询的时候如果限定为一条记录的时候,使用的比较多,有时候获取多条记录并不能解决业务问题,但是会增加服务器压力
分页
利用limit来限制获取指定区间的数据。
基本语法: limit offset ,length;//offset P偏移量,从哪开始,length 就是具体获取多少条记录
Mysql中记录的数量从0开始。
limit 0,2; //获取前两条记录
注意:limit后面的length表示最多获取对应数量,但是如果数量不够,系统不会强求