• 售前

  • 售后

热门帖子
入门百科

MySQL中聚合函数count的使用和性能优化本领

[复制链接]
戏做顿 显示全部楼层 发表于 2021-10-26 12:54:00 |阅读模式 打印 上一主题 下一主题
本文的情况是Windows 10,MySQL版本是5.7.12-log
一、 根本利用
count的根本作用是有两个:
      
  • 统计某个列的数据的数目;  
  • 统计效果集的行数;
用来获取满意条件的数据的数目。但是此中有一些与利用中印象差异的情况,好比当count作用一列、多列、以及利用*来表达整行产生的效果是差异的。
示例表如下:
  1. CREATE TABLE `NewTable` (
  2. `id` int(11) NULL DEFAULT NULL ,
  3. `name` varchar(30) NULL DEFAULT NULL ,
  4. `country` varchar(50) NULL DEFAULT NULL ,
  5. `province` varchar(30) NULL DEFAULT NULL ,
  6. `city` varchar(30) NULL DEFAULT NULL
  7. )ENGINE=InnoDB
复制代码
1.1 不计算NULL的值
如果有NULL值,在返回的效果中会被过滤掉
  1. select count(country) from person;
复制代码
返回效果如下:

如果满意条件的数据项不存在,则结构返回0,经常通过这种方式判断是否有满意条件的数据存在;返回的数据范例是bigint。
1.2 对count(*)的处理
count(*)的处理是有点差异的,它会返回全部数据的数目,但是不会过滤此中的NULL值,它也并不是相称于睁开玉成部的列,而是直接会忽略全部的列而直接统计全部的行数。语句如下:
  1. select count(*) from person;
复制代码
返回效果如下:

当想要返回全部的数据的数目的时间,但是又不想包罗全部是NULL的列,利用count(*)是不大概做到的,但是在1.1中说到count作用于列的时间会过滤NULL,那么直接这么写是不是对?
  1. select count(id, `name`, country, province, city) from person;
复制代码
那就错了,count只能作用于单列,不能作用于多列 ,以是上面的写法是错误的。
另外针对count(*)语句,在MyISAM存储引擎中做了优化,每个表的数据行数都会存储在存储引擎中,可以很快拿到;但是在事务性的存储引擎中,好比InnoDB中,由于会涉及到多个事务;
1.3 对count(distinct …)的处理
count(distinct …)会返回彼此差异但优劣NULL的数据的行数。这一点和只利用distinct是有区别的,由于distinct是不过滤NULL值的,详见MySQL中distinct的利用方法 。
- 如果没有符合条件的数据则返回0;
- 该语句可以作用于多列,是当各个列之间有一个差异,就以为整行数据差异,与distinct作用于多列时效果雷同;
  1. select count(DISTINCT country) from person;
复制代码
返回效果如下:

但是对于count(*)和count(distinct )两者的联合,如下:
  1. select count(DISTINCT *) from person;
复制代码
该语句是错误的,无法执行,因此与select count(DISTINCT *) from person 还是有区别的。
二、 性能优化
通常情况下,count(*)操纵必要大量扫描数据表中的行,如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度思量。
2.1 在数据库的层次上优化
2.1.1 针对count(*)
在MySQL内部已经针对count(*)举行了优化,利用explain查询如下:
  1. EXPLAIN select count(*) from person;
复制代码
从中可以看出该查询没有利用全表扫描也没有利用索引,甚至不必要查询数据表,在上面的示例数据库中得知,该库的存储引擎是InnoDB ,而且此中既没有主键也没有索引。
2.2 针对单个列举行count
查询如下:
  1. EXPLAIN select count(country) from person where id > 2;
复制代码
发如今没有主键和索引的情况下,对全表举行了扫描。在数据中避免大量扫描数据行,一个最直接的方法利用索引:
当对id设置为一般索引 :INDEX abc (id) USING BTREE 。
执行查询如下:
  1. EXPLAIN select count(country) from person where id > 2;
复制代码
效果如下:

此时发现并没有利用索引,仍然举行的是全表扫描,当执行如下时:
  1. EXPLAIN select count(country) from person where id > 4;
复制代码
效果如下:

这是利用了索引举行了范围查询,显然比上面的要好。
但是问题来了,为什么偶尔候利用索引,偶尔候不用索引?在上面的第一次查询中已经可以或许检测出大概的key但是并没有利用?如果有知道的大神给解读一下!
对id设置为主键,执行查询如下:
  1. EXPLAIN select count(country) from person where id > 2;
复制代码
效果如下:

2.2 在应用的层次上优化
在应用的层次上优化,可以思量在体系架构中引入缓存子体系,好比在已往中常用的Memcached,大概如今非常流行的Redis, 但是如许会增长体系的复杂性。
mysql group by与聚合函数(sum,count等)实例
起首我们先来相识一下mysql聚合函数
mysql中一种特殊的函数:聚合函数,SUM, COUNT, MAX, MIN, AVG等。这些函数和别的函数的根本区别就是它们一般作用在多条记录上。例如:
  1. SELECT SUM(score) FROM table
复制代码
这个sql的意思是查询表table内里全部score列的总和。
接着我们通过一个实例来讲授group by语句中如何利用聚合函数。
book表如下:
idfirst_namelast_namecity
1JasonMartinToronto
2AlisonMathewsVancouver
3JamesMathewsVancouver
4CeliaRiceVancouver
5DavidLarryNew York

如今我们要对city举行分组查询,并获取每个分组有多少条数据,我们必要count聚合函数。
  1. SELECT *,count(*) FROM book GROUP BY city
复制代码
效果为:
idfirst_namelast_namecitycount(*)
1JasonMartinToronto1
2AlisonMathewsVancouver3
5DavidLarryNew York1

先以city把返回记录分成多个组,这就是GROUP BY的字面寄义。分完组后,然后用聚合函数对每组中的差异字段(一或多条记录)作运算。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作