【第三章 小功能大用处】3.1、慢查询分析

in with 0 comment

Redis提供的5中数据结构已经足够强大,但除此之外,Redis还提供了诸如慢查询分 析、功能强大的Redis Shell、Pipeline、事物与Lua脚本、Bitmaps、 HyperLogLog、发布订阅、GEO等附加功能。

慢查询分析

许多存储系统提供慢查询日志帮助开发和运维人员定位系统存在的慢操作。所谓慢查 询日志就是系统在命令执行前后计算每条命令的执行时间,当超过预设阀值,就将这 条命令的相关信息(例如:发生时间,耗时,命令的详细信息)记录下来,Redis也 提供了类似的功能。

如下图所示,Redis客户端执行一条命令如下4个部分:

1)发送命令

2)命令排队

3)命令执行

4)返回结果

需要注意,慢查询只统计步骤3)的时间,所以没有慢查询并不代表客户端没有超时 问题。

  1. 慢查询的两个配置参数

    对于慢查询功能,需要明确两件事:

    • 预设阀值怎么设置?

    • 慢查询记录存放在哪?

    Redis提供了slowlog-log-slower-than和slowlog-max-len配置来解决这两 个问题。从字面意思就可看出,slowlog-log-slower-than就是那个预设阀 值,它的单位是微妙(1秒=1000毫秒=1000000微秒),默认值是10000,假如 执行了一条“很慢”的命令(例如keys *),如果他的执行时间超过了10000微 秒,那么他将被记录在慢查询日志中。

    运维提示:如果slowlog-log-slower-than=0会记录所有的命令, slowlog-log-slower-than<0对于任何名都不会进行记录。

    从字面意思看,slowlog-max-len只是说明了慢查询日志最多存储多少条,并 没有说明放在哪里?实际上Redis使用了一个列表来存储慢查询日志, slowlog-max-len就是列表的最大长度。一个新的命令满足慢查询条件时被插 入到这个列表中,当慢查询日志列表已处于其最大长度时,最早插入的一个命令 将从列表中移出,例如slowlog-max-len设置为5,当有第6条慢查询插入时, 那么队头的第一条数据就出列,第6条慢查询就会入列。

    在Redis中有两种修改配置的方法,一种是修改配置文件,另一种是是使用 config set命令动态修改。例如下面使用config set命令将 slowlog-log-slower-than设置为20000毫秒,slowlog-max-len设置为 1000:

    config set slowlog-log-slower-than 20000
    config set slowlog-max-len 1000
    config rewrite
    

    如果要Redis将配置持久化到本地配置文件,需要执行config rewrite命令, 如下图:

    虽然慢查询日志是存放在Redis内存列表中的,但是Redis并没有暴露这个列表 的键,而是通过一组命令来实现对慢查询日志的访问和管理。下面介绍这几个命 令:

    (1)获取慢查询日志

    slowlog get [n]

    下面操作返回当前Redis的慢查询,参数n可以指定条数:

    127.0.0.1:6379> slowlog get
    1) 1) (integer) 666
       2) (integer) 1456786500
       3) (integer) 11615
       4) 1) "BGREWRITEAOF"
    2) 1) (integer) 665
       2) (integer) 1456718400
       3) (integer) 12006
       4) 1) "SETEX"
          2) "video_info_200"
          3) "300"
          4) "2"
    ...
    

    可以看到每个慢查询日志有4个属性组成,分别是慢查询日志的标识id、发生时 间戳、命令耗时、执行时间和参数,慢查询列表如下图:

    (2)获取慢查询日志列表当前的长度

    slowlog len

    例如,当前Redis中有45条慢查询:

    127.0.0.1:6379> slowlog len 
    (integer) 45
    

    (3)慢查询日志重置

    slowlog reset

    实际是对列表做清理操作,例如:

    127.0.0.1:6379> slowlog len
    (integer) 45
    127.0.0.1:6379> slowlog reset
    OK
    127.0.0.1:6379> slowlog len
    (integer) 0
    
  2. 最佳实践

    慢查询功能可以有效地帮助我们找到Redis可能存在的瓶颈,但是在实际使用过 程中要注意以下几点:

    • slowlog-max-len配置建议:线上建议调大慢查询列表,记录慢查询是Redis 会对长命令做截断操作,并不会占用大量内存。增大慢查询列表可以减缓慢查询 被剔除的可能,例如线上可设置为1000以上。

    • slowlog-log-slower-than配置建议:默认超过10毫秒判定为慢查询,需要 根据Redis并发量调整该值。由于Redis采用单线程响应命令,对于高流量的场 景,如果命令执行时间在1毫秒以上,那么Redis最多可支撑OPS不到1000.因此 对于高OPS场景的Redis建议设置为1毫秒。

    • 慢查询只记录命令执行时间,并不包括命令排队和网络传输时间。因此客户端 执行命令的时间会大于名实际操作时间。因为命令执行排队机制,慢查询虎导致 其他命令级联阻塞,因此客户端出现请求超时,需要检查该时间点是否有对应的 慢查询,从而分析出是否为慢查询导致的命令级联阻塞。

    • 由于慢查询日志是一个先进先出的队列,也就是说如果慢查询比较多的情况 下,可能会丢失部分慢查询命令,为了防止这种情况发生,可以定期执行slow get命令将慢查询日志持久化到其他存储中(例如MySQL),然后可以制作可视 化界面进行查询,Redis私有云CacheCloud提供了这样的可能,好的工具可以 让问题排查事半功倍。