黄埔班第31节:分布式缓存Redis应用实战-1

2020/02/05

1、分布式架构的分析

优点与缺点

分而治之,比一个节点要无论是计算能力还是存储能力,都要提升很多

优点

  • 业务解偶
  • 系统模块化,可重用化高
  • 提升系统的并发量
  • 优化了运维部署的效率(Pre,dubbo:Mock)

缺点

  • 架构复杂(人员学习成本高)
  • 多个子系统部署复杂
  • 系统之间通信耗时
  • 调试排错复杂

设计原则

  • 异步解偶
  • 幂等要一致 N*1(定时任务,8点去数据库把A+1):分布式锁来解决
  • 拆分原则
  • 融合分布式的中间件:Redis、ES、MQ
  • 容错高可用

2、分布式缓存分析

什么是NoSQL

  • Not Only SQL
  • 横向扩展更加方便
  • HA(集群)
  • 持久化
  • NoSQL常见的分类
    • key-value:Redis、Memcache
    • 列存储:Hbase
    • 文档型:MongoDB
    • 图形:Neo4J、FlockDB

什么是Redis

  • NoSQL
  • 分布式缓存中间件
  • key-value存储
  • 海量数据访问
  • 数据是存在内存里的,读取更块
  • 支持水平扩展

Ehcache

  • 优点
    • Java开发的
    • 基于JVM缓存
    • 简单、方便:hibernate和Mybatis都有集成
  • 缺点
    • 不支持集群(更适合单机应用)
    • 不支持分布式

Memcache

  • 优点
    • 简单的key-value存储
    • 内存使用率高
    • 多核,多线程
  • 缺点
    • 无法容灾
    • 无法持久化

Redis

  • 优点
    • 丰富的数据结构
    • 持久化
    • 主从同步,故障转移(一台机挂了,访问可以跳到另一台机)
    • 支持集群3.x以后
  • 缺点
    • 单线程(大量数据存储的时候性能会降低)
    • 单核(无法充分利用CPU的多核性能,建议使用多实例)

3、Redis单机安装

#下载redis 上传到服务器,解压
tar -zxvf redis-5.0.7.tar.gz
yum -y install gcc-c++
#解压后的根目录
cd redis-5.0.7
make && make install
#/usr/local/bin redis-server /usr/local/redis/redis.conf
# 配置以服务的方式启动redis

#1.在/usr/local下创建redis目录
mkdir /usr/local/redis

#2.复制redis.conf文件,以redis的端口号命名
cd redis-5.0.7
cp redis.conf /usr/local/redis/6379.conf

#3.修改
vi redis.conf
daemonize yes #后台运行
bind 0.0.0.0 #不限制ip访问
requirepass icoding #密码
dir /usr/local/redis/working #工作目录,rdb备份的数据保存目录

#4.将redis安装包util下的redis_init_script
cp redis_init_script /etc/init.d/redisd
vi redisd
CONF="/usr/local/redis/${REDISPORT}.conf" #配置文件的路径
PASSWORD=icoding
$CLIEXEC -p $REDISPORT -a $PASSWORD shutdown
#给redisd授权
chmod 777 redisd
#启动
service redisd start
#关闭
service redisd stop

4、Redis的数据类型命令

String

# 一定不能线上执行,否则key太多占用服务器资源
keys *
keys abc*
#管道命令不在redis-cli客户端下执行,在linux下执行模糊删除
#redis-cli -a icoding keys "a*" | xargs redis-cli -a icoding del
set age 18 #没有则创建,有则覆盖
setnx age 18 #没有则创建,有什么都不做
type age #获取类型
get/del key #获取删除数据
set key value ex time #设置值的时候同时设置过期时间(秒)
ttl key #还剩多久,-1永不过时,-2过去,正数就是还剩多少秒
append age gavin #追加字符串
strlen key #获取字符串长度

incr/decr key #给value+1/-1,如果key不存在则创建并将值设置为1
incrby/decrby key step #不存则创建一个-step/+step

getrange key start end # end=-1 表示到最后
setrange key start newdata # 替换

mset key1 value1 key2 value2 # 不支持过期时间同时设置,批量设置值
mget key1 key2 # 连续取值
msetnx key1 value1 key2 value2 #没有则创建,有什么都不做

#我们的Redis可以当成一个数据库,甲方1,甲方2,甲方3,就可以使用redis的库的概念
#databases 16 #默认从0到15共16个库,配置文件可以配置库的个数
#select 1  选择的2个库
set icoding 7 

# 危险命令
keys 
flushdb #他是原子性的,一旦执行就无法回头,删除当前db下所有数据
flushall #删除所有数据库的数据
config get port#获取配置的端口信息
config get * #获取所有的配置信息
# 给命令重命名
rename-command CONFIG "icodingconfig"
rename-command KEYS "icodingkeys"
rename-command FLUSHDB "icodingflushdb"
rename-command FLUSHDB ""		# 禁用FLUSHDB命令
rename-command FLUSHALL "icodingflushall" 

哈希Hash

# 比如对象
user {
	name : icoding
	age : 18
	sex : male
}
# 设置对象
hset/hsetnx user name icoding age 18 sex male
hget user name
hmset user name icoding age 18
hmget user name age sex
# 获取对象所有属性
hgetall user
# 按
hincrby user age 2
hincrbyfloat user age 2.2
hlen user #获取有多少个属性
hexists user age # 判断属性是否存在
hkeys user #获取所有属性
hvals user #获取所有value
hdel user name #删除属性
del user #删除key

列表List

#list对象[]
lpush userList v1 v2 v3 v4 v5 #从左边开始压栈
rpush userList v1 v2 v3 v4 v5 #从右边开始压栈
lpop userlist #从左边出栈
rpop userlist #从右边出栈
llen userList #元素个数
lindex userList index #直接获取下标对应的值
lset userList index value #直接设置下标的值
linsert userList before/after pivot(栈内的具体值) value
lrem userList num value #删除几个相同数据的value
ltrim userList start end #截取

集合Set

sadd userSet v1 v2 v3 v4 val5 val5 #保存集合并去重
smembers userSet #获取值,但顺序和写入不一定相同
scard userSet #获取集合数量
sismember userSet value #看value是否存在于集合中
srem userSet val1 val2 #删除集合值
spop userSet 2 #随机出栈2个,场景:随机抽奖
srandmember userSet 2 #随机展示两个,场景:随机抽奖
smove k1 k2 v2 #将集合k1中的v2移动到k2中
sinter k1 k2 #交集,交叉的值
sunion k1 k2 #并集并去重

有序集合ZSet

场景:排序、评估

zadd zk1 10 apple 20 peach 30 banana 40 pear 50 cherry #设置有分数的集合
zadd zk1 10.8 apple 20.9 peach 30.1 banana 40 pear 50 cherry
zrange zk1 0 -1 withscores #根据位置获取数据并显示分数,-1全部
zcard zk1 #获得集合数量
zrank zk1 banana #获取值的下标
zscore zk1 apple #获取值的分数
zcount zk1 10 30 #统计分数区间有的数据个数
zrangebyscore zk1 10 40 #获取分数内的值
zrangebyscore zk1 10 40 limit 13  #在分数的基础上再进行下标的区间的过滤
zrangebyscore zk1 (10 (40 #获取分数内的值不包含边界
zrem zk1 apple #删除集合中的值

地理位置Geo

它是zset扩展类型,在Redis 3.2版本后提供的,支持存储地理坐标的一个数据结构,可以用来做类似摇一摇,附近的人,周边搜索的功能

# 语法类型
geoadd key 经度 纬度 成员 [经度 纬度 成员...]
# geoadd命令必须以标准的x y member结构来接受参数,必须先输入经度后输入纬度

geoadd能够记录的坐标是有限:

  • 非常接近两级的区域无法索引(南北极)
  • 精确的坐标限制是由 EPSG:900913等坐标系统定义
  • 经度:-180到180度之间
  • 纬度:-85.05117878到85.05117878度之间
  • 如果超出这个范围则会报错

新增和查询

# 添加一批城市
geoadd china:city 116.408 39.904 beijing 121.445 31.213 shanghai 113.265 23.108 guangzhou 114.109 22.544 shenzhen 108.969 34.285 xian 108.55 34.09 changan 
# 查询
geopos china:city beijing shanghai

中国城市经纬度 http://www.hao828.com/chaxun/zhongguochengshijingweidu

获得节点间距离

geodist china:city shanghai beijing km

单位:

  • m : 米
  • km :千米
  • mi :英里
  • ft : 英尺
  • 默认是m
  • 会有0.5%的误差(因为地球是椭球体,不是完全的球体)

周边搜索

# 方圆多少公里内有哪些节点
georadius china:city 121.445 31.213 1300 km withdist withcoord
georadius china:city 121.445 31.213 1300 km withdist withcoord asc count 3
georadiusbymember china:city beijing 1300 km withdist withcoord asc count 3

# 节点hash
geohash china:city xian changan
1) "wqj7p9ku9e0"
2) "wqj1yjgswk0"
  • withdist : 返回节点距离
  • withcoord : 带上坐标
  • asc/desc: 升序/降序

删除节点

zrem china:city changan # zset的删除命令
type china:city # 返回zset类型

业务场景

搜索附近的人,餐饮

x y name1 x y name2

x y canyin:123 x y canyin:456

Hyperloglog

这个数据类型其实就做了一件事,统计不重复的数据量

比如要记录我们网站的UV(user view)量

sadd 20200208 1 2 3 4 5 6 5 4 3 2 1
scard 20200208

它只存放基数,不存放数据

pfadd 20200207 1 2 3 4 5 6 5 4 3 2 1 # 添加记录基数
pfadd 20200206 1 2 3 4 5 6 7 8 9 10
pfcount 20200206 # 返回基数
pfmerge 202002 20200206 20200207 #pfmerge newkey sourcekey1 sourcekey2 合并生成了一个新key,原来的key不会消失
  • hyperloglog是一个基数估算算法,有一定误差的
  • 误差值在0.81%
  • hyperloglog的key占用空间很小只有12K,而你用set就需要把这些value都要保存,set存一年数据有多大

5、Redis的线程模型

Redis是一个单线程应用

每一条到达服务端的命令都不会立即执行,所有命令都会进入一个队列中,所以Redis不会产生并发问题

为什么Redis是单线程模型效率还这么高

1、纯内存访问:数据放在内存中,内存的响应时间100纳秒

2、非阻塞I/O:Redis采用epoll作为I/O多路复用技术的实现,再加上Redis自身的事件处理模型将epoll中的连接、读写、关闭都转换为事件,不在I/O上浪费过多时间

3、采用单线程,避免了不必要的上下文切换和竞争条件

由于模型的本身机制,因此尽量不要和redis交互大数据量的内容

什么是多路复用

假如你是一个老师,让30个学生回答问题,如何在学生做完后检查是否正确?

1、第一种:A,B,C,D按顺序轮询

2、第二种:老师身上有查克拉会分身,分了30分身去处理(相当于30个进程处理)

3、第三种:你在讲台上问谁回答完毕谁举手,你去回答谁,这就是I/O复用模型了

Post Directory