目录
- 前言
- 一、set类型
- 二、set 类型数据的基本操作
- 三、set 类型数据的扩展操作
-
- 业务场景一
- 业务场景二
- 业务场景三
- 业务场景四
- 业务场景五
- 四、set 类型数据操作的注意事项
前言
一、set类型
- 新的存储需求:存储大量的数据,在查询方面提供更高的效率(list类型有顺序有索引存储大量数据但链表结构查询效率低)
- 需要的存储结构:能够保存大量的数据,高效的内部存储机制,便于查询
- 系统分析出各个分类的最新或最热点信息条目并组织成set集合
- 随机挑选其中部分信息
- 配合用户关注信息分类中的热点信息组织成展示的全信息集合
- 随机获取集合中指定数量的数据[原集合不变]
- 推荐过了可能还会推
- 随机获取集合中的某个数据并将该数据移出集合[原集合发生改变]
- 推荐过了不会再推,分配过了不会再分[比如给每个人分配不同任务]
- 求两个集合的交、并、差集并存储到指定集合中
- 依赖set集合数据不重复的特征[将一个人对应的所有操作放到一个set集合中],依赖set集合hash存储结构特征完成数据过滤与快速查询
- 根据用户id获取用户所有角色
- 根据用户所有角色获取用户所有操作权限放入set集合
- Redis 应用于同类型数据的快速去重
- 基于经营战略设定问题用户发现、鉴别规则——被列入黑名单
- 周期性更新满足规则的用户黑名单,加入set集合
- 用户行为信息达到后与黑名单进行比对,确认行为去向
- 黑名单过滤IP地址:应用于开放游客访问权限的信息源
- 黑名单过滤设备信息:应用于限定访问设备的信息源[识别设备]本人手机在宿舍一连校园 路由器就会 红(T=T)
- 黑名单过滤用户:应用于基于访问权限的信息源
- Redis 应用于基于黑名单与白名单设定的服务控制
三、set 类型数据的扩展操作
业务场景一
每位用户首次注册使用今日头条时会设置3项爱好的内容,但是后期为了增加用户的活跃度、兴趣点,必须让用户对其他信息类别逐渐产生兴趣,增加客户留存度(用户粘性),如何实现/p>
业务分析
解决方案
解决方案
Tips :
业务场景五
**黑名单:**开放性但会过滤
资讯类信息类 站追求高访问量,但是由于其信息的价值,往往容易被不法分子利用,通过爬虫技术,快速获取信息,个别特种行业 站信息通过爬虫获取分析后,可以转换成商业机密进行出售。例如第三方火车票、机票、酒店刷票代购软件,电商刷评论、刷好评。
同时爬虫带来的伪流量也会给经营者带来错觉,产生错误的决策,有效避免 站被爬虫反复爬取成为每个 站都要考虑的基本问题。在基于技术层面区分出爬虫用户后,需要将此类用户进行有效的屏蔽,这就是黑名单的典型应用。
ps:不是说爬虫一定做摧毁性的工作,有些小型 站需要爬虫为其带来一些流量。
白名单:限定性
对于安全性更高的应用访问,仅仅靠黑名单是不能解决安全问题的,此时需要设定可访问的用户群体,依赖白名单做更为苛刻的访问验证。
解决方案
具体操作的原理与业务场景四一样
Tips:
四、set 类型数据操作的注意事项
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!