---数据分析师---
四、序列挖掘

序列挖掘产生的背景
奶瓶 -> 婴儿车 -> 书包 买房 -> 装修 -> 家具
序列概述
- 目的:从所收集到的众多序列中,找到事务发展的前后关联性,进而推断其后续的发生可能
- 研究对象:事务序列,简称序列
| 会员卡号 | 时间1 | 时间2 | 时间3 | 时间4 |
| 1 | 香肠,花生米 | 饮料 | 啤酒 | - |
| 2 | 饮料 | 啤酒 | 香肠 | - |
| 3 | 面包 | 饮料 | 香肠,啤酒 | - |
| 4 | 花生米 | 饮料 | 啤酒 | 香肠 |
| 5 | 啤酒 | 香肠,花生米 | 面包 | - |
| 6 | 花生米 | 面包 | - | - |
< center>序列的时间点上不一定连续,允许间隔< /center>
序列规则的支持度和置信度
- 支持度:
- C(香肠,花生米)> C(饮料)⇒ C (啤酒)的支持度 1/6 = 0.17
- C(饮料)⇒ C (啤酒)的支持度4/6 = 0.67
- 置信度:
- C(香肠)⇒ C (饮料)的置信度1/5 = 0.2
- C(饮料)⇒ C (香肠)的置信度3/4 = 0.75
| 会员卡号 | 时间1 | 时间2 | 时间3 | 时间4 |
| 1 | 香肠,花生米 | 饮料 | 啤酒 | - |
| 2 | 饮料 | 啤酒 | 香肠 | - |
| 3 | 面包 | 饮料 | 香肠,啤酒 | - |
| 4 | 花生米 | 饮料 | 啤酒 | 香肠 |
| 5 | 啤酒 | 香肠,花生米 | 面包 | - |
| 6 | 花生米 | 面包 | - | - |
--END--