---数据分析师---
六、异常点分析

异常点分析原理
- 异常点:与数据的其他部分不同的数据对象
- 一个人的噪音是另一个人的信号
- 电信欺诈分析、信用卡欺诈探测、收入极高或极低的客户分区、医疗分析
- 异常点分析内容
- 在给定的数据集合中定义什么样的数据为不一致的
- 找到一个有效的方法来挖掘异常点
- 统计学方法
- 基于距离的方法
异常点的检测
- 异常点分析的三个阶段:
- 第一,聚类,即根据“亲疏程度”将样本点聚成若干类
- 第二,计算,即在第一个阶段聚类的基础上,依据距离,计算所有样本点的异常性测度指标
- 第三,诊断,即在第二个阶段异常性测度指标的基础上,确定最终的异常点,并分析导致样本异常的原因,即分析异常点在那个变量方向上呈现异常