数据挖掘贝叶斯分类

贝叶斯分类是根据 贝叶斯定理。贝叶斯分类器的统计分类。贝叶斯分类器是能够预测类别成员概率,例如一个给定的元组属于一个特定类的概率。

贝叶斯定理

托马斯·贝叶斯后贝叶斯定理命名。有两种类型的概率,如下所示:

  • 后验概率 [P(H/X)]

  • 先验概率 [P(H)]

其中,X是数据元组和H是一些假设。

根据贝叶斯定理

 

P(H/X)= P(X/H)P(H) / P(X)

 

贝叶斯信仰网络

  • 贝叶斯信念网络指定联合条件概率分布

  • 贝叶斯网络和概率网络被称为信念网络。

  • 贝叶斯信念网络允许类条件独立的变量子集之间进行定义。

  • 贝叶斯信念网络提供上学习可以进行因果关系的图形模型。

我们可以利用受过训练的贝叶斯网络进行分类。以下是与该贝叶斯信仰也是已知的名称:

  • 信念网络

  • 贝叶斯网络

  • 概率网络

有两个组成部分来定义贝叶斯信仰网络:

  • 向无环图

  • 一组条件概率表

向无环图

  • 在有向无环图中的每个节点代表一个随机变量。

  • 这些变量可以是离散的或连续的重视。

  • 这些变量可以对应于数据给出实际的属性。

向无环图表示

下图显示了一个有向无环图六布尔变量。

Acyclic Graph

图中的电弧使因果知识的表示。例如肺癌是肺癌的一个人的家族病史,以及影响的人是否是吸烟者。值得注意的是,该可变正X光不依赖于患者是否患有肺癌的家族史或者是吸烟者,因为我们知道患者有肺癌。

设置条件概率表表示:

条件概率表变量LungCancer(LC),显示它的父节点,家族史(FH)和吸烟者(S)的值的每一种可能的组合的值。

Probability Table
 

上一篇: 数据挖掘的决策树 下一篇: 基于数据挖掘的分类规则