数据挖掘 - 应用与趋势

数据挖掘技术被广泛应用于不同的领域。有今天的商业数据挖掘系统提供的数竟然有在这一领域的许多挑战。在本教程中,我们将应用程序和数据挖掘的发展趋势。

数据挖掘中的应用

下面是在数据挖掘,广泛应用于区域列表:

  • 财务数据分析

  • 零售业

  • 电信业

  • 生物数据分析

  • 其他科学应用

  • 入侵检测

财务数据分析

在银行和金融业的财务数据一般是可靠的高品质极大方便了系统的数据分析和数据挖掘和。下面是几个典型的案例:

  • 设计和建造数据仓库的多维数据分析和数据挖掘。

  • 贷款偿还预测和客户信用政策分析。

  • 分类和客户进行有针对性的营销聚类。

  • 检测洗钱和其他金融犯罪的。

零售业

数据挖掘在零售行业的巨大应用,因为它来自于销售,客户购买历史,货物运输,消费和服务收集大量的数据。这是很自然的收集数据的数量将继续增加,因为易用性,可用性和网络的普及迅速扩大。

数据挖掘在零售业有助于识别客户的购买模式和趋势。这导致客户服务和良好的客户保留和满意质量的提高。下面是在零售行业的数据挖掘的例子列表:

  • 基于数据挖掘的优势数据仓库的设计与施工。

  • 销售,客户,产品,时间和地区的多维分析。

  • 分析销售活动成效。

  • 客户忠诚度。

  • 产品推荐和交叉引用的项目。

电信行业

今天,电信行业是最新兴产业提供各种服务,如传真,寻呼机,移动电话,互联网的使者,图像,电子邮件,网络数据传输等之一,由于新的计算机和通信技术的发展,电信工业正在迅速扩大。这就是为什么数据挖掘变得非常重要,帮助和了解企业的原因。

在电信行业数据挖掘有助于确定电信模式,赶上欺诈行为,更好地利用资源,提高服务质量。这里是清单例子,其中数据挖掘提升电信服务:

  • 电信数据的多维分析。

  • 欺诈模式分析。

  • 识别异常模式。

  • 多维关联和序列模式分析。

  • 移动通信服务。

  • 在电信数据分析中使用的可视化工具。

生物数据分析

现在天我们看到,有广阔的增长,生物,如基因组学,蛋白组学,功能基因组学和生物医学研究的领域。生物数据挖掘是生物信息学中非常重要的一部分。以下是在哪些方面进行生物数据分析数据挖掘有助于:

  • 语义集成异构的,分布式的基因组和蛋白质组数据库。

  • 对齐,索引,相似性搜索和比较分析多个核苷酸序列。

  • 发现的结构模式和遗传网络和蛋白途径的分析。

  • 关联和路径分析。

  • 可视化工具在基因数据分析。

其他科学领域

上面讨论的应用程序往往处理相对较小而均匀数据集的统计技术是适当的。巨大的数据量已收集到的科学领域,如地球科学,天文学等有大量的被产生,因为在各个领域,如气候和生态系统模拟,化学工程,流体力学等的快速数值模拟的数据集以下是数据挖掘在科学应用领域的应用:

  • 数据仓库和数据预处理。

  • 基于图的挖掘。

  • 可视化和特定领域的知识。

入侵检测

入侵是指任何类型的行动,威胁网络资源的完整性,机密性或可用性。在这个世界连接的安全性已成为主要问题。随着工具和技巧互联网和可用性的提高使用率入侵和攻击网络提示入侵检测成为网络管理的重要组成部分。下面是其中的数据挖掘技术可以应用于入侵检测领域的列表:

  • 开发数据挖掘算法的入侵检测。

  • 协会和相关分析,汇总,以帮助选择和建立判别属性。

  • 分析流数据。

  • 分布式数据挖掘。

  • 可视化和查询工具。

数据挖掘系统产品

有很多数据挖掘系统产品和特定领域的数据挖掘应用程序可用。新的数据挖掘系统和应用程序被添加到以前的系统。也正在作出对数据挖掘语言的标准化的努力。

选择数据挖掘系统

其中数据挖掘系统的选择将取决于以下数据挖掘系统的特点:

  • 数据类型 - 数据挖掘系统可以处理格式化的文本,基于记录的数据和关系数据。该数据也可能是ASCII文本,关系数据库的数据或数据仓库中的数据。因此,我们应该检查什么确切的格式,数据挖掘系统可以处理。

  • 系统问题 - 我们必须考虑数据挖掘系统使用不同操作系统的兼容性。一个数据挖掘系统可能只在一个操作系统或几个运行。还有,提供基于web的用户界面,并允许使用XML数据作为输入的数据挖掘系统。

  • 数据源 - 数据源是指在数据格式中,数据挖掘系统的操作方式。有些数据挖掘系统只能工作在ASCII文本文件,而其他多个关系数据源。数据挖掘系统还应该支持ODBC连接或OLE DB的ODBC连接。

  • 数据挖掘的功能和方法 - 也有一些只提供一个数据挖掘功能,如分类,而一些提供了多种数据挖掘功能,如概念的描述,发现驱动的OLAP分析,关联规则挖掘,关联分析,统计分析,分类,预测,聚类,离群数据挖掘系统分析,相似性检索等。

  • 耦合的数据挖掘与数据库或数据仓库系统 - 数据挖掘系统需要被加上数据库或数据仓库系统。该耦合部件被集成到一个统一的信息处理环境。这里是下面列出的耦合类型:

    • 无耦合

    • 松耦合

    • 半紧密耦合

    • 紧耦合

  • 可扩展性- 有两个可扩展性问题,数据挖掘,如下所示:

    • 行(数据库大小)可扩展性 - 数据挖掘系统被认为是可扩展的列时数或行被放大10倍,这需要不超过10倍以上来执行查询。

    • 列(尺寸)销路 - 数据挖掘系统被认为是可扩展的列,如果与列数的挖掘查询执行时间线性增加。

  • 可视化工具 - 可视化数据挖掘可分类如下:

    • 数据可视化

    • 挖掘结果可视化

    • 挖掘过程可视化

    • 可视化数据挖掘

  • 数据挖掘查询语言和图形用户界面 - 图形用户界面,易于使用,并须提升用户引导,交互式数据挖掘。不同于关系型数据库系统中的数据挖掘系统不共享基础数据挖掘查询语言。

趋势数据挖掘

以下是趋势的数据挖掘,反映追求如建筑集成和交互式数据挖掘的环境中,数据挖掘语言的设计挑战的清单:

  • 应用探索

  • 可扩展性和交互式数据挖掘方法

  • 数据挖掘与整合的数据库系统,数据仓库系统和网络数据库系统。

  • 数据挖掘查询语言的标准化

  • 可视化数据挖掘

  • 新的方法来挖掘复杂的数据类型

  • 生物数据挖掘

  • 数据挖掘和软件工程

  • Web挖掘

  • 分布式数据挖掘

  • 实时数据挖掘

  • 多数据库的数据挖掘

  • 隐私保护和数据挖掘信息安全


上一篇: 数据挖掘 - 挖掘互联网 下一篇: 数据挖掘 - 主题