关于数据挖掘的问题

来源:百度知道 编辑:UC知道 时间:2024/05/14 08:45:50
什么是兴趣度?支持度 属性 数据噪声
具体讲一下好吗

在维表中 ------行是元组 列是属性(只能说到这种程度了 只要你稍微有点基础 应该可以明白 如果你是初学这 建议你吧 多唯数据模型的知识好好看看 如星形模式 雪花模式)
支持度(A=>B)-----包含A和B的元组数/元组总数
数据躁声 -----大量的数据中 错误的 容易造成统计和数据挖掘混乱的数据
兴趣度----包含很多种(通俗的讲就是对于用户所需要的信息程度)

不如买本DATA MINING的书

基于先进的数据仓库(Data Warehousing)、联机分析处理(OLAP)和数据挖掘(Data Mining)技术的商业智能解决方案。整合客户不同系统中不同平台、不同结构的数据,进行综合分析,以报表、图形等多种形式提供实时而有效的决策辅助信息,使各级决策者获得知识和洞察力,提高决策的质量和效率。

(一)系统结构

(二)功能特点

功能强大的数据整合平台,提取不同系统中不同平台、不同结构的数据,进行净化和转换。通过定制可以连接现有各种运营系统、ERP(Oracle、SAP等)、CRM及财政管理、人力资源管理、供应链管理等各种传统应用系统。支持Oracel、Sybase、DB2、MS SQL Server、Informix等各种常见的数据库平台。

支持外部文件系统作为数据源,支持XML、Excel、格式化文件等独立文件系统,并可以使用FTP、Email等多种文件传送方式。

现不同系统之间数据交换的通用平台。
数据导入: 将各种信息来源的数据导入指定的系统,支持Excel文件、格式化文本文件等各种类型的数据文件导入。
数据导出: 将系统内部指定的数据或者查询结果导出到文件,支持Excel文件和格式化文本文件。
数据同步: 不同数据库系统间数据交换, 不同平台、不同结构的数据库系统之间进行数据提取、转换,实现系统间数据的传输和同步。

先进的联机分析处理(OLAP)技术,可根据从不同角度对商业数据进行整理分析,逐层(Drill-up/Drill-Down)及多角度交叉分析(Slice