工学 >>> 计算机科学技术 >>> 计算机软件 >>> 软件理论 操作系统与操作环境 程序设计及其语言 编译系统 数据库 软件开发环境与开发技术 软件工程 计算机软件其他学科
搜索结果: 31-45 共查到计算机软件 数据挖掘相关记录79条 . 查询时间(0.141 秒)
中药数据的不规范,使预处理成为数据挖掘系统中的一个重要过程。该文开发中药特性信息数据挖掘系统,介绍系统结构与挖掘流程,分析中药数据的特征,对数据进行预处理,包括过滤噪声数据、中医药术语规范化、缺损数据处理、剂量单位规范化、作用度规一化、功效量化等。
根据数据挖掘技术中的关联规则理论,提出“道路交通事故属性”的定义,并建立一种新的道路交通事故数据挖掘模型,利用改进的多维多数据类型的Apriori算法,从记录交通事故的数据库中发现潜在的、有价值、有联系的规律,用以指导交通管理部门找出道路黑点,并做出决策,杜绝事故隐患、减少事故发生,保障人们的生命和财产的安全。
为实现数据在同一个地点进行处理而无须移动,介绍一种基于高性能云的分布式数据并行处理方法。使用一个专用的网络服务分层结构,适用于高性能广域网络连接的计算机集群所产生的大型分布式数据集的数据挖掘。实验结果表明,与Hadoop方法相比,该方法的性能有显著提高。
在开源数据挖掘平台WEKA上进行了挖掘测试和分析,并分析了其存在的主要问题。为了克服WEKA系统在聚类方面的薄弱性,在WEKA的开源环境下进行二次开发,扩充了聚类算法。介绍了将k-中心点轮换算法嵌入到WEKA平台的过程,充分利用了开源WEKA中的类和可视化功能,并对嵌入的算法和原有聚类算法进行了对比分析。该算法改进了传统的k-中心点算法,避免陷入局部最优,而且它对初始点不太敏感,可以获取更好的聚类...
数据挖掘旨在从海量数据挖掘未知的有价值的新知识或规律,然而专业技术人员对应用领域背景知识不熟悉常常导致数据挖掘不能顺利实施。针对该问题,将本体这一知识表示方法引入到数据挖掘中,利用本体的特点,设计了一个基于本体的智能数据挖掘系统。详细介绍了系统各部分的构成及工作原理。该系统的实现能够将普遍的背景知识引入到数据挖掘的各个环节中,从而辅助技术人员顺利实现挖掘目标。
在钢铁企业的成本分析中,工艺路线关键工序消耗的分析和控制成为钢铁企业生产成本决策分析中首要的任务。通过以工艺路线为切入点,结合企业的成本分析项目,对生产成本工序进行数据仓库维度建模。采用基于抽样的C4.5算法对生产成本工序数据进行挖掘挖掘出工艺路线中的关键工序和影响钢铁企业成本的分类规则,为企业的成本管理提供了科学依据。
随着数据库的广泛应用,数据挖掘技术面临数据的海量化、分布化问题。采用面向服务的架构构造数据挖掘系统是解决该问题的方法之一。提出一种基于领域本体的数据挖掘服务发现算法,通过引入领域知识,定义数据挖掘本体,有效地解决了数据挖掘服务发现问题。首先给出了结合领域知识的数据挖掘服务发现框架,提出了数据挖掘方法本体和质量本体的定义,并给出了根据领域知识及用户需求进行数据挖掘服务发现的算法,为数据挖掘服务选择提...
离群数据挖掘数据挖掘的重要任务之一。首先分析了离群数据及其挖掘方法,然后根据LF算法和CSI算法,提出了基于群体智能的离群数据挖掘算法,并进行了仿真实验。实验结果显示了基于群体智能的离群数据挖掘算法的有效性。与其它方法相比,该算法避免了用户在设定参数初始值时给算法带来的影响,并且不需要设定初始聚类中心,因此具有更好的鲁棒性。
进行教育考试数据挖掘与分析研究,有利于充分发掘教育考试数据的潜在价值,更好地为教育管理、教育决策提供科学的依据。分析了教育考试数据资源现状与特点,构建了高考数据集市雪花模型,采用Apriori算法生成频繁数据项集,并以最小置信度75%为条件,挖掘出考生4科高考成绩之间的关联规则。
介绍企业信用评估和当前隐私保护数据挖掘技术的最新进展,利用适用于企业信用评估的大规模分布式隐私保护数据挖掘架构,讨论了基于该架构的面向企业信用评估的分布式隐私保护数据挖掘。该研究不仅将有助于大规模分布式环境下的隐私保护数据挖掘系统的研发,而且能够有力推动“信用中国”的建设步伐,以达到更好地服务经济的目的。
针对一个真实的高校人力资源数据集,分析了在高校人力资源管理中适用的数据挖掘技术与过程,通过探索性的数据分析进行了特征值的离散化和特征值的归约、特征选择和构造等方面的分析,并给出了衡量教学科研人员科研能力水平的分类标签建议。利用决策树模型分析了影响教师科研能力的几个关键因素,聚类分析对教师的现状进行了客观而有效地描述,关联规则技术描述了教学、科研和社会工作等几方面的关系。研究分析的结果具有较好的解释...
研究探索了包括目标理解、准备数据数据预处理、建立模型、评估解释、知识应用等水文数据挖掘的六个过程。并采用公共的数据处理和挖掘算法,实现各过程之间数据无缝连接,形成了松散耦合的水文数据挖掘系统体系框架。在实施水文数据挖掘过程中,将数据挖掘的一些数据处理方式应用到了水文领域,同时也采用了水文领域中的一些数据处理技术,实现了数据挖掘领域与专业领域的数据处理和评价方式融合。通过选取江苏省国家水文数据库中...
生物信息学是以计算机为工具对生物信息进行存储、检索和分析的科学。人类基因组计划的启动和实施使得核酸、蛋白质数据迅速增长,如何从海量数据中获取有效信息成为生物信息学迫切要解决的问题。数据挖掘与生物信息学有很好的结合点,其在生物信息学领域的应用潜力日益受到人们的重视。简述了生物信息学和数据挖掘,并介绍了数据挖掘技术在生物信息学中的几类典型应用。
基于频繁序列模式的压缩技术旨在提高数据挖掘结果的可用性和可理解性,从庞大的序列模式中发现有用的知识。分析了现有频繁模式压缩算法的不足,提出了在模式聚类函数的基础上生成一个压缩的偏序(Partial Order)的算法,实验结果显示该算法可以对频繁序列模式进行高效,高质量的压缩,可以得到数量更少、信息量更大的模式,从而提高发现的频繁访问序列的兴趣性。
介绍了一种基于统计分析的数据离散化方法——谱系聚类法,以胶合板缺陷检测数据为应用对象进行了基于谱系聚类的数据离散化研究,并与其它离散化方法进行了对比分析,对比结果表明经谱系聚类方法离散化后的数据,再进行粗糙集约简时,会有更多的冗余属性和记录被约掉,从而可以降低模型的复杂程度,加快获取知识的进程,提高分类的准确率。工程实践证明谱系聚类是一种有效的可用于数据预处理的离散化方法,结合粗糙集算法可以获取满...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...