搜索结果: 1-10 共查到“计算机科学技术 数据预处理”相关记录10条 . 查询时间(0.146 秒)
中山大学信息科学与技术学院数据挖掘课件第三章 数据预处理
中山大学信息科学与技术学院 数据挖掘 课件 第三章 数据预处理
2013/5/29
中山大学信息科学与技术学院数据挖掘课件第三章 数据预处理。
VLBI软件相关处理机数据预处理方法
甚长基线干涉测量技术(VLBI) 软件相关处理机 预处理 时间同步 MARK5
2013/4/9
在绕月探测工程 VLBI数据处理中心的软件相关处理机系统中,各 VLBI观测站采集的原始数据必须经过预处理才能进行相关处理与条纹搜索等运算。处理机预处理模块对来自各个观测站的MARK5观测数据进行模式判别、寻找同步头、计算 CRC校验码、时间同步等操作,生成时间长度为1min的标准 Linux文件,并存放于硬盘阵列上,供相关处理和条纹搜索使用。预处理模块和软件相关处理模块、条纹搜索模块协调配合,保...
卫星台站预报和数据预处理是卫星激光测距中两个重要组成部分,前者为激光测距仪提供引导数据和距离预报值;后者将测距数据中的噪声剔除,保留有效数据,并生成统一格式的数据,以便进一步应用。随着激光测距技术的发展,现使用的统一数据格式已不能满足要求,为此 ILRS提出一种全新的 CRD统一数据格式。该文介绍了上海天文台 SLR卫星台站预报和数据预处理操作软件、标准点计算方法及 CRD新型数据格式的应用。
基于数据预处理的并行分层聚类算法
分层聚类 并行算法 预处理数据
2010/9/3
分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一。针对目前基于SIMD模型的并行分层聚类算法处理海量数据时效果不理想的问题,提出一种基于数据预处理的自适应并行分层聚类算法,在O((λn)2/p)的时间内对n个输入数据点进行聚类。其中1≤p≤n/log n,0.1≤λ≤0.3。将提出的算法与现有文献结论进行的性能对比分析表明,本算法明显改进了现有文献...
Web日志挖掘中的数据预处理技术
Web日志挖掘 数据预处理 用户会话识别
2009/11/26
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。
改进的Web日志数据预处理技术
Web日志挖掘 数据预处理 frame页面
2009/8/19
介绍Web日志挖掘预处理过程中一些特殊情况的处理方法,在会话识别阶段给出一种基于过滤框架网页与会话重组相结合的会话识别方法,在会话识别之前进行框架网页的过滤,根据传统的会话识别方法构造初始会话集,使用会话重组算法对初始会话集进行优化。实验结果显示,该方法提高了会话识别的质量。
基于数据挖掘的中医药数据预处理方法
数据预处理 数据挖掘 数据归约
2009/3/20
中药文化的地区差异带来了中医药数据的众多不确定性,为解决基于数据挖掘的新药研制决策支持系统的数据问题,提出了一套规范原始中医药数据的处理方法。应用了数据归约技术、聚类的方法、模糊集理论改进了中医药数据的质量,使得在预处理后的中药方剂数据库中成功挖掘出重要规则,为研制中药新药提供了有力的决策支持。
基于兴趣特征的WUM数据预处理方法
Web使用挖掘 兴趣品质 兴趣特征
2009/1/7
为了降低数据规模,并从行为日志中发现更有推荐价值的访问模式,提出了基于用户兴趣特征的数据预处理方法。该方法过滤不具有推荐价值的、用户因偶然发生的短期兴趣而访问网络的行为记录。实验结果表明该方法能够较好地降低数据规模,过滤掉噪音数据,从而减小代理端日志挖掘的复杂度,提高基于Web使用挖掘(WUM)进行个性化推荐的准确度。
一种新的数据预处理算法——NLCA
非线性相关分析 数据挖掘 信用风险评估
2008/12/16
针对数据预处理的方法进行了研究,提出了基于非线性相关性分析与量化(Non-Linear Correlation Analysis,NLCA)算法。NLCA算法是一种基于在多重图中通过对多重边聚合从而达到约简的工具,它包括边聚合与点聚合。这种算法能够很好地表示实时数据全局的相关性,改进了现有使用联合概率的单一计算方法。对该算法进行了大量实际数据的验证,显示出它是一种优于现有的数据预处理方法。