搜索结果: 1-9 共查到“计算机科学技术 文本挖掘”相关记录9条 . 查询时间(0.139 秒)
提出一种基于隐马尔可夫模型的转录因子文本挖掘算法(HMM-TFM),该方法通过建立转录因子名称的词库,利用谓语筛选策略判断句子是否描述转录因子, 使用隐马尔可夫模型预测单词词性,并根据前后文单词词性识别转录因子的名称。实验结果表明,HMM-TFM在英文文献中抽取转录因子名称的查全率和查准率分别可达74.2%和77.9%。
提出一种基于隐马尔可夫模型的转录因子文本挖掘算法(HMM-TFM), 该方法通过建立转录因子名称的词库, 利用谓语筛选策略判断句子是否描述转录因子, 使用隐马尔可夫模型预测单词词性, 并根据前后文单词词性识别转录因子的名称. 实验结果表明, HMM-TFM在英文文献中抽取转录因子名称的查全率和查准率分别可达74.2%和77.9%.
基于文本挖掘的话题发现技术
话题发现与跟踪 层次聚类 文本挖掘 动态阈值
2009/9/27
在分析灾害新闻特点的基础上,提出一种基于文本挖掘的话题发现技术,采用基于平均分组的层次聚类算法,对灾害新闻资料进行组织,从而生成新闻专题,为用户提供个性化服务,并形成专题检测系统,同时介绍基于时间和地点权值向量的相似度计算模型以及基于时间的动态阈值模型。实验结果表明,该算法能够获得较好的性能。
基于模糊聚类的文本挖掘算法
聚类数 文本聚类 模糊聚类
2009/8/12
针对传统FCM算法对孤立点比较敏感,须预先指定聚类数目的缺陷,提出一种新的模糊聚类算法NSFCM,将其应用于文本挖掘中。NSFCM对数据对象的隶属度增加一个权值,以减少孤立点对聚类中心的影响。采用平均信息熵确定聚类数,通过密度函数获得初始聚类中心。仿真结果证明,该算法聚类的精度和执行效率均高于FCM算法,效果较好。
基于文本挖掘技术的专利质量评价与实证研究
文本挖掘 专利质量 技术新颖度
2009/7/2
分析了专利价值评价现状及其应用限制,在此基础上提出了基于文本挖掘技术的专利质量评价方法,用以挖掘专利数据内部的、客观的信息。通过新颖度度量函数量化专利的技术新颖程度,依此来评价某一个行业内的专利质量。然后,将该方法应用到我国光通信技术领域,进行相关专利的质量评价。
基于本体论的文本挖掘技术综述
文本挖掘 本体论 常识本体
2009/1/8
文本挖掘技术是从海量文本信息中获取潜在有用知识的有效途径。传统的文本挖掘方法由于不能有效运用语义信息而难以达到更高的准确度。本体论为语义信息的合理表示和有效组织提供了理论支持和技术手段。介绍和分析了常识本体和领域本体以及基于这些本体的文本挖掘方法。
回顾了中文和英文语言环境下的Web文本挖掘现状,阐明了其现阶段的特点和技术瓶颈.之后提出了一种基于Web文本挖掘的网页内容挖掘技术:AIS (Augmented information support),介绍了相关实现所涉及的基础技术和功能.最后将AIS技术应用于香山科学会议网站,开发了AIS4XSSC文本挖掘系统并展示了现阶段其主要功能.实践表明AIS技术能够从大量的Web文本中有效提炼信息,提...
文本挖掘技术研究进展*
文本挖掘 中文分词 特征选取 文本摘要
2008/3/5
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展。最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景。