搜索结果: 16-30 共查到“知识库 图书分类学”相关记录125条 . 查询时间(1.39 秒)
开源主题图引擎TM4J应用研究
TM4J 主题图 Java 开源
2007/12/28
[摘要]在分析TM4J的基本体系结构、主要类和核心接口的基础上,讨论通过TM4J的开发包从XTM文件生成主题图的代码示例,并讲解如何运用Ant实现Hibernate支持的关系数据库持久存储主题图的流程。最后给出几个现有的TM4J应用案例。
文本分类相似度模型和概率模型的实现与比较*
文本分类 向量空间模型 简单贝叶斯
2007/12/28
[摘要]设计并建立一个基于向量空间模型和简单贝叶斯的文本分类系统,系统引入小类校正和兼类判断的算法,完成层级多标签的分类。进行基于向量空间模型和简单贝叶斯分类效果的对比,实验证明,在约3万篇测试集上(共15个大类,244个小类),基于向量空间模型的大类分类高25.2个百分点,层级小类分类高26.3个百分点。
[摘要]设计并实现一个基于向量空间模型和简单贝叶斯的文本分类系统,系统采用层级多标签的分类策略。详细介绍词语切分统计、终分类器值计算、层级小类校正和兼类判断四个子系统模块。基于向量空间模型分类的第一级大类和层级小类的微平均分别为89.7%和77.8%,简单贝叶斯分别为67.6%和66.5%。
增量式索引技术在信息搜索引擎中的应用
传统搜索引擎 增量式索引 即时更新
2007/12/28
[摘要]用传统的搜索引擎技术搜索时,每次都需要重新生成索引,这个过程会花费大量时间。采用增量索引方法后,系统支持即时增量索引,即对新加入的文档可以立即加入索引,且不用重新对原内容进行重索引。系统能满足信息搜索中搜索数据量的增长和索引即时更新的要求。
元搜索引擎原理在实现分布式虚拟联合目录中的应用研究
联合目录 分布式系统 元搜索引擎
2007/12/28
[摘要]详细介绍元搜索引擎在实现高校图书馆分布式虚拟联合目录中的应用、实现的原理及方法,分析用Java语言的编程思路,给出详细的系统结构,并讨论其性能。
语音信息的内容分析技术研究综述
内容分析法 语音信息 语音识别
2007/12/28
[摘要]研究语音信息内容分析的特点,对比文本信息分析处理的异同,对语音信息的内容分析技术进行综述并给出内容分析技术的体系框架,并对语音识别、情感信息的识别、语音识别分类等重难点技术进行研究。
[摘要]主题地图作为异构信息检索的重要手段之一,在以分类目录为目的的文件存档和以概念化导航为目的的Web浏览中得到广泛应用。为了保证作为其基础的下层语义网络的完备性和健壮性,验证主题地图在语法和语义上的合法性非常重要。为此,提出了主题地图模式及约束语言规范,研究了Schema约束和上下文语义约束,并建立了与之相配套的主题地图语义验证器,实现了对于主题地图约束的合法性验证。
用FCA对搜索结果进行分类*
搜索引擎 形式概念分析 概念格
2007/12/28
[摘要]用形式概念分析的方法,对用户的搜索结果进行自动分类研究,经过建立模型进行实验证明,用形式概念的方式可以对搜索结果进行自动分类,用户可以更便利更准确地使用搜索结果,有效提高查找信息效率。
应用Protégé构建临床药物本体的探索*
本体开发 临床药物 RDF/OWL语言
2007/12/28
[摘要]通过对临床药物领域大量概念的分析,提出若干类和属性,并以这些类和属性初步构建成包含4种临床药物的试验性临床药物学本体,由此了解药物本体的构建特点,为药学本体具体应用完善专家系统,指导临床医生用药提供必要的决策支持。
医学关键词与叙词对照表自动构建研究
对照表 互信息 条件概率 字面相似性
2007/12/28
[摘要]以中国生物医学文献数据库部分数据作为语料,通过实验比较几种测量词间相关性的方法在测量关键词与叙词相关性时的准确性,探讨自动构建关键词与叙词对照表的可行性和有效方法。
一种通用HTML网页主题信息提取方法*
DOM 信息提取 分块 相关度
2007/12/28
[摘要]采用DOM规范,把HTML网页表示成树结构,对不同模板的HTML页面“主题”信息提取进行研究和分析,提出一种新的结点主题相关性判定方法,依据此方法判定出要抽取的主题内容,并删除无关内容,结果输出只含主题信息的HTML文档。
分众分类:网络时代的新型信息分类法(编译)
信息分类 分众分类 网络传播 知识管理
2007/12/28
[摘要]针对网络信息分类体系构建的要求日趋突出,主要研究了一种与传统分类体系截然不同的分众分类体系,分别对这一全新分类体系的思想来源、主要机制及其主要功能加以阐述,并分析了其未来在知识管理方面可行的企业级应用前景。
多种载体信息资源的自动分类方法与实践
信息资源 自动分类 信息载体 信息系统
2007/12/28
[摘要]通过对多种载体信息资源MARC的数据分析,归纳总结其MARC数据的不同,并根据不同载体资源MARC字段的特征,设计并实现计算机自动分类,从而提高信息服务的质量。
[摘要]针对个性化搜索的3个关键问题:用户信息搜集,用户信息库的动态更新与个性化检索算法,探索性地提出基于Ajax用户行为跟踪方案,以会话为单位动态更新用户行为信息库策略与加入用户文档的向量空间检索模型,并在此基础上设计和实现个性化搜索引擎实验系统。
一种改进的文档层次分类方法
文档分类 层次分类 限制投票法
2007/12/27
[摘要]在文本分类的类别数量庞大的情况下,层次分类是一种有效的分类途径。但是,常用的层次分类法容易产生“阻滞”的问题。为了解决该问题,提出一种改进型层次分类方法,即限制投票法,并运用Rocchio分类器在基础教育学科资源环境下进行了实验。结果表明,该方法能够降低阻滞,具有较好的分类效果。