搜索结果: 91-105 共查到“知识库 自然语言处理”相关记录314条 . 查询时间(1.188 秒)
法语料库文本语义接受度评价研究
法语语料库 语义接受度 抽取率
2009/11/19
法文本语义接受度(SAS)研究属于基于语料库的SAS研究分支。以等距离系统随机抽样方法进行对比实验。抽取公式为A+BX≤C,A为起始页码,B为抽取间距,C为文本总页码,X为可取页数集。当以L’Assommoir(1953版)为语料,B∈(10;5;4;3;2;1)时,词句抽取率(SR)为9.55%,20.29%,25.13%,33.13%,50.36%和100%,SAS为0.089 7,0.084...
基于遗传算法和舍伍德思想的双数组Trie树改进
舍伍德随机思想 遗传算法 变异
2009/11/19
对汉语信息处理中常常要涉及汉语词典查询,当所涉及的词典规模较为庞大时如何快速访问词典以获取词语知识便成为了一个需重点解决的问题。将阐述一种简单快捷的基于双数组Trie(Double-Array Trie)原理的词典查询机制。该算法的查询时间为O(n)的线性时间(n为查询词条的长度),由此可见双数组算法在时间上存在着明显优势,但在空间耗费上却存在着浪费现象。前人提出了一些解决方案,其中主要的有:在构...
使用句间关系恢复人名和机构名称省略
语义块共享 句间关系 概念层次网络(HNC)理论
2009/11/19
语义块是句子的语义构成单位,句子内发生的省略现象可以归结为语义块的省略。在句类分析的基础上,从小句间语义块共享关系的角度分析语义块中人名和机构名称的省略。将省略现象分为语义块整块共享形成的省略和语义块部分共享形成的省略,分析了两种情况的特点,并给出了相应的处理算法。测试表明,该算法对于两种省略均有很好的处理效果。
使用半监督学习方法中的自训练、协同训练方法,利用少量已标注样本和大量未标注样本来完成蛋白质关系抽取的任务.首先使用基于词特征的SVM(support vector machine)模型进行自训练,然后使用基于词特征的SVM模型和基于依存树特征的SVM模型进行协同训练.通过对4个语料的实验,验证了自训练及协同训练方法在蛋白质关系抽取领域中的应用效果.相比于自训练,协同训练可以通过两个相对独立的视图相...
随着计算机网络的发展,电子文章逐渐繁荣.电子文章版权保护近年来也越来越受关注.电子文章版权保护的一个解决方案是,首先提取一个作者的写作特征,通过写作特征的比较来判断版权所属.目前作者特征提取方向的研究多集中在寻找新的更有效的特征上.如何更加有效的提取一个作者的写作特征仍是一件富有挑战性的工作.本文建立了一个作者特征提取引擎模型,该引擎以某个作者某一类型的文章作为输入,以该作者在这一类型文章上的写作...
We present the first unsupervised approach to the problem of learning a semantic parser, using Markov logic. Our USP system transforms dependency trees into quasi-logical forms, recursively induces la...
Learning Context-Dependent Mappings from Sentences to Logical Form
Learning Context-Dependent Mappings Sentences Logical Form
2013/4/22
We consider the problem of learning context-dependent mappings from sentences to logical form. The training examples are sequences of sentences annotated with lambda-calculus meaning representations. ...
一种提高本体映射精确度的方法
本体映射 自然语言处理 WordNet词库
2010/4/2
针对本体映射精确度不高的问题,提出一种基于自然语言处理的本体映射结果校验方法。对复合词进行启发式处理,分析WordNet词库中词汇所对应注释的语法树,提取与参考本体和目标本体相关的词汇,对已有的本体映射结果进行校验。实验结果表明,该方法能有效提高本体映射的精确度。
话题发现与追踪技术研究
话题发现与追踪 统一研究框架 表示模型
2009/11/4
话题发现与追踪以新闻流为处理对象,采用基于事件的信息组织方式进行研究,一直是自然语言处理领域里的热点。该研究借鉴大量相关研究尤其是信息检索中的经典模型和方法,取得了很大成功。首先介绍了话题发现与追踪的主要研究内容、评价方法以及发展历史;然后对其多个研究内容提出一个统一研究框架,并对该框架中的关键技术进行了详细分析;最后指出该领域中的关键问题及难点,并对未来研究做出展望。
11001 New Features for Statistical Machine Translation
11001 New Features Statistical Machine Translation
2013/4/22
We use the Margin Infused Relaxed Algorithm of Crammer et al. to add a large number of new features to two machine translation systems: the Hiero hierarchical phrasebased translation system and our sy...
Multi-task learning is the problem of maxi-mizing the performance of a system across a number of related tasks. When applied to mul-tiple domains for the same task, it is similar to domain adaptation,...
Fast Translation Rule Matching for Syntax-based Statistical Machine Translation
Fast Translation Rule Matching Syntax-based Statistical Machine Translation
2013/4/22
Fast Translation Rule Matching for Syntax-based Statistical Machine Translation。
Effective Use of Linguistic and Contextual Information for SMT
Effective Use Linguistic Contextual Information SMT
2013/4/22
Effective Use of Linguistic and Contextual Information for SMT。
改进的基于句模匹配算法的问句理解方法
自然语言处理 句模匹配算法 词库匹配算法
2009/10/20
句模匹配方法是基于字符表层的文本分析技术,只能处理各个关键词中有分隔词的问句,具有局限性。针对该问题,结合问答系统的应用背景,提出将句模匹配与关键词词库匹配相结合的方法,改进了传统的句模匹配问句理解方法。实际应用表明,该方法能扩大问句理解的范围,提高问句理解的准确性。