工学 >>> 计算机科学技术 >>> 人工智能 >>> 自然语言处理 >>>
搜索结果: 121-135 共查到知识库 自然语言处理相关记录314条 . 查询时间(0.539 秒)
提出基于非负矩阵分解(NMF)的中文文本主题分类方法,应用NMF算法分解词-文本矩阵获取词之间的相关性,有效地解决同义词、多义词的影响。实验结果表明,与基于奇异值分解的潜在语义索引方法相比,该方法计算速度快、占用存储空间较少。在潜在语义数据降低较大的情况下,NMF方法具有更好的分类精度。
概念名称是本体映射中的一个重要要素。针对目前概念名称相似度计算中存在的概念名称多义性问题,提出一种改进的算法。该算法结合概念注释和义项解释,利用潜语义分析,明确概念在Wordnet中对应的义项,在一定程度上提高了相似度计算的准确度。实验表明该方法是切实可行的。
提出一种基于树核的英文代词消解方法。针对结构化信息在指代消解中的重要作用,使用SVM提供的卷积树核函数自动获取句法结构信息,将句法树作为一个特征与其他基本特征结合。通过应用不同的剪枝策略,考虑不同句法树对系统的影响,在原有的句法树上扩充一些语义节点。在ACE2004 NWIRE基准数据上进行实验的结果证明,该方法对代词的消解起到明显的作用,综合值f提高了11.9%。
提出一种基于依存内容单元的金字塔自动摘要评估方法,通过确定依存内容单元,构建金字塔模型,给出相应的自动评估流程。该方法不仅能够避免人工处理的不稳定性,并可实现整个评估过程的自动化。仿真实验结果表明,该方法的Person相关系数及Sperman相关系数均大于传统ROUGE-1算法。
针对文本分类领域中向量空间模型维数过高和空间扭曲的问题,提出一种基于正交分解的新模型。借用物理学中力的正交分解,将高维的文本向量映射到低维的以类别为坐标轴的空间中,解决了高维的向量和扭曲的空间这2个问题。实验表明,与向量空间模型相比,新模型下分类速度有较大提高,精度也有所增加。
词语聚类是语音识别、智能信息检索等领域的一个重要的自然语言处理问题。实现基于互信息的对称聚类模型,并针对该模型未考虑词语顺序的缺陷,提出一种新的非对称聚类模型。按照聚类词相对其他词语的位置关系,该模型分为2个子模型,即条件聚类模型和预测聚类模型。在大规模数据集上的实验表明,相对于对称聚类模型,非对称聚类模型是一种更为有效的词语聚类模型。
现有数据聚类方法在处理文本数据时,没有考虑词之间潜在的相似信息,导致聚类效果不理想。针对中文短信文本聚类提出一种基于语义的聚类算法。给出中文概念、词和中文短信文本的相似度度量方法,通过向下连锁裂变和向上两两归并完成中文短信文本聚类。实验结果表明,该算法的聚类质量高于传统算法。
协同虚拟装配技术是虚拟样机技术与虚拟现实技术相结合所产生的一个新的研究热点。基于细胞元表示的语义特征造型技术,提出一种统一的协同虚拟装配框架,在该框架下能够有效支持异构CAD系统间零件及装配体的协同装配。网络传输以特征依赖图存储的操作信息,可降低网络负荷,提高响应速度。该思想初步应用在自主开发的HUST-CAIDS与UG间的异构协同设计中,证明了以上理论的可行性。
提出一种基于CW的语义信誉系统,使买家可以使用自然语言评论卖家,网络上的节点能阅读针对卖家的评论。考虑交易额大小,以生成最终评论结果,给出价格因素对评论结果的影响。与使用数值描述节点可信度的传统信誉系统相比,该系统更符合人类的思维习惯。
特定领域的主题识别和关键词提取有着广泛的应用,但通过人工指定识别或文本聚类自动生成的主题类别缺乏客观的度量方法。该文结合基于BIC准则的模型选择理论和独立分量分析技术对主题的数量进行概率估计,给出主题数量在BIC意义下的统计分布。在此基础上实现了文档矩阵的ICA分解,并根据分离的独立分量获得主题的关键词及其权重。实验表明,该方法在没有领域知识支持的情况下能估计出反映文本集合的主题数并提取相应的关键...
提出一种基于支持向量机(SVM)的英语名词短语的指代消解方法,并给出具体实现系统。实验采用了几个常用的基本特征,在MUC-6公开语料上测试得到的F值为68.6,优于同类型的其他原型系统。分析SVM中不同核函数对分类结果的影响以及不同的特征对指代消解的作用。实验结果表明,同位语、别名和字符串匹配3个特征对指代消解非常重要,距离作为特征使用时对指代消解没有帮助,但可在训练样例生成时作为限制条件来使用。...
针对基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法所存在的缺陷,提出基于本体和句法分析的某领域分词方法,通过建立体裁本体进行句法分析,从智能化的角度进行查词,避免了传统方法不考虑上下文信息导致的语义丢失等情况。实验结果证明,该方法可以较大地提高分词的精度。
在基于事件框架的新闻信息抽取中,针对事件侧面被框架结构所限定的问题,提出一种事件新侧面探测方法,并定义事件新侧面的2种类型。通过去除已有的侧面内容,实现LSA聚类探测,同时在文本特征选取部分采用词对特征模型,以充分利用有限文本中的语法信息。在原型系统中对该方法进行测试,实验结果表明,该方法是有效的。
案例推理方法建立在“相似问题具有相似解”的基础上,能否从案例库中检索出与新问题“最相似”的案例是案例推理方法成功的关键因素之一。该文提出一种改进的检索方法,在原始最近相邻算法基础上,用专家对新问题案例与历史案例属性差异的效用评价替代原始的属性差异值来衡量专家对属性差异的敏感程度。引入变异系数来标度新问题案例与历史案例的属性差异的分布情况,从而保证检索出的最相似案例具有较高的属性差异的均衡性。通过具...
提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度减少信息损失的前提下实现了文本特征的有效降维。对文本的分类实验结果表明,该特征降维方法具有良好的分类效果。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...