中文分词论文

  • 汉语自动分词研究中的几个理论问题_自然语言处理论文

    汉语自动分词研究中的几个理论问题_自然语言处理论文

    汉语自动分词研究中的若干理论问题,本文主要内容关键词为:汉语论文,分词论文,理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。提要讨论了汉语自动分词研究中的...
  • 论汉语分词标准_中文分词论文

    论汉语分词标准_中文分词论文

    浅谈汉语分词的标准*,本文主要内容关键词为:汉语论文,分词论文,浅谈论文,标准论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。分词是汉语信息处理中的一项基础工...
  • 汉语自动分词研究综述_自然语言处理论文

    汉语自动分词研究综述_自然语言处理论文

    汉语自动分词研究评述,本文主要内容关键词为:汉语论文,分词论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。1.汉语自动分词的现实性与可能性众所周知,中文文本没...
  • 语言接触案例:关于“V(O)有”_中文分词论文

    语言接触案例:关于“V(O)有”_中文分词论文

    语言接触的一个案例——再谈“V(O)已”,本文主要内容关键词为:再谈论文,案例论文,语言论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。一在拙作《〈世说新语〉...
  • 通用语料库#183的词汇提取与词汇组成分析_自然语言处理论文

    通用语料库#183的词汇提取与词汇组成分析_自然语言处理论文

    国家语委“通用语料库#183;核心库”的词表提取及词汇构成分析,本文主要内容关键词为:国家语委论文,语料库论文,词表论文,词汇论文,核心论文,此文献不代表本站观点,内容供学术参...
  • Web文本自动分类技术研究综述_自然语言处理论文

    Web文本自动分类技术研究综述_自然语言处理论文

    Web自动文本分类技术研究综述,本文主要内容关键词为:技术研究论文,文本论文,Web论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。1引言近年来,Web已经成...
  • 谈“夏洛特烦恼”这类分词歧义结构论文

    谈“夏洛特烦恼”这类分词歧义结构论文

    谈“夏洛特烦恼”这类分词歧义结构李晨(华中师范大学语言与语言教育研究中心,湖北武汉430079)摘要:现代汉语中存在着类似于“夏洛特烦恼”的分词歧义结构,这是一类对于人和机器都...
  • 关于数据库汉语查询语句中查询信息的研究

    关于数据库汉语查询语句中查询信息的研究

    张占英[1]2004年在《关于数据库汉语查询语句中查询信息的研究》文中研究说明数据库自然语言界面(NLIDB)是自然语言处理(NLP)最早和最广泛的研究领域之一,它主要涉及到自然语言处理和数据库系统的研究,是一个具有重大理论价值和巨大实用价值的研究领域。在数据库自然语言查询界面的研究中,对用户输入的...
  • 基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术

    基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术

    俞鸿魁[1]2004年在《基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术》文中研究说明本文提出了一种基于层次隐马尔可夫模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和命名实体识别集成到一个完整的理论框架中。在分词方面,采取的是基于类的隐马尔可夫模型,在这层隐马尔可夫模型中,命名实...
  • 大规模分布式全文搜索系统的研究与设计

    大规模分布式全文搜索系统的研究与设计

    余锦[1]2004年在《大规模分布式全文搜索系统的研究与设计》文中研究表明Internet的迅速普及和发展,使人们面临着一个信息的海洋,快速从中获取真正感兴趣的信息变得至关重要。全文搜索系统(主要指搜索引擎)即是提供这种功能的一种工具。现有全文搜索系统大都采用集中式体系结构,在可扩展性、容错性等方面...
  • 中文统计自然语言处理隐马模型的研究

    中文统计自然语言处理隐马模型的研究

    陈波[1]2003年在《中文统计自然语言处理隐马模型的研究》文中研究指明自然语言处理,相对其它领域,如编程语言,具有特殊的因难,主要表现在知识的获取与使用上。早期自然语言处理的知识几乎都是人工总结的,如机器翻译词典、各种文法等。然而,语言是社会发展的产物,不是简单的可以由"专家"...
  • 中文全文检索技术研究

    中文全文检索技术研究

    周翊超[1]2008年在《军事文献搜索引擎架构的研究与实现》文中进行了进一步梳理军队信息服务体系与创新研究作为军队信息化建设战略研究的基础构件之一,在挖掘信息资源,实现无障碍传递,推进技术革新,协助军事科研,培养现代化军队,造就高素质复合型人才等方面,具有重要的理论价值和现实意义。当今时代,信息资源...
  • 基于多类的汉语文本自动分类研究

    基于多类的汉语文本自动分类研究

    卢忠良[1]2002年在《基于多类的汉语文本自动分类研究》文中研究指明随着计算机应用及“Internet”的日益普及,通过各种渠道获取的数据和信息正以惊人的速度增长,“丰富的数据与可用的信息”之间的矛盾也日见突出。如何快速有效的发掘海量信息中蕴含的有价值信息,合理分类及准确地定位所需信息,同时摒弃大...
  • 数据挖掘在Internet信息检索中的应用

    数据挖掘在Internet信息检索中的应用

    熊回香[1]2003年在《网络信息检索及其发展趋势研究》文中进行了进一步梳理随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检...
  • 基地统计和规则的中文姓名识别系统的研制

    基地统计和规则的中文姓名识别系统的研制

    王省[1]2000年在《基地统计和规则的中文姓名识别系统的研制》文中进行了进一步梳理中文姓名的识别是提高汉语分词系统正确率的关键技术之一,对整个机器翻译系统有重要影响。本文将统计和规则方法结合起来,根据其侧重点不同,提出了侧重规则和侧重统计两种识别模型。规则模型主要利用串频统计作切分预处理,并利用统...
  • 任意类型的未登录词的识别研究

    任意类型的未登录词的识别研究

    何燕[1]2000年在《任意类型的未登录词的识别研究》文中认为我们利用机器自动分词并经人工校对后的350万字语料,采用统计的方法,对出现在分词碎片中的未登录词进行识别。本文报告了我的实验情况:处理训练语料,从中获得有用的资源;对生语料文本进行两趟分词,第二趟分词是从分词碎片中识别未登录词;进行封闭测...