55问答网
所有问题
自然语言处理——4. 语料库与语言知识库
如题所述
举报该问题
其他回答
第1个回答 2022-06-12
语料库在语言研究中被广泛使用:语言习得、方言学、语言教学、句法和语义、音系研究等
(1)计算机的迅速发展;
(2)转换生成语言学派对语料库语言学的批判不都正确(如指责计算机分析语料是伪技术),有的是片面的甚至是错误的(如对语料数据价值的否定)。
两种含义:一种是指在同一种语言的语料上的平行,例如,“国际英语语料库”,共有20个平行的子语料库,分别来自以英语为母语或官方语言和主要语言的国家,如英国、美国、加拿大、澳大利亚、新西兰等。其平行性表现为语料选取的时间、对象、比例、文本数、文本长度等几乎是一致的。建库的目的是对不同国家的英语进行对比研究。
另一种平行语料库是指在两种或多种语言之间的平行采样和加工,例如,机器翻译中的双语对齐语料库
•加拿大议会会议录(Canadian Hansards)
http://www.isi.edu/natural-language/download/hansard/
•克姆尼茨英-德翻译语料库(Chemnitz E-G Translation Corpus)
http://www.tu-chemnitz.de/phil/english/chairs/linguist/real/independent/transcorpus/index.htm
•英语-挪威语平行语料库(ENPC)
https://www.hf.uio.no/ilos/english/services/omc/enpc/
•葡-英双向平行语料库(Compara)
http://www.linguateca.pt/COMPARA/Welcome.html
•香港立法委员会会议记录(Hong Kong Hansards)
http://catalog.ldc.upenn.edu/LDC2000T50
•香港新闻(Hong Kong News)
•香港法律(Hong Kong Laws)
历时8年,两个阶段:1996年至2000年为第一阶段,主要完成了形态和句法分析层的标注工作,形成了PDT 1.0版;2000年至2004年为第二阶段,主要进行树库的深层语法层(tectogrammaticallayer) 的信息标注,形成PDT 2.0 版。
http://www.chineseldc.org
(192. 168. 88. 2)
相似回答
自然语言处理
语料库和语言知识库
的区别
答:
我比较倾向的解释是:
语料库
是
自然语言处理
领域的数据集,而
语言知识库
是词库、词典、句法规则库等等。
什么是
语料库
?
答:
语料库
中存放的是在语言的实际使用中真实出现过的语言材料。1、语料库 是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,
自然语言处理
中基于统计或实例的研究等方面。2、语料库分类 异质的、同质的、系统的、专用的。3、语料库特征 语料库中存...
语料库
是什么意思?
答:
语料库
是指收集、整理和存储语言材料的计算机数据库。它包括了书面语言以及语音材料,旨在为
自然语言处理
、语言学研究等领域提供支持。语料库可以帮助研究者快速高效地获取和分析语言数据,从而更好地理解语言的特性、结构以及规则。语料库包括了多个种类,例如参考语料库、语音语料库、平衡语料库等。而语料库...
快速了解什么是
自然语言处理
答:
4
自然语言处理
的发展的几个特点 基于句法-语义规则的理性主义方法受到质疑,随着语料库建设
和语料库
语言学 的崛起,大规模真实文本的处理成为自然语言处理的主要战略目标。自然语言处理中越来越多地使用机器自动学习的方法来获取
语言知识
。统计数学方法越来越受到重视。自然语言处理中越来越重视词汇的作用,...
自然语言处理
中
语料
预处理的方法
答:
常用的词性标注方法包括基于规则和统计的算法,如最大熵词性标注和HMM词性标注。接下来,我们来看一个词性标注的例子。你也可以自己试试:http://ictclas.nlpir.org/nlpir/ 去阻止文字。我们在接受新闻的时候,会过滤掉无效的信息,筛选出有用的信息。对于
自然语言
来说,去停词是一种明智的操作。一篇...
大家正在搜
自然语言处理 任务
英语语料库语言
什么是自然语言处理
自然语言处理并不是一般地
自然语言处理的应用
自然语言处理概述
中文自然语言处理
自然语言处理实战
自然语言处理发展