快捷搜索:  汽车  科技

语料库多大算是大型语料库(几个最有名的语料库)

语料库多大算是大型语料库(几个最有名的语料库)

语料库语言学产生于二十世纪60年代,至近十几年已经发展成为计算语言学的重要分支学科。语料库的全称为机存语料库,指存入计算机作为计算机分析的语言素材集。语料库背后的学术思想源于经验主义思潮的复苏,认为可以根据统计学的原理把某一语言的语料按一定的原则抽样存入计算机,作为其全部语料的代表而进行统计分析。研究假设:只要抽样的原则合理,存入足够量的语料后进行的结果也是相当可靠的。目前,比较有名的语料库有美国的Brown语料库、英国和挪威共同建成的LOB语料库、英国的伦教--隆德语料库LLC、英国科林斯出版社和伯明翰大学联合建立的英语语料库COBUILD、英国国家语料库BNC、英国国家英语语料库ICE 等等。在我国,也有一些相当规模的语料库,如北京语言大学研制的现代汉语研究语料库、清华大学研制的现代汉语共时语料库、国家语委主持研制的现代汉语历时语料库等等。

语料库多大算是大型语料库(几个最有名的语料库)(1)

猜您喜欢: