首 页 工作机构 法规·标准 语文工作 科研工作 学术交流 培训测试 中文信息处理 语文博物馆 网上服务 百家论坛 图片·视频
信息浏览
首页 >>>论文
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 向朋友推荐 向朋友推荐 关闭窗口 关闭窗口


词义标注语料库建设综述

, 吴云芳, 俞士汶

(北京大学 计算语言学研究所, 北京 100871)

 

  : 词义消歧的关键问题是缺少大规模、高质量的词义标注语料库。本文分别从语料选取、 词典选择、 标注规模和标注质量等方面介绍已经建成的较有影响的若干词义标注语料库。在自动构建词义标注语料库的方法中,本文集中介绍 bootstrapping策略在语料库建设方面的应用以及利用双语对齐语料库开展的相关研究。最后,针对词义标注语料库建设存在的问题提出自己的分析和思考。


下载:词义标注语料库建设综述


来源:中文信息学报
[上传时间:2008-10-06]
回首页 返回首页 放入收藏夹 放入收藏夹 打印 打印 向朋友推荐 向朋友推荐 关闭窗口 关闭窗口