中国传媒大学有声媒体文本语料库
130 阅读 2021-04-22 10:10:08 上传 0KB
中国传媒大学有声媒体文本语料库
该语料库(http://ling.cuc.edu.cn/Raw-Pub/)由中国传媒大学国家语言资源检测与研究有声媒体中心开发,2003年开始建设,2005年上线,其后不断扩大语料规模, 并于2016年进行了第三次改版。该语料库包括2008-2013年的3万多个广播、电视节目的转写文本,总字符数达到2.4 亿个,并对所有文本进行了自动分词和词性标注。
点赞
收藏
表情
图片
附件