情感语料库的构建和分析

被引：108

作者：

徐琳宏

林鸿飞

赵晶

机构：

[1] 大连理工大学计算机科学与工程系

来源：

中文信息学报 | 2008年 / 01期

基金：

教育部留学回国人员科研启动基金;

关键词：

计算机应用; 中文信息处理; 情感语料库; 文本编码规范; 一致性检查; 情感迁移;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

本文介绍了情感语料库构建方面的一些经验,讨论了在设计和建设情感语料库中的几个基本问题:制定标注规范、选择标注集、设计标注工具以及标注过程中的质量监控。目前已经标注完成近4万句,100万字的语料。在完成这些已标注语料的基础上,进一步给出了语料库的情感分布,情感迁移规律等统计数据,分析了情感语料库的特点及应用。它的建成将为文本情感计算提供更加强大的资源支持。

引用

页码：116 / 122

页数：7

共 7 条

[1] 基于语义理解的文本倾向性识别机制 [J].