一种新的句子相似度度量及其在文本自动摘要中的应用

被引：33

作者：

张奇

黄萱菁

吴立德

机构：

[1] 复旦大学计算机科学与工程系,复旦大学计算机科学与工程系,复旦大学计算机科学与工程系上海,上海,上海

来源：

中文信息学报 | 2005年 / 02期

关键词：

计算机应用; 中文信息处理; 文本自动摘要; 向量模型; 相似度计算;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

本文提出了一种新的句子相似度度量的方法并应用于文本自动摘要中。其创新处在于相似度计算不仅考虑句子中的uni gram ,还考虑了bi gram和tri gram ,通过回归方法将这几种相似度结果综合起来。实验证明这种相似度计算方法是有效的。同时本文还提出了一种新的 ,利用句子间相似度以及句子的权重的抽句式文摘算法 ,在抽取出句子的同时也去掉了冗余。DUC2 0 0 3、DUC2 0 0 4 (DocumentUnderstandingConference 2 0 0 3,2 0 0 4 )的评测结果征明了方法的有效性。我们的系统在DUC2 0 0 4的评测中列第二位。

引用

页码：93 / 99

页数：7