基于潜在语义分析的汉语问答系统答案提取

被引:44
作者
余正涛 [1 ]
樊孝忠 [2 ]
郭剑毅 [1 ]
耿增民 [2 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 北京理工大学计算机科学工程系
关键词
问答系统; 答案提取; 相似度; 向量空间模型; 潜在语义分析;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 081203 ;
摘要
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果.
引用
收藏
页码:1889 / 1893
页数:5
相关论文
共 8 条
[1]   基于网络的中文问答系统及信息抽取算法研究 [J].
崔桓 ;
蔡东风 ;
苗雪雷 .
中文信息学报, 2004, (03) :24-31
[2]   基于潜在语义分析的BBS文档Bayes鉴别器 [J].
刘昌钰 ;
唐常杰 ;
于中华 ;
杜永萍 ;
郭颖 .
计算机学报, 2004, (04) :566-572
[3]   基于潜在语义分析的信息检索 [J].
盖杰 ;
王怡 ;
武港山 .
计算机工程, 2004, (02) :58-60
[4]   基于互联网的中文问答系统 [J].
张永奎 ;
赵辄谦 ;
白丽君 ;
陈鑫卿 .
计算机工程, 2003, (15) :84-85+197
[5]   自动问答综述 [J].
郑实福 ;
刘挺 ;
秦兵 ;
李生 .
中文信息学报, 2002, (06) :46-52
[6]   基于潜在语义索引的文本摘要方法 [J].
林鸿飞 ;
高仁璟 .
大连理工大学学报, 2001, (06) :744-748
[7]   基于示例的文本标题分类机制 [J].
林鸿飞 .
计算机研究与发展, 2001, (09) :1132-1136
[8]  
Thomas K. Landauer,Peter W. Foltz,Darrell Laham.An introduction to latent semantic analysis[J].Discourse Processes,1998(2-3)