一种面向基因与疾病关系的文本挖掘方法

被引:2
作者
龚乐君 [1 ,2 ]
韦有兵 [1 ]
谢建明 [1 ]
袁志栋 [1 ]
孙啸 [1 ]
机构
[1] 东南大学生物电子学国家重点实验室
[2] 淮阴工学院计算机工程学院
关键词
生物医学; 文本挖掘; 关系抽取; 实体识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
结合模式匹配、生物医学本体及共现技术,设计了一种自动抽取基因与疾病、基因与基因之间关系的文本挖掘方法,并开发了一个可以处理海量文本数据的系统.该系统可抽取与疾病相关的基因实体,挖掘基因与疾病、基因与基因之间的关系,衡量基因与疾病实体的相关性,并为分析基因与疾病、基因与基因之间的关系提供了网络可视化工具.实验结果表明,系统在测试数据集上抽取基因与疾病之间的关系可获得83.0%的综合测评率,抽取基因与基因之间的关系可获得78.5%的综合测评率.该系统已成功应用于乳腺癌及相关基因的研究.
引用
收藏
页码:486 / 490
页数:5
相关论文
共 4 条
[1]   Histopathology of BRCA1- and BRCA2-associated breast cancer [J].
Honrado, Emiliano ;
Benitez, Javier ;
Palacios, Jose .
CRITICAL REVIEWS IN ONCOLOGY HEMATOLOGY, 2006, 59 (01) :27-39
[2]  
Recent Developments in Critical Genes in the Molecular Biology of Breast Cancer[J] . Somkiat Sunpaweravong.Asian Journal of Surgery . 2005 (1)
[3]   Guidelines for human gene nomenclature [J].
Wain, HM ;
Bruford, EA ;
Lovering, RC ;
Lush, MJ ;
Wright, MW ;
Povey, S .
GENOMICS, 2002, 79 (04) :464-470
[4]  
Complementary structures in disjoint sci-ence literatures .2 Swanson D R. Proceedings of the14th Annual In-ternational ACM SIGIR Conference on Research andDevelopment in Information Retrieval . 1991