电子病历命名实体识别和实体关系抽取研究综述

被引:121
作者
杨锦锋 [1 ]
于秋滨 [2 ]
关毅 [1 ]
蒋志鹏 [1 ]
机构
[1] 哈尔滨工业大学语言技术中心网络智能研究室
[2] 哈尔滨医科大学附属第二医院病案室
关键词
电子病历; 命名实体识别; 实体关系抽取; 共享评测任务;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
电子病历(Electronic medical records,EMR)产生于临床治疗过程,其中命名实体和实体关系反映了患者健康状况,包含了大量与患者健康状况密切相关的医疗知识,因而对它们的识别和抽取是信息抽取研究在医疗领域的重要扩展.本文首先讨论了电子病历文本的语言特点和结构特点,然后在梳理了命名实体识别和实体关系抽取研究一般思路的基础上,分析了电子病历命名实体识别、实体修饰识别和实体关系抽取研究的具体任务和对应任务的主要研究方法.本文还介绍了相关的共享评测任务和标注语料库以及医疗领域几个重要的词典和知识库等资源.最后对这一研究领域仍需解决的问题和未来的发展方向作了展望.
引用
收藏
页码:1537 / 1562
页数:26
相关论文
共 17 条
[1]   面向中文电子病历的词法语料标注研究 [J].
蒋志鹏 ;
赵芳芳 ;
关毅 ;
杨锦锋 .
高技术通讯, 2014, 24 (06) :609-615
[2]   基于HL7的电子病历关键信息抽取技术研究 [J].
徐永东 ;
权光日 ;
王亚东 .
哈尔滨工业大学学报, 2011, 43 (11) :89-94
[3]   电子病历中命名实体的智能识别 [J].
叶枫 ;
陈莺莺 ;
周根贵 ;
李昊旻 ;
李莹 .
中国生物医学工程学报, 2011, 30 (02) :256-262
[4]  
置信度加权在线序列标注算法[J]. 汤步洲,王晓龙,王轩.自动化学报. 2011(02)
[5]   中文人称名词短语单复数自动识别 [J].
郎君 ;
秦兵 ;
刘挺 ;
李正华 ;
李生 .
自动化学报, 2008, (08) :972-979
[6]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[7]   中文金融新闻中公司名的识别 [J].
王宁 ;
葛瑞芳 ;
苑春法 ;
黄锦辉 ;
李文捷 .
中文信息学报, 2002, (02) :1-6
[8]   医学诊疗领域通用专家系统设计与实现 [J].
林东 ;
邵军力 .
自动化学报, 1995, (03) :380-382
[9]  
信息抽取中实体关系识别研究[D]. 张奇.中国科学技术大学. 2010
[10]  
https://github.com/yangjinfeng/emrproject .