基于依赖关联度的业务过程噪声日志过滤方法

被引:3
作者
孙笑笑 [1 ,2 ]
张蕾 [1 ,2 ]
俞东进 [1 ,2 ]
潘建梁 [1 ,2 ]
侯文杰 [1 ,2 ]
王焕强 [1 ,2 ]
机构
[1] 杭州电子科技大学计算机学院
[2] 复杂系统建模与仿真教育部重点实验室
关键词
流程挖掘; 模型质量; 噪声日志过滤方法; 依赖关联度; 业务流程管理;
D O I
10.13196/j.cims.2019.04.020
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
日志中发生的低频次行为与挖掘的流程模型中某些不必要的结构相对应,而这些结构的出现会引起挖掘模型在适应度和精确度等指标上的下降。为解决这些结构对流程挖掘模型质量造成的影响,提出一种基于依赖关联度的噪声日志过滤方法。该方法首先根据日志中事件及其依赖关系的统计频率,定义了依赖关系的局部关联度和整体关联度,并将两者归一化为混合关联度来筛选出噪声日志。然后通过轨迹可达性分析去除日志中的噪声,以便最大程度地保留日志轨迹中记录的其他行为。与传统噪声日志过滤算法过滤掉包含噪声日志的整条日志轨迹不同,所提算法在移除噪声日志的同时最大程度地保留了原始日志中的其他非噪声日志。
引用
收藏
页码:969 / 977
页数:9
相关论文
共 3 条
[1]  
Genetic process mining: an experimental evaluation[J] . A. K. A. Medeiros,A. J. M. M. Weijters,W. M. P. Aalst.Data Mining and Knowledge Discovery . 2007 (2)
[2]  
Temporal sequence learning and data reduction for anomaly detection[J] . Terran Lane,Carla E. Brodley.ACM Transactions on Information and System Security (TISSEC) . 1999 (3)
[3]  
Workflow Mining: Discovering Process Models from Event Logs .2 Wil van der Aalst,Ton Weijters,Laura Maruster. IEEE Transactions on Knowledge and Data Engineering . 2004