面向维汉神经机器翻译的双向重排序模型分析

被引:9
作者
张新路 [1 ,2 ,3 ]
李晓 [1 ,2 ,3 ]
杨雅婷 [1 ,2 ,3 ]
王磊 [1 ,2 ,3 ]
董瑞 [1 ,2 ,3 ]
机构
[1] 中国科学院新疆理化技术研究所
[2] 中国科学院大学
[3] 新疆民族语音语言信息处理实验室
关键词
神经机器翻译; 集成学习; 双向重排序; 维吾尔语;
D O I
10.13209/j.0479-8023.2019.093
中图分类号
H085.3 [两种语言的翻译]; TP391.2 [翻译机];
学科分类号
050211 ; 081203 ; 0835 ;
摘要
在维吾尔语到汉语等低资源语料库上,神经机器翻译的拟合训练容易陷入局部最优解,导致单一模型的翻译结果可能不是全局最优解。针对此问题,通过集成策略,有效整合多个模型预测的概率分布,将多个翻译模型作为一个整体;同时采用基于交叉熵的重排序方法,将具有相反解码方向的翻译模型相结合,最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉平行语料上的实验结果表明,与单一的Transformer模型相比,改进后的方法提升4.82个BLEU值。
引用
收藏
页码:31 / 38
页数:8
相关论文
共 6 条
[1]   面向神经机器翻译的集成学习方法分析 [J].
李北 ;
王强 ;
肖桐 ;
姜雨帆 ;
张哲旸 ;
刘继强 ;
张俐 ;
于清 .
中文信息学报, 2019, (03) :42-51
[2]  
统计自然语言处理[M]. 清华大学出版社 , 宗成庆, 2013
[3]  
Bagging and Boosting statistical machine translation systems[J] . Tong Xiao,Jingbo Zhu,Tongran Liu.Artificial Intelligence . 2012
[4]  
An Empirical Comparison of Voting Classification Algorithms: Bagging, Boosting, and Variants[J] . Eric Bauer,Ron Kohavi.Machine Learning . 1999 (1-2)
[5]  
XMU neural machine translation systems for WMT 17 .2 Tan Z,Wang B,Hu J,et al. Proceedings of the Second Conference on Machine Translation . 2017
[6]  
The university of edinburgh''s neural mt systems for wmtl7 .2 Sennrich,R,Birch,A,Currey,A,Germann,U,Haddow,B,Heafield,K,Miceli Barone,A.V,Williams,P. Proceedings of the Second Conference on Machine Translation . 2017