新闻动态
联系我们
通讯/办公地址:
邮箱:
当前位置: 中文主页 >> 团队动态 >> 新闻动态
实验室一篇论文被Knowledge-based Systems录用
发布时间: 点击次数:

题目:Pseudo-kNN-MT: Enhancing Domain Adaptability of Neural Machine Translation Via Target Language Data

作者:阿卜杜热西提·热合曼,罗应峰,阮俊豪,刘宏宇,肖桐,朱靖波

简介:

为了解决神经机器翻译(NMT)在特定领域双语数据稀缺的情况下的领域适应性难题,

我们在这篇论文中提出了一种名为 Pseudo-kNN-MT 的无需模型训练的方法。

该方法通过从目标语言数据中检索跟待翻译句子语义相似的句子,与源语言句子配对构造“伪双语数据”,并在kNN-MT框架下融合相似翻译知识。

为了有效降低伪数据带来的噪声,我们将跨语言检索的句子相似度信息整合进kNN概率的计算过程中。

实验结果表明,该方法在多种语言对和领域的测试中,无论是在高资源还是低资源场景下,都显著提升了NMT模型的领域适应能力。

这是一种高效、灵活且成本低廉的即插即用型解决方案,有效利用了易于获取的单语数据来增强机器翻译的领域适应性。