实验室一篇论文被Knowledge-based Systems录用
发布时间:
点击次数:
题目:Pseudo-kNN-MT: Enhancing Domain Adaptability of Neural Machine Translation Via Target Language Data
作者:阿卜杜热西提·热合曼,罗应峰,阮俊豪,刘宏宇,肖桐,朱靖波
简介:
为了解决神经机器翻译(NMT)在特定领域双语数据稀缺的情况下的领域适应性难题,
我们在这篇论文中提出了一种名为 Pseudo-kNN-MT 的无需模型训练的方法。
该方法通过从目标语言数据中检索跟待翻译句子语义相似的句子,与源语言句子配对构造“伪双语数据”,并在kNN-MT框架下融合相似翻译知识。
为了有效降低伪数据带来的噪声,我们将跨语言检索的句子相似度信息整合进kNN概率的计算过程中。
实验结果表明,该方法在多种语言对和领域的测试中,无论是在高资源还是低资源场景下,都显著提升了NMT模型的领域适应能力。
这是一种高效、灵活且成本低廉的即插即用型解决方案,有效利用了易于获取的单语数据来增强机器翻译的领域适应性。
下一条:实验室两篇论文被CCMT大会录用
