1.题目:Progressive and Consistent Subword Regularization for Neural Machine Translation
作者: 高永祺,罗应峰,张庆宏,邵惠博,肖桐,朱靖波
简介:我们提出了渐进一致的子词正则化方法(PCSR),在训练过程中将分词的粒度从细到粗渐进地变化,并拉近多种粒度分词之间的一致性,从而使模型充分利用单词内部的语义信息。
2.题目: 《Improving End-to-End Speech Translation with Progressive Dual Encoding》
作者:张润来,陈赛寒,张裕浩,杜扬帆,陈昊,肖桐,朱靖波
简介:提出一种面向端到端 ST 多任务学习范式的渐进式对偶编码方法,通过使用语音文本两个模态的编码器渐进地学习一个统一的表示,避免了多任务学习中跨模态挑战。这种方法在不需要高成本的无监督预训练语音编码器的同时,使用更轻量化的参数量实现了更好的性能。
3.题目:DFS-QA: Dynamic Frame Selection for Better Video Question Answering
作者:任志博,侯宝玉(共一),朱慕华,王会珍,肖桐,朱靖波
简介:以前的视频问答(VideoQA)任务方法依赖于帧级表示或区域级表示来对视频的视觉内容进行编码。其中基于帧级表示的方法主要包含两种策略,一种策略是利用根据固定时间间隔选择的所有帧,另一种策略是选择单个帧来代表整个视频。在本文中,我们排斥这两个极端,并专注于动态选择帧是否可以实现更好性能的问题。为此,我们提出了一种新颖的弱监督动态帧选择方法。此外,为了更好地利用选定的帧,我们利用多实例学习方法来学习基于帧-问题对而不是所有选定帧的整体表示来预测答案。我们在基准数据集MSRVTT、MSVD和NEXT-QA上进行了大量实验,实验结果表明所提出的方法实现了最佳或有竞争力的性能,特别是我们的系统相比其他模型更加简单。