雷达信号处理重点实验室陈渤教授团队研究成果被顶会NeurIPS2022录用
(通讯员 徐逸石 王东升)近日,第36届神经信息处理系统大会(Advances in Neural Information Processing Systems,简称NeurIPS,https://nips.cc/)公布了其论文录用结果。作为国际公认的人工智能和机器学习领域顶级会议,NeurIPS大会每年都吸引了学术界和工业界的广泛关注,其收录的论文也代表了领域当今最前沿的研究成果。本次,雷达信号处理国家级重点实验室陈渤教授团队共有三篇文章被NeurIPS2022录用,包括博士生王东升与徐逸石相互合作的两项研究成果,分别为《Knowledge-Aware Bayesian Deep Topic Model》和《HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding》以及本科毕业于我校“毕德显班”的李晔文与团队毕业生、目前在新加坡南洋理工做博士后的王超杰合作完成的《Alleviating Posterior Collapse in Deep Topic Models via Policy Gradient》。
近年来,陈渤教授团队在认知概率模型研究领域持续发力。多项研究成果延续了团队在ICML2022、ICLR2022和NeurIPS2021的系列工作,为深度概率模型引入领域知识提供了前沿的理论指导,并进一步提升了模型推理速度和算法灵活性,向模型实用性和落地迈进了一步。
王东升与徐逸石合作的《Knowledge-Aware Bayesian Deep Topic Model》提出了一种在概率建模过程中引入先验领域知识的新方法,可以帮助模型学习到更加符合人类认知的层次化概念表示。与完全基于数据似然的方法不同,本文所提出的模型通过将单词和主题嵌入到同一向量空间中从而实现对文档和先验知识的联合建模。基于图卷积神经网络的编码器使得语义相似的主题和单词之间可以进行信息交换。此外,借助先进的自适应图技术,本文还提出了一个模型的扩展版本,该扩展旨在引导模型对所提供的先验主题结构进行完善以匹配目标语料库。模型的主要思想如下图所示。
另一工作《HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding》同样由徐逸石和王东升合作完成。鉴于欧式空间在表达层次关系方面的基本限制,本文提出了一种基于双曲嵌入的知识表示方法。双曲空间是一种曲率为负常数的空间,拥有与树结构相类似的性质,因此在表示层次化数据方面有着天然的优势。本文提出的模型将单词和主题嵌入到同一双曲空间,利用双曲空间中特殊的距离度量来挖掘单词之间的语义层级关系,进而帮助模型发现数据中更加可解释的概念。此外,考虑到实际应用中先验知识对提升模型性能的重要性,本文进一步提出了一个基于对比学习思想的正则项,它可以有效地将外部结构化的知识注入模型当中从而引导模型挖掘出用户所感兴趣的概念关系图。模型的整体结构如下图所示。
值得注意的是,电子工程学院2017级李晔文同学本科毕业于我校“毕德显班”(现已前往新加坡南洋理工大学攻读博士),他将自己在陈渤教授指导下开展的本科毕设研究成果进一步完善,也成功被 NeurIPS2022录用。一方面体现了学校及学院对本科生全面素质教育的重视,反映了雷达信号处理国家级重点实验室对“毕德显班”本科生人才培养工作的支持与成效。另一方面也为“毕德显班”的后辈树立了榜样,为本科生科研道路规划提供了指引,希望能激励本科生在学有余力的情况下尽早接触科研,以兴趣为动力,更好地驱动科研创新。