2025年2月21日,由南通大学智能信息研究中心MedAI实验室负责人王理教授组织撰写,贾奇峰为第一作者的题为Fragment-level feature fusion method using retrosynthetic fragmentation algorithm for molecular property prediction的文章发表在Journal of Molecular Graphics and Modelling上。
这项研究探讨了从多个视角整合分子表示的方法,目前的图对比学习方法大多从分子层面入手,缺乏细粒度的信息。另外,目前的分子性质预测模型缺乏分子多层次的信息。因此RFA-FFM从多视角和多层次提取分子信息,通过结合两种逆合成片段化算法(BRICS和RECAP),并对生成的片段进行对比学习,同时重新处理负样本对,提高对比学习精度。此外,RFA-FFM不仅关注整个分子的表示,还融合了不同层次的分子信息,包括分子整体、BRICS生成的片段和MacFrag生成的更小片段。这种多层次特征融合策略使得模型能够更全面地捕捉分子结构和功能特性。实验表明,RFA-FFM在四个分类基准任务上的表现优于现有最先进的监督学习基线模型,ROC-AUC分数提高了0.3%至2.6%。在回归任务中,误差减少了约0.7%至3%。特别是在乙型肝炎病毒数据集的案例研究中,RFA-FFM的表现比基线模型高出7%至11%。此外,在血脑屏障渗透性任务中,RFA-FFM相较于BPE和CC-Single片段化算法,性能提升了2%至4%,进一步验证了模型融合多视角、多层次分子信息的有效性。