2026年2月7日,由南通大学智能信息研究中心MedAI实验室负责人王理教授组织撰写,张业康为第一作者的题为MolGramTreeNet: A multimodal molecular property prediction model via grammar tree-constrained molecular representation的文章发表在IScience上.
此研究提出了一种新型多模态深度学习模型MolGramTreeNet,该模型创新性地将分子语法树表示与分子图结构表示相结合,通过上下文无关文法(CFG)对SMILES分子序列进行解析,构建分子语法树,从而显式编码分子结构中的化学规则和层次关系。同时,模型利用图卷积神经网络提取分子二维拓扑结构特征,并通过双路径融合框架实现多模态信息协同建模。实验结果表明,MolGramTreeNet在多个分子性质预测基准数据集上均取得优于现有方法的性能,在毒性预测、溶解度预测等任务中表现出显著优势。此外,该模型还具备良好的可解释性,可通过注意力机制识别潜在的有毒官能团,为药物设计和安全性评估提供重要参考。该研究为人工智能驱动的药物发现和分子设计提供了一种新的技术思路.