• 团队介绍
  • 成员介绍
  • 成果展示
  • 团队新闻

临床前

  • a.论文
  • b.专利
  • c.落地

临床中

  • a.论文
  • b.专利
  • c.落地

临床后

  • a.论文
  • b.专利
  • c.落地

药物临床前

a.论文

[1] Sanjeevi Pandiyan, Tiantian Ruan, Zhuheng Zhong, Min Yao, Li Wang#,Modeling 3D structures of PIK3CA and PIK3R1 genes based on homology modeling, molecular docking, molecular dynamics and MM-GBSA study against breast cancer: Insights from an in-silico approach,Journal of Molecular Structure,2025,1331,141580,doi:10.1016/j.molstruc.2025.141580.中科院2区,JCRQ1.

[2] Sanjeevi Pandiyan, Li Wang#. In-silico design of novel potential HDAC inhibitors from indazole derivatives targeting breast cancer through QSAR, molecular docking and pharmacokinetics studies. Comput Biol Chem. 110:108035. doi: 10.1016/j.compbiolchem.2024.108035. 中科院4区,JCRQ2.

[3] Yajie Hao, Xing Chen, Ailu Fei, Qifeng Jia, Yu Chen, Jinsong Shao, Sanjeevi Pandiyan and Li Wang#. SG-ATT: A Sequence Graph Cross-Attention Representation Architecture for Molecular Property Prediction. Molecules, 2024, 29, 492. doi:10.3390/ molecules29020492中科院2区,JCRQ1.

[4] Zeyu Yin; Yu Chen; Yajie Hao; Sanjeevi Pandiyan; Jinsong Shao; Li Wang#; FOTF-CPI: A compound-protein interaction prediction transformer based on the fusion of optimal transport Fragments, iScience, 2024, doi:10.1016/j.isci.2023.108756. 中科院2区,JCRQ1.

[5] Jinsong Shao; Qifeng Jia; Xing Chen; Yajie Hao; Li Wang#; Molecular fragmentation as a crucial step in the AI-based drug development pathway, Communications Chemistry, 2024, doi:10.1038/s42004-024-01109-2. 中科院1区TOP,JCRQ1.

[6] Jingsong Shao; Qineng Gong; Zeyu Yin; Wenjie Pan; Sanjeevi Pandiyan; Li Wang#; S2DV: converting SMILES to a drug vector for predicting the activity of anti-HBV small molecules, Briefings in Bioinformatics, 2022, doi:10.1093/bib/bbab593, (IF13.99),TOP 中科院2区,JCRQ1.

[7] Sanjeevi Pandiyan, Li Wang#. A comprehensive review on recent approaches for cancer drug discovery associated with artificial intelligence. Computers in Biology and Medicine. 150:106140. doi: 10.1016/j.compbiomed.2022.106140. (IF6.70)中科院2区,JCRQ1.

[8] Li Wang, Min Yao, Wenjie Zheng, Miao Fang, Mengna Wu, Jianying Sun, Zhizhen Dong, Dengfu Yao. Insulin-like Growth Factor I Receptor: A Novel Target for Hepatocellular Carcinoma Gene Therapy. Mini-Rev Med Chem. 2019; 19(4): 272-280 (IF2.842) JCR3区.


b.专利

[1] 基于表示学习的抗HBV小分子药物预测模型及其构建方法20211111940379 授权2024年.

[2] 一种基于Ising模型的无监督词嵌入表示学习方法2021107260423 基于物理化学属性的词向量表示学习方法 授权2023年.

[3] 一种基于神经网络语言模型的药物潜在不良反应发现方法2019100394754 基于神经网络的语言模型 授权2023年.

[4] 一种基于注意力机制的医疗实体向量转化方法2019106440031 基于注意力机制的医疗实体向量转化方法 授权2023年.


c.项目


药物临床中

a.论文

[1] Wang L, Liu Q and Yao M Editorial: Molecular innate immunity and AI data analysis in hepatic diseases. Front. Immunol. 14:1276111.doi: 10.3389/fimmu.2023.1276111 (IF7.23)中科院2区,JCRQ1.


b.专利


c.项目

[1] 基于自然语言处理的电子病历分析 2022-2023 合作公司:杭州璞睿生命科技有限公司

· 实现患者电子病历EMR医学文本的分层级隐私脱敏,Acc>98%;

· 实现医学文本四个场景多个信息的自动抽取,包括基因和药物名称、骨髓、血象和不良事件等,Acc>95%;

· 构建基于诊断、药物、检验与症状四大类的医学知识库,并实现对14类医学实体自动识别与抽取,F1>90%;

· 基于医学知识库,实现对患者的自动筛选与分类,能够在全院级别180万患者EMR上按照临床试验的纳排条件进行快速筛选。

    医学实体9类,分别是疾病、临床表现、医疗程序、医疗设备、药物、医学检验项目、身体、科室、微生物。

    医学属性5类,分别是疾病属性、临床表现属性、药物属性、医学检验项目属性、医疗程序属性

· 基于医学知识库,实现对患者的自动筛选与分类,能够在全院级别180万患者EMR上按照临床试验的纳排条件进行快速筛选。


药物临床后

a.论文

[1] Li Wang, Jiang L, Pan D, Wang Q, Yin Z, Kang Z, Tian H, Geng X, Shao J, Pan W, Yin J, Fang L, Wang Y, Zhang W, Li Z, Zheng J, Hu W, Pan Y, Yu D, Guo S, Lu W, Li Q, Zhou Y, Xu H. Novel Approach by Natural Language Processing for COVID-19 Knowledge Discovery, Biomedical Journal. 2022, DOI: 10.1016/j.bj.2022.03.011. (IF7.89) 中科院2区,JCRQ2.

[2] Heming Bai, Lei Jiang, Ting Li, Chong Liu, Xiaoxia Zuo, Yi Liu, Shaoxian Hu, Linyun Sun, Miaojia Zhang, Jin Lin, Weiguo Xiao, Qingwen Wang, Dongbao Zhao, Huaxiang Wu, Xiaodan Kong, Wenkang Gao, Wanxin Hou, Myeongsu Seong, Yuanpeng Zhang, Fangfang Chen, Sheng Chen, Xin Wu, Chunde Bao#, Li Wang#, Huji Xu#. Acute effects of air pollution on lupus nephritis in patients with systemic lupus erythematosus: A multicenter panel study in China. Environmental Research, 2021, 195, DOI:10.1016/j.jes.2021.01.022.( IF 8.43)JCR1区.

[3] Li Wang, Qinghua Wang,Heming Bai,Cong Liu,Wei Liu,Yuanpeng Zhang,Lei Jiang, Huji Xu, Kai Wang and Yunyun Zhou. EHR2Vec: representation learning of medical concepts from temporal patterns of clinical notes based on self-attention mechanism, Frontiers in Genetics, DOI: 10.3389/fgene.2020.00630 (IF4.599) JCR2区.

[4] Li Wang; Wenjie Pan; QingHua Wang; Heming Bai; Wei Liu; Lei Jiang; Yuanpeng Zhang; A Modified Skip-Gram Algorithm for Extracting Drug-Drug Interactions from AERS Reports, Computational and Mathematical Methods in Medicine, 2020, doi:10.1155/2020/1747413 (IF2.24)JCR4区.

[5] Wang L, Zhang Y, Jiang M, Wang J, Dong J, Liu Y, Tao C, Jiang G, Zhou Y, Xu H. Toward a normalized clinical drug knowledge base in China - applying the RxNorm model to Chinese clinical drugs. J Am Med Inform Assoc. 2018 Jul 1;25(7):809-818.( IF4.27 )Top JCR2区.


b.专利


c.项目

[1] 益赛普治疗类风湿关节炎及强直性脊柱炎真实世界研究项目 2021-2024 合作公司:上海三生国建制药有限公司

对2010年至2017年来强直性脊柱炎(AS)与类风湿关节炎(RA)数据质量的测试,收集临床实践中规范治疗使用药物数据在RA及AS覆盖率及相关临床检测指标;与10家医疗机构(三级甲等)进行沟通对接,收集临床数据。运用临床药物大数据研究的方法,将RA和AS临床实践中所观察的指标(生命体征,评估指标,实验室指标,影像学指标及相关体征),疗效评估及用药情况进行整理并建立数据库。生成2010年至2017年关于强直性脊柱炎(AS)与类风湿关节炎(RA)临床诊疗相关的数据报告,包括常规的诊疗路径及益赛普的治疗路径等;更新临床药物分析的工具,目地使得准确度与召回值都提高5百分点左右;将药物标准库NCCD完全纳入OHDSI术语标准库,在OHDSI 年会上开展讲座,交流药物名称标准化映射软件的使用。

 

[2] 国家自然科学基金,面上项目(81873915),面向信息交互的中国临床标准药物知识库构建与评测研究 2018-2022

为了使得不同系统之间能够有效地无歧义地交换药品相关信息,项目通过借鉴国外成熟的药物信息模型,针对中国临床药物的描述特点,构建中国临床标准药物知识库。研究从四大数据源搜集药物的基本信息,然后将自然语言处理技术和领域专家审查相结合,实现药物属性提取,标准化,生成不同规格级别的药物名称描述,从多角度多层次构成药物知识库。目前药物知识库包含19,639种临床药物,250,267条药物概念以及2,602,760条药物关系。我们将药物知识库应用于江苏省人民医院院内药品与药物知识库进行映射、转换成通用数据模型中标准概念,用于后期药物统计与数据挖掘。实验结果表明,药物知识库可以准确描述规范化的药物信息,覆盖大部分药物资源,展示其促进中国各种电子病历系统之间药物信息互操作性的能力。

 

[3] 科技部国家重点研发计划,基于人工智能的临床辅助决策支持新型服务模式解决方(2018YFC0116902),2018-2020

建立临床文本中辅助决策支持概念的标准化映射,将临床指南转化为临床知识库体系;基于多种决策支持模型的新一代人工智能技术实现,搭建满足就医闭环流程需求临床辅助决策专家系统大数据云技术平台。研究临床医学文本的存储、管理与分析智能化流程,尤其是解决实现多中心临床数据的高速传输、云端管理与分析完整流程;在统一数据标准化框架下,开发临床辅助决策专家系统;研发新一代人工智能计算框架、算法与模型,实现知识的排列,索引与展现;分析满足智能辅助分诊、问诊、诊断和治疗的多致病性因素的分布规律。

 

[4] 中国国家肿瘤中心肿瘤大数据平台数据库建设以及肿瘤数据商业化应用 2017-2018 合作公司:神州数码医疗科技股份有限公司

· 数据采集

安徽、湖南、徐州、新疆、重庆、哈尔滨、甘肃新增数据采集,完成新疆、甘肃、哈尔滨数据上传。与辽宁、云南、徐州肿瘤医院讨论辐射区域数据采集方式。

· 肿瘤数据库分析

核查标准模型正确性并统计各字段数据量(包含有效值、无效值、空值、总数):

病案首页:(1)对约300万条的病案首页数据的35个字段进行数据清洗;(2)梳理并确定病案首页16个省的病案号处理规则;(3)制作国籍字典表,包含大洲、地区、国家名称中文、国家名称英文、国家名称缩写。

患者级数据统计:梳理各省份数据在标准模型中的关联关系,进行徐州、甘肃、湖南、河南、哈尔滨、重庆、安徽、山东、新疆、江苏、辽宁(沈阳)、北京、山西、吉林、云南、河北,一共16个省的患者级数据统计。统计标准模型中16个省各表(每个省11个表)有效患者数、有效数据条数、有效数据对应的时间段。

患者级数据服务平台设计:(1)撰写《患者级肿瘤数据服务平台需求文档》,包含数据调用逻辑,功能需求等。(2)完成原型图,包含病案首页、入院记录、首次病程、日常病程、手术记录、出院记录、检查报告、医嘱共8个页面。

完成了医学肿瘤患者信息展示平台的后台服务端搭建和接口设计,完成了后台代码开发,编写了示范代码。

收集肺癌、食管癌、肝癌、胃癌、结直肠癌、乳腺癌等8 种常见等恶性肿瘤的临床电子病历文本,结合病理科和检验科以及医嘱文本,建设标准化和可共享的病历文本集成平台;利用自然语言处理和电子病历信息抽取等关键技术进行大规模数据抽取。实现肿瘤大数据高性能处理分析与具体应用。整合SNOMET CT,CHPO,LOINC等多个术语系统,开发针对肺癌、食管癌、肝癌、胃癌、结直肠癌、乳腺癌等8 种常见等恶性肿瘤的专用术语体系,协助进行电子病例的结构化和数据提取。对癌症知识,采用本体技术进行研究和分析,构建癌症本体模型。协助建立肿瘤医疗随访平台,临床决策支持平台。优化肿瘤精准医学大数据存储技术及传输安全性。

制定数据清洗逻辑及校验标准并撰写《数据清洗逻辑及数据校验》文档(1)病案首页清洗,包含191个字段清洗规则、24个数据校验规则;(2)各省标准模型关联,标准库入库清洗(3)标准模型清洗、规则:单表数据校验:共24个,涉及31个字段项;多表关联数据校验:共20各个,涉及22张数据表,79个字段项。

· 医学自然语言处理相关工作

撰写病种和身体结构的标注规则2份;标注现病史100份;设计NLP展示平台的表结构及字段1份。

整理常见癌种涉及的人体解剖部位字典表1份。

诊断信息提取:侧性+身体部位+亚型修饰语+癌/恶性肿瘤的提取。并根据亚型修饰语判断肺癌的亚型。

现病史事件流分析:时间点识别,识别患者的检测事件、治疗事件,根据时间节点对现病史进行切分。

现病史中肿瘤标志物提取:EGFR、ALK是否经过基因突变检测,检测结果以及EGFR的突变位点信息提取。乳腺癌患者ER、PR、HER2的检测方式以及检测结果提取。

化疗方案提取:乳腺癌、肺癌常见化疗方案、化疗药物的提取。并根据现病史事件流结果判断化疗是否为新辅助化疗。

个人史:吸烟史、月经史等的提取。

肝癌评分:KPS、ECOG评分等的提取。

分期提取:TNM分期,肝癌Child-pugh分级。

搭建了tensorflow和keras机器学习框架来提升工作效率和准确率,并将深度学习算法应用于自然语言处理领域,尤其在医学NER(命名实体识别)上使用了主动学习算法。


地址: 中国江苏省南通市崇川区崇川路 58 号南通产业技术研究院 4 号楼 14 楼,邮编226000

邮箱: wangli@ntu.edu.cn 电话: +86-15951318963

版权 © 2009-2024 Med-AI课题组, 南通大学