天然产物在生命体系中扮演着至关重要的角色,不仅是潜在药物候选物和疾病标志物,也承担着微生物及宿主间通讯的信号功能。然而,这些小分子往往深藏于复杂生物样本中,难以捕捉。如何在海量数据中高效挖掘未知活性成分,是天然产物研究和代谢组学领域面临的长期挑战。
液相色谱-高分辨率质谱联用技术(LC-HRMS)能够在单次分析中获取大量结构信息丰富的二级质谱数据。以GNPS为代表的工具在推动全球天然产物数据共享与分子网络构建方面发挥了重要作用,但目前其分析主要依赖单一的余弦相似度算法,且实验质谱数据库规模仍相对有限,难以实现对复杂化学空间的系统性深度挖掘。
针对这一瓶颈,课题组魏斌老师组在人工智能海洋药物研究领域自主研发了全新的天然产物质谱数据挖掘平台 MSanalyst。该平台整合了超过50万条实验二级质谱及120万条虚拟二级质谱,极大拓展了可用于结构比对与注释的化学空间。研究团队系统评估并优化了46种二级质谱相似性算法,通过大规模注释测试探索算法间的互补性,最终构建出一套高准确度的多算法融合策略,显著提升了未知分子的结构注释能力。为便于科研人员使用,团队同步推出了网页版(https://msanalyst.net/)和本地版(GitHub: https://github.com/WenchYu/MSanalyst)软件,兼顾操作的便捷性与部署的灵活性,以适应不同应用场景下的研究需求。

图 1. MSanalyst工作流程示意图
团队将 MSanalyst 平台应用于稀有放线菌 Kutzneria viridogrisea DSM 43850 的次级代谢产物分析,从中成功发现了一类未被报道的新型芳香糖苷类天然产物——kutznaposides A–F。进一步的多组学整合与生物学研究表明,kutznaposides C–F 起源于一条此前未知的甲萘醌旁路代谢途径。该途径在菌株应对高氧环境、缓解氧毒性损伤中扮演关键角色。值得注意的是,kutznaposides C、D、F 及其前体在体外展现出显著的抗菌活性与良好的抗氧化能力,其抗氧化效果与维生素C相当,体现出潜在的生物医学应用价值。该案例不仅体现了MSanalyst在复杂代谢物挖掘与结构鉴定中的技术优势,也进一步验证了人工智能、天然药物学与生物化学深度融合在解析隐蔽代谢途径、驱动新天然产物发现方面的创新价值。

图 2. 融合多种质谱比对算法发现抗菌和抗氧化的芳香糖苷类新天然产物
该研究以“Targeted discovery of aromatic glycosides with dual detoxification effects via a highly customized molecular networking platform”为题,于2025年12月30日在Cell子刊《Cell Chemical Biology》在线发表,浙江工业大学为第一完成单位。药学院2022级博士生俞文超、协同中心副研究员俞琰垒以及药学院2022级硕士董炳城为共同第一作者;海洋药物团队魏斌副研究员、王鸿教授与美国匹兹堡大学吴祺豪助理教授共同担任通讯作者。本研究得到了国家重点研发计划(2022YFC2804700、2022YFC2804104)、浙江省高校基本科研业务费专项资金(RF-A2022013)、国家自然科学基金项目(42276137)、国家“111计划”(D17012)以及浙江省自然资源开发利用国际科技合作基地的支持。