Chem Sci | 上海药物所合作开发糖结合口袋预测与分析在线服务平台
2025年5月27日,上海交通大学医学院程曦研究员课题组与中国科学院上海药物研究所郑明月研究员课题组、信息化管理处的合作成果在线发表在Chemical Science杂志上。成果以“GlycanInsight: an open platform for carbohydrate-binding pocket prediction and characterization”为题,介绍了一种深度学习驱动的糖结合口袋预测与分析在线服务平台GlycanInsight,为糖功能机制研究和药物开发提供精准高效的工具。
糖不仅是生命活动的能量来源,更是调控免疫应答、细胞分化、神经发育等关键过程的“信号兵”。然而,糖类的复杂多样性让科学家们难以精确捕捉它们与蛋白质的结合位置——这些信息恰恰是开发糖类药物的核心钥匙。更棘手的是,传统配体结合口袋预测工具对糖类束手无策。已有的算法准确度普遍低于30%,马修斯相关系数(MCC)不足0.4。
糖科学的发展长期受制于开放、精准且易用计算工具的匮乏。研究团队推出 GlycanInsight——一个用户友好的开放式计算平台,集成了DeepGlycanSite算法以实现精准的糖结合位点预测,并将预测位点聚类为三维口袋,以实现糖结合口袋特征分析、相似蛋白质搜索和潜在配体预测(图1)。该平台提供交互式图形用户界面,支持从结构和序列两个层面展示预测结果,同时提供详细的糖结合口袋信息和可能结合的配体(图2)。除了在线可视化工具,系统还支持下载PyMOL脚本以供离线查看,所有预测、分析和可视化结果均可从结果页面下载。
在实验解析结构数据集T145上,GlycanInsight 的各项评估指标均显著优于其他工具,平均MCC 和精确率超 0.6,而其余工具则不足0.4;在 AlphaFold2预测结构数据集 T145AF2上,GlycanInsight 的平均 MCC 达 0.53、精确率达 0.48,表现依旧领先。GlycanInsight在实验结构和AlphaFold2预测结构中均能精准识别糖结合口袋,充分展现其良好的泛化能力。此外,GlycanInsight比其他算法能更精准地预测单糖、二糖和寡糖等代表性糖的结合口袋。
GlycanInsight提供免费易用的在线平台,专注于糖结合口袋预测分析,性能超越同类计算工具,可高精度预测各类糖分子的结合口袋。平台通过图形界面可视化结果,整合进化保守性计算及潜在糖配体预测功能,广泛适用于糖与蛋白质相互作用机制解析、功能注释及药物设计。研究者无需编程,上传蛋白序列或结构即可获精准预测。该平台结合精准预测与自动化功能,为糖科学基础研究及糖调控靶向疗法开发提供技术支持。随着此类AI技术的进步,曾被长期视为生命“暗物质”的糖类世界,其神秘面貌正被逐步照亮。
上海药物所/中国科学院大学杭州高等研究院联合培养硕士研究生储沁钰、上海药物所博士研究生何欣恒以及信息化管理处谈欣怡为本文共同第一作者;上海交通大学医学院药物学与人工智能交叉学系程曦研究员和上海药物所郑明月研究员为本文共同通讯作者。该研究得到上海药物所“糖测序联合攻关团队”的支持和帮助,得到上海市市级科技重大专项、中国科学院战略性先导科技专项、国家重点研发计划、中国科学院青年创新促进会和上海市东方英才计划的资助。
原文链接:https://pubs.rsc.org/en/content/articlelanding/2025/sc/d5sc02262b
图1. GlycanInsight工作流程。该平台可利用用户上传的PDB格式三维蛋白质结构文件(或PDB ID)进行预测。如果没有蛋白质结构文件,用户可以输入 UniProt ID,由GlycanInsight获取AlphaFold2 预测结构进行结合口袋预测。用户还能通过上传 SDF、PDB 或 Mol2 格式文件,提供糖类配体的二维结构信息。
图2. GlycanInsight具有用户友好型图形界面。
(供稿部门:郑明月课题组)