北邮教师王光宇在Nature子刊连续发表两篇学术成果
时间: 2023-09-19
来源: 教育部
浏览量: 5828
收藏
近日,北京邮电大学信息与通信工程学院、网络与交换技术全国重点实验室王光宇特聘研究员,携手国内外多个生物医学团队开展交叉合作,在基于强化学习的个性化用药策略、病毒进化趋势预测及AI 蛋白设计方面取得重要成果。9月14日,7月31日在《自然-医学》(Nature Medicine)分别以《采用强化学习算法优化2型糖尿病患者的血糖控制:概念验证试验》、《基于深度学习的蛋白质-蛋白质相互作用分析及预测SARS-CoV-2的传染性与变异进化》为题发表两篇以王光宇特聘研究员为一作及通讯作者的重要学术研究论文。
两篇研究工作均获得了国家自然科学基金面上项目、新基石科学基金会所设立的科学探索奖、中国科协青年人才托举工程等项目支持。 图1:《自然-医学》在线发表两篇来自王光宇课题组的论文
论文主要观点如下: 对于慢性疾病的治疗和长期管理中,传统的用药决策很大程度上是基于医生的经验和临床指南来进行。然而,患者代谢环境、药物反应等都存在显著的个体差异,同时疾病具有随时间动态演化的特性,对药物需求也会动态变化,因此如何精确、高效及个体化的调整用药策略一直以来是困扰医学界的难题。 针对这一复杂决策问题,王光宇研究员团队联合复旦大学附属中山医院、牛津大学等机构开发了基于强化学习的动态用药策略工具(RL-DITR)。首先,团队基于海量的电子病历数据构建了预训练语言模型ClinicalBERT,可以有效提取患者的复杂健康记录,如人口统计学信息、既往史、症状、生化指标、药物和胰岛素使用信息,并进一步标准化为多维时序特征表示。在此基础上,团队开发了基于强化学习的动态胰岛素调节方案(RL-DITR),包括一个用于追踪个体血糖状态演变的患者模型(Patient Model)和一个用于长期治疗中进行多步规划的策略模型(Policy Model),这种基于模型的强化方法通过与患者模型的交互并不断迭代来学习最佳治疗策略。为了确保智能决策的安全性,团队还引入了监督学习(SL)与强化学习混合训练策略,以加强临床专业知识约束。为了系统评估模型性能,团队进行了一系列从计算机模拟到临床部署的研究,涵盖了AI与医生的比较验证研究、“人在回路”的前瞻性部署研究、及概念验证的临床试验。结果表明了基于强化学习的动态用药策略工具的潜在价值。研究成果于2023年9月14日在《自然-医学》(Nature Medicine)发表,其中预训练语言模型ClinicalBERT,发布到了Hugging Face,每个月下载量逾1万次。(论文1链接:https://www.nature.com/articles/s41591-023-02552-9) 图2:基于强化学习的智能用药决策方法
自2021年以来,DeepMind 发布AlphaFold2的研究成果,实现了对蛋白质结构的准确预测,其性能与冷冻电子显微镜等实验技术解析的3D结构相媲美,被广泛视为“变革生命科学”的历史性突破。然而,如何从蛋白质序列或结构出发,实现其复杂功能的预测,仍是一个重要挑战。蛋白质之间的相互作用(Protein-Protein Interaction, PPI)及其结合亲和力(Affinity)是探讨生物学活动和功能的关键。这包括但不限于细胞代谢、信号传导、肌肉收缩和免疫系统等过程。在传染病研究中,例如SARS-CoV-2病毒的刺突蛋白(S蛋白)与目标细胞上的血管紧张素转换酶2(ACE2)或中和抗体的相互作用,决定了病毒的受体亲和力和免疫逃逸能力。针对这一核心挑战,王光宇团队提出了一种通用的蛋白质功能分析框架UniBind(见图3),此框架包括将蛋白质表示为残基和原子级别的多尺度图结构、从上述图结构中提取蛋白特征的双路径神经网络BindFormer、以及BindFormer中的几何和能量注意力机制(GEA)模块。为了处理数据的异构性,团队采用多任务学习和模型集成方法训练UniBind,从多源异构的生物数据集中学习相关信息,以增强其预测的鲁棒性。 图3:蛋白质功能分析框架UniBind
团队使用SKEMPI和SKEMPI v.2.0等主要基准数据集进行的系统测试和验证,结果表明UniBind具有准确性、鲁棒性和可扩展性。通过分析全球流感数据库中的六百多万病毒序列,UniBind可预测哪些突变会导致病毒的传染力增加,或使病毒对抗体或疫苗产生抗性(图4)。团队利用此AI系统模拟了三万多株已知的病毒毒株,并正确预测了目前占主导地位的突变株的演变。此外,利用可溶性ACE2作为诱饵蛋白中和SARS-CoV-2感染已是一个可行策略, UniBind采用了计算机模拟演化的方法,筛选了一系列候选蛋白,并通过“湿实验”验证了设计高亲和力的ACE2受体诱饵分子的潜力,这有望成为防治当前和未来病毒变体的通用策略。最后,研究团队还利用UniBind探索了各种β冠状病毒与不同宿主受体的结合能力,这对寻找重大流行病的中间宿主、预测病毒跨物种传播途径具有重要意义。研究成果于2023年7月31日在《自然-医学》(Nature Medicine)发表,此工作为蛋白质与蛋白质复合物的亲和力分析提供了一个通用计算框架,并为未来疫情的早期监控、及加速疫苗和治疗策略的研发奠定了基础。(论文2链接:https://www.nature.com/articles/s41591-023-02552-9)。 图4:病毒进化趋势预测
两篇研究工作均获得了国家自然科学基金面上项目、新基石科学基金会所设立的科学探索奖、中国科协青年人才托举工程等项目支持。 图1:《自然-医学》在线发表两篇来自王光宇课题组的论文
论文主要观点如下: 对于慢性疾病的治疗和长期管理中,传统的用药决策很大程度上是基于医生的经验和临床指南来进行。然而,患者代谢环境、药物反应等都存在显著的个体差异,同时疾病具有随时间动态演化的特性,对药物需求也会动态变化,因此如何精确、高效及个体化的调整用药策略一直以来是困扰医学界的难题。 针对这一复杂决策问题,王光宇研究员团队联合复旦大学附属中山医院、牛津大学等机构开发了基于强化学习的动态用药策略工具(RL-DITR)。首先,团队基于海量的电子病历数据构建了预训练语言模型ClinicalBERT,可以有效提取患者的复杂健康记录,如人口统计学信息、既往史、症状、生化指标、药物和胰岛素使用信息,并进一步标准化为多维时序特征表示。在此基础上,团队开发了基于强化学习的动态胰岛素调节方案(RL-DITR),包括一个用于追踪个体血糖状态演变的患者模型(Patient Model)和一个用于长期治疗中进行多步规划的策略模型(Policy Model),这种基于模型的强化方法通过与患者模型的交互并不断迭代来学习最佳治疗策略。为了确保智能决策的安全性,团队还引入了监督学习(SL)与强化学习混合训练策略,以加强临床专业知识约束。为了系统评估模型性能,团队进行了一系列从计算机模拟到临床部署的研究,涵盖了AI与医生的比较验证研究、“人在回路”的前瞻性部署研究、及概念验证的临床试验。结果表明了基于强化学习的动态用药策略工具的潜在价值。研究成果于2023年9月14日在《自然-医学》(Nature Medicine)发表,其中预训练语言模型ClinicalBERT,发布到了Hugging Face,每个月下载量逾1万次。(论文1链接:https://www.nature.com/articles/s41591-023-02552-9) 图2:基于强化学习的智能用药决策方法
自2021年以来,DeepMind 发布AlphaFold2的研究成果,实现了对蛋白质结构的准确预测,其性能与冷冻电子显微镜等实验技术解析的3D结构相媲美,被广泛视为“变革生命科学”的历史性突破。然而,如何从蛋白质序列或结构出发,实现其复杂功能的预测,仍是一个重要挑战。蛋白质之间的相互作用(Protein-Protein Interaction, PPI)及其结合亲和力(Affinity)是探讨生物学活动和功能的关键。这包括但不限于细胞代谢、信号传导、肌肉收缩和免疫系统等过程。在传染病研究中,例如SARS-CoV-2病毒的刺突蛋白(S蛋白)与目标细胞上的血管紧张素转换酶2(ACE2)或中和抗体的相互作用,决定了病毒的受体亲和力和免疫逃逸能力。针对这一核心挑战,王光宇团队提出了一种通用的蛋白质功能分析框架UniBind(见图3),此框架包括将蛋白质表示为残基和原子级别的多尺度图结构、从上述图结构中提取蛋白特征的双路径神经网络BindFormer、以及BindFormer中的几何和能量注意力机制(GEA)模块。为了处理数据的异构性,团队采用多任务学习和模型集成方法训练UniBind,从多源异构的生物数据集中学习相关信息,以增强其预测的鲁棒性。 图3:蛋白质功能分析框架UniBind
团队使用SKEMPI和SKEMPI v.2.0等主要基准数据集进行的系统测试和验证,结果表明UniBind具有准确性、鲁棒性和可扩展性。通过分析全球流感数据库中的六百多万病毒序列,UniBind可预测哪些突变会导致病毒的传染力增加,或使病毒对抗体或疫苗产生抗性(图4)。团队利用此AI系统模拟了三万多株已知的病毒毒株,并正确预测了目前占主导地位的突变株的演变。此外,利用可溶性ACE2作为诱饵蛋白中和SARS-CoV-2感染已是一个可行策略, UniBind采用了计算机模拟演化的方法,筛选了一系列候选蛋白,并通过“湿实验”验证了设计高亲和力的ACE2受体诱饵分子的潜力,这有望成为防治当前和未来病毒变体的通用策略。最后,研究团队还利用UniBind探索了各种β冠状病毒与不同宿主受体的结合能力,这对寻找重大流行病的中间宿主、预测病毒跨物种传播途径具有重要意义。研究成果于2023年7月31日在《自然-医学》(Nature Medicine)发表,此工作为蛋白质与蛋白质复合物的亲和力分析提供了一个通用计算框架,并为未来疫情的早期监控、及加速疫苗和治疗策略的研发奠定了基础。(论文2链接:https://www.nature.com/articles/s41591-023-02552-9)。 图4:病毒进化趋势预测