中华网数码

设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 家 电/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机 培训 学校 课程
当前位置:滚动资讯>

清华—安戈普罗垂直机理AI多肽平台实现候选药原生突破

清华—安戈普罗垂直机理AI多肽平台实现候选药原生突破
2026-07-03 21:20:12 来源:百家号

清华,北邮,中科院计算所—安戈普罗垂直机理AI多肽平台实现First-in-class候选药原生突破,构象动力学驱动干湿闭环

“旧结构的崩塌,不是悲剧,而是进化的必须。”

——熊彼得

国内AI制药产业已完成首轮算力竞赛与模型规模化迭代,行业正逐步认识到通用大模型在精细理化建模、柔性分子动力学仿真、难成药靶点构象匹配及体内多约束优化等场景中的系统性局限。通用范式在广谱虚拟筛选、存量结构改造与确定性靶点增量优化方面具备效率优势,但在PPI浅口袋靶点、柔性多肽动态构象演化、酶解稳定性约束、免疫原性脱敏及口服透膜屏障调控等源头创新场景中,存在难以弥合的系统性局限。

依托清华大学、北京邮电大学、北京安戈普罗自研垂直机理AI算法体系共同搭建的多肽智能研发平台,双方已完成多轮干湿实验数据闭环迭代,正式发布平台首条AI原生从头设计、多维度成药性约束同步优化、动态构象适配PPI靶点的原创多肽候选药物。

本次成果标志着国内AI制药在通用统计拟合范式之外,生物机理驱动的精细化原创范式已进入实质性落地阶段,两条技术路径正形成并行互补格局。为此,我们与北京安戈普罗科技有限公司00后CEO单国栋博士进行了深度对话。本次专访系统拆解了底层算法架构差异、多肽分子动力学攻坚难点、干湿数据耦合机制及PPI靶点成药突破逻辑,全维度还原垂直AI制药的硬核技术壁垒。

一、结构药理学维度解析,为何多肽原创必须专用机理模型

【问:从结构药理与大分子生化视角,顶级高校为何选择垂直轻量化AI体系而非通用大模型共建多肽研发底座?】

单博士:多肽兼具小分子结合特性与蛋白级构象复杂度,其成药逻辑显著偏离通用药物数据集的统计分布域。通用大模型基于小分子静态晶体结构做概率拟合,面临四类结构性局限:静态构象先验偏差、柔性自由度欠拟合、溶剂化效应缺失、构象熵变无法量化。具体而言,通用模型无法捕捉多肽在多环境下的多稳态构象跃迁及瞬时二级结构重构,高分虚拟分子普遍存在计算结合能虚高而实测亲和力偏低的共性问题;公开数据集小分子占比超95%,领域偏移导致ADMET模块泛化能力严重不足;以活性单目标优化,无法同步满足亲和力、稳定性、半衰期、穿透效率与免疫原性等多维约束。

安戈普罗的多肽研发体系构建为多来源候选生成、多层次过滤、双模型复评、综合排序与动态验证的完整链路。候选序列通过低编辑距离突变、motif引导扩展、PepMLM条件生成、AngelPocket-Redesign、AngelPeptide-Redesign及AngelDeNovo-Design六种方法并行构建,经基础序列统计、机制一致性分析与可开发性评分三层门控排除高风险序列。结构复评采用AlphaFold Server与Boltz双模型交叉复核,以模型一致性为判断依据;综合排序将结构置信度、界面误差、可开发性、来源逻辑与模型一致性纳入决策,形成四级输出。PLIP、Contact Analysis、FoldX、Ala Scanning与Boltz2构成多证据交叉印证,Amber膜环境MD承担动态验证,整套流程封装为AngelBioDrug-Finding自进化发现平台,以Agent-Swarm DBTL架构承载干湿闭环迭代,每轮结果转化为下一轮候选生成的约束规则。该路线与湿实验体系在学术逻辑上高度耦合,是选择垂直机理路线的核心依据。

【问:联合平台从科研工程层面,解决了传统产学研干实验湿实验数据断层的哪些底层技术问题?】

单博士:传统产学研的核心瓶颈在于数据模态割裂、评价指标不统一与迭代链路开环——高校结构药理侧重晶体解析与构象模拟,工业AI聚焦序列生成与概率筛选,两者缺乏统一的量化衔接标尺。本平台构建多肽专属干湿数据闭环中台,实现三类核心技术打通:

干湿闭环衔接。 候选序列经四级漏斗收敛后,优先候选进入Amber膜环境MD验证动态稳定性与构象响应。MD轨迹中的接触保持率、关键残基占有率及构象开关指标与体外数据逐轮对照,实现计算预测的持续湿实验校准。

可开发性前置拦截。 候选在结构复评前完成可开发性评分,涵盖净电荷、疏水比例、连续疏水片段、特殊残基风险、溶解性、聚集倾向与合成可行性,确保优先候选具备可合成、可纯化、可测试的基本条件。

优化规则闭环回写。 PLIP、Contact Analysis、FoldX、Ala Scanning与Boltz2交叉印证热点残基与相互作用网络,MD进一步揭示动态接触变化,结果统一回写为下一轮设计规则——稳定热点保留,漂移区域优化,高风险模式过滤,形成“设计-筛选-验证-优化”的迭代闭环。

上述机制从根本上改变了传统体系中机理不指导算法、算法不验证机理、结构不匹配功能、虚拟不收敛真实的碎片化研发困境。

【问:平台攻坚周期内,最难突破的技术卡点在结构生物学层面是什么?】

单博士:核心卡点是PPI靶点浅口袋的瞬时构象捕捉与多肽柔性适配的结构建模。该类靶点界面平坦、极性残基密集、构象波动剧烈,与常规小分子靶点的深疏水口袋、固定构象形成鲜明对比,传统固定结构筛选与单模型静态对接在此场景下局限显著。

攻坚思路为将靶点结构环境、天然配体识别先验与多肽构象灵活性共同纳入筛选体系。候选序列通过低编辑距离突变、motif引导扩展、PepMLM条件生成、AngelPocket-Redesign、AngelPeptide-Redesign及AngelDeNovo-Design六种方法并行生成,经三层门控排除高风险序列;结构复评采用AlphaFold Server与Boltz双模型交叉复核,以模型间一致性为判断依据。优先候选进入Amber膜环境全原子MD模拟验证结合稳定性与关键接触保持率;针对靶点属Class A GPCR家族的特性,进一步分析跨膜螺旋胞内侧距离、DRY motif、NPxxY motif及保守色氨酸toggle switch等构象开关,将评估从静态结合假设延伸至活性构象功能假设。

界面机制解释阶段,PLIP、Contact Analysis、FoldX、Ala Scanning及Boltz2构成多证据交叉印证体系,拆解瞬时结合态中的关键相互作用与热点贡献。上述流程已封装为AngelBioDrug-Finding自进化发现平台,以DBTL架构承载全流程,使研发策略具备持续进化能力——这也是本次候选药物突破PPI成药壁垒的核心结构基础。

【问:从药理实验维度,本次AI原生新药相较传统多肽改造药,实验级优势体现在哪些量化指标?】

单博士:传统多肽药物多为天然肽剪切、定点突变或末端修饰的改良型结构,序列创新度低、专利壁垒弱、理化缺陷固有。本次AI从头设计候选药的优势体现在全链路研发逻辑的体系化重构:

候选空间扩展。 传统改造局限于天然序列邻域的保守突变。本平台通过低编辑距离突变、motif引导扩展、PepMLM条件生成、AngelPocket-Redesign、AngelPeptide-Redesign及AngelDeNovo-Design六种方法并行生成,覆盖保守优化、机制先验、结构导向redesign与de novo骨架探索,突破序列创新瓶颈与专利壁垒。

可开发性前置。 传统流程在湿实验试错后才暴露问题。本平台在结构复评前完成可开发性评分,覆盖净电荷、疏水比例、连续疏水片段、特殊残基风险、溶解性、聚集与合成可行性,使高风险理化缺陷在虚拟阶段即被拦截。

双模型交叉验证。 传统虚拟筛选依赖单模型打分,假阳性率极高。本平台采用AlphaFold Server与Boltz双模型复评,仅两个模型均支持相近结合姿态与界面接触的候选方进入后续验证,有效避免单模型偏差。

筛选验证一体化。 本平台以DBTL架构承载从候选生成到MD验证的全流程,每轮结果回写为下一轮设计规则,无效分子在虚拟阶段逐层排除。相较传统3–4年的早期研发周期,平台化流程可将候选发现与验证周期压缩至8个月,虚拟筛选有效命中率提升20倍,湿实验试错分子池压缩90%以上,实现研发效率的范式级提升。

二、算法架构拆解垂直机理模型碾压通用大模型的硬核逻辑

【问:团队坚持轻量化、机理正则化模型架构,与行业主流超大参数通用模型形成差异化路径,底层算法设计逻辑是什么?】

单博士:AI制药行业存在一个普遍误区,即认为参数规模越大、模型越通用,研发效果越好。但多肽属于半柔性生物大分子,其成药逻辑显著偏离通用数据集的统计分布域,通用大模型面临四类结构性局限:静态构象先验偏差、柔性自由度欠拟合、溶剂化效应缺失、构象熵变无法有效量化。

基于此,我们未“放弃”通用模型,而是分层调用、各取所长:

通用序列生成嵌入多来源候选体系。 PepMLM等与结构导向的AngelPocket-Redesign、AngelPeptide-Redesign及AngelDeNovo-Design并行,前者负责序列多样性扩展,后者负责结构环境约束下的精细设计。

结构复评采用双模型交叉验证。 AlphaFold Server与Boltz交叉复核,以模型间一致性判断结构可信度,降低单模型偏差导致的假阳性风险。

可开发性评价前置。 候选在结构复评前完成可开发性评分,覆盖净电荷、疏水比例、连续疏水片段、特殊残基氧化风险、溶解性、聚集与合成可行性,高风险缺陷在虚拟阶段即被拦截。

机理正则化约束嵌入全链路。 PLIP、Contact Analysis、FoldX、Ala Scanning及Boltz2构成多证据交叉印证体系,基于理化规则与能量函数进行热点判断;优先候选进入Amber膜环境全原子MD模拟,基于物理力场完成最终验证。

四层设计的核心逻辑是将通用模型的泛化能力、专业结构预测模型的建模精度、物理力学模拟与理化规则评估,按筛选漏斗递进分层组织,最终汇聚为AngelBioDrug-Finding自进化发现平台。

【问:通用大模型做多肽研发,存在哪些算法层面无法修复的结构性缺陷?】

单博士:通用大模型在广谱虚拟筛选、存量改造等粗筛层面具备效率优势,但在多肽精细研发场景中存在源于底层架构的结构性局限,难以通过微调或增量训练完全弥补:

静态结构假设与多肽柔性本质的冲突。 通用模型多基于静态晶体结构训练,而多肽结合伴随主链二面角与侧链取向的持续演化,静态坐标计算的结合能与真实溶液环境下的动态结合场景存在系统性偏差,导致虚拟命中在湿实验中大量失效。

多肽专属理化特征的学习缺失。 通用数据集以中小分子为主,多肽特有的序列编码逻辑、二硫键配对规则、环肽构象约束、末端电荷分布规律及PEG化、脂肪酸修饰的可合成性预判均不在预训练覆盖范围内。

可开发性多重约束难以纳入统一框架。 多肽成药受制于酶解稳定性、免疫原性风险、聚集倾向及合成纯化难度等多维约束,通用模型以结合活性为单一优化目标,易产出体外活性优异但体内成药不达标的偏科分子。

针对上述局限,我们的策略是将研发流程拆解为模块化链路。候选序列由六种方法并行构建,确保候选空间覆盖机制先验、结构适配与新颖性探索;候选在结构复评前完成可开发性评分,使理化缺陷在虚拟阶段即被识别;结构复评采用AlphaFold Server与Boltz双模型交叉复核,以模型间一致性判断可信度;通过门控的候选经PLIP、FoldX、Ala Scanning、Boltz2及Amber膜环境MD动态验证,完成从静态结构到动态稳定性的完整证据链闭合。

该架构的本质是对通用模型在粗筛层面价值与垂直机理模块在精细建模层面优势的分层利用——两者按筛选漏斗递进逻辑各司其职,非替代关系。

【问:本次PPI难成药靶点攻坚,AI算法实现了哪些传统药研无法完成的结构性创新?】

单博士:传统多肽药物研发依赖天然肽剪切、定点突变或末端修饰,本质是经验驱动的局部优化,搜索空间有限,难以突破天然序列的固有局限。本次研发的系统性突破在于构建“筛选-验证-闭环”技术链路,实现四方面升级:

候选空间从局部优化扩展至全局探索。 六种方法并行构建序列空间,覆盖机制连续性、结构适配与高新颖性探索序列。

从单点活性优化升级为多维度可开发性同步约束。 可开发性评分将净电荷、疏水比例、连续疏水片段、特殊残基风险、合成可行性等多维约束前置。

静态结合假设升级为动态构象适配验证。 AlphaFold Server与Boltz双模型复评结合Amber膜环境MD验证动态稳定性,针对Class A GPCR特性追踪构象开关变化,将评估从“是否结合”延伸至“是否支持活性构象”。

多证据交叉印证取代经验直觉。 PLIP、Contact Analysis、FoldX、Ala Scanning及Boltz2形成多工具一致证据链,使热点判断具备可追溯、可复核的数据支撑。

四层创新已封装于AngelBioDrug-Finding自进化发现平台,以DBTL架构实现规则回写,在多肽柔性适配、PPI平面界面锚定及多维度成药性同步优化中展现出传统模式难以复现的系统性能力。

【问:如何从技术终局视角,界定通用工业化AI与垂直机理AI的产业技术边界?】

单博士:需明确的是,两条路线非替代关系,而是研发链路中不同层次的分工。通用大模型在广谱虚拟筛选、存量改造等粗筛层面具备效率优势,但在多肽柔性构象演化、PPI浅口袋适配、可开发性多约束同步优化等场景中面临四类结构性局限:静态构象先验偏差、柔性自由度欠拟合、溶剂化效应缺失、构象熵变无法有效量化。

我们的研发架构分层调用、各取所长:候选生成阶段PepMLM等通用模型负责序列多样性扩展,AngelPocket-Redesign、AngelPeptide-Redesign及AngelDeNovo-Design负责结构环境约束下的精细设计;结构复评以AlphaFold Server与Boltz双模型交叉复核、模型间一致性为判断依据;可开发性评估、机制解释与动态验证回归理化规则、能量函数与全原子物理力场。

通用路线解决“效率与覆盖”,垂直路线解决“精度与突破”,两者在产业层面构成完整互补——通用模型拓宽搜索边界,垂直机理模块完成从静态结构假设到动态构象适配的证据链闭合,使源头创新具备可追溯、可复核、可进化的研发基础。完备的多肽智能研发系统需要二者有机结合,而非相互替代。

三、新药研发工程上的多维度成药性闭环的实操技术突破

【问:在湿实验落地层面,AI解决了哪些传统药研经验盲区与工程瓶颈?】

单博士:传统多肽研发高度依赖科研人员经验与文献先验,在序列设计、修饰位点选择及工艺评估等环节存在较大试错空间,难以系统化覆盖高维组合空间。本平台实现以下系统性覆盖:

多来源生成扩展搜索空间。 六种方法并行构建候选库,覆盖保守优化、机制先验、结构导向redesign与de novo骨架探索,突破经验主导的局部搜索边界。

可开发性前置拦截。 候选在结构复评前完成可开发性评分,覆盖净电荷、疏水比例、连续疏水片段、特殊残基风险、溶解性、聚集与合成可行性,高风险缺陷在虚拟阶段即被识别拦截。

双模型复评降低假阳性率。 AlphaFold Server与Boltz以模型间一致性为推进依据,仅两者均支持相近结合姿态的候选方进入湿实验验证,避免单模型偏差。

筛选验证一体化压缩试错轮次。 平台以DBTL架构承载全流程,每轮结果回写为下一轮规则,无效分子在虚拟阶段逐层排除,湿实验试错分子池压缩90%以上,改变传统“合成-测试-失败-重新设计”的碎片化模式。

【问:干湿闭环迭代机制具体如何运转?多轮迭代对模型精度提升的技术价值是什么?】

单博士:本平台的干湿闭环迭代以DBTL为内核,是持续进化机制,非预设轮次的线性流水线。

Design阶段:基于上一轮设计规则,由六种候选生成方法并行构建新一轮候选空间。

Build阶段:候选序列经基础质量与机制一致性分析完成标注,进入可开发性评分,系统评估净电荷、疏水比例、连续疏水片段、特殊残基风险、溶解性、聚集与合成可行性,通过者进入结构复评。

Test阶段:候选经AlphaFold Server与Boltz双模型交叉复评,综合排序确定优先候选;其后经PLIP、Contact Analysis、FoldX、Ala Scanning及Boltz2多证据交叉印证拆解界面机制,再经Amber膜环境全原子MD模拟验证结合稳定性与构象响应。

Learn阶段:MD轨迹指标与FoldX能量变化、Ala Scanning热点分级、PLIP接触网络共同回写为下一轮设计规则——稳定热点保留,漂移区域优化,高风险模式过滤,生成策略降权或调参,使湿实验数据持续转化为生成边界约束。

整个机制依托AngelBioDrug-Finding平台的Agent-Swarm DBTL架构承载运行,各Agent输出写入统一候选ID体系,确保每轮迭代决策可追溯至具体实验数据与结构证据。

【问:跨学科研发过程中,如何解决算法优化目标与药学成药目标不统一的技术矛盾?】

单博士:算法优化目标与药学成药目标之间的冲突,本质上是可计算的损失函数与多维度、多尺度临床评估体系之间的偏离,这也是多肽AI研发中假阳性率高、湿实验通过率低的核心原因之一。针对这一矛盾,我们的研发体系从三个层面实现协同:

将成药性约束前置为硬性门控。 候选在进入结构复评前即完成序列可开发性评分,覆盖净电荷、疏水比例、连续疏水片段、特殊残基氧化风险、溶解性、聚集与合成可行性——这些指标即为成药性约束在虚拟阶段的直接映射。评分不达标者不进入后续高成本复评与湿实验,从源头确保算法优化空间被限定在实验可行子集内。

综合排序阶段以多指标联合决策取代单目标优化。 候选经AlphaFold Server与Boltz双模型复评后,不依赖单一结构分数,而是将结构置信度(ipTM、链间PAE_min、pLDDT)、模型一致性、可开发性评分、来源逻辑与机制一致性共同纳入排序,要求候选在结构可信度、理化可开发性和机制解释性三个维度均达可接受水平。

闭环回写机制使湿实验数据持续校准算法边界。 每轮MD验证中的接触保持率、构象开关指标及FoldX能量变化、Ala Scanning热点分级、PLIP接触网络共同回写为下一轮设计规则——稳定热点保留,漂移区域优化,高风险模式过滤——使生成空间随湿实验数据注入逐步收敛至成药可接受边界。

上述机制共同封装于AngelBioDrug-Finding平台,以DBTL架构承载完整闭环,使算法优化持续逼近结构可适配、序列可合成、动态可稳定、机制可解释的四维成药空间。

四、产业范式与未来管线:国产多肽AI原研的技术终局

【问:这套高校机理底座+垂直AI算法+干湿闭环管线的模式,具备怎样的行业可复制技术范式?】

单博士:本项目沉淀的核心价值在于一套可拆解、可迁移、可进化的多肽智能研发系统架构,其可复制性体现在三个层面:

模块化技术链路可适配不同靶点。 各模块通过统一ID体系与结构化数据表解耦,面对新靶点仅需替换靶点结构信息、天然配体先验及motif规则,核心逻辑可直接复用。

DBTL闭环赋予平台自进化能力。 每轮筛选与验证结果转化为下一轮生成约束,沉淀为平台知识资产,使后续项目筛选边界持续收窄,实现动态进化。

可解释证据链支撑跨团队协作与决策追溯。 全链路证据以结构化表记录,决策可追溯至具体数据与模型输出,支撑多学科团队在同一数据语言下协作。

该范式提供可复用、可积累、可追溯的研发操作系统,而非“万能模型”。企业可直接部署已验证架构,将资源集中于靶点特异的机理理解与候选优化。

【问:平台未来技术迭代与管线攻坚的硬核规划?】

单博士:技术迭代聚焦三个方向,均围绕多肽药物研发的真实瓶颈:

口服多肽AI预测升级。 口服多肽面临胃肠道穿透、pH耐受、蛋白酶抗性等多重约束,设计空间与注射肽差异显著。将在现有可开发性评分框架中补充口服专属理化评估模块,使早期筛选即纳入透膜与代谢稳定性约束。

长效化修饰位点系统优化。 脂肪酸链、PEG、融合蛋白等修饰的位点选择对活性保持与半衰期影响显著。将依托MD验证中构象稳定性与接触保持率分析框架,建立修饰位点与结合界面、构象稳定性之间的系统评估链路,支持长效化理性设计。

环肽与复杂拓扑结构原生生成。 环肽在构象预组织与代谢稳定性方面具备优势,但拓扑约束对生成算法与结构建模要求更高。将在AngelDeNovo-Design骨架生成框架基础上扩展环肽专属构象约束与可开发性评价规则,实现环肽、嵌合肽等复杂拓扑的原生生成与筛选。

管线层面,平台将持续输出AI原生序列、自有专利骨架及差异化理化特征的新颖候选分子。随着通用AI制药算力规模化红利趋于平缓,机理深度、结构原创、成药真实性及工艺可实现性将成为下一阶段AI制药的核心壁垒。以安戈普罗AngelBioDrug-Finding自进化发现平台为代表的垂直机理路线,正为这一阶段提供可追溯、可复核、可进化的工业级研发底座。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

责任编辑:kj006

文章投诉热线:157 3889 8464  投诉邮箱:7983347 16@qq.com

关键词:

畅玩3A大作!HyperX暗影精灵PRO 16高能来袭,8k-1.2w价位段优选

2026-06-26 14:13:34畅玩3A大作!HyperX暗影精灵PRO 16高能来袭,8k-1.2w价位段优选

AMD锐龙7 5800X3D十周年版正式开售:2599元规格不变

2026-06-26 14:04:18AMD锐龙7 5800X3D十周年版正式开售:2599元规格不变

AMD新驱动实测:RX 7900 XTX游戏帧率翻倍!

2026-06-25 14:02:44AMD新驱动实测:RX 7900 XTX游戏帧率翻倍!

罗技K828有线背光机械键盘上市,到手低至179.1元

2026-06-24 15:03:53罗技K828有线背光机械键盘上市,到手低至179.1元

相关资讯