今日概览
- SEPIA:用合成表位库补抗体训练数据 用 AlphaSeq 实测 2,600 万亲和值,为 1,161 个计算设计复合物提供实验验证。
重点关注
01SEPIA:用合成表位库补抗体训练数据
抗体从头设计模型常因结构-配对训练样本不足而泛化乏力。作者提出用计算设计的“合成表位蛋白”(SEP) 与 VHH 纳米抗体在酵母展示平台 AlphaSeq 上高通量测亲和力,直接为机器学习补充带实验标签的复合物样本。流程产出 2,600 余万次 on-/off-target 亲和值,对应相同数量的 VHH-SEP 伪结构;其中 1,161 个复合物经实验验证为强且特异结合,并附带 >7.5 万个点突变体的亲和数据。将 SEPIA 伪结构并入训练集后,评分模型对从头抗体设计的排序性能优于传统置信指标,显示数据扩增确实可提升模型判别力。
局限在于:所有实验均在酵母表面 in vitro 结合层面完成,缺乏细胞或动物 in vivo 功能验证;测试对象仅限 VHH 类型抗体,对全长 IgG 或其他骨架的适用性未评估;伪结构仍依赖计算预测,尚未与真实晶体结构逐一比对,可能引入系统误差。
今日观察
今日观察
AlphaSeq 一次产出 2,600 万亲和力实测值,为 1,161 个计算设计的抗体-抗原复合物补上实验标签;训练集扩充后,机器学习排序直接优于传统置信指标,提示“高通量实验+AI 再训练”能在 in vitro 阶段就显著拉高命中率。不过数据仅停留在酵母表面结合层面,尚未触及 IgG 可开发性或体内功能,后续仍需补做细胞与动物层级验证。
对 AI 药物发现团队的提示:先锁定可并行放大的一体化实验平台(如 AlphaSeq),用千万级真实亲和值快速回填训练缺口;同步建立“in silico→in vitro→IgG/功能”三段式验证漏斗,把本轮排序模型当成早期过滤器,而非终点决策器,以免在缺乏体内证据时过度优化结合能。
以上内容为个人解读,仅供参考。权威内容请以原论文为准。