SEPIA合成表位库填补抗体数据缺口，曲线下面积提升8.4%

今日概览

SEPIA：用合成表位库补抗体训练数据 用 AlphaSeq 实测 2,600 万亲和值，为 1,161 个计算设计复合物提供实验验证。

重点关注

01SEPIA：用合成表位库补抗体训练数据

抗体从头设计模型常因结构-配对训练样本不足而泛化乏力。作者提出用计算设计的“合成表位蛋白”(SEP) 与 VHH 纳米抗体在酵母展示平台 AlphaSeq 上高通量测亲和力，直接为机器学习补充带实验标签的复合物样本。流程产出 2,600 余万次 on-/off-target 亲和值，对应相同数量的 VHH-SEP 伪结构；其中 1,161 个复合物经实验验证为强且特异结合，并附带 >7.5 万个点突变体的亲和数据。将 SEPIA 伪结构并入训练集后，评分模型对从头抗体设计的排序性能优于传统置信指标，显示数据扩增确实可提升模型判别力。

局限在于：所有实验均在酵母表面 in vitro 结合层面完成，缺乏细胞或动物 in vivo 功能验证；测试对象仅限 VHH 类型抗体，对全长 IgG 或其他骨架的适用性未评估；伪结构仍依赖计算预测，尚未与真实晶体结构逐一比对，可能引入系统误差。

用 AlphaSeq 实测 2,600 万亲和值，为 1,161 个计算设计复合物提供实验验证。扩充训练集后，机器学习模型在抗体设计排序上优于传统置信指标。仅完成酵母表面 in vitro 结合测试，未覆盖 IgG 及体内功能验证。

原文：The Synthetic Epitope Atlas: High-Throughput Design and Validation of De Novo Antibody-Antigen Complexes

今日观察

今日观察
AlphaSeq 一次产出 2,600 万亲和力实测值，为 1,161 个计算设计的抗体-抗原复合物补上实验标签；训练集扩充后，机器学习排序直接优于传统置信指标，提示“高通量实验+AI 再训练”能在 in vitro 阶段就显著拉高命中率。不过数据仅停留在酵母表面结合层面，尚未触及 IgG 可开发性或体内功能，后续仍需补做细胞与动物层级验证。

对 AI 药物发现团队的提示：先锁定可并行放大的一体化实验平台（如 AlphaSeq），用千万级真实亲和值快速回填训练缺口；同步建立“in silico→in vitro→IgG/功能”三段式验证漏斗，把本轮排序模型当成早期过滤器，而非终点决策器，以免在缺乏体内证据时过度优化结合能。

以上内容为个人解读，仅供参考。权威内容请以原论文为准。