MindDance AI 生物医药简报是一份面向 AI 制药、计算生物学和蛋白质设计从业者的每日简报。 我们从 arXiv 和 bioRxiv 每天数百篇新论文中,筛选出最值得关注的 3-5 篇 AI + 生命科学交叉方向的工作,用从业者能理解的语言解读它们的意义。
为什么做这个
AI 正在深刻改变生命科学和药物发现。arXiv 的机器学习分类 (cs.LG) 和定量生物学分类 (q-bio.*) 每天新增数百篇论文,bioRxiv 上的计算生物学工作也在快速增长。但 AI 生物医药领域的论文散布在多个分类和预印本平台,缺少一个专注于这个交叉方向的筛选和解读入口。
MindDance 简报就是为了解决这个问题:每天 3 分钟,知道 AI 生物医药领域最重要的进展。
核心读者是 AI 制药公司的研究员、计算生物学方向的博士生和博后、药企 AI 部门的数据科学家、以及关注这个方向的投资人和创业者。优先级按 Drug > Chem > Bio > Med 排列——药物发现和分子层面的工作排在最前面。
适合谁读
- AI 制药研究员:跟踪分子生成、对接、ADMET 预测、逆合成等方向的最新方法
- 计算生物学从业者:关注蛋白质设计、结构预测、基因组建模、分子动力学等
- 药企 AI 部门:高效获取 AIDD 领域动态,判断哪些方法值得引入 pipeline
- 生物信息学学生/博后:追踪前沿、发现新工具和新 benchmark
- 生物医药投资人:持续跟踪 AI 生命科学的技术脉络
怎么筛选
数据采集(四源)
每天自动采集来自四个数据源的论文:
- arXiv 核心分类:q-bio.BM(生物分子)、q-bio.QM(定量方法)、q-bio.GN(基因组学)、q-bio.MN(分子网络)——直接相关,不需要预过滤
- arXiv 扩展分类:cs.LG(机器学习)、cs.AI(人工智能)、physics.chem-ph(化学物理)、physics.bio-ph(生物物理)——通用分类,用 104 个生物医药关键词自动预过滤,只保留 AI + 生命科学交叉的论文
- bioRxiv:Bioinformatics、Biophysics、Pharmacology、Systems Biology、Synthetic Biology、Biochemistry、Molecular Biology、Genomics、Computational Biology 共 9 个学科——用 AI 关键词反向过滤,只保留使用了机器学习/深度学习方法的论文
- Hugging Face Daily Papers:社区推荐的高热度论文,作为补充信号
此外,通过 Semantic Scholar API 补充引用数据和代码仓库信息。
多信号评分(8 类信号)
每篇论文通过规则引擎,综合 8 类信号自动打分:
| 信号 | 权重 | 逻辑 |
|---|---|---|
| 机构背景 | 2.5 | 来自 80+ 家 AI 制药公司(Isomorphic、Recursion、XtalPi 等)、大型药企 AI 部门(Genentech、AstraZeneca 等)、顶级学术机构(Baker Lab、MIT、清华等)的论文获得加分 |
| 顶刊/顶会 | 2.0 | 发表在 Nature/Science/Cell 系列、NeurIPS/ICML/ICLR、或领域核心期刊(JCIM、J Med Chem、Nucleic Acids Research 等)的论文获得加分 |
| 领域相关性 | 2.0 | 标题/摘要中匹配 AIDD 核心关键词(drug design、binding affinity、protein folding、molecular dynamics 等 30+ 个关键词)的密度越高分数越高 |
| 代码可用 | 1.5 | 有开源代码实现的论文获得加分——AIDD 领域可复现性极重要 |
| GitHub 热度 | 1.0 | 关联仓库在 GitHub Trending 上的论文获得加分 |
| 社区推荐 | 1.0 | 被 Hugging Face Daily Papers 收录 |
| 学术影响力 | 0.5 | Semantic Scholar 引用数越高分数越高(分 3 档) |
| 社区热度 | 0.5 | Hugging Face 投票数越高分数越高(分 4 档) |
领域相关性门槛:没有任何领域相关性的论文(domain_relevance = 0)不会进入"重点关注",即使总分达标。这确保 Featured 论文必须与 AI 生物医药直接相关。
得分达到阈值的论文进入 "重点关注"(2-5 篇)和 "也值得关注"(最多 12 篇)两个层级。
AI 解读
算法做筛选,AI 做解读。每篇入选论文由 Claude Sonnet 4.5 基于标题和摘要生成解读,遵循统一的编辑原则:
- 先讲问题,再讲方案:先讲生物学/化学问题背景,再讲 AI 方法如何解决
- 标注验证层级:明确区分 in silico / in vitro / in vivo 验证,标注实验验证的充分程度
- 保持克制:不称所有东西为"突破",对 benchmark 结果注明数据集和比较基准
- 术语保留原文:关键术语保留英文原文(binding affinity、docking、ADMET、inverse folding 等)
- 可验证:每篇解读都链接原论文,读者可以自行查证
全流程透明
每期简报都有对应的 论文来源页(sources),公开展示所有候选论文及其得分理由。
覆盖的主题方向
MindDance 简报覆盖 12 个 AI 生物医药主题,按优先级排列:
- 分子生成与优化:de novo design、scaffold hopping、分子图生成
- 蛋白质结构预测:AlphaFold、co-folding、cryo-EM 辅助建模
- 蛋白质设计:inverse folding、定向进化、酶设计
- 分子对接与结合:docking、binding affinity、virtual screening
- ADMET 与成药性:毒性预测、药代动力学、QSAR
- 分子动力学:force field、FEP、enhanced sampling、coarse-grained
- 化学合成与逆合成:retrosynthesis、反应预测、合成路线规划
- 基因组与转录组:单细胞分析、基因调控、多组学
- 抗体与生物大分子:nanobody、CDR 设计、affinity maturation
- 临床与医学 AI:biomarker、精准医疗、医学影像
- AI Agent for Science:自动化实验、假设生成、自驱动实验室
- 生物基础模型:蛋白质语言模型、基因组语言模型、多模态生物模型
每个方向有独立的话题页,方便按领域追踪。
更新频率
MindDance 简报 每天更新,采用 T+1 发布节奏(覆盖昨日论文,最大化新鲜度)。中文版和英文版同步发布。
已知局限
- 解读基于摘要而非全文:深度有限,关键实验结论以原论文为准
- 扩展分类依赖关键词预过滤:cs.LG 中使用非标准术语的跨领域论文可能被遗漏
- bioRxiv 时效性:bioRxiv API 有延迟,部分论文可能在次日才被采集到
- AI 生成解读的局限:AI 可能误解论文细节,所有解读都应以原论文为准
- 评分偏差:偏 drug discovery 导向的评分可能低估纯生物学理论贡献
FAQ
MindDance 简报和 Papers With Code、Semantic Scholar 有什么区别?
它们是论文索引和发现工具。MindDance 做的是另一件事:专注 AI + 生命科学交叉方向,帮你判断今天哪些生物医药 AI 论文值得关注,以及为什么。不做全量索引,只做每日精选和从业者视角的解读。
为什么有些热门论文没有进入"重点关注"?
热度只是评分信号之一。我们更看重领域相关性和从业者视角的实际影响。没有领域相关性的论文不会进入"重点关注",即使总分很高。
解读是 AI 自动生成的吗?
是的。论文筛选和评分是全自动的,解读由 Claude Sonnet 4.5 基于论文标题和摘要生成。关键实验结论以原论文为准。如果发现解读偏差,欢迎反馈。
如何引用 MindDance 简报的内容?
建议同时引用两个链接:1. MindDance 简报文章页(用于解读上下文)2. 对应论文来源页中的原论文链接(用于技术事实与实验结论)