Chroma 这篇论文,不能只当作一篇模型论文来看。
它真正有价值的地方,不是告诉行业“AI 又能做一件新事情”,而是把蛋白药物研发中的一个老问题,用生成式模型重新打开了.
过去,蛋白设计很大程度上是在已有自然蛋白、已有 scaffold、已有抗体框架里做改造。
Chroma 想回答的是另一个问题:
如果我们不只是修改已有分子,而是从目标约束出发,直接生成新的蛋白结构和序列,早期药物发现的起点会不会发生变化?
这才是它的意义。
但对 Generate 来说,Chroma 还不是终点。
它更像是公司技术叙事中的一个公开科学支点。
它证明 Generate 团队确实在生成式蛋白设计上做出了可同行评议、可实验验证的工作。
但从一篇 Nature 论文,到一个真正能上市的蛋白药物,中间仍然隔着PCC、IND、临床试验、监管审评和商业化竞争。
所以,这篇文章真正要讨论的,不是“Chroma 有多先进”。
而是:
Chroma 到底证明了什么?
它没有证明什么?
它和 Generate 当前管线之间,能建立什么关系?
以及,为什么 AI 蛋白设计真正要被验证的,不是模型能不能生成蛋白,而是生成出来的分子能不能成为药。论文基本信息
论文标题:
Illuminating protein space with a programmable generative model
发表期刊:Nature
发表时间:2023 年
卷页信息:Nature 623, 1070–1078 (2023)
DOI:10.1038/s41586-023-06728-8
主要作者:
John B. Ingraham、Max Baranov、Zak Costello 等
作者单位:Generate Biomedicines, Somerville, MA, USA
一句话定位:
Chroma 是 Generate 团队提出的可编程蛋白生成模型,目标是直接生成新的蛋白结构和序列,并允许研究者在生成过程中加入对称性、子结构、形状、语义甚至自然语言等约束。本文核心论点
Chroma 的意义,不是它替代了AlphaFold。
它解决的问题本来就不一样。
AlphaFold 更像是回答:
一个已知蛋白序列,可能折叠成什么结构?
Chroma 更像是回答:
如果我希望得到一种具备特定结构、形状、局部功能或设计约束的新蛋白,能不能从蛋白空间中生成出来?
前者是结构预测。
后者是生成设计。
这一区别,对 AI 制药非常重要。
因为药物研发真正需要的,不只是“看懂自然界已有蛋白”,还包括“设计自然界未必已经给出的分子”。
Chroma 论文可以作为 Generate 蛋白生成能力的公开科学证据。
但不能把论文中的蛋白实验表征,直接写成药物候选物成功。
这篇论文最准确的定位是:
它证明 AI 蛋白设计正在从“结构预测”走向“可约束的生成设计”;但 Generate 真正要证明的,是这些设计能力能否进入 PCC、IND、临床和监管。一、为什么Chroma 不是 AlphaFold 的重复?
过去几年,AlphaFold 几乎成为 AI 结构生物学最重要的符号。
它极大提高了蛋白结构预测能力。
但 AlphaFold 解决的是一个相对明确的问题:
给定序列,预测结构。
这件事对药物研发非常重要。
因为结构信息会影响靶点理解、结合位点分析、突变解释、药物设计和机制研究。
但对药物发现来说,仅仅知道一个蛋白“长什么样”,还不够。
研发人员更关心另一个问题:
能不能设计一个新的蛋白,让它具备我们想要的结构、界面、稳定性、选择性或功能?
这就是 Chroma 的切入点。
Chroma 不是在重复 AlphaFold。
它试图从另一个方向进入蛋白空间。
AlphaFold 更接近“识别和预测”。
Chroma 更接近“生成和设计”。
这就像一个人已经能读懂地图,和一个人开始尝试设计一座新城市。
两者都重要。
但不是同一件事。
对 AI 制药来说,这个转向非常关键。
因为药物研发的核心不是被动理解自然界已经存在什么,而是主动构建一个足够安全、有效、稳定、可制造、可监管的治疗分子。
如果 AI 只能预测结构,它主要是帮助研究人员看清楚已有对象。
如果 AI 可以生成结构和序列,它就可能参与更早期的分子创造。
这也是 Chroma 值得单独写成一篇文章的原因。参考来源:Nature:Illuminating protein space with a programmable generative model;Generate Chroma 发布公告;Generate Chroma / Platform 页面;Generate Pipeline 页面;Generate GB-0895 III 期 SOLAIRIA 公告;Generate 2026 年第一季度财务与业务更新;ClinicalTrials.gov:GB-0895 相关 III 期研究登记;AlphaFold Nature 2021 论文;RFdiffusion Nature 2023 论文;ProteinMPNN Science 2022 论文.免责声明:本文仅基于截至发文时可核验公开资料整理,不构成投资建议、医学建议或用药建议。文中涉及未上市药物、临床项目和平台能力的判断,均存在研发、临床、监管和商业化不确定性。公司新闻稿仅作为公司口径引用,不能等同于独立验证事实。Chroma 论文中的实验验证不能直接外推为临床疗效、注册成功率或商业化成功。二、Chroma 到底做了什么?
Chroma 的核心任务,可以简化理解为三步。
第一步,生成蛋白骨架。
也就是先提出一个可能折叠、可能稳定存在的三维结构框架。
第二步,为这个结构设计对应的氨基酸序列。
也就是让这个结构不只是一个几何形状,而是变成一个具体的蛋白分子设计。
第三步,在生成过程中加入约束。
这一步是 Chroma 的重点。
如果模型只是随机生成一个看起来像蛋白的东西,药物研发价值有限。
真正有价值的是:
模型能不能按照研发需求来生成?
比如:
一个抗体项目希望重建 CDR loop。
一个酶项目希望保留活性位点。
一个蛋白结合项目希望在靶点表面形成特定接触界面。
一个多蛋白复合物项目希望满足特定空间组织关系。
一个工程化蛋白项目希望兼顾稳定性、形状和局部结构。
Chroma 的“programmable”,就是体现在这里。
它不是单纯生成一个蛋白。
它是尝试让生成过程可以被条件控制。
论文中提到的约束包括对称性、子结构、形状、语义以及自然语言提示。
这意味着,蛋白设计不再只是围绕已有 scaffold 做局部修改。
它开始有机会从目标条件出发,去探索更大的蛋白设计空间。
当然,这仍然是早期设计阶段的能力。
它还不是药物。
但它改变了研发问题的起点。
过去很多蛋白工程是在问:
这个已有分子还能怎么改?
Chroma 试图推动行业去问:
如果从设计目标出发,我们能不能生成一个新的分子起点?三、310 个蛋白实验表征,到底说明什么?
Chroma 论文最值得重视的部分,是它没有停留在计算图像上。
研究团队对 310 个设计蛋白做了实验表征。
这很重要。
因为蛋白设计最怕的是“模型里很好看,实验里不可用”。
一个蛋白在计算机里结构漂亮,并不代表它能表达。
能表达,也不代表它能正确折叠。
能折叠,也不代表它稳定。
稳定,也不代表它有功能。
Chroma 论文使用了一系列实验方法验证这些设计蛋白。
包括 split-GFP 溶解性实验、FACS、Nanopore sequencing、western blot、圆二色谱、差示扫描量热,以及 X-ray 晶体结构解析。
这些实验不是临床验证。
但它们是计算蛋白设计走向现实世界的第一道门槛。
其中最有代表性的结果,是两个设计蛋白获得了晶体结构。
这两个结构与 Chroma 生成模型在原子尺度上非常接近,RMSD 约 1 Å 左右。
这说明什么?
它说明 Chroma 生成的一部分蛋白,不只是“像蛋白”。
它们可以表达。
可以折叠。
可以稳定存在。
甚至可以在实验结构层面接近模型设计。
这是论文的硬价值。
但这个结果不能被过度解读。
310 个蛋白不是 310 个药物候选物。
两个晶体结构成功,也不代表所有 Chroma 生成蛋白都能成药。
结构接近,不等于功能充分。
可表达,不等于可开发。
可折叠,不等于有体内疗效。
生物物理性质好,不等于 PK、毒理、免疫原性和 CMC 都过关。
所以,Chroma 论文最准确的结论是:
AI 生成蛋白设计已经具备一部分实验可实现性。
但它还没有证明:
AI 生成蛋白可以直接成为药物。
这一区分非常重要。
也是判断 AI 制药公司时最容易被忽略的地方。四、从论文到管线,中间隔着PCC、IND、临床和监管
如果 Chroma 只是一篇学术论文,故事到这里已经足够完整。
但 Generate 不是普通学术团队。
它是一家临床阶段 TechBio 公司。
所以,对产业读者来说,真正的问题是:
Chroma 这类生成式蛋白设计能力,如何进入管线?
从论文到药物,中间不是一步。
至少要经过几个关口。
第一个关口,是功能验证。
蛋白生成出来后,是否真的能结合目标?
结合是否足够强?
是否有功能活性?
是否有选择性?
第二个关口,是可开发性。
蛋白是否稳定?
是否容易聚集?
是否可表达?
是否容易纯化?
是否适合规模化生产?
是否存在明显免疫原性风险?
第三个关口,是 PCC。
也就是 preclinical candidate,临床前候选分子。
PCC 不只是“有活性”。
它还要综合考虑药效、PK、毒理、CMC、给药方式、剂量窗口和适应症策略。
第四个关口,是 IND。
这一步要面对系统的 GLP 毒理、CMC 包、药理药效、质量研究和监管沟通。
第五个关口,才是临床。
I 期看安全性、耐受性、PK/PD。
II 期看剂量和初步疗效。
III 期看注册性终点。
最后才是审评和商业化。
所以,Chroma 的意义不是跳过这些环节。
它真正可能改变的是前端。
让 hit generation 更主动。
让 lead optimization 更可编程。
让候选分子设计空间更大。
让实验团队有更多高质量起点。
但它不能替代药物研发的后半程。
这也是为什么,Generate 真正要证明的,不是 Chroma 能不能生成蛋白。
而是这些生成式设计能力,能不能支撑资产走过药物研发流程。五、Chroma 与 GB-0895:能建立关系,但不能强行画等号
Generate 当前最关键的临床资产,是 GB-0895。
GB-0895 是一种靶向 TSLP 的单克隆抗体,用于 severe asthma 的 III 期临床研究。
它的核心差异化诉求是长效。
Generate 披露的信息显示,GB-0895 被设计为每 26 周一次皮下注射,也就是大约半年一次。
这对 severe asthma 有潜在商业意义。
因为 TSLP 靶点已经有上市药物 Tezspire,说明这个方向不是完全未知靶点。
Generate 真正要证明的是:
在已被部分验证的 TSLP 生物学基础上,能不能做出更长效、更便利,同时仍然有效和安全的抗体。
那么,Chroma 和 GB-0895 是什么关系?
可以这样理解:
Chroma 代表 Generate 在生成式蛋白设计上的公开科学证据。
GB-0895 代表 Generate 把 generative biology 平台推向临床验证的核心资产。
两者共同说明:
Generate 不是只做论文,也不是只讲平台。
它试图把生成式设计能力导入真实药物管线。
但这里必须保留边界。
公开资料不足以确认 Chroma 直接设计了 GB-0895。
Generate 披露 GB-0895 由其 generative biology platform 和 generative optimization technology stack 设计或优化。
但这不等同于“Chroma 单独完成设计”。
这一点非常重要。
因为在产业文章里,不能把三件事混成一件事:
平台论文。
公司平台。
具体临床资产。
Chroma 可以支撑我们理解 Generate 的技术方向。
但 GB-0895 的真正验证,不在 Chroma 论文里。
而在 severe asthma III 期临床结果里。
GB-0895 最终要回答的问题,不是模型生成得好不好。
而是:
半年一次给药,能不能在真实 severe asthma 患者中持续降低急性加重风险?
安全性是否可接受?
监管是否认可?
商业上是否能与既有 TSLP 药物形成差异化?
这些才是资产层面的考题。六、Chroma 与 GB-4362:更像“设计思路相关”,不是“已验证关系”
GB-4362 是 Generate 另一个值得关注的项目。
它不是传统抗肿瘤药。
它是一种 free MMAE antibody。
MMAE 是很多 ADC 使用的细胞毒 payload。
当 MMAE 从 ADC 中释放并进入循环暴露时,可能与系统毒性相关。
GB-4362 的设计逻辑是:
选择性结合循环中的 free MMAE,尽量降低游离 MMAE 相关毒性,同时不影响完整 ADC。
如果这个策略成立,它的价值不是单药杀瘤。
而是改善 ADC 治疗窗口。
这和 Chroma 有什么关系?
从方法学上看,Chroma 体现的生成式蛋白设计能力,确实可能与这类 payload-binding antibody 的设计思路相关。
因为这种项目对结合特异性、空间构象、稳定性和选择性要求很高。
但公开资料没有证明 GB-4362 直接来自 Chroma。
所以更准确的写法是:
GB-4362 显示 Generate 平台不只想做传统抗体,也在探索 ADC 相关毒性管理工具。
Chroma 论文可以帮助读者理解 Generate 为什么强调“按需求设计蛋白”。
但 Chroma 不能直接作为 GB-4362 已被验证的证据。
GB-4362 真正要证明的,是在 ADC 联用场景中,能不能改善游离 payload 相关毒性,并且不牺牲 ADC 本身的治疗作用。
这是临床问题。
不是模型问题。八、这篇论文对药企和投资人的真正启示
Chroma 这篇论文对药企和投资人的价值,不在于给出一个“AI 制药已经成功”的答案。
它真正提供的是一套新的追问方式。
第一,判断 AI 蛋白设计公司,不能只看模型。
要问模型是否有实验验证。
Chroma 的价值就在于,它不是只停留在 in silico 生成,而是做了 310 个蛋白的实验表征,并解析了两个晶体结构。
第二,不能只看论文。
要看论文和平台之间是否有连续性。
Chroma 是 Generate 技术能力的公开证据之一。
但它不是 Generate 全部商业平台。
第三,不能只看平台。
要看平台是否进入管线。
Generate 的重要性在于,它已经有 GB-0895 这样的 III 期资产,也有 GB-4362、GB-5267 这类跨 modality 项目。
第四,不能只看管线阶段。
还要看临床终点和监管路径。
GB-0895 最终要在 severe asthma III 期中证明减少年化哮喘急性加重率,而不是证明一个模型好看。
第五,不能只看合作和融资。
要看资产能不能兑现。
平台公司可以靠论文、融资和合作获得关注。
但长期价值仍然要靠临床数据和商业化验证。
这也是 AI 制药进入深水区后的共同问题。
过去大家看的是:
模型能不能生成?
现在真正要看的是:
生成出来的东西,能不能成为药?九、结语:Chroma 是科学底座,不是终点
Chroma 是一篇重要论文。
它说明 AI 蛋白设计正在从结构预测,走向生成设计。
也说明模型生成的部分蛋白可以被实验表达、折叠和结构验证。
这对整个 AI 蛋白设计行业都有意义。
但对 Generate 来说,Chroma 只是开始。
真正的产业验证,不在 Nature 论文里完成。
它要在 PCC、IND、临床和监管中完成。
GB-0895 能不能在 severe asthma III 期中成功?
GB-4362 能不能真正改善 MMAE ADC 的治疗窗口?
GB-5267 能不能在实体瘤细胞治疗中显示可接受的安全性和初步活性?
这些问题,才是 Generate 下一阶段真正要回答的。
所以,Chroma 的价值不能被低估。
但也不能被神化。
它证明 AI 蛋白设计可以进入更主动、更可编程的阶段。
但 Generate 真正要证明的,是这些设计能力能不能穿过药物研发最硬的关口。
AI 蛋白设计真正要证明的,不是能生成。
而是能成药。后续「知识星球」会有延伸内容
1.Chroma 论文图表逐图拆解
2.Chroma 与 AlphaFold、RFdiffusion、ProteinMPNN 的技术对比
3.Chroma 实验验证证据矩阵
4.Chroma 与 GB-0895 的关系:公开证据、公司披露、合理推断、不能确认
5.GB-0895 的 III 期 SOLAIRIA 试验设计拆解
6.GB-4362 为什么更像 ADC 毒性管理工具
7.GB-5267 与实体瘤 CAR-T 的技术风险
8.AI 蛋白设计从论文到 PCC 的尽调清单
9.药企如何判断 AI 蛋白设计平台是否值得合作
10.Generate 与 Chai Discovery、Isomorphic Labs、Recursion 的平台阶段差异
关注「新叶AI智药」.一起看清 AI 制药从概念走向验证的真实路径。