Guardant Shield 获批：详谈这5年你该了解的按部就班、跌跌撞撞、布局和野望

2024-08-03, 5377 words, 20 min read

本文是熊言熊语邮件通讯的会员内容，限时同步首发于熊言熊语微信公众号。文章较长，引用较多。

写在前面

Guardant health Shield 近日官宣获批，从我2021年入行关注至今终于等来了这一天。作为熊言熊语邮件通讯产品系列的早就定下的选题之一，趁热打铁，把零散记录了很久的draft详细整理成文与你分享。

在本次通讯中，你将会：

从 Shield 按部就班的获批之路中看到立场如何决定性能、嘴硬如何与谨慎并行；
在 Shield 稳定产出的产品进化过程中看到 Guardant health 清晰的学术发声节奏；
在 Shield 跌跌撞撞的性能提升之路中看到研发和产品的反复横跳和究极取舍；
也别忘了一起了解 Shield 在多癌早筛上的布局和野望。

如果你对这篇文章感兴趣，欢迎通过邮箱订阅我的 「熊言熊语」会员通讯，我将第一时间与你分享肿瘤生物医药领域最新行业研究进展和我的所思所学所想，点此链接即可进行免费订阅。

按部就班的获批之路

7 月 29 日，Guardant Health 在官网宣布 FDA 批准 Shield 作为结直肠癌 (CRC) 的筛查方案。

Shield 因此成为 FDA 批准的第一款用于 CRC 筛查、满足美国医保要求的血液检测产品。其使用范围是 45 岁及以上具有平均患病风险的成年人。

Shield 的获批并不令人意外，似乎这一切都在按照 Guardant Health（下文简称 GH）计划的路线稳步推进。

在 2024 JP Morgan 上 GH 给出了如下清晰的时间线。

今年 5 月，FDA 分子和临床遗传学专家小组经过一番「热烈」讨论，对 Shield 的安全性、有效性和风险收益比都给出了整体积极的评价。这次讨论通过也已经预示着 Shield「有望」成为第一个获 FDA 批准的肠癌血液筛查产品。

立场决定性能

如果再往前追溯，是什么促成了这次专家小组的通过呢？

一是基于 Guardant Shield 之前已经获得的上市前批准 (PMA) 申请，二是评估平均风险人群使用 Shield 检测性能关键结果的 ECLIPSE 研究于今年 3 月发表在《新英格兰医学杂志》(NEJM) 上。

ECLIPSE 是一项非随机、前瞻性、多中心研究，纳入了年龄在 45 岁至 84 岁之间计划接受肠镜筛查的患者。

如下图所示，虽然研究招募的患者人数达到 2 万多例，但其中 1.2 万例并没有纳入实际的临床验证队列。研究团队通过下采样方法随机抽样了 1 万人，删删减减之后有 7000 多人进入了最后的临床评估阶段。

ECLIPSE 的主要终点是相对于肠镜检查 CRC 的敏感性和对晚期肿瘤（结直肠癌或晚期癌前病变）的特异性，次要终点是检测晚期癌前病变的敏感性。在 clinicaltrials 注册的临床试验中，次要终点还包括 CRC 检测的阳性预测值 (PPV) 和阴性预测值 (NPV)。

对于 Shield 的性能，GH 在发布的 PROVIDER BROCHURE 中已经给出了一个非常清晰的总结。

在 NEJM 的论文中，更详细的主要结果总结如下：

检测 CRC 的总体敏感性为 83.1%
对具有筛查价值、病理确诊的 I-III 期 CRC 的敏感性为 87.5%
对不同分期 CRC 的敏感性:
1. I 期 (病理确诊):65%; I 期 (临床诊断):55%
2. II 期、III 期和 IV 期: 均为 100%
在非进展期腺瘤、未发现肿瘤和肠镜阴性人群中的特异性为 89.6%
在未发现肿瘤和肠镜阴性人群中的特异性为 89.9%

如果以上这些数据都还算说得过去，但晚期癌前病变 (AA) 的敏感性仅为 13.2%。

emmm，因为这不是计划中的研究终点，只能算是软肋谈不上硬伤。 关于 AA 的问题，我们还会在后文有一个详细的展开。

在同期 NEJM 上，Exact Sciences Cologuard 和 GH 背靠背发表了自家产品最新一代产品的实验结果。

我们得以给出一个相对清晰（但并不严谨）的对比。

	cfDNA	stool
CRC 敏感性	83.1%	93.9%
I 期 CRC 敏感性	65%	86%
晚期癌前病变敏感性	13.3%	43.4%（HGD 74.6%）
晚期肿瘤特异性	89.6%	90.6%
NPV	99.92%	99.97%
PPV	3.16%	3.4%

虽然各项指标相比对方都不占优，但是 GH 说：不是比不过，而是你不会比，不考虑依从性的敏感性，在真实世界里就是耍流氓。

在 2023 年的 JP Morgan 大会上，GH 提出了一个并不算新的新概念——" 有效敏感性 "（Effective Sensitivity）。Shield 的依从性为 90%，敏感性为 83%，两者相乘得出有效敏感性为 75%；而 Cologuard 的依从性为 65%，敏感性虽然略高（87%），但两者相乘后的有效敏感性仅为 60%。

论秀，还是 GH 秀，散了吧。

然而，仔细思考后会发现，这两种检测方法之间的差异其实并不令人意外。无论是微小残留病灶（MRD）还是肿瘤筛查，对于血液检测，我们有一个基本共识：只有脱落的 DNA 进入血液循环系统才有可能被检测到，而且通常来说，越接近病变部位的样本越敏感。这也同样可以解释为什么在泌尿系统相关肿瘤的检测中，尿液样本的早期筛查性能要比血液检测好得多。

Shield 自身具有的便利性和高依从性，在满足同样筛查条件下可以提高筛查率，这一点没有问题。

但我们也需要清楚地认识到，Shield 目前并不能算是真正意义上预防结直肠癌（CRC）的「筛查」工具（其对进展期腺瘤 AA 的检出率仅为 13%），它更像是一种非侵入性的 " 检查 " 方法。即便如此，它仍可能会漏诊接近一半的 1 期患者。

嘴硬和谨慎并不冲突

虽然面对投资人描绘着美好的概念，但 GH 比任何人都清楚自己产品的局限性。

这一点从 GH Shield 产品手册中随处可见的防御性极强的限制性说明就能看出。

一起来感受一下。

Precaution：基于临床研究数据，Shield 对 I 期结直肠癌的检测灵敏度有限（55%-65%），并且无法检测到 87% 的癌前病变。每 10 名 Shield 结果为阴性的患者中，可能有 1 名患有癌前病变，而这种病变本可以通过结肠镜筛查检测到。Shield 对 II、III 和 IV 期结直肠癌的检测显示出较高的检测率。

限制性因素众多，我们列举几个主要的：

Shield 无法检出小于 10 毫米的结直肠癌病灶。
Shield 对高级别腺瘤（可能发展为结直肠癌的癌前病变）的检测能力有限，可能影响预防结直肠癌发展的效果。临床研究数据显示，Shield 仅正确识别了 13.2% 的高级别腺瘤患者，意味着 86.8% 的高级别腺瘤患者被误判为阴性。
Shield 的假阳性率为 10%，即每 10 名没有晚期肿瘤（结直肠癌或高级腺瘤）的人中就有 1 人会得到假阳性结果。

有趣的是，这些 label 上的预防性声明甚至成为了今天投资者电话说明会的提问重点，多个问题都围绕这些预防性声明可能产生的潜在影响展开。

另外值得注意的是，Shield 检测尚未被美国预防服务工作组（USPSTF）或美国癌症协会（ACS）的指南收录，许多非公立保险公司可能要求产品被纳入指南才会提供覆盖，这意味着 Shield 还有一段路要走。

此外，在 NCT04136002 实验记录中，项目入组人数从最初预估的 2 万人，在 2023 年 4 月修改为 4 万人，到今年 4 月又修改为实际入组人数 44467 人。

在电话会议上，GH 高管一再强调他们与 Medicare 保持着顺畅的沟通。入组人数增加，想必也是有 NEJM 中没有充分回答的问题需要继续回答。

稳定产出的产品进化史

聊完产品获批的 part，我们再回过头来聊聊 Shield 产品本身。

时间回到 2019 年，GH 通过 2019年AACR 首次公开介绍了他们针对结直肠癌（CRC）的检测产品。这个产品的独特之处在于同时分析 ctDNA 的基因组和表观基因组特征。

基因组变异包括：SNV，Indel，fusion 和 CNV；表观遗传变异包括 DNA 甲基化信号和核小体站位/片段组学。

产品设计上，GH 利用晚期癌症患者的 cfDNA 大型数据库，开发了一个 500Kb 大小的靶向测序 panel。这个 panel 可以检测与 CRC 相关转录因子结合位点的体细胞变异、甲基化变化和其他表观基因组变异。技术上能同时检测甲基化和非甲基化的 cfDNA。

初步分析结果显示，相比单独的体细胞突变分析，加入表观基因组分析显著提高了 ctDNA 的检测能力。

2020 年 AACR 会议上，GH 继续发布了相关研究进展。这时，他们的检测产品被命名为 LUNAR-2 assay（即现在的 Shield），其靶向区域针对常见的致癌突变以及在癌症中可能经历表观基因组修饰变化的区域（差异甲基化和核小体定位变化导致差异的 DNA 片段化模式）。

析过程包括

检测体细胞基因组突变和变异过滤；
评估观察到的 cDNA 分子在不同甲基化分区中的分布；
评估 panel 上基因组区域中 cDNA 片段化模式。

这次的 poster 还明确指出了 panel 设计数据来源于超过 10 万例 Guardant360 数据以及健康人/晚期 CRC 患者的全基因组测序 (WGS) 数据。

研究发现，在 CRC 肿瘤组织中，根据差异甲基化选择的区域显示出明显的甲基化信号。通过比较结肠镜检查阴性的受试者和晚期 CRC 患者的 cfDNA 全基因组测序数据，研究者观察到一致且强烈的甲基化信号差异，提高了区分能力。

随着算法和技术的逐渐成熟，2021年 ASCO 上，GH 公布了一项涉及 434 名患者和 271 名对照样本的更大规模 LUNAR-2 性能评估。研究结果显示，该检测方法在多个临床特征中都表现出具有临床意义的敏感性。这项 poster 的最后提到：

A prospective registrational study is ongoing to evaluate the test in an average risk CRC screening cohort.

同年，在美国胃肠病学会（American College of Gastroenterology）年会上，GH 发表了一个更详细的口头报告，重点强调了该产品在早期 CRC 筛查中的潜力，以及在一般风险人群中的应用前景。

进而引出了该产品应用于早期 CRC 进行 screening 的潜力，也提到了把它应用在一般风险人群中的应用场景。

一年之后，2022 年 ASCO 会议中 GH 进一步发声。这次他们带来了在西班牙四家医院开展的前瞻性研究分析结果。

值得注意的是，这次 Shield 代替 LUNAR-2 成为了产品名，而整个检测方案里增加了一个看起来「不怎么和谐」的蛋白质组学结果。这一变化也不难理解，既然 GH 选择了结合突变信息和表观遗传学的多组学策略，那么在产品迭代过程中自然会考虑到蛋白质组学。

不过，事后证明，蛋白质检测结果整合到最终的 YES or No 判断中，这一策略似乎对也不对，并没有真实提高检测性能（后面我们会具体提到）。

在这项研究中，GH 对超过 6000 个样本上进行了训练，其中包括 2685 个 ACN 阴性样本和 1698 个 ACN 阳性样本。通过 1072 个 ACN 阴性样本和 551 个 ACN 阳性样本确定阈值，在验证之前，以 91.5% 的特异性为目标锁定模型阈值。

随后在六个中心验证中得到了如下结果。两个小细节，I 期癌症的敏感性高达 90%，AA 的敏感性还在 20%。

时间来到，2023 年 5 月，在著名的消化系统疾病年会（Digestive Disease Week）上，GH 首次正式对外公布了 ECLIPSE 研究的初步结果。

这次公布的分期敏感性和我们在 NEJM 看到的已经基本一致。

AA 的敏感性掉到了 13%，当时还公布了 HGD 的性能（23%），但在最终的 NEJM 文章中并未提及。

同时，GH 也提到了如何在真实世界中考虑依从性的问题：评估筛查项目时需要考虑真实世界的条件和患者因素。倡导从理想化条件下的有效性评估向更实际、更贴近临床实践的效果评估转变。

从 Shield 的发展历程来看，从 19 年开始，基本每年都会有非常稳定的产出，整体的产品技术路径和临床应用场景也越来越清晰。点赞 GH Shield 的研发和科学团队。

在这次展示内容的最后，GH 提到 Further assay development to expand detection capabilities。而这件事， Shield 一直在尝试。

跌跌撞撞的性能提升之路

来来去去的蛋白

如果说 Shield 的 FDA 获批之路看起来顺风顺水按部就班，那它的性能提升之路似乎就只能摸着石头过河。

在上文，我留了一个扣子，2022 年 6 月 ASCO 的 Poster 里，GH 提到在既往的分析方法基础上新整合了蛋白质检测的结果。

可到了 2023 年 5 月 DDW 大会的结果展示中，蛋白质组学又默默地消失了。

发生了什么？

这其中的缘由，我们可以从 2023 年 10 月 GH 在 Annals of Oncology 发表的结果和 2024 年 NEJM ECLIPSE 主文章中窥见一二。

2023 年 10 月的 Annals of Oncology 论文中，GH 提到：

The aim of this study was to determine the performance of a novel multimodal ctDNA-based blood assay (that includes detection of genomic mutations, methylations, fragmentomics and proteomics) to detect CRC at different Tumor-node-metastasis (TNM) stages (primary endpoint) and advanced precancerous lesions (secondary endpoint), in a pilot study of FIT-positive individuals from a population-based screening program and individuals with known CRC.

emm，看来最初并未打算放弃晚期癌前病变的检测。

在这项涉及 623 例样本的研究中，首先使用不包含蛋白的算法进行分析，晚期癌前病变的敏感性为 14%

GH 似乎对这个结果并不满意，还想挣扎一下。于是他们说道：

In order to improve the accuracy to detect precancerous lesions, an exploratory analysis that used a refined version of the blood multimodal ctDNA-based test was carried out in a subgroup of 86 individuals from cohort 1.

他们的做法是加入蛋白质组学数据。

首先在癌症样本和健康样本之间对表达水平存在差异的多种蛋白质标记物进行分析，然后开发统计模型整合这些蛋白质标记物的水平，生成蛋白质分类结果，最终与之前的结果整合，生成一个二分类判断。（合理怀疑是 Olink 的销售手段高超，说服了他们😂）

一顿操作猛如虎，性能提升 5%。

在这 86 个样本的小队列中，AA 的敏感性被提升到了 23%（小队列不加蛋白的原始版本 AA 敏感性是 18%）。可随之而来的小问题是特异性也从之前的 90% 掉到了 86%。

虽然文章发在 Annals of Oncology，但是如果通过蛋白质组学加成让 AA 提升 5% 敏感性的代价是牺牲 4% 的特异性。我想，这是除AA 性能党之外所有人都不能接受的。

别忘了，Shield 的底线是坚守 90% 特异性，满足 Medicare 的要求。

于是，在 2024 年 3 月 NEJM 主文章的附件材料中，我读到了这样一段话。

虽然只是一句轻描淡写的「添加蛋白质反而不如只用 cfDNA 效果好」。懂得都懂：两全相害取其轻，特异性上不放松。

默默翻倍的 panel

从 2019 年开始到 NEJM 文章发表前，公开的学术资料中凡是涉及到产品设计路线图的，GH 一直宣称 LUNAR2 的 panel 大小为 500Kb，甚至 2024 ASCO 一篇摘要中，方法学部分仍然标注了 500Kb。

但到了 MEJM 的文章中 panel 大小默默变成了 1Mb，无奖竞猜，多出来的 500Kb 是干什么的？

Shield V2 新版本性能几何

Cologuard 有 V2，Shield 同样也并非不思进取。

早在 2023 年的几次公开会议中，GH 就已经透露了 Shield V2 版本的消息。

在放弃 AA 性能的挣扎之后，V2 版本的 Shield 保证特异性不降的前提下，将整体敏感性从 V1 版本的 84% 提升到了 91%。

这一结果最终正式发表在 2024 年 ASCO-GI 会议中。GH 1M panel，10X 测序深度的数据中，通过提高噪声过滤和模型调参，更好地检测了 ctDNA 低脱落的肿瘤样本。相比 ECLIPSE 实验中的模型，LoD95 下降到十万分之四，I/II 期敏感性从 76% 提高到 88%。