拷贝数编译
一、研究背景与核心问题
| 问题 | 传统方法局限 | 本研究突破 |
|---|---|---|
| 转移灶基因组长什么样? | 只能拿到单灶活检 | 尸检系统采样,覆盖所有转移灶 |
| 转移是怎么发生的? | 推测性强 | 通过进化树反推迁移路径 |
| 什么基因组特征驱动远处转移? | 样本不够 | 大规模多区域采样 + 纵向追踪 |
二、研究设计
两个临床队列联合:
- TRACERx(NCT01888601):前瞻性追踪早期可手术 NSCLC,手术时多区域采样原发灶,纵向随访 + 复发时再取样
- PEACE(NCT03004755):研究性尸检项目,死后系统采样所有转移灶,影像学引导
- 队列规模:24 名 NSCLC 患者,501 个纵向收集的原发+转移肿瘤样本
| 指标 | 数据 |
|---|---|
| 原发灶采样区域 | 108 区域 / 24 个原发灶(中位 4 区域) |
| 转移灶采样 | 352 区域 / 233 个解剖学不同的转移灶(平均 16 区域/患者) |
| 影像学覆盖 | 70%(112/160)影像学检出转移灶有 WES 数据 |
| 解剖位置 | 19 个(肺 125、淋巴结 80、肝 33、软组织 23、脑 22、肾上腺 17、骨 7) |
| 患者特征 | 中位年龄 70 岁,19 戒烟/3 现吸/2 从不吸烟 |
| 中位 DFS | 11 个月(IQR: 6-18) |
| 中位 OS | 29 个月(IQR: 16-46) |
三、组学技术路线
3.1 实验层面:从组织到数据
-
FFPE 切片 → H&E 染色 → 病理评估(肿瘤含量、坏死、自溶程度)
-
新鲜冷冻组织 → DNA 提取 → DIN > 4(Agilent TapeStation)→ WES
-
外周血(术前/尸检时股静脉/心室)→ 胚系 DNA → 配对测序
3.2 测序:高深度 WES
| 参数 | 规格 |
|---|---|
| 测序类型 | 全外显子组测序(WES) |
| 中位深度 | 401×(IQR: 360-442) |
| 样本量 | 501 个组织 + 配对胚系 |
| 质控门槛 | DIN > 4 + 通过 CN calling 和 variant calling |
**选 WES 而非 WGS 的原因:**成本可控(501 个样本 WGS 极昂贵),WES 足够检测 SNVs、indels、SCNAs 和 WGD。局限:无法检测 SV、ecDNA、非编码区突变。
3.3 生信分析管线(完整流程)
Phase 1:基础检测
-
比对:FASTQ → 参考基因组比对 → BAM
-
体细胞突变检测:SNVs + DNVs(双重标准:比例检验 + ≥90% reads 同时含两变异)+ Indels
-
拷贝数检测:Refphase(单倍型特异性 CN + 拯救低纯度样本)→ ALPACA(亚克隆特异性 CN profile)
-
WGD 检测:ParallelGDDetect
-
Driver 突变注释:OncoKB、openCRAVAT、Ensembl VEP(v.114)、LOFTEE、SpliceAI(阈值0.8)、BoostDM、CHASMplus(组织特异性)
Phase 2:进化重建
-
亚克隆聚类(CONIPHER + PyClone):按突变存在/缺失预聚类 → PyClone 推断 CCF → 枚举所有可能的进化树拓扑 → 选 SCE 最低的树
-
亚克隆分类:Truncal(MRCA) / Primary-unique / Metastasis-unique / Shared subclonal
-
亚克隆 CN profile(ALPACA):输入 CONIPHER 树 + CCF + Refphase 等位基因特异性 CN
-
WGD 定时(ParallelGDDetect):将 WGD 事件定位到进化树分支
-
Driver 变异时序分析:按亚克隆分类 + TSG 双等位失活(LOH+SNV 时空关系)+ 临床可操作性
Phase 3:迁移模式重建
-
MACHINA 算法:输入患者级进化树,三种模型(仅原发灶播种 / 单来源 met→met / 多来源 met→met),选最简约模型
-
迁移概率评估:100 棵最低 SCE 树 × MACHINA → 迁移概率 = 该迁移在所有解中出现比例
-
LOH 保守性验证:不可逆 LOH 事件独立验证迁移方向
Phase 4:突变过程与多样性分析
-
COSMIC 签名分析(SigProfilerAssignment):≥50 突变直接拟合,<50 突变 1000 次 bootstrap 重采样
-
签名分类:Clock-like(SBS1+5) / Smoking(SBS4) / APOBEC(SBS2+13) / Platinum(SBS31+35) / Other(SBS17b)
-
遗传多样性量化:SNV 多样性(L1 范数)+ SCNA 多样性(段长加权 L1 范数,按 ploidy 归一化)→ 四层次比较(intra-primary / intra-met / inter-met / primary-met)
3.4 关键工具汇总
| 分析层级 | 工具/方法 | 输入 | 输出 |
|---|---|---|---|
| 测序 | Illumina WES | DNA(DIN>4) | BAM/FASTQ |
| 突变检测 | Somatic caller | BAM + 胚系 | SNVs, DNVs, indels |
| CN 检测 | Refphase + ALPACA | BAM + 等位基因频率 | 亚克隆特异性 CN |
| WGD 检测 | ParallelGDDetect | CN 数据 | WGD 时序 |
| 亚克隆聚类 | CONIPHER + PyClone | 突变频率 + 多区域 | 进化树 + CCF |
| Driver 注释 | OncoKB, VEP, CHASMplus 等 | 突变列表 | Driver 分类 + 临床分级 |
| 迁移重建 | MACHINA | 进化树 | 迁移路径 + 概率 |
| 签名分析 | SigProfilerAssignment | 亚克隆突变 | COSMIC 签名活动 |
| 多样性量化 | 自定义 L1 范数 | CCF / CN | 四层次异质性指标 |
| 统计建模 | LME 模型, Wilcoxon, Fisher | 上述输出 | P 值 / 相关性 |
四、核心发现
| 发现 | 关键数据 | 意义 |
|---|---|---|
| 转移灶与原发灶基因组差异巨大 | 27% driver 突变为转移灶独有;83% 患者 ≥1 个 met-unique driver | 单灶活检严重低估转移异质性 |
| 突变过程随时间变化 | 吸烟签名原发 21% vs 转移 7%;铂类签名 64% 患者转移灶检出 | 转移灶积累不同于原发灶的突变谱 |
| Met→met 播种是主流 | 60% 转移灶由其他转移灶播种(非原发灶) | 晚期 NSCLC 转移是级联扩散网络 |
| 多原发亚克隆分别扩散 | 62.5% 患者有多个原发灶亚克隆分别建立不同转移灶 | 转移起源比传统认知更复杂 |
| CIN 驱动远处转移 | 胸腔外播种亚克隆 SCNA 显著增高(P=9.6×10⁻⁵) | CIN 特异性帮助突破胸腔屏障 |
| 原位时间与播种能力相关 | 转移灶存在越久越可能成为播种源(P=0.03) | 时间是必要但非充分条件 |
| 解剖学约束 | 71.3% 迁移起止于同一解剖腔 | 大部分转移局限于同一腔内 |
五、方法学亮点
-
分子钟思路:用突变/SCNA 积累量作为时间代理,而非依赖日历时间
-
进化不确定性处理:100 棵树 × MACHINA → 迁移概率,而非单一最优树
-
LOH 保守性验证:用不可逆 LOH 事件独立验证迁移方向
-
亚克隆分辨率 CN 分析:ALPACA + Refphase 实现亚克隆级别 SCNA 定量
六、局限性
-
仅 WES,无 WGS → 遗漏 SV、ecDNA、非编码区
-
无单细胞测序 → 亚克隆分辨率受限于 bulk CCF 估计
-
无转录组/表观组 → 无法研究 TME 和非遗传因素
-
88% 患者接受过系统治疗 → 无法完全区分治疗 vs 自然进化
-
样本量 24 例 → 统计效力有限
七、临床意义
| 层面 | 启示 |
|---|---|
| 活检策略 | 单灶活检不够,需要多区域采样或液体活检捕获转移异质性 |
| 治疗耐药 | 转移灶积累的 treatment-associated driver 突变可能导致原发灶治疗后仍进展 |
| 寡转移治疗 | 胸腔内转移倾向于同腔扩散,局部巩固治疗可能有价值 |
| CIN 作为 biomarker | SCNA 负荷可能预测远处转移风险 |
| 液体活检 | ctDNA 可能比单灶活检更好地反映全身转移异质性 |
八、后续研究
TRACERx EVO(NCT05628376):扩展到 600 例 NSCLC/SCLC/间皮瘤,计划 100 例研究性尸检,做高深度 WGS。
笔记整理时间:2026-05-11 | 来源:MinerU 转换全文 + PDF chunk 阅读
精读报告:Evolutionary characterization of lung cancer metastasis
论文基本信息
- 标题:Evolutionary characterization of lung cancer metastasis
- 作者:Sonya Hessey, Abigail Bunkum, Ariana Huebner等(共约140位作者)
- 通讯作者:Simone Zaccaria, Nicholas McGranahan, Charles Swanton, Mariam Jamal-Hanjani
- 期刊:Nature(2026年)
- DOI:10.1038/s41586-026-10428-4
- 发表时间:Received 2025-06-29,Accepted 2026-03-17
研究背景与问题
转移是癌症相关死亡的主要原因,肺癌因高发病率、常以转移性疾病起病和术后高复发率,占转移性癌症病例的最大份额。然而,控制转移播散的生物学过程尚不清楚。既往研究多受限于采样不足(仅少数转移灶),无法完整还原转移进化全貌。本研究旨在通过纵向、多区域采样和研究性尸检,全面重建NSCLC从诊断到死亡的转移进化历史和迁移模式。
核心发现
-
转移灶基因组显著偏离原发灶:原发灶与转移灶间的遗传异质性显著高于转移灶间异质性(突变多样性P=0.004,SCNA多样性P=6.0×10⁻⁵),提示播散后原发灶和转移灶各自独立进化。
-
多亚克隆播散普遍存在:62.5%(15/24)患者的转移灶由多个不同的原发肿瘤亚克隆分别播散建立,每个亚克隆奠基一个独立转移灶。
-
转移间播散是主要模式:60%(156/258)的转移灶由其他转移灶播散,38%(98/258)由原发灶直接播散。88%(21/24)的患者同时存在原发灶和转移灶来源的播散。
-
亚克隆播散能力不均等:虽然93%患者中不同原发播散亚克隆播散转移灶数量无显著差异,但仅45%(30/67)的原发播散亚克隆的后代能进一步从转移灶播散。
-
转移灶在位时间与播散能力正相关:首次复发扫描检测到的转移灶播散率为36.8%(14/38),而尸检时才检测到的仅为16.4%(10/61,P=0.03)。播散转移灶体积更大(P=0.025)、亚克隆更多(P=0.028)。
-
解剖腔约束:71.3%(92/129)的转移间播散在同一解剖腔内进行。胸腔内转移灶更早出现且播散率更高(26.4% vs 13.9%,P=0.013)。
-
CIN促进胸腔外播散:播散至胸腔外的亚克隆显著富集SCNA(P=9.6×10⁻⁵),而仅胸腔内播散的亚克隆则无此富集。这一发现在TRACERx独立队列中得到验证。
-
驱动突变在转移灶中持续积累:196个驱动突变中27%(53/196)为转移特异性,83%(20/24)患者至少有一个转移特异性驱动突变。WGD在92%(22/24)患者中发生,76%在原发灶,24%在转移灶。
研究体系详解
- TRACERx队列:前瞻性、多中心、I-IIIB期NSCLC手术患者纵向随访研究(NCT01888601),术中多区域采样原发灶。
- PEACE队列:全国性多癌种研究性尸检项目(NCT03004755),嵌入TRACERx招募中心实现共同入组。
- 最终队列:24例同时入组TRACERx和PEACE的NSCLC患者(49例共同入组→41例死亡→33例尸检→24例通过质控)。
- 样本量:501个样本通过WES和质控(108原发灶区域 + 41转移灶区域 + 352尸检转移灶区域)。
- 测序深度:中位401.2×(IQR 360.2-441.5)。
- 影像覆盖:23例有影像的患者中,WES数据覆盖70%(112/160)的生前影像检测转移灶。
- 转移灶分布:涵盖19个解剖部位,平均每位患者16个转移灶区域(范围3-39),平均11个解剖独立转移灶(范围2-37)。
组学技术路线(详细)
实验层面:从组织到数据
- FFPE 切片 → H&E 染色 → 病理评估(肿瘤含量、坏死、自溶程度)
- 新鲜冷冻组织 → DNA 提取 → DIN > 4(Agilent TapeStation)→ WES
- 外周血(术前/尸检时股静脉/心室)→ 胚系 DNA → 配对测序
测序:高深度 WES
| 参数 | 规格 |
|---|---|
| 测序类型 | 全外显子组测序(WES) |
| 中位深度 | 401×(IQR: 360-442) |
| 样本量 | 501 个组织 + 配对胚系 |
| 质控门槛 | DIN > 4 + 通过 CN calling 和 variant calling |
选 WES 而非 WGS 的原因:成本可控(501 个样本 WGS 极昂贵),WES 足够检测 SNVs、indels、SCNAs 和 WGD。局限:无法检测 SV、ecDNA、非编码区突变。
生信分析管线(完整流程)
Phase 1:基础检测
- 比对:FASTQ → 参考基因组比对 → BAM
- 体细胞突变检测:SNVs + DNVs(双重标准:比例检验 + ≥90% reads 同时含两变异)+ Indels
- 拷贝数检测:Refphase(单倍型特异性 CN + 拯救低纯度样本)→ ALPACA(亚克隆特异性 CN profile)
- WGD 检测:ParallelGDDetect
- Driver 突变注释:OncoKB、openCRAVAT、Ensembl VEP(v.114)、LOFTEE、SpliceAI(阈值0.8)、BoostDM、CHASMplus(组织特异性)
Phase 2:进化重建
- 亚克隆聚类(CONIPHER + PyClone):按突变存在/缺失预聚类 → PyClone 推断 CCF → 枚举所有可能的进化树拓扑 → 选 SCE 最低的树
- 亚克隆分类:Truncal(MRCA) / Primary-unique / Metastasis-unique / Shared subclonal
- 亚克隆 CN profile(ALPACA):输入 CONIPHER 树 + CCF + Refphase 等位基因特异性 CN
- WGD 定时(ParallelGDDetect):将 WGD 事件定位到进化树分支
- Driver 变异时序分析:按亚克隆分类 + TSG 双等位失活(LOH+SNV 时空关系)+ 临床可操作性
Phase 3:迁移模式重建
- MACHINA 算法:输入患者级进化树,三种模型(仅原发灶播种 / 单来源 met→met / 多来源 met→met),选最简约模型
- 迁移概率评估:100 棵最低 SCE 树 × MACHINA → 迁移概率 = 该迁移在所有解中出现比例
- LOH 保守性验证:不可逆 LOH 事件独立验证迁移方向
Phase 4:突变过程与多样性分析
- COSMIC 签名分析(SigProfilerAssignment):≥50 突变直接拟合,<50 突变 1000 次 bootstrap 重采样
- 签名分类:Clock-like(SBS1+5) / Smoking(SBS4) / APOBEC(SBS2+13) / Platinum(SBS31+35) / Other(SBS17b)
- 遗传多样性量化:SNV 多样性(L1 范数)+ SCNA 多样性(段长加权 L1 范数,按 ploidy 归一化)→ 四层次比较(intra-primary / intra-met / inter-met / primary-met)
关键工具汇总
| 分析层级 | 工具/方法 | 输入 | 输出 |
|---|---|---|---|
| 测序 | Illumina WES | DNA(DIN>4) | BAM/FASTQ |
| 突变检测 | Somatic caller | BAM + 胚系 | SNVs, DNVs, indels |
| CN 检测 | Refphase + ALPACA | BAM + 等位基因频率 | 亚克隆特异性 CN |
| WGD 检测 | ParallelGDDetect | CN 数据 | WGD 时序 |
| 亚克隆聚类 | CONIPHER + PyClone | 突变频率 + 多区域 | 进化树 + CCF |
| Driver 注释 | OncoKB, VEP, CHASMplus 等 | 突变列表 | Driver 分类 + 临床分级 |
| 迁移重建 | MACHINA | 进化树 | 迁移路径 + 概率 |
| 签名分析 | SigProfilerAssignment | 亚克隆突变 | COSMIC 签名活动 |
| 多样性量化 | 自定义 L1 范数 | CCF / CN | 四层次异质性指标 |
| 统计建模 | LME 模型, Wilcoxon, Fisher | 上述输出 | P 值 / 相关性 |
方法学亮点
- 分子钟思路:用突变/SCNA 积累量作为时间代理,而非依赖日历时间
- 进化不确定性处理:100 棵树 × MACHINA → 迁移概率,而非单一最优树
- LOH 保守性验证:用不可逆 LOH 事件独立验证迁移方向
- 亚克隆分辨率 CN 分析:ALPACA + Refphase 实现亚克隆级别 SCNA 定量
局限性(方法学)
- 仅 WES,无 WGS → 遗漏 SV、ecDNA、非编码区
- 无单细胞测序 → 亚克隆分辨率受限于 bulk CCF 估计
- 无转录组/表观组 → 无法研究 TME 和非遗传因素
- 88% 患者接受过系统治疗 → 无法完全区分治疗 vs 自然进化
转移进化模型
本研究构建的转移进化模型包含四个核心要素:
多亚克隆播散:原发肿瘤中多个不同亚克隆具有播散能力,各自独立建立转移灶。这推翻了"单一克隆播散"的传统假设。
转移间播散(metastasis-to-metastasis seeding):已建立的转移灶成为进一步播散的源头,形成播散级联(seeding cascade)。超过60%的转移灶由此模式建立,且播散转移灶更早出现于影像。
解剖约束:播散受解剖位置强烈影响。胸腔内转移灶更早出现、播散率更高,且71.3%的播散在同一解剖腔内进行。跨越腔室(胸腔→腔外)的播散更困难但播散范围更广。
CIN促进腔外扩散:能够跨越胸腔边界的亚克隆富集体细胞拷贝数改变(SCNA),表明染色体不稳定性(CIN)是支撑跨腔播散能力的关键基因组特征。CIN可能通过生成亚克隆多样性或改变肿瘤微环境来促进转移。
关键数据解读
亚克隆多样性:每个转移灶中位7个亚克隆(范围3-37),79%的转移灶含有其他转移灶未检出的特异性亚克隆。转移特异性亚克隆数(中位28)是既往有限采样研究(中位2.5)的11倍。
驱动突变时序:49%(97/196)驱动突变为truncal;70%影响抑癌基因;TP53在75%患者中突变且89%双等位失活;KRAS是最常突变癌基因(21%),始终为truncal。
WGD事件:92%(22/24)患者发生WGD;76%发生在原发灶(11 truncal、11 shared subclonal、9 primary-unique),24%在转移灶;原发灶subclonal和转移灶unique WGD事件在29%患者中出现在平行进化分支上,提示晚期疾病中的适应性优势。
突变过程的时间演变:吸烟特征(SBS4)83.4%位于trunk(早期事件);APOBEC活性在原发灶更高(54% vs 34%亚克隆,P=0.0045);铂类特征在64%接受铂类化疗患者的转移特异性亚克隆中检出。
与现有知识的关联
- 与既往TRACERx研究的关系:本研究将Al Bakir等(Nature 2023)发现的NSCLC转移进化模型扩展至前所未有的采样深度,将转移特异性亚克隆检出数量提升11倍。
- 跨癌种一致性:转移灶间异质性低于原发灶与转移灶间异质性的模式与前列腺癌(Gundem et al., Nature 2015)一致。多克隆播散与卵巢癌(McPherson et al., Nat Genet 2016)和前列腺癌研究一致。
- CIN与转移的关联:与Bakhoum等(Nature 2018)提出的CIN通过胞质DNA应答促进转移的机制相呼应,以及本团队既往TRACERx研究中CIN与转移复发风险的关联。
- LCT治疗策略:为局部巩固治疗(LCT)提供生物学依据,与Iyengar等、Gomez等的II期临床试验结果一致。但NRG-LU002(2024)在免疫治疗为主的患者中未显示LCT获益,提示需选择合适的患者群体。
- 解剖约束模型:与结直肠癌中淋巴结转移和远处转移通过不同进化机制发展的发现相呼应。
局限性与思考
- 样本量有限:仅24例患者,限制了对治疗对转移进化影响的评估能力,以及对基因组事件的统计功效。
- 治疗偏倚:88%患者接受了系统性治疗,研究结果能否推广到未治疗患者和初诊即转移患者尚不确定。
- Bulk WES的局限性:尽管采用高深度WES,但相比全基因组测序和单细胞测序,仍可能低估亚克隆多样性。无法研究结构变异、环状DNA(ecDNA)、肿瘤微环境和非遗传过程在转移中的作用。
- 单区域采样的低估效应:25%的转移灶为多区域采样,75%为单区域,仍可能低估转移异质性。作者通过关联分析证实了这一趋势。
- 播散能力的因果性:CIN与腔外播散能力的关联是相关性而非因果性,需要功能研究进一步验证。
- 后续研究:TRACERx EVO(NCT05628376)计划招募600例跨分期患者,进行高深度全基因组测序和100例研究性尸检,有望克服上述局限。
关键图表索引
- Fig. 1:TRACERx-PEACE队列临床和样本特征;纵向时间线、转移灶影像与采样覆盖、遗传异质性分析
- Fig. 2:驱动突变进化时序;原发灶/转移灶/共享/转移特异性亚克隆中的驱动事件分布
- Fig. 3:转移播散模式;原发灶→转移灶 vs 转移灶→转移灶播散、患者级迁移路线和体图
- Fig. 4:转移间播散与在位时间和解剖位置的关联;OS相关性、影像检测时间、亚克隆分支结构、解剖腔约束
- Fig. 5:胸腔外播散亚克隆富集染色体不稳定性;SCNA负荷与播散状态、播散方向的关联
- Extended Data Fig. 1:亚克隆多样性与采样量关系、突变特征在不同亚克隆类别中的分布
- Extended Data Fig. 2:驱动突变详情、WGD时序与SCNA异质性
- Extended Data Fig. 3-7:MACHINA算法迁移推断、播散概率评估、独立验证分析
交叉引用
- [[肺癌转移进化特征]] — 对应 Wiki 综合页
- [[肿瘤进化与异质性]] — 克隆进化理论框架
- [[肿瘤微环境]] — 转移微环境
- [[肾细胞癌]] — 跨癌种进化特征比较
肺癌转移进化特征 — 精读报告
本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
评论交流
欢迎留下你的想法