Prognostic genome and transcriptome signatures in colorectal cancers

대장암에서의 예후 예측 유전체 및 전사체 시그니처

Abstract

대장암은 핵심 암 경로에 있는 드라이버 유전자에 영향을 미치는 일련의 체세포 유전체 변이에 의해 발생합니다. 이 연구에서는 암을 유발하는 체세포 돌연변이의 기능적 및 예후적 영향을 파악하기 위해, 장기간 추적 관찰된 인구 기반 코호트에서 1,063개의 1차 대장암의 전체 유전체와 전사체를 분석했습니다. 96개의 변이된 드라이버 유전자 중 9개는 이전에 대장암과 연관된 적이 없었고, 24개는 어떤 암과도 관련이 없던 유전자였습니다. 연구에서 두 가지 뚜렷한 경로 공돌연변이 패턴이 관찰되었으며, 시간적 분석을 통해 9개의 초기 드라이버 유전자 변이와 3개의 후기 드라이버 유전자 변이가 확인되었습니다. 또한, 여러 대장암 특이적 돌연변이 과정의 시그니처가 발견되었습니다. WNT, EGFR, TGFβ 경로 유전자, 미토콘드리아 CYB 유전자, 3개의 조절 요소, 21개의 복제수 변이(CNV), 그리고 COSMIC SBS44 시그니처가 생존율과 유의미한 상관관계를 보였습니다. 유전자 발현 분석을 통해 고유한 분자적 특징을 가진 다섯 가지 예후적 아형이 도출되었으며, 이러한 아형 중 일부는 기저 유전체 변이에 의해 설명될 수 있었습니다. 마이크로세틀라이트 불안정성(MSI) 종양은 저산소증 수준과 면역 및 간질 세포의 침투 정도가 다른 두 가지 하위 그룹으로 나뉘었습니다. 이 연구는 대장암에 대한 가장 포괄적인 유전체 및 전사체 통합 분석으로, 돌연변이, 유전자 발현, 그리고 환자의 예후를 상호 연결하여 분석하였습니다. 예후적 돌연변이와 발현 아형의 식별은 향후 대장암 치료의 개인화에 중요한 지침을 제공할 수 있을 것입니다.

Figures

Mutational landscape

1. 샘플 수집 및 유전체 분석: 1,063명의 대장암(CRC) 환자에서 종양 및 정상 대조군 샘플로부터 고품질 전체 유전체(평균 53배 커버리지)와 종양 전사체(평균 3,000만 쌍의 리드)를 분석했으며, 96개의 변이된 드라이버 유전자를 식별했습니다. 이 중 23%의 종양은 과돌연변이(hypermutated) 상태였고, 21%는 MSI 양성으로 확인되었습니다.
2. 종양 특성: 과돌연변이(HM) 종양은 비과돌연변이(nHM) 종양에 비해 나이가 많고(중앙값 76세 대 71세), 여성에게 많았으며, 우측 대장, 점액성, 고등급(저분화 또는 미분화), II기 단계 종양이 더 자주 나타났습니다. 또한, HM 종양의 20% 이상에서 TGFβ–BMP, WNT, RTK–RAS, 리보솜 단백질, PI3K 등의 경로가 변이된 것으로 확인되었습니다.
3. 드라이버 유전자 및 경로: 전체 코호트에서 96개의 고유한 드라이버 유전자와 13개의 추가적인 아형 특이적 드라이버가 확인되었습니다. nHM 종양에서 가장 흔한 돌연변이는 KRAS p.G12D (15%) 및 p.G12V (11%)였으며, WNT, p53, RTK–RAS, PI3K 경로에 속한 유전자들이 10% 이상의 nHM 종양에서 변이된 것으로 나타났습니다.

Fig. 1. Somatic mutation analysis of 1,063 CRC genomes identifies 96 driver genes.

(A) 유의미한 돌연변이 유전자와 임상적 특징

(B) 돌연변이 유병률 및 임상적 특징

(C) DNA 손상 반응(DDR) 유전자 변이

[Fig 1A] 이 패널은 96개의 유의미하게 돌연변이된 유전자를 보여줍니다. 각 유전자에 대해 과돌연변이(HM)와 비과돌연변이(nHM) 종양에서의 생존률(HR)과의 연관성을 다변량 Cox 회귀 분석으로 표시하고 있습니다. 또한 각 유전자가 임상적 및 유전체적 특징과 어떻게 연관되는지도 나타나 있습니다. 오른쪽에는 돌연변이 유형과 유전자에 영향을 받는 경로에 대한 설명이 포함되어 있습니다.

[Fig 1B] 이 패널은 각 종양에서 전체 돌연변이(파란색)와 비동의적 돌연변이(빨간색)의 유병률을 보여줍니다. 과돌연변이(HM)와 비과돌연변이(nHM)를 구분하는 기준선이 회색 선으로 표시되어 있으며, 선택된 유전자들의 돌연변이 상태와 임상적 특징이 하단에 나타나 있습니다.

[Fig 1C]  패널은 21개의 HM 종양 중 MSS를 가진 15개의 종양에서 DNA 손상 반응(DDR) 유전자 변이를 보여줍니다. 상단에는 각 샘플의 비동의적 돌연변이 총 개수가 발암 경로에 따라 색상으로 표시되어 있습니다.

SVs and timing analyses

 1. 유전자 복제수 변이(CNV)와 구조적 변이(SV) 분석: 대장암(CRC) 진행 중 발생하는 모든 유형의 유전체적 사건을 포함하기 위해 CNV와 SV를 분석했습니다. 주로 7p와 20q의 염색체 획득과 17p, 18p, 18q의 LOH(이형접합성 상실)가 가장 흔하게 나타났습니다. 특히, nHM 종양에서 CNV의 빈도가 더 높았고, GNAS와 ASXL1 유전자에서 CNV가 빈번하게 발생했습니다.

2. 특정 구조적 변이와 임상적 연관성: 고등급 종양에서 결실(deletions)이 가장 흔하게 나타났으며, 전좌(translocations)는 고령 환자, HM, MSI, 그리고 고등급 종양에서 더 자주 발생했습니다. 반면, 역위(inversions)와 탄뎀 중복(tandem duplications)은 HM, MSI, 우측 대장 종양에서 더 적게 나타났습니다. 주요 종양 억제 유전자인 RUNX1, PTEN, SMAD3이 자주 결실되는 것으로 확인되었습니다.

3. 조기 및 후기 유전체 사건: APC, TP53, KRAS, BRAF, ZFP36L2 돌연변이와 염색체 17p, 18의 손실이 대장암 진행의 초기 사건으로 나타났습니다. 반면, 전 게놈 복제, 1q, 6p, 9p, 12, 16p, 17q, 19q의 획득, 그리고 TRPS1, GNAS, CEP170의 돌연변이는 후기 또는 아형(subclonal) 사건으로 확인되었습니다. 이러한 발견은 대장암의 초기 진단과 침습 및 전이와 관련된 중요한 정보를 제공합니다.

Fig. 2.  Structural variation and relative timing of somatic events in CRC.

(A) 드라이버 유전자의 복제수 변이(CNVs)

(B) 구조적 변이(SVs)와 임상적, 유전체적, 전사체적 특징

(C) 드라이버 유전자 돌연변이와 구조적 변이의 발생 시점

[Fig 2A] 이 패널은 대장암(CRC)에서 드라이버 유전자의 복제수 변이를 유형별로 시각화한 것입니다. LOH(이형접합성 상실, 녹색), 결실(노란색), 증폭(빨간색)으로 나누어 표현되었습니다. 각 막대의 높이는 해당 변이를 가진 종양의 비율을 나타냅니다. 유전자들은 그들의 게놈 위치에 따라 표시되어 있으며, 역할에 따라 암유전자(Oncogenes, 보라색), 종양 억제 유전자(Tumor Suppressor Genes, 주황색), 두 가지 역할 모두를 하는 유전자(빨간색), 그리고 역할이 알려지지 않은 유전자(검은색)로 구분됩니다.

[Fig 2B]이 패널은 결실(deletions), 역위(inversions), 탄뎀 중복(tandem duplications), 전좌(translocations) 등 주요 구조적 변이가 임상적, 유전체적, 전사체적 특징에 따라 어떻게 분포하는지 보여줍니다. 박스플롯은 1사분위수(IQR)와 중앙값을 나타내며, 통계적 유의성은 Wilcoxon 순위합 검정을 통해 평가되었습니다.

[Fig 2C] 이 패널은 801개의 nHM CRC 종양에서 드라이버 유전자 돌연변이와 구조적 변이(SVs)의 발생 시점을 시각화한 것입니다. PhylogicNDT를 사용하여 이들 변이가 발생한 시점이 초기에 발생한 변이(초록색), 중간 시점에 발생한 변이(검은색), 후기 또는 아형(subclonal) 변이(보라색)로 분류되었습니다.

Expression of drivers and fusion genes

  1. 유전자 변이와 발현 수준의 연관성: RTK–RAS, PI3K, p53, TGFβ 경로의 유전자(EGFR, KRAS, PIK3CA 등)에서 변이가 있는 종양은 유전자 발현이 증가한 반면, APC, PTEN, TP53 변이가 있는 종양에서는 발현이 감소했습니다. WNT 경로에서는 SOX9과 TCF7L2 변이가 있는 종양에서 해당 유전자 발현이 증가한 반면, 다른 WNT 경로 유전자에서는 발현이 감소했습니다.

  2. 특정 유전자 간의 상호작용: BRAF와 RNF43의 동시 변이를 가진 종양에서는 BRAF 발현이 증가하고 RNF43 발현이 감소했습니다. 또한, 항원 제시(HLA-A, B2M 등), 전사 조절(ASXL1, NONO), 세포자살(BAX), 히스톤 변형(KMT2B), 리보솜 기능(PPL22)과 관련된 여러 유전자에서 변이와 함께 발현 감소가 관찰되었습니다.

  3. 융합 전사체 분석: 총 621개의 융합 전사체가 338개의 nHM 종양(41%)과 78개의 HM 종양(32%)에서 발현되었으며, 이 중 17개는 재발성 융합으로 확인되었습니다. PTPRK, RSPO3, SEPTIN14 등이 가장 자주 융합된 유전자들로 나타났으며, 특히 PTPRK–RSPO3 융합은 대장암에서 분화 촉진과 줄기세포 특성 상실을 유도하는 것으로 알려져 있습니다.

Fig. 3. Integrative analysis of somatic alterations and gene expression levels in CRC signalling pathways.

대장암(nHM 및 HM 종양)에서 발생한 유전자 변이(돌연변이 및 복제수 변이)가 주요 암 관련 신호 경로(RTK-RAS, WNT, PI3K, p53, TGFβ, MYC 등) 내에서 유전자 발현에 미치는 영향을 시각적으로 보여줍니다. 각 유전자에서 발생한 변이가 발현 변화를 유도하며, 일부 유전자는 발현이 증가하거나 감소하는 경향을 나타냅니다. 특히, 드라이버 유전자들이 암의 발병 및 진행에 중요한 역할을 하며, nHM과 HM 종양 간의 유전자 변이 및 발현 패턴의 차이가 강조되어 있습니다. 이 그림은 유전자 변이와 암 경로 간의 상호작용을 이해하는 데 중요한 정보를 제공합니다.

Prognostic gene expression signature

 1. 새로운 대장암 예후 아형(CRPS) 분류: CRPS는 기존의 CMS 분류를 부분적으로 재현하면서도, 더 많은 종양을 분류하고 예후 예측에 있어 더 우수한 성능을 보였습니다. 예를 들어, CRPS1 그룹은 CMS1 그룹보다 더 많은 HM 종양을 포함하며, CMS 분류에서 분류되지 않은 종양들도 대부분 CRPS에 할당되었습니다.

2. 각 CRPS 아형의 임상적 특징: CRPS1은 주로 우측 대장, 고령, 여성 환자에게서 더 흔하게 나타났으며, CRPS4는 주로 직장에 위치하며 TGFβ와 WNT 경로 활성화와 관련이 있었습니다. CRPS5는 우측 대장에 위치하며, WNT 신호 억제와 높은 KRAS, PIK3CA, FBXW7 변이 빈도를 특징으로 했습니다.

3. CRPS의 예후 예측 능력: CRPS 분류는 생존율(OS)과 무재발 생존율(RFS)에 대한 예측 능력이 뛰어나며, CRPS2와 CRPS3은 가장 긴 생존율을, CRPS4는 가장 짧은 생존율을 보였습니다. 또한, 외부 검증에서 CRPS 분류의 정확도와 예후 예측 능력이 확인되었습니다.

Fig. 4. Refined prognostic subtypes derived from 1,063 CRC transcriptomes

(A) CRPS와 CMS의 비교

(B) CRPS에 따른 전사체적 특징 및 유전체적 변이

(C,D) 생존율 분석

[Fig. 3A] 이 패널은 Sankey 다이어그램을 사용하여 새로운 CRPS 분류와 기존 CMS 분류 간의 관계를 시각적으로 나타냅니다. 각 CRPS 아형은 CMS 아형과 비교되며, 각 아형이 전체 종양 샘플에서 차지하는 비율이 표시됩니다. CRPS는 기존 CMS보다 세분화된 아형을 제공하여, 특히 CMS4 종양이 CRPS2와 CRPS4로 나뉘는 등 더 정교한 분류가 가능함을 보여줍니다. 이로 인해 CRPS 분류가 기존 CMS보다 더 나은 예후 예측 능력을 가지며, 보다 개인화된 치료 접근에 기여할 수 있습니다.

[Fig. 3B] 이 패널은 CRPS 아형에 따른 전사체적 특징과 유전체적 변이(CNV)를 나타낸 히트맵입니다. 각 열은 특정 전사체 시그니처 또는 CNV를 나타내며, 각 행은 CRPS 아형을 나타냅니다. 색상은 발현 수준의 변화(예: 유전자 활성화 또는 억제)를 의미하며, 유의미한 변이와 그 빈도가 표시되어 있습니다. 이 패널은 CRPS 아형별로 전사체 및 유전체 변이가 어떻게 다르게 나타나는지를 시각적으로 보여줍니다. 예를 들어, CRPS4는 stromal 침윤과 TGFβ 경로 활성화가 특징이며, 이는 종양의 미세환경 및 전이 가능성에 영향을 미칠 수 있습니다. 이러한 정보는 특정 CRPS 아형에서의 치료 목표를 더 명확하게 정의하는 데 도움이 됩니다.

[Fig. 3C,D] Kaplan-Meier 생존곡선이 CRPS 아형별로 (상단 패널) 및 CMS 아형별로 (하단 패널) 나타나 있으며, 전반적인 생존율(OS)과 무재발 생존율(RFS)을 비교합니다. 또 다른 패널(d)에서는 CMS4로 분류된 종양이 CRPS2와 CRPS4로 재분류된 경우의 생존율 차이를 보여줍니다. 이 패널은 CRPS 분류가 생존율 예측에 있어 CMS보다 더 우수한 성능을 보임을 강조합니다. 특히, CRPS2와 CRPS3 아형은 가장 긴 생존율을 보였고, CRPS4는 가장 짧은 생존율을 보였습니다. 이는 CRPS 분류가 더 정확한 예후 예측 도구임을 나타내며, CRPS 기반의 분류가 암 치료에서 더욱 정밀한 접근을 가능하게 할 수 있음을 시사합니다.

Disscussion

본 연구에서는 대장암(CRC)에 대한 전체 유전체 시퀀싱(WGS)과 전사체 데이터를 통합하여 분석하고, 예후 인자를 분석할 수 있도록 충분한 임상적 추적 관찰을 제공하는 대규모 연구를 수행하였습니다. 대장암의 분자 유전적 기초는 비교적 잘 알려져 있지만, 분석된 대부분의 종양은 임상 시험, 대형 전문 병원, 또는 샘플링 시점에 적극적으로 치료된 종양에 기반하고 있습니다. 예후가 나쁜 유전적 변이를 가진 종양은 특정 기준에 따라 선별되는 임상 시험이나, 치료 가능성이 있는 환자만 분석하는 병원 기반 코호트에서 충분히 대표되지 못하고 있습니다.

우리는 1차 종양의 외과적 제거를 받는 환자 집단에서 발생한 CRC를 통합적으로 분석하였습니다. 이 연구를 통해 기존의 CRC 드라이버 유전자 목록을 33개의 유전자로 확장했으며, 이 중 3분의 2는 이전에 암 드라이버로 설명되지 않았으나 대부분 암 관련 경로에 속하는 것으로 나타났습니다. 결함 있는 DNA 불일치 복구(MMR)와 POLE 돌연변이와 관련된 새로운 돌연변이 시그니처들이 확인되었습니다. 타이밍 분석을 통해 대부분의 염색체 손실이 초기 단계에서 발생하며, 증폭은 후기 단계에서 일어난다는 사실이 밝혀졌고, TP53 변이가 PIK3CA 변이와 10q(PTEN) 손실에 선행한다는 것을 시사했습니다. 이전에 알려지지 않은 여러 초기 사건들이 확인되었고, 1q와 CEP170, 8q와 TRPS1, 20q와 GNAS의 증폭과 변이의 늦은 시점은 클론 적합성, 침습, 전이 맥락에서 추가 분석의 필요성을 제기합니다.

통합 분석의 중요한 발견으로는 (1) 예후가 좋은 CRPS2–CRPS3형 종양에서 염색체 20 증폭이 풍부하게 나타났으며, 이는 이전에 좋은 예후와 관련된 것으로 알려져 있습니다; (2) M1 대식세포는 좋은 예후의 CRPS1 종양에서 풍부하게 나타났고, M2 대식세포는 나쁜 예후의 CRPS4 종양에서 풍부했습니다; (3) 주요 드라이버 유전자 발현 수준이 돌연변이 상태와 연관되었고; (4) 조절 요소에서의 예후적 돌연변이가 특정 유전자의 발현 변화와 연관되었습니다; (5) 종양의 저산소증이 특정 돌연변이 시그니처와 연관되었습니다; (6) MSI 종양이 분자적 특징이 다른 두 가지 클래스으로 나뉘었습니다.

현재의 분자 분류와 비교하여, 예후적 CRPS 시그니처는 대장암 아형 분류를 정밀하게 개선하고, 대부분의 종양을 분류할 수 있는 능력을 제공합니다. CRPS의 강건성은 더 큰 코호트에서 완전한 추적 관찰과 함께 검증되어야 합니다. 확인된 예후 유전체 인자들을 요약하면(Table 1), 이전에 보고된 APC, BRAF, RNF43 돌연변이와 SMAD4 손실의 예후적 관련성을 확인하였고, TGFBR2의 변이가 생존과 양의 연관성을 보이는 등 이전에 보고되지 않은 예후 드라이버 유전자들을 보고합니다. 주목할 만한 점은, 예후적 드라이버 유전자들이 WNT, EGFR-KRAS-BRAF, 또는 TGFβ 경로에 속해 있다는 것입니다. 또한, MT-CYB와 ID2, HS3ST1, DAPK1의 조절 요소에서의 예후 돌연변이는 추가 연구가 필요합니다. 이러한 발견들은 CRC 유전자에 대한 기능적 연구와 진단 및 치료 방법 개발을 위한 중요한 기초를 제공합니다. 향후 같은 종양과 환자의 후성유전체, 단백질체, 대사체의 특성을 파악하는 것은 서로 다른 예후적 특징들이 어떻게 연관되는지를 추가로 이해하는 데 도움이 될 것입니다.

REF

답글 남기기