Dissecting human population variation in single-cell responses to SARS-CoV-2

인구 간 SARS-CoV-2에 대한 single-cell 반응의 차이 분석

[EzV] Dissecting human population variation in single-cell responses to SARS-CoV-2

Abstract

서로 다른 인구는 각자 SARS-CoV-2 감염 이후 나타나는 임상적인 증상에 차이를 보이며, 그 유전적 및 면역학적 기반은 최근에 들어 밝혀지기 시작했습니다. 그러나 SARS-CoV-2에 대한 인구별 면역 반응 차이의 범위와 원인은 여전히 불분명합니다.

이 논문에서는 SARS-CoV-2 또는 influenza A 바이러스를 통해 반응을 일으킨 222명의 건강한 기증자의 말초 혈액 단핵 세포에 대한 single-cell RNA-sequencing 데이터를 보고합니다. 이들은 SARS-CoV-2가 influenza A 바이러스와 비교하여 더 약하지만 더 이질적인 interferon-stimulated gene activity과 myeloid cell의 독특한 pro-inflammatory(염증 촉진성) 신호를 유도한다는 것을 보여줍니다. 바이러스에 대한 transcription 반응은 주로 cell abundance의 변화에 의해 주도되는 뚜렷한 인구 별 차이를 보여주며, 이는 latent cytomegalovirus infection*과 관련된 림프 분화 증가 반응을 포함합니다. Expression quantitative trait loci(eQTL) 및 mediation analysis는 유전적 변이가 특정 장소에 강력한 영향을 미치는 등 인구 간 면역 반응의 차이에 대한 세포 구성의 광범위한 효과를 보여줍니다.


이들은 나아가, 특히 동아시아에서 SARS-CoV-2 반응과 관련된 변종에 대해 자연 선택이 면역 반응의 인구 별 차이를 증가시켰다는 것을 보이며, 바이러스에 대한 myeloid 세포의 반응과 같이 네안데르탈인 형질의 도입이 면역 기능이 바뀌는 데 영향을 주는 세포 및 분자 메커니즘을 논합니다. 마지막으로, colocalization 및 transcriptome-wide association analysis는 SARS-CoV-2에 대한 면역 반응의 유전적 기반과 COVID-19 severity(중증도) 사이에 동시에 겹쳐 나타나는 지점을 밝혀내어 현 세대 COVID-19 위험의 차이에 기여하는 요인에 대한 통찰력을 제공합니다.



* latent infection: 잠재감염. 병원체가 신체 내에 남아 있으나 휴면기에 있어 증상을 나타내지 않음. / cytomegalovirus: 거대세포바이러스. 헤르페스바이러스과(Herpesviridae)에 속하는 종으로 잠재감염의 형태를 보임.

Results

Single-cell responses to RNA viruses

  • SARS-CoV-2 influenza A(이하 IAV)에 대한 transcription 반응을 특징화
  • 이를 위해 SARS-CoV-2에 노출되지 않은 PBMCs(peripheral blood mononuclear cells)에 대해 scRNA-seq 진행

[Fig 1] Dissecting human population variation in single-cell responses to SARS-CoV-2

[Figure 1] 인구 별 SARS-CoV-2 및 IAV에 대한 single-cell 분석 결과
(A) 연구 디자인입니다. 중앙아프리카(남자 80명), 서유럽(남자 80명) 및 동아시아(남자 26명, 여자 36명) 인구 총합 222명을 모아 scRNA-seq 연구를 진행했습니다.
(B) Uniform manifold approximation and projection(UMAP) 결과로 총 22가지의 cell type을 파악했습니다.
(C) UMAP 결과로 NS(감염되지 않은 상태), COV(SARS-CoV-2 감염), IAV(인플루엔자 감염) 상태 별 세포의 분포를 나타냈습니다.

[Fig 1B, 1C] Lineage identity(인종) 및 바이러스 감염에 의해 각각 32% 및 27$의 gene expression variation을 설명할 수 있었습니다. 바이러스 감염은 확인할 수 있는 유전자 발현 12,655가지 중 2,914가지에 대해, 감염되지 않은 상태에 비해 2,914가지 유전자의 발현 증가 반응을 일으켰습니다.

Cellular heterogeneity across populations

  • 아프리카인 혹은 유럽인 조상을 가진 남성 참가자들의 면역 반응이 인구 별로 어떻게 달라지는지 평가(수집 방식에 대한 차이를 배제하고자, 모집 방식이 서로 같은 두 인구 비교)

[Fig 2] Dissecting human population variation in single-cell responses to SARS-CoV-2

[Figure 2] 세포 구성이 바이러스 감염에 대한 transcription 반응에 끼치는 영향
(A) 아프리카인(AFB)과 유럽인(EUB)의 각 면역 계통(immune lineage) 내 세포 유형 비율입니다.
(B) 각 면역 계통에서 기저 상태(NS) 또는 SARS-CoV-2(COV) 또는 IAV에 대해 아프리카와 유럽 그룹 간에 차별적으로 발현되는 유전자의 수입니다.
(C) 세포 유형 및 바이러스(GBP7)에 걸쳐 공유되거나, SARS-CoV-2-stimulated myeloid cells(CCL23)에 특화된 popDRG(differential responses between populations)의 예시입니다.
(D) SARS-CoV-2에 노출된 후, 각 인구 간에 서로 다르게 발현되는 유전자에 대한 세포 조성의 조절에 대한 효과를 봅니다.
(E) NK 계통에서 cell migration의 positive regulation에 관여하는 유전자(GO:0030335)에 대해, 바이러스 자극에 관한 반응 차이에 대해 세포 조성을 조절한 효과를 보입니다.
(F) 인종 별 CMV+/- 혈청 상태(serostatus)에 따른 CD8+ EMRA T 및 memory-like NK cell의 빈도의 분포입니다.

[Fig 2a] 세포의 분포 상 인종 별로 차이를 보였으며, 특히 NK cell의 차이가 컸습니다. Memory-like NK cell의 세부 계통에 포함되는 NK cell은 아프리카인구에서 55.2%였으나, 유럽인구에서는 12.2%로 큰 차이를 보였습니다. 이는 Wilcoxon’s rank-sum test p<1.3 x 10-18의 결과를 보여 유의미한 차이를 확인하였습니다.

[Fig 2b] 계통 간 3,389가지 유전자가 popDEG(differences in expression in the basal state) 상에서의 차이를 보였습니다. 또한 SARS-CoV-2 IAV 감염 후 popDRG는 각각 898, 652개였습니다.

[Fig 2c] popDRG 중에서는 면역계 조절 인자 중 주요 인자들이 포함되어 있었음을 확인했습니다(IFN-responsive GBP7, macrophage inflammatory protein MIP-3, CCL23 )

 

[Fig 2b & 2d] 해당 결과들을 통해, 인구 별 세포 구성의 차이는 popDEG15~47%, popDRG7~46%에 기여했다고 주장합니다. 특히 NK cell에 이러한 차이의 효과가 가장 크게 나타났습니다.

Repercussions of CMV infection

  • 세포 구성 상 인구 간 차이를 확인한 결과, genetic effects에서는 큰 차이를 확인하지 못함  
  • 환경의 차이를 강조
  • [Fig 2F] Latent cytomegalovirus(CMV)의 감염이 세포 구성 및 인구수에 따라 다르기 때문에 혈청 상태를 통해 CMV의 흔적을 파악한 결과, 아프리카 인구가 유럽 인구에 비해 매우 큰 비율로 CMV+를 가지고 있었음.
  • CMV의 혈청 상태는 아프리카인 및 유럽인 간 세포 종류의 차이에 약 73%를 기여하며, 이는 SARS-CoV-2에 대한 transcriptional response에 크게 영향을 끼침
  • 그러나 CMV+는 SARS-CoV-2 반응에 대해, 세포 구성 외에는 제한적인 효과만을 보임. 
  • SARS-CoV-2의 반응에 대해 환경적인 요인의 중요성을 강조

Genetic basis of the leukocyte response

  • 전사 변이에 대한 인간 유전자 변이의 영향을 평가하기 위해, cis-regulatory variants에 초점을 맞추어 세 인구집단 모두에서 eQTL(expression quantitative trait loci)를 공동으로 매핑
  • 해당 결과들을 통해 virus-induced reQTL은 세포 종류에 따라 영향을 받으며, myeloid 반응의 유전적인 면모에 바이러스에 대한 특이성을 강조함

[Fig 3] Dissecting human population variation in single-cell responses to SARS-CoV-2

[Figure 3] RNA virus에 대한 면역 반응의 유전적인 배경
(A) 각 면역계통 내 유전자당 검출된 eQTL 수입니다.
(B) SARS-CoV-2 및 IAV 에 인해 감염된 세포 간의 reQTL* effect size(β)의 비교 결과입니다.
(C) 각 계통 및 감염원에 따라 정리된, virus-dependent reQTL의 수입니다.
(D) MMP1 에서 SARS-CoV-2-specific한 reQTL의 예시입니다.
(E) 인구 간 서로 다르게 발현된 유전자(popDEG)의 eQTL 결과입니다.
(F) 각 계통 및 감염원에 대해 그린 그래프로, x축은 genetics 혹은 세포 구성이 유전자(각 계통 및 자극에서 유전자당 가장 유의한 eQTL) 발현의 인구 간 차이에 얼마나 기여하는지를 나타냅니다. 모든 popDEG(위) 및 eQTL과 관련된 popDEG(아래)에 따라 결과가 나뉩니다.

* reQTL: DNA 대립 유전자 수를 변이 대립 유전자 빈도로 대체하여 측정하는 eQTL의 일종.

[Fig 3a] FDR(False Discovery Rate) 1%의 보정 결과, 각 계통 당 1,866 – 4,323개의 독립적인 eQTL을 발견했으며, 이는 5,198개의 유전자와 관련 있습니다.

[Fig 3b, c, d] 바이러스에 의존적인 reQTL의 비율은 세포의 종류에 따라 모두 달랐습니다. Lymphoid cell에서는 바이러스 간 7.7%의 effect size 차이를 보인 반면, myeloid reQTL의 49%는 SARS-CoV-2 및 IAV 노출에 의해 reQTL의 차이를 더 크게 보였습니다. 이 중 SARS-CoV-2의 감염과 관련하여 가장 강한 reQTL은 rs534191입니다.

Ancestry effects on immune response

  • 면역 반응의 인구 간 차이에 대한 유전적 변이의 기여를 평가하기 위해, popDEG와 popDRG에 대한 심층 분석 진행
  • [Fig 3e] 각 계통에서 발현되는 유전자의 11~24%가 적어도 하나의 eQTL을 가지고 있다는 것을 발견했지만, 이 비율은 cellular heterogeneity로 설명되지 않은 popDEG와 popDRG의 경우 각각 56%와 60%까지 증가함
  • [Fig 3f] 유전자 발현 및 바이러스 반응에 대해 세포 구성의 차이가 인구 간 차이를 크게 드러냈으며, 유전적인 요인은 이보다 더 적은 영향력을 보임

Natural selection and SARS-CoV-2 responses

  • 면역 반응에서 발생하는 인구 차이 중 natural selection의 기여도를 확인하기 위해, local adaption과 관련된 (r)eQTL 및 genome-wide한 신호의 공통적인 부분을 측정(PBS; population branch statistics)  찾은 eQTL 및 reQTL에 연관된 유전자 중 IFN-mediated antiviral immunity에 관련된 유전자 확인(아프리카인: DHX58, TRIM14 / 유럽인: ISG20, IFIT5, BST2, IFITM2-3 / 동아시아인: IFI44L, IFITM2)
  • 이후 (r)eQTL의 빈도를 조상계에서 추적한 결과 IFN-mediated antiviral immunity 관련 유전자들의 반복된 gene adaptation*을 확인

[Fig 4] Dissecting human population variation in single-cell responses to SARS-CoV-2

[Figure 4] 자연선택은 면역 반응에 대한 인구 별 차이에 영향을 끼친다
(A) 245개의 SARS-CoV-2 reQTL에 대해, 지난 2,000세대의 자연선택 기간에 대한 예측 결과입니다. 특히 동아시아인(CHS)에서 빠르게 adaptation이 일어났습니다.
(B) 2개의 SARS-CoV-2 reQTL에 대한 Allele frequency trajectory입니다.

* gene adaptation: 번식 & 생존을 향상시키고 자연 선택에 의한 진화로 인한 유전적 기반을 갖는 생물학적 특성.

 

[Figure 4a] SARS-CoV-2에 특이적인 reQTL 28개는 동아시아인을 중심으로 약 770-970 세대 전 adaptation의 양상을 보였으며, 이는 SARS-CoV-2와 상호작용하는 단백질들과 관련있는 genetic adaptation입니다.

 

[Figure 4b] 위보다도 더 전에는 동아시아인의 SARS-CoV-2에 대한 반응의 차이를 유도하는 유전자에 대한 selection event가 발생했습니다.

Neanderthal heritage on immune functions

  • Neanderthal introgression*이 바이러스에 대한 면역 반응에 끼친 효과를 파악
  • 고대 haplotype은 유전자 발현을 변형할 가능성이 4~1.5배 높았음. 이는 SARS-CoV-2-stimulated CD16+ monocytes와 같은 유전자의 enrichment를 유도하여, 면역 반응을 촉진하는 유전자가 유지되었음을 의미함

     

    * Neanderthal introgression: “네안데르탈인 이입”. 현대 인간과 고생대 유럽 및 서아시아 지역에 서식하던 네안데르탈인 간의 유전적 교류로 인해 현대 인간의 유전자에 네안데르탈 유전자가 혼합된 현상

Contribution of eQTLs to COVID-19 risk

  • SARS-CoV-2의 감염 후 COVID-19의 위험에 대한 유전자 변이의 기여도를 확인

[Fig 5] Dissecting human population variation in single-cell responses to SARS-CoV-2

[Figure 5] eQTL 및 reQTL은 COVID-19의 위협에 기여한다
(A) eQTL 및 reQTL에서 COVID-19 감염 민감성 및 중증도와 연관된 GWAS loci를 enrichment한 결과입니다.
(B) COVID-19 중증도 loci 및 IRF1, IFNAR2 eQTL과 colocalization한 결과입니다.

[Figure 5a] eQTL loci 중 감염 민감성과 중증도에 의해 발현이 증가하는 부분을 확인한 결과, 모든 부분에서 유의미한 결과를 확인했습니다.

 

[Figure 5b] Colocalization의 결과, 1차 면역과 관련된 IFNAR2(non-stimulated CD4+ T cells), IFR1(non-stimulated NK & CD8+ T cells)이 유의미하게 발견되었으며, OAS1(lymphoid cells, stimulated) OAS3(CD16+ monocytes, SARS-CoV-2 exposed)도 발견되었습니다.

[Fig 6] Dissecting human population variation in single-cell responses to SARS-CoV-2

[Figure 6] COVID-19과 연관된 (r)eQTL의 adaptation 및 고대 이입
(r)eQTL 및 COVID-19 위협 인자의 특징을 인구 간 차이나 네안데르탈 이입 사건과 함께 연관성을 확인했습니다.
(A) 면역 계통 및 감염인자 전반에 걸친, 유전자 발현에 대한 target allele의 영향입니다.
(B) 관련 유전자의 임상적 및 기능적인 역할입니다.
(C) Target allele의 현재 인구 내 빈도입니다.
(D) Target allele이 COVID-19 위험(감염, 입원 및 위중한 상태), colocalization probability 및 유전자 발현이 TWA(transcriptome-wide association) 분석에 의해 감지된 COVID-19 위험에 가장 영향을 미칠 가능성이 높은 계통 및 상태에 미치는 영향입니다.

Figure 6의 전반적인 발견들입니다.

(1) 20개의 eQTLCOVID-19 관련 유전자들과 colocalization되었으며, selection signal이 양의 방향으로 발견되거나(13 eQTLs) 고대 이입(7 eQTL)을 확인했습니다. 그 중 14개의 eQTLCOVID-19의 민감성 혹은 중증도와 관련이 있었습니다.

(2) 39kb의 네안데르탈 haplotype이 유라시아 인구의 MUC20 locus를 둘러 있는데, 이 중에는 rs2177336-T allele을 포함하고 있어 SARS-CoV-2에 노출된 세포에서 MUC20의 발현이 높아짐을 확인했습니다. 이는 특히 CD4+ T cell에서 많이 보였으며, COVID-19 감염 민감성을 낮춰주었습니다.

 

(3) 전반적으로, 위 결과들은 자연선택 및 네안데르탈 이입이 현재 COVID-19의 위험에 대한 면역 반응에 어떤 영향을 주었는지 밝혔습니다.

Disscussion

이 논문에서는 세포 구성이 SARS-CoV-2에 대한 면역 반응의 인구 차이의 주요 동인임을 보여줍니다. CMV 감염과의 연관성과 함께 아프리카 혈통의 lymphoid lineage에서 더 높은 비율의 기억 세포는 이전의 환경 노출이 세포 활성화 상태의 인구 차이에 어떻게 기여할 수 있는지를 강조합니다. 이 연구는 나아가 자연 선택과 네안데르탈인의 내성이 SARS-CoV-2에 대한 현재의 면역 반응을 구별하는 데 기여했음을 보여주며, 이에 그치지 않고 SARS-CoV-2에 대한 전사 반응 변화의 유전적 요인의 해부를 통해 COVID-19 위험과 관련된 대립유전자의 영향에 대한 통찰력을 제공합니다.

전반적으로, 이들의 결과는 RNA virus, 특히 SARS-CoV-2에 대한 peripheral immune response의 완전한 다양성을 포착하는 데 있어 single-cell 접근법의 가치를 강조하고 개인과 인구집단에 걸쳐 면역 반응 변화의 환경, 유전적 및 진화적 동인에 대한 통찰력을 제공합니다.

REF