인체 골격 발달의 기능적 유전체학과 키 유전성의 패턴 분석
Abstract
키의 변이는 긴뼈 성장판을 구성하는 연골세포 (연골모세포)의 조절 변화에 기인합니다. 현재까지 우리는 인체 골격에서 채취한 연골모세포의 후성유전학적 조절과 유전자 발현에 대한 이해가 부족하여, 키 생물학을 조절하는 기본적인 규제 메커니즘을 명확히 이해하지 못하고 있습니다. 본 연구에서는 먼저 다양한 성장판에서 채취한 연골모세포를 바탕으로 인체 골격 발달 과정 전반에 걸친 방대한 후성유전학적 및 전사체 지도를 생성함으로써 이 문제를 해결하고, 인간의 뼈와 관절 발달을 형성하는 새로운 규제 네트워크를 발견하였습니다.
다음으로, 이러한 지도를 키와 관련된 전장 유전체 연관 연구 (GWAS) 신호와 결합하여, 골격 요소 특이적 변이와 전역적으로 작용하는 변이가 골격 성장에 미치는 규제적 영향을 분리하여 분석하였습니다. 이를 통해 키 변이에 있어 규제적 다면성이 핵심적으로 중요하다는 사실을 밝혔습니다.
마지막으로, 키는 높은 유전율을 가지며 복합형질 유전학의 대표적 사례로 자주 사용되므로, 본 데이터세트를 검증 가능한 전유전체 모델 (omnigenic model) 프레임워크 내에서 활용하여 연골모세포 발달 모듈과 키 생물학 및 골격 성장을 조형하는 말초적 작용 인자를 새롭게 규명하였습니다.
Figures
Epigenomic assessment of long-bone skeletal development
– 연구진은 인간 연골세포의 후성유전체를 분석하기 위해 태아 53/54일 시점의 샘플에서 ATAC-seq를 수행하여 골격 발달 초기에 형성되는 연골 구조와 긴 뼈의 연골 연장 시기에 초점을 맞췄습니다.
– 분석 결과, 골격 내 위치별 염색질 접근성 패턴은 뼈 종류가 아닌 관절 정체성을 기준으로 클러스터링되었으며, 조기 활성 조절 요소는 뼈 성장 시작과 관련이 있고 후기 활성 요소는 성장 유지에 관련된 것으로 나타났습니다.
– 조기와 후기 발달 시기의 후성유전체 활동은 대체로 일치했으나, 시간 제한적 조절 요소는 각 시기에 따라 다른 골격 발달 기능과 연관이 있음을 보여줍니다.
[Figure 1] 인간 골격 발달 중 후성유전학적 프로파일링
(A) 실험 개요도.
(B) (왼쪽, UpSet plot) 서로 다른 골격 요소 및 배아 뇌와 중첩되는 ATAC-seq 영역의 수. (중앙, 파이 차트) 요소 간 중첩된 ATAC-seq 영역의 비율. (오른쪽, 히트맵) 골격 요소의 Jaccard 유사도 지수.
(C) E50s와 E60s 시점 사이에서 공통 또는 특정 조절 영역이나 피크가 중첩된 ATAC-seq 영역의 비율.
(D) E50/E60s 시점의 영역 세트에 대한 GREAT 인간 표현형 강화.
Transcriptomic assessment of long-bone skeletal development
– RNA-seq 분석 결과, 골단 조직 샘플은 조직 유형과 사지 유형 (전지/후지)에 따라 클러스터링되었으며, 골단 특이적으로 차별적으로 발현되는 유전자 (DEG)의 클러스터링 패턴은 ATAC-seq 분석과 유사하게 나타났습니다.
– 시간에 따른 발현 변화를 분석한 결과, 대부분의 유전자는 특정 해부학적 위치에서 발현 수준이 크게 변하지 않았습니다.
– 특정 골단 또는 관절에서의 발현 프로그램을 조사한 결과, 원위 대퇴골에서 발현이 증가된 유전자들은 “골격계 발달”, “연골 발달”, “Wnt 신호 경로”와 관련된 생물학적 과정을 포함했습니다.
[Figure 2] 인간 골격 발달 중 전사체 프로파일링
(A) 요소 전반에서 일관되게 차별적으로 발현되는 상위 200개 유전자의 발현 히트맵.
– 해부학적 범주 (뼈, 팔다리, 뼈 끝)로 요소를 그룹화한 결과는 상단의 세 가지 색상 막대로 표시.
(B) 개별 뼈 끝 조직에서 정의된 중복 차별 발현 유전자 (DEGs)의 히트맵.
(C) 해부학적 관절 수준에서 정의된 DEGs의 히트맵.
(D) 특정 뼈 끝 조직에서 DEGs의 비율로, 초기/후기 임신 기간에 따라 발현 편향을 보이는 유전자.
Transcriptomic assessment of long-bone skeletal development
– 전방지 및 후방지 조직의 유전자 발현 분석을 통해 유전자 발현 프로그램이 관절과 지체 유형에 의해 영향을 받으며, 각 관절과 지체 유형에 특화된 DEG 패턴을 보였습니다.
– TBX5와 PITX1과 같은 주요 발달 조절 인자들이 특정 관절에서 발현이 증가하며, 이는 이들의 지체 생물학에서의 역할과 일치합니다.
– 이 연구는 인간 골격 발달의 에피지놈 및 전사체 환경에 대한 통찰을 제공하며, 해부학적 부위 특이적인 조절 프로그램을 강조하고, 신장 유전적 유전 가능성과의 연관성을 조사하는 기초를 마련합니다.
[Figure 3] 발달 중 해부학적 관절의 분기된 조절 활동
(A–D) 개별 해부학적 관절 (어깨, 팔꿈치, 무릎, 엉덩이) 별 관절 특이적 조절 행동에 대한 설명. 각 패널 내:
(상단) 관절 특이적 향상자의 서열 모티프 강화.
(왼쪽 하단) 특정 관절에서 차별적으로 발현된 유전자의 발현 화산 플롯.
(오른쪽 하단) (상단 파이 차트) 특정 관절에서 발현 증가를 보이는 유전자의 비율로, 발달 초기 (E50–E54, 분홍색) 또는 후기 (E55–E59, 녹색)에 발현 증가를 보이거나, 시간이 지나도 변화가 없는 경우 (파란색). (하단 파이 차트) 관절 특이적 유전자 중 다른 관절에서도 발현 증가를 보이는 유전자의 비율.
(E) ATAC- 및 RNA-seq 데이터셋 통합.
(F) 특정 관절에서 발달 초기 (왼쪽, 빨간색) 또는 후기 (오른쪽, 녹색) 골격 발현에 편향된 유전자에 대한 GO 용어 강화.
Integration of genetic associations for height with skeletal epigenetic and transcriptomic context & Partitioning genetic associations for height, sitting height, and leg length using human skeletal data
– 연구에서는 높이와 관련된 유전자 변이들이 연골 세포 조절 영역에 존재할 때, 이들이 유전자 발현에 영향을 미쳐 골격 발달과 성장에 영향을 줄 수 있다는 가설을 제시하며, 이를 확인하기 위해 최근의 신장 GWAS 메타 분석을 활용했습니다.
– 연구는 다양한 골격 부위에서 조절 변이와 유전자 발현 패턴을 비교한 결과, 특정 관절 및 지체 부위에서 유전자 발현이 특정 변이와 관련이 있음을 발견했습니다.
– 골격의 축과 부속골에서 각각 신장, 앉은 키, 다리 길이와 관련된 조절 영역이 차별적으로 분포하고, 이를 통해 신장 유전학과 골격 생물학의 관계를 더욱 잘 이해할 수 있었습니다.
[Figure 4] 골격형성의 기능적 유전체학과 키 연관성의 통합
(A) 키와 연관된 정밀 지도 변이가 다양한 ATAC-seq 영역 카테고리 (광범위한 다면발현성부터 매우 조직 특이적인 영역까지)에 속하는 비율.
(B) 다양한 ATAC-seq 영역 세트 내에서 키 연관 정밀 지도 변이의 배수 증가/감소율.
(C–E) UK Biobank 데이터로부터 (C) 앉은 키, (D) 다리 길이, (E) 서 있는 키와 관련된 유의한 변이의 배수 강화율.
(F) (C–E)의 변이 세트에 대한 축 골격 후성유전학 데이터셋을 사용한 배수 강화율.
An approach for assessing omnigenicity and discerning the underlying regulatory architecture of height biology & Identifying gene co-expression modules & Modules capture trait-relevant biology & Regulatory networks around modules integrate genetic heritability signals
– 연구는 신장과 관련된 유전자들이 상호작용하는 모듈로 그룹화되어 있으며, 이들 모듈이 신장 발달에 중요한 역할을 한다고 제안합니다.
– 여러 골격 부위에서 유전자 발현 패턴을 분석하여, CD1 모듈이 신장 유전 가능성과 밀접하게 연관된 핵심 유전자들이 포함되어 있다는 결과를 도출했습니다.
– CD1 모듈은 유전자 발현 및 조절 네트워크를 통해 신장 발달과 관련된 유전적 변이를 설명하는 중요한 요소로 작용하며, 이 모듈의 조절 요소들은 신장 유전 가능성에 큰 영향을 미칩니다.
[Figure 5] 유전자 co-expression 모듈과 키 유전성의 유전 구조
(A) Omnigenic 키 구조를 설명하는 제안된 프레임워크의 개략도.
– 검은 선- co-expression 패턴 공유; 녹색 원- co-expression; 내부 원- 전사인자 (TF)와 같은 상위 요인에 의해 조절
– 주변에서 중심으로 이동함에 따라 키와의 연관성 증가 예상.
(B) MAGMA 분석을 통해 강화된 모든 모듈에 대해 상위 두 개의 강화된 GO 생물학적 과정.
(C) 임의 크기와 일치하는 유전자 세트와의 비교를 기반으로 한 모듈의 키 연관성 강화. −log10 조정된 p value를 x축에 표시.
(D) 특정 모듈의 유전자에 대한 집합적 위치 기반 키 연관 통계의 분포.
왼쪽 상단: CD1 모듈의 유전성 (h2) 분포.
오른쪽 상단: CD1 모듈의 절대 효과 크기 (beta) 분포.
A general framework for understanding complex-trait genetics
– 연구는 신장 유전학을 기반으로 복잡한 특성의 유전적 구조를 이해하는 개념적 틀을 개발하고, 이를 통해 다른 복잡한 특성들도 이해할 수 있는 잠재력을 제시합니다.
– 이 틀은 ‘omnigenic 모델’을 기반으로 하여, 인간 신장 발달뿐만 아니라 제2형 당뇨병 (T2D)과 같은 다른 복잡한 질환에도 적용될 수 있음을 보여주었습니다.
– T2D에 대한 분석을 통해 췌장 유전자들의 co-expression 모듈을 정의하고, 이를 통해 T2D와 관련된 유전자 신호와 QTL 변이 데이터를 통합하여 omnigenic 모델의 유용성을 확인했습니다.
[Figure 6] 제2형 당뇨병 유전적 연관성에 대한 프레임워크 적용
(A) 유의한 연관 테스트를 생성한 모듈에 대한 상위 두 개의 강화된 GO 용어.
(B) 제2형 당뇨병 GWAS 변이에 대한 유전자 세트 연관 강화 모듈.
(C) 특정 모듈의 유전자에 대한 집합적 위치 기반 제2형 당뇨병 연관 통계의 분포.
상단: 주어진 모듈에 대해 위치별 평균 −log10 (p value)의 분포를 무작위 생성된 크기 일치 모듈의 분포와 비교.
중간: 100,000개의 무작위 크기 일치 모듈에 대해 세트 평균 위치 −log10 (p value)의 분포.
하단: 동일한 100,000개의 무작위 크기 일치 모듈에 대해 세트 평균 위치 절대 효과 크기 (beta 계수)의 분포.
Disscussion
본 연구는 골격 요소의 성장 차이가 두드러지는 발달 시기에 체간 및 부속 골격 전반에 걸친 후성유전학적 및 전사체 활동의 고해상도 데이터를 생성하여, 연골모세포 매개 골격 부위화 과정에서 해부학적 특이성을 가진 유전자와 관련 규제 영역을 규명하였습니다. 이를 통해 신장, 앉은키, 다리 길이와 관련된 골격 성장의 발달 유전적 조절을 분석하였으며, 골격 형성과정에서 규제 활동과 신장 유전성 간의 전장 유전체적 관계를 탐구하였습니다. 연구는 신장 생물학에서 다유전자 구조를 조사하기 위해 omnigenic 모델을 활용하여, 핵심 대사 경로와 연골 발달에 중요한 CD1 모듈을 확인하였고, 이 모듈에 포함된 FOXP1이 주요 상위 조절자로 작용함을 밝혔습니다. CD1 모듈은 연골모세포의 대사 활동과 골격 성장에 기여하는 핵심 유전자 세트를 포함하며, FOXP1은 이러한 유전자들의 조절 네트워크에서 중요한 역할을 하는 것으로 나타났습니다. 더 나아가, 복합형질 유전학 연구를 위한 분석 프레임워크를 개발하여, 이를 신장뿐 아니라 제2형 당뇨병 (T2D)과 같은 다른 복합형질 연구에도 적용 가능함을 확인하였으며, 다양한 형질의 복잡한 유전적 구조를 이해하는 데 기여할 수 있는 방향성을 제시하였습니다.
본 연구에서는 골격 요소가 현저히 성장하고 차별적으로 발달하는 시기를 대상으로 체간과 부속 골격 전반에 걸친 후성유전학적 및 전사체 활동의 대규모 고해상도 데이터를 생성하였습니다. 이를 통해 해부학적으로 특이성을 가지는 개별 유전자의 발현 영역과 연골모세포에 의해 매개되는 골격 지역화 발달에 관여하는 추정 규제 영역을 분리할 수 있었습니다. 이러한 부위 특이적 골격 규제 네트워크에 대한 지식을 활용하여, 신장, 앉은키, 다리 길이에 영향을 미치는 골격 성장의 발달 유전적 조절 메커니즘을 분석하였습니다. 더 나아가, 골격 형성 과정에서 규제 활동과 신장 유전성 간의 전장 유전체적 관계를 탐구하였습니다.
본 연구는 관련 형질 연관성과 관련된 조직, 해부학적 부위 및 세포 유형에 의해 암시된 유전체 유전성을 통해 형질 발현을 더 깊이 이해한 복합형질 유전학의 선행 연구에서 영감을 받았습니다. 구체적으로, 최근 신장에 대한 GWAS (전장 유전체 연관 연구) 메타 분석 데이터를 활용하여, 개별 골단이 신장 유전성에 미치는 기여를 분석하였습니다. 우리의 예상과 달리 특정 해부학적 부위 간 연관성에는 큰 차이가 나타나지 않았습니다. 대신, 엉덩이 및 무릎 조직을 포함한 넓은 접근성 경향과 유전자 발현 패턴이 덜 제한적인 유전자에 대한 더 강한 유전자 수준의 풍부성이 관찰되었습니다. 일반적으로, 위치 내의 규제 영역 수 (조직 간 통합)와 평균 골격 유전자 발현이 신장 관련 유전자 집합 연관성에 가장 강한 영향을 미쳤으며, 변이당 분석에서는 골격 전반의 접근성에서 다면발현성이 증가하는 경향이 관찰되었습니다.
결과적으로, 골격 전반에서 활동하는 일반적인 성장 프로그램이 성인 신장 형성에 가장 큰 영향을 미칠 수 있으며, 유전자 및 규제 요소의 발현/접근성 영역이 넓을수록 골격 성장 (따라서 신장)에 대한 영향이 클 가능성이 제기되었습니다. 물론, 부위 특이적 활동이 발달 후반부, 즉 출생 후에 신장 형성에 더 큰 역할을 할 수 있음을 배제할 수는 없습니다. 실제로, 사춘기 이전의 개체에서 관찰되는 신장 증가는 엉덩이뼈 성장판의 가속화된 성장과 관련이 있습니다. 그러나 이러한 효과는 영양 상태, 성호르몬 신호 전달, 면역 기능 등과 같은 출생 후 골격 성장에 영향을 미치는 환경적 요인에 의해 복잡해질 수 있습니다.
이러한 결과를 바탕으로, 우리는 신장 생물학 및 변이의 성장 과정을 뒷받침하는 다유전자 구조를 omnigenic 모델을 사용하여 더 깊이 연구하였습니다. 이 맥락에서, 우리는 적합한 규제, 전사체, 유전 연관 데이터셋을 이용하여 복합 형질의 omnigenic 특성을 분석할 수 있는 개념적 프레임워크를 개발하였으며, 동시에 해당 형질에 대한 중요한 생물학적 정보를 밝혀냈습니다.
먼저, 우리는 형질 생물학에 영향을 미치는 유전자 집합이 모듈로서 조정된 발현을 보일 경우, 해당 유전자들이 형질 유전성에 집합적으로 큰 영향을 미칠 것이라고 가정하였습니다. CD1이라는 모듈을 확인하였으며, 이 모듈은 신장과의 유전자 수준 연관성에서 가장 강한 풍부성을 보였습니다. CD1은 탄수화물 대사 및 소분자 대사 과정 (예: ATP 합성)에 관여하는 유전자에 대해 강한 풍부성을 나타냈습니다. 탄수화물은 장골 성장 과정을 조절하는 내연골화 과정 동안 연골모세포에 중요한 대사 산물로 작용합니다. 글리콜리틱 효소는 쥐의 골격 결함과 연관된 바 있으며, CD1에는 이러한 효소를 포함하는 알돌레이스 계열의 유전자 두 개가 포함되어 있습니다. 이러한 당은 또한 복잡한 생체 분자의 전구체로 작용하며, 프로테오글리칸과 같은 구조적 구성 요소는 연골 모델 및 성장판 발달에 필수적입니다. CD1에는 주요 연골 프로테오글리칸 및 당단백질 (예: ACAN, COL2A1, COMP)뿐만 아니라, 당화 및 프로테오글리칸 변형에 관여하는 유전자 (B3GALT6, CHST14)도 포함되어 있으며, 이는 발달 장애 및 결합 조직과 연관되어 있습니다. 또한, 이 모듈은 비정상적인 골격 발달에 관여하는 것으로 알려진 유전자 (OMIM 기준)를 불균형적으로 많이 포함하고 있습니다. 이러한 CD1 모듈은 신장 생물학에 관여하는 핵심 유전자 집합의 일부를 반영하는 것으로 보입니다.
둘째, 이러한 모듈의 상위 조절자로 작용할 가능성이 있는 요인들을 고려하였습니다. 우리는 신장과의 전반적 연관성을 가지는 변이를 포함하는 모티프를 가진 3개의 전사 인자 (TFs)와 CD1 유전자 주위에서 편향성을 보이는 9개의 전사 인자를 확인하였습니다. 이들 전사 인자를 암호화하는 위치는 신장과의 강한 연관성을 보이지 않아 높은 선택적 제약을 시사할 수 있습니다. 그중 하나인 FOXP1은 변이가 FOXP1 모티프를 향상시킬 때 신장을 증가시키는 방향성을 보였습니다. FOXP1은 골화 과정을 억제하며, 돌연변이는 쥐와 인간에서 성장 관련 골격 표현형에 영향을 미칠 수 있습니다. 최근 인간 장골의 단일 세포 RNA 시퀀싱 (scRNA-seq) 연구에서는 FOXP1/2 네트워크 활동이 연골-골 결합 계통에서 높게 나타났으며, FOXP1/2 발현은 장골 말단의 연골막에서 검출되었습니다. FOXP1은 신장 생물학에서 세포 대사 및 증식과 같은 유전자 집합을 조절하는 “마스터 조절자”로 작용할 가능성이 제기되었습니다.
셋째, 우리는 omnigenic 모델의 주요 기대치를 테스트하였습니다. 즉, 이러한 모듈이 신장 생물학에 세트로 영향을 미칠 경우, 공조직적 발현을 통해 규제 네트워크 효과로 신장 유전성에 집합적 영향을 미칠 것이라는 가정입니다. 모듈 발현을 조절하는 상위 조절자를 고려한 결과, 몇몇 co-expression 모듈이 무작위화된 모듈 세트에 비해 신장 유전성과 효과 크기의 집합적 분포에서 증가된 값을 나타냈습니다. 이러한 모듈을 인간 골격 발달에 영향을 미치는 것으로 알려진 유전자 세트 (OMIM 기준)와 비교한 결과, OMIM 유전자들이 개별적으로 강한 연관성을 가지는 반면, 우리의 모듈은 네트워크 효과 측면에서 보다 방향성이 있고 집합적으로 추가적인 영향을 미칠 가능성이 높았습니다.
마지막으로, 본 연구에서 개발한 프레임워크가 신장을 넘어 복합 형질 유전학 연구 전반에 적용 가능한지 여부를 검토하였습니다. 제2형 당뇨병 (T2D)이라는 또 다른 복합 형질을 고려한 결과, T2D 유전학에서 관찰된 패턴 및 분포가 신장 유전학 분석에서 발견된 것과 유사하게 작동하였으며, omnigenic 모델 개념화에 기반한 기대치와도 일치하였습니다. 신장은 주로 특정 조직/장기와 연관되어 있다는 점에서 T2D와 유사하지만, 이는 T2D 질병 생물학의 추가적인 복잡성을 단순화한 것일 수 있습니다. 더 통합적인 병인학 (예: 고혈압)에 기초한 복합 형질 연구로 우리의 프레임워크를 확장 및 적용하는 것은 향후 연구에서 중요한 방향성으로 간주됩니다.