Science-EasyView

Dopamine promotes head direction plasticity during orienting movements

도파민은 방향 이동 중에 머리 방향 가소성을 촉진합니다.

Dopamine promotes head direction plasticity during orienting movements

Abstract

연결 가중치에 정보를 저장하는 신경망에서는 감도와 안정성 사이에 균형이 있습니다. 새로운 정보를 통합하려면 연결이 유연해야 하지만 너무 유연하면 저장된 정보가 손상될 수 있습니다. 잠재적인 해결책은 ‘학습 시기’ 신호를 기반으로 작업별 정보가 풍부한 시기에만 가소성을 허용하는 것입니다. 우리는 도파민이 새로운 공간 정보를 사용할 수 있을 때, 즉 동물이 움직일 때 뇌의 공간 지도를 업데이트할 수 있는 학습 시기 신호를 제공한다고 추론했습니다.

여기서 우리는 초파리 머리 방향 네트워크를 자극하는 도파민 뉴런이 파리가 머리 방향을 바꾸려고 할 때 활성화된다는 것을 보여줍니다. 또한, 그들의 활동은 회전 속도의 순간 변동에 따라 확장됩니다. 도파민 방출과 시각적 신호를 결합하면 머리 방향 세포에 대한 신호의 영향이 지속적으로 강화됩니다. 반대로, 이러한 도파민 뉴런을 억제하면 신호의 영향이 감소합니다. 이 메커니즘은 방향 이동이 머리 방향 정보의 풍부한 스트림을 제공하는 순간에 학습을 가속화하여 저장된 정보를 보호하기 위해 다른 시간에는 학습 속도를 낮출 수 있습니다.

우리의 결과는 뇌의 공간 학습이 어떻게 높은 학습률이 높은 정보 섭취율과 일치하는 별개의 시기로 압축될 수 있는지 보여줍니다.

Figure

[Figure 1] ExR2 도파민 뉴런은 회전 속도와 상관관계가 있습니다.
(A) 헤드 방향 맵의 회로도.
(B) 회전 및 전방 보행 속도를 측정하는 동안 ExR2 뉴런에서 jGCaMP7f를 이미징합니다.
(C) 평균 ExR2 ΔF/F 대 회전 속도(플라이당 한 줄, n = 13플라이). 회색 음영은 휴식과 이동 사이의 전환을 나타냅니다. 이 범위를 벗어나면 ΔF/F와 회전 속도는 선형적으로 관련됩니다.
(D) 평균 ExR2 ΔF/F는 회전 및 전진 속도로 비닝되고, 13개의 파리에 걸쳐 집계되고 시간 지점에 대해 평균화됩니다. 회색 저장소가 비어 있습니다.
(E) 속도를 사용하여 ExR2 활동을 예측하는 선형 회귀 모델에 대한 분산 설명(조정된 R2). 점의 각 쌍은 하나의 파리입니다(n = 13). 모델은 각 비행에 대해 별도로 장착되었습니다. 회전 속도만으로도 높은 R2가 생성되었습니다. 전진 속도를 추가하면 약간의 추가 증가가 발생했습니다(***P = 5.3 × 10-5, 양면 쌍 t-검정).
(F) 광학 흐름에 대한 ExR2 응답. 고정된 수직 격자가 회전하기 시작하고 광학 흐름의 시작은 ExR2 활동의 지속적인 증가를 유도합니다(파리에서 평균 ± sem, ΔF/F는 P = 0.0012, 양면 1샘플 t-테스트로 0과 크게 다릅니다) , n = 13마리). 여기서 우리는 파리가 가만히 서 있을 때의 시험만 분석했습니다.
(G) 모델 입력으로 사용되는 예제 데이터. 파리는 시각적 머리 방향 신호로 가상 환경에서 걸었습니다.
(H) 도식적인 ER-EPG 연결. 회로도의 인접한 ER 뉴런은 방위각 공간에서 인접한 수용 필드를 갖습니다. 연결 가중치는 원 크기로 표시됩니다. 가중치는 무작위로 초기화된 다음 Hebbian 가소성을 통해 진화합니다.
(I) 일반적인 모델 실행의 가중치.
(J) ER 출력 가중치와 EPG 입력 가중치의 모집단 벡터 평균 사이의 평균 순환 상관관계; 평균(n = 섞인 데이터에 대해 훈련된 117개의 시뮬레이션) ± 95% 신뢰 구간. 시뮬레이션의 끝에서 적응 학습률과의 상관관계가 더 높습니다(P = 6.2 × 10-21, 양측 Wilcoxon 부호 순위 테스트).

[Figure 2] ExR2 도파민은 EPG 뉴런과 시각 단서 간의 연관성을 강화합니다.
(A) ATP(5mM)의 30초 펄스는 P2X2 수용체(n = 5 세포)를 발현하는 ExR2 뉴런을 자극합니다. 파리는 이 그림이나 그림 3에서 구형 트레드밀에 서 있지 않습니다.
(B) 회전 신호에 반응하는 EPG 뉴런의 예. 각 큐 주기에 대해 뉴런의 선호 큐 위치와 응답 진폭(최대 – 최소 막 전위)을 측정했습니다. 0°의 위치는 큐가 플라이 앞에 있음을 의미합니다. 확장 데이터 그림 6a는 또 다른 예를 보여줍니다.
(C) 6개의 EPG 뉴런에 대한 시간 경과에 따른 선호 큐 위치. 각 포인트는 하나의 자극 주기입니다. 녹색 음영은 ATP(5mM) 또는 도파민(200μM)의 펄스를 나타냅니다. 대조군(세포 1 및 2)에서 ExR2 뉴런은 P2X2 수용체를 발현하지 않았다. ExR2 활성화(세포 3 및 4)로 세포의 선호 큐 위치가 더 일관되고 때로는 이동했습니다. 도파민은 유사한 변화를 일으켰습니다(세포 5 및 6). sd, 원형 표준 편차.
(D) ExR2 뉴런이 P2X2를 발현하지 않는 대조군(대조군, n = 10)에서 ExR2 활성화(n = 11) 또는 도파민(n = 12) 대 ATP 처리 전후의 바람직한 큐 위치의 가변성. 가는 선은 개별 EPG 뉴런을 나타냅니다. 굵은 선은 수단을 나타냅니다. 선호하는 큐 위치는 ExR2 활성화 후 덜 가변적입니다(**P = 0.0049). 도파민은 유의미하지는 않지만 유사한 경향을 나타냅니다(유의하지 않음(NS), P = 0.052). ATP는 컨트롤에 영향을 미치지 않습니다(NS, P = 0.77, 양면 Wilcoxon 부호 순위 테스트). 값은 c에 표시된 창에서 측정됩니다.
(E) 시각적 단서에 대한 반응의 진폭, 각 세포의 기준선으로 정규화, 세포에 대해 평균화(±s.e.m.); n 값은 d에서와 같습니다.
(F) 정규화된 반응 진폭은 ExR2 활성화(**P = 0.0068) 또는 도파민 치료(**P = 0.0024) 후에 증가하지만 대조군(NS, P = 1, 양면 Wilcoxon 부호 순위 테스트)에서는 증가하지 않습니다. 점은 단일 셀을 나타냅니다. 선은 수단을 나타냅니다. n 값은 d에서와 같습니다.

[Figure 3] ExR2 활성화를 시각적 신호와 페어링하면 헤드 방향 맵에 대한 신호의 영향이 증가합니다.
(A) 비행 주위에 시각적 신호를 회전시키면서 EPG 뉴런에서 이미징 jGCaMP7f. 활성화 기간 동안 ATP가 전달되었습니다. 일부 실험에서 ExR2 뉴런은 P2X2 수용체를 발현하지 않았거나(‘ExR2 활성화 없음’) ATP가 어둠 속에서 전달되었습니다(‘신호 없음’).
(B) 두 파리의 예제 데이터. EPG 범프 위치(pos.)는 타원체 내 범프의 각도 위상입니다. 각 ΔF/F 히트맵에서 인접한 행은 타원체 본체에 있는 원형 맵의 인접한 쐐기입니다.
(C) 각 큐 회전 주기에 대해 추정되는 큐 위치와 EPG 범프 위치 사이의 상호 정보; 평균 ± sem 파리 전체(ExR2 활성화, n = 20, ExR2 활성화 없음, n = 18, 이 패널 및 모든 후속 패널에서 신호가 없는 ExR2 활성화, n = 19).
(D) c에 표시된 창에서 측정된 큐 위치와 범프 위치(post – pre) 간의 상호 정보 변경. 점은 파리를 나타냅니다. 선은 수단을 나타냅니다(ExR2 활성화 없음, NS, P = 0.12, ExR2 활성화, ***P = 0.00036, 단서가 없는 ExR2 활성화, NS, P = 0.49, Bonferroni 보정을 사용한 양면 일표본 t-검정).
(E) 각 큐 회전 주기에 대한 범프 진폭(최대 – 최소 ΔF/F); 평균 ± sem 파리를 가로질러. 신호가 보이지 않을 때 범프 진폭은 동등한 시간 창에서 계산되었습니다.
(F) e에 표시된 창에서 측정된 범프 진폭의 변화(사후 – 사전). 점은 파리를 나타냅니다. 선은 수단을 나타냅니다(ExR2 활성화 없음, NS, P = 0.34, ExR2 활성화, **P = 0.0039, 단서가 없는 ExR2 활성화, NS, P = 0.22, Bonferroni 보정을 사용한 양면 일표본 t-검정).
(G) c에 표시된 창에서 측정된 범프 위치와 큐 위치(post – pre) 사이의 평균 오프셋의 변화. 점은 파리를 나타냅니다. 선은 평균을 나타냅니다 (두 경우 모두 NS, P = 0.70, Kruskal–Wallis 검정).

[Figure 4] ExR2 활동을 억제하면 머리 방향 지도에 대한 시각적 단서의 영향이 줄어듭니다.
(A) Kir2.1 발현을 통해 ExR2 활성이 억제되는 동안 EPG 뉴런에서 이미징 jGCaMP7f. 훈련 기간 동안 시각적 신호는 구형 트레드밀에서 파리의 회전에 의해 제어되었습니다. 테스트 기간 동안 큐는 일정한 속도로 회전했습니다.
(B) 3개의 제어 파리(상단) 및 2개의 Kir2.1 파리(하단)에 대한 테스트 기간 데이터 예. 각 ΔF/F 히트맵에서 인접한 행은 타원체 본체에 있는 원형 맵의 인접한 쐐기입니다.
(C) 테스트 기간에 큐 위치와 범프 위치 간의 상호 정보 추정. 점은 파리를 나타냅니다. 선은 수단을 나타냅니다(Kir2.1 표현의 경우 n = 21, 여기 및 e에서 n = 20 제어). b의 예에는 레이블이 지정되어 있습니다. 상호 정보는 Kir2.1 파리에서 더 낮습니다(*P = 0.027, 양면 2표본 t 검정).
(D) 두 유전자형에 대한 EPG 범프 진폭 대 파리의 회전 속도; 데이터는 속도별로 비닝되고 파리 전체에서 평균화되기 전에 파리 내에서 평균화됩니다(파리 전체에서 ±s.e.m). 속도 ≤100° s−1만 포함됩니다. 범프 진폭은 각 플라이 내에서 z 점수가 매겨집니다. 회로도는 회전 속도가 높을수록 더 높은 범프 진폭을 보여줍니다.
(E) 실험 전반에 걸쳐 범프 진폭과 회전 속도 간의 상관 관계. 점은 파리를 나타냅니다. 선은 수단을 나타냅니다. ExR2 뉴런이 Kir2.1을 표현하는 파리에서 이 상관관계는 더 낮습니다(***P = 3.5 × 10-6, 피셔 변환을 사용한 양면 2샘플 t-테스트).

Disscussion

우리는 ExR2 도파민 뉴런 활동이 감각 단서와 머리 방향 세포 사이의 연관성을 촉진한다는 것을 발견했습니다. 이러한 연관성은 아마도 ER-EPG 시냅스에서 Hebbian 가소성을 통해 파리가 새로운 자극으로 구성된 새로운 환경에 들어갈 때 재구성되는 것으로 나타났습니다. Drosophila mushroom body에서 도파민은 다른 도파민 수용체 유형에 작용하여 시냅스 강화와 시냅스 억제를 모두 촉진할 수 있습니다. ER 뉴런은 EPG 뉴런과 마찬가지로 여러 도파민 수용체 유형을 발현합니다. ER-EPG 시냅스는 도파민 방출 부위에 매우 근접해 있습니다. 미래에는 ER-EPG 시냅스 가소성에서 서로 다른 도파민 수용체의 역할을 결정하는 것이 흥미로울 것입니다. 특히, 우리 연구가 추가적으로 진행되는 동안 발표된 연구에 따르면 파리가 처벌과 관련된 방향에서 벗어나는 법을 배우기 위해서는 ER 뉴런의 여러 도파민 수용체가 필요하다고 보고되었습니다. 그 연구는 또한 과분극 ExR2 뉴런이 이러한 형태의 학습을 차단한다는 것을 보여주었습니다. 우리의 결과는 ExR2 뉴런이 과분극 될 때 파리가 시각적 단서와 머리 방향 사이의 정상적인 연결을 형성하지 않는다는 것을 보여줌으로써 이 연구를 확장합니다. 이 파리는 머리 방향의 내부 지도에 시각적 신호 위치를 매핑하는 과정에 장애가 있으므로 예측된 처벌을 피하기 위해 시각적 신호를 사용하여 임의의 (기억된) 방향으로 조종할 수 없다는 것은 논리적입니다.

특히 ExR2 도파민 뉴런은 파리가 회전할 때 주로 활성화됩니다. 이것은 부분적으로 스티어링에 관여하는 하강 뉴런을 포함하여 많은 하강 뉴런이 위치한 뇌 영역인 측면 부속엽의 ExR2 뉴런에 대한 시냅스 입력 때문일 것입니다. 또한 ExR2 뉴런은 회전 운동을 추적하는 PEN_a 뉴런으로부터 입력을 받습니다. 회전 운동은 시각적 신호, 하늘 전체 시각적 패턴 우세한 바람 등에 영향을 받는 머리 방향 시스템과 특별한 관련이 있습니다. 이와 같이 회전 운동은 머리 방향 시스템에서 통계적 학습을 위한 풍부한 데이터 세트를 제공합니다. 우리의 결과는 도파민이 이러한 데이터가 풍부한 시대로 학습을 압축하는 역할을 한다고 주장합니다. 특히, 포유류 뇌의 특정 도파민 뉴런은 운동 수행의 특정 운동학적 특징에 시간 고정되어 있습니다. 작업별 움직임이 학습을 위한 풍부한 데이터 세트를 생성하는 시간 간격으로 시냅스 가소성을 압축함으로써 이러한 포유류 도파민 뉴런이 유사한 기능을 수행한다고 추측할 수 있습니다.

시스템이 지속적으로 학습하지 않는 이유를 물어볼 가치가 있습니다. Drosophila를 비롯한 기타 절지동물의 머리 방향 시스템의 행동 기능 중 하나는 먼 목표 목적지를 향해 탐색하는 동안 직선 경로를 시행하는 것입니다. 그러나 직선 이동은 망막의 시각적 세계를 안정화하므로 시스템이 지속적으로 학습하는 경우 현재 보기가 과도하게 학습됨에 따라 뇌의 머리 방향 지도가 점진적으로 왜곡됩니다. 따라서 경험의 범위를 제한하는 목표 지향적 행동과 광범위한 경험 샘플링이 필요한 통계적 학습 사이에는 내재된 긴장이 있습니다. 이 문제에 대한 한 가지 해결책은 쇠똥구리가 여행을 떠나기 전에 제자리에서 회전할 때 하는 것처럼 목표를 추구하기 전에 세계의 스냅샷을 미리 암기하는 것입니다. 그런 다음 목표 지향적 탐색 중에 뇌는 추가 방향 학습을 능동적 방향 전환 행동의 순간으로 압축해야 합니다. 이것은 학습과 성능이 일반적으로 별도의 시대로 분할되는 기계 학습 프로토콜을 연상시킵니다.


기계 학습에서는 강화 학습 (보상을 최대화하는 방식으로 작업을 선택하기 위해 시행착오를 통한 학습)과 비지도 학습 (보상이나 레이블의 이점 없이 데이터 세트의 구조를 추론)을 구분하는 것이 일반적입니다. 뇌에서 도파민은 강화 학습에서 분명한 역할을 합니다. 대조적으로, 비지도 학습에서 도파민의 잠재적인 역할은 잘 알려져 있지 않습니다. 공간 학습은 비지도 학습의 대표적인 예입니다. 여기서 뇌의 임무는 단순히 탐색을 통해 환경의 구조를 추론하는 것입니다. 우리의 결과는 도파민과 공간 학습 사이의 연관성을 밝혀내며 (그렇지 않으면) 감독되지 않은 추론의 속도를 제어하는 ‘감독’ 요소의 필요성을 강조합니다.

REF

Exit mobile version