что в мозге отвечает за мотивацию
Зажги во мне огонь: как мозг мотивирует нас к действию
Наталия Киеня
Даже самый волевой человек мало на что способен без хорошей мотивации. Но что это такое, и как она возникает? Какие участки мозга отвечают за нее?Почему бывает так сложно заставить себя что-то сделать — и наоборот, что помогает нам сдержаться и преодолеть искушение? «Теории и практики» рассказывают о нейробиологии мотивации.
Судя по запросам в поисковых системах, многие хотят узнать, где находятся «центры мотивации». Однако, к сожалению, таких центров на карте полушарий мозга нет: в создание и обработку побуждающих импульсов вовлечено множество участков нервной ткани, и все они параллельно занимаются другими процессами.
Как и все процессы в мозгу, мотивация — процесс комплексный. В его основе лежит действие нейромедиаторов — биологически активных химических веществ, которые осуществляют передачу электрического импульса от нейрона к нейрону и от нейронов к мышечной ткани. В случае с мотивацией нейромедиаторы оказывают на мозг пробуждающее действие, понуждая его создать желание, оценить вознаграждение, сфокусировать внимание, обратиться к навыкам или памяти и произвести другие действия, необходимые для того, что секунды спустя станет поступком.
В роли главного героя тут выступает допамин, известный многим как «гормон удовольствия». Для мозга это важное вещество: оно вырабатывается в его тканях в самых разных случаях и участвует в самых разных процессах, вызывая чувство оживления и радость получения награды, душевный подъем и улучшение настроения. Любопытно, однако, то, что когда человек находится на пути к поставленной цели, допамин выполняет свою задачу до того, как она оказывается достигнута. Он вознаграждает нас раньше, чем мы получаем искомое, делает путь приятным, подталкивает разум вперед, побуждая добиться желаемого или избежать угрозы. В результате происходит то, с чем все мы знакомы: перспектива сразиться с обстоятельствами щекочет нервы, обещание награды воодушевляет, маленькие шаги на пути к ней ободряют, и мы, помимо давления ответственности, испытываем еще и множество приятных и даже волнующих чувств.
Но откуда и куда движется допамин? Все начинается в лимбической системе — собрании различных мозговых структур, которое располагается под корой больших полушарий, в глубине черепной коробки, и отвечает за базовые паттерны поведения, благоприятные с точки зрения эволюции, участвует в формировании эмоций и выполняет другие функции. Если вы идете по темному парку, и звук шагов другого прохожего позади вызывает у вас страх и желание убежать, это лимбическая система предупреждает вас о возможной опасности. Если вы слышите плач незнакомого ребенка и не можете не обращать на него внимания, это снова она: предлагает вам защитить беспомощного детеныша. Если вы видите на витрине в кафе пончик и хотите съесть его, это тоже ее работа — совет употреблять питательную еду всегда, когда она доступна.
Однако человек не был бы человеком, если бы не мог похвастаться не только функциональной лимбической системой, но и прекрасно развитой корой больших полушарий, которая и отличает нас так сильно от всех остальных живых существ на планете. Кора человеческого мозга, в числе прочего, способна обрабатывать абстрактные понятия и цели, а также оценивать абстрактное вознаграждение, в том числе, в перспективе. Этот факт, судя по всему, отчасти и лежит в основе мотивационных процессов.
«Иногда то, что приносит нам удовлетворение, необходимо для выживания, — рассказывает Самюэль МакКлю, глава Лаборатории нейробиологии принятия решений Стэнфордского университета. — Но крупная предлобная кора — одна из характерных черт нашего вида, и ее способность обрабатывать абстрактные понятия и цели уникальна. Мы можем использовать эти области для того, чтобы преодолеть эффект автоматической работы лимбической системы и мотивировать себя на разные варианты поведения. Удивительно, но каждый человек может вести себя согласно абстрактным идеалам, а не так, как требует мгновенная система вознаграждений».
Сегодня нейробиологи полагают, что все стратегии поведения человека — автоматические. В их основе лежит стремление выживать, заложенное в нас, как и в представителях любого другого вида на планете, эволюционно. Импульс голода, агрессии, побега, стремление к размножению или защите потомства рождается в тканях лимбической системы и подталкивает нас к простой стратегии принятия решений. Однако мозг устроен таким образом, что для реализации «в поступок» этому импульсу нужно пройти через предлобную кору, способную создавать абстрактные цели и образ поведения на их основе. Она оценивает поступившее от лимбической системы предложение и решает, стоит ли воспользоваться им.
Диалог выглядит примерно так:
Лимбическая система: «Съешь пончик!»
Предлобная кора: «Он калорийный».
Л. с.: «Именно! Давай, ешь!»
П. к.: «Нет, у меня через месяц церемония вручения «Оскар». Представь, как я буду выглядеть в своем новом смокинге, если похудею!»
Л. с.: «Аппетитный пончик!»
П. к. «Стоять на красной ковровой дорожке и чувствовать себя привлекательным будет намного приятнее, чем съесть пончик и нарушить диету. Нет».
И в результате человек заказывает салат.
Исследователи считают, что процесс принятия решений на основе абстрактных целей и абстрактной выгоды для мозга труден. Он отнимает больше сил, требует больше времени. Однако мотивация продолжать действие, идущее вразрез с рекомендациями лимбической системы, тоже поддерживается короткими всплесками допамина. Они происходят, если мы достигаем промежуточной цели: например, «преодолеваем искушение» или «потеряли еще один килограмм». Эти всплески действуют как аванс и обещают великолепное чувство достижения большой абстрактной цели, Цели с большой буквы (а также колоссальный объем допамина, который сопровождает это событие). Оно не может сравниться с сиюминутным удовольствием от поедания пончика, так что мозг, по сути, обходится с человеком честно и просто предлагает ему выбрать «больше удовольствия».
«Мотивация зависит от коры, поскольку именно кора предоставляет нам цель, — рассказывает МакКлю. — Но что заставляет ее выбрать одну цель среди множества других? Это вопрос деятельности допаминовой системы вознаграждения в рамках лимбической системы, а точнее — прилежащего ядра (так называемый центр удовольствия в глубине головного мозга. — Прим. ред.). В то же время мы можем использовать предлобную кору, чтобы обдумать возможные сценарии развития событий и проиллюстрировать их примерами. Так вы формируете ожидание того, какое вознаграждение получите, и тем самым создаете цель в будущем. Так что как процесс мотивация опирается и на лимбическую систему, и на мезокортикальный путь (один из допаминовых нервных путей. — Прим. ред.). Вообразив возможный сценарий развития событий, вы задействуете этот путь, чтобы определить размеры «дивидендов», которые получите в будущем с эмоциональной точки зрения».
Но как же мозг выбирает абстрактную цель, чтобы мы могли к ней стремиться? Сегодня ответа на этот вопрос не существует, однако нейробиологи предполагают, что в основе выбора лежит оценка потенциального вознаграждения. Возможно, наш разум каждый раз оценивает свои возможности и индивидуальные пожелания, а потом выбирает самое приятное, а может, и самое труднодостижимое: ведь чем больше маленьких шагов придется сделать на пути к цели, тем больше допамина получит мозг. И даже более того: чем больше работы будет вложено в реализацию поставленной задачи, тем сильнее будет эмоциональный, и, вероятно, и допаминовый отклик в финале.
Опирается ли этот процесс на «эволюционные» стремления: быть сытым, найти подходящего партнера, победить врага? Вероятно, да. Стив Джобс советовал «оставаться голодным», Зигмунд Фрейд утверждал, что творчество — это сублимация либидо, различные монашеские ордены рекомендовали аскезу для поддержания духовного огня, в среде средневекового рыцарства были приняты ограничительные обеты, которые не снимались, пока герой не добивался поставленной задачи. В культуре можно найти бесчисленное количество примеров, когда самоограничение использовалось для достижения абстрактных целей. Очевидно, в основе этой интуитивной стратегии лежит интуитивное использование порожденного лимбической системой желания в качестве «топлива». Возможно, его наличие позволяет запустить допаминовую «механику», и, в результате, мотивирует нас двигаться вперед.
Центры анализа и принятия решений в мозге: как мы принимаем решения и что мешает видеть очевидные
Как мы принимаем решения
А как принимаете решения Вы? Действуете ли Вы импульсивно, поддавшись мимолетным эмоциям? Или долго обдумываете каждый Ваш шаг, составляя списки «за» и «против»? Или спрашиваете мнения Ваших родных и близких и позволяете им принимать серьезные решения за Вас? Или, может, полагаетесь на Вашу «развитую интуицию»?
Попробуем разобраться в этих сложных процессах с нейроанатомической точки зрения и также рассмотрим, какие механизмы позволяют (или заставляют) человека принимать рискованные и самодеструктивные решения.
Любопытство не порок
При этом есть люди, которые легко принимают рискованные решения, и есть люди, которые предпочитают лишний раз «не переступать черту».
Почему мы так по-разному определяем и оцениваем потенциальную опасность наших действий?
Центры принятия решения против центров удовольствия
Поскольку в природе все предусмотрено и уравновешено, логично ожидать, что своеобразный «противовес» должен быть и у наших центров удовольствия. Эволюционно он появляется значительно позднее, и, в отличие от центров удовольствия, располагающихся в толще мозга, данная зона находится на поверхности мозга и является частью неокортекса (или новой коры).
Зона, которая нас интересует отвечает за рациональность, исполнительность, анализ рисков и выигрыша и процессы долгосрочного планирования. Эта зона находится в префронтальной коре. Именно здесь происходит (если он происходит) анализ совершаемых или планируемых поступков и их оценка с точки зрения немедленного получения результата или отсроченного, но более крупного выигрыша. Т.е. получу ли я синицу в руках или журавля в небе.
Здесь большое значение имеют и культуральные особенности – так, например, у нас распространено понятие «живем один раз», «наша жизнь настолько непредсказуема, что все равно не знаешь, от чего умрешь» и проч.
Это все достаточно распространённые отговорки, чтобы не задумываться об отдаленных последствиях своих рисковых решений.
К сожалению, у большинства людей срабатывает стратегия «немедленного выигрыша», т.е. доминируют более эволюционно древние, глубинные и примитивные структуры, которые и созревают раньше, и быстрее включается в процесс принятия решений, чем аналитические зоны, которым требуется некоторое время «на раскачку».
Нейромаркетинг против префронтального кортекса
Эффект «немедленного выигрыша» очень успешно эксплуатируют маркетологи, кредитные организации т ритейлеры, призывая купить нас то, что нам на самом деле не нужно, лишь потому что «только сегодня только для вас действуют суперскидки», не давая нам буквально опомниться и запустить наши аналитические зоны.
Наш мозг очень болезненно относится к потенциальным потерям и данную идею, что «мы можем что-то упустить или потерять» широко используют в нейромаркетинге.
У маркетологов есть четкое правило «ограничение времени действия акции/скидки» чтобы мы поторопились принять решение нашей «подкоркой».
Психоактивные вещества (ПАВ) против префронтального кортекса
Вернемся к ситуации употребления ПАВ. То, как люди балансируют между долгосрочными и краткосрочными наградой и наказанием, является важным фактором того, как они относятся к злоупотреблению субстанциями или поведенческим компульсиям (компульсивное переедание, шоппинг, в том числе он-лайн шоппинг). Если люди рассуждают о риске потребления алкоголя примерно в следующем ключе: «Хорошо, ты можешь выпить, но потом ты можешь лишиться водительских прав или получить проблемы на работе, дома», это значит, что они запустили программу анализа своего поведения несколько дальше выпитой рюмки спиртного.
Но большинство, к сожалению, рассуждает так: «лучше я выпью сейчас, а о дальнейших проблемах подумаю по мере их поступления» и выбирают удовольствия здесь и сейчас, несмотря на то что могут получить от этого проблемы.
Такие люди недооценивают долгосрочные риски и переоценивают краткосрочные выгоды. Почему же мы принимаем такие неверные недальновидные решения?
Что мешает нам принимать очевидные решения
Зачастую мы не осознаем этой борьбы, однако она происходит у нас каждый день, начинаясь, у некоторых, с раннего утра, когда мы пытаемся дотянуться до будильника или телефона, но продуманный планировщик с вечера поставил его подальше, чтобы утром до него нельзя было дотянуться. Это пример конструктивной борьбы. Но бывает, что аналитик недооценивает разрушающую силу деятеля, когда тот оказывается в триггерной горячей ситуации.
Так, например, шопоголик, идущий на распродажу «посмотреть, нет ли скидки на определенный товар» гарантированно вернется с кучей ненужных покупок, а человек, неравнодушный к алкоголю, собравшийся на вечеринку с твердым намерением пить там только сок тоже скорее всего не сдержит данного себе слова.
Таким образом наша задача – укрепить позиции аналитика в холодном состоянии.
Шопоголик может взять с собой лишь определенную сумму наличностью и оставить карту дома. А человеку с проблемным алкогольным поведением лучше и вовсе избегать питейных заведений (равно как и вино-водочных отделов в супермаркетах), если же это по каким-либо причинам невозможно может выпить накануне вечеринки противоалкогольный препарат.
Также важным фактором принятия нежелательных решений являются автоматизмы и бездумное, машинальное поведение. Так, например, одно из наиболее бездумных действий – прием пищи, если вы параллельно смотрите телевизор, читаете или зависаете в телефоне.
Почему подростки отличаются высокорискованным поведением?
Наши высшие корковые структуры и, соответственно, аналитические способности полностью созревают с возрастом (одна из составляющих опыта, мудрости).
Мозг подростка имеет незрелый неокортекс, однако, вполне созревшую систему вознаграждения, таким образом юный мозг как бы настроен на поиск и поглощение удовольствий без малейшей возможности их анализа и контроля. Т.е. в силу незрелости контролирующих мозговых структур начало злоупотребления ПАВ в подростковом возрасте чревато злокачественным течением, т.к. подросток нейрофизиологически не в состоянии полностью оценивать риски и последствия своих привычек (таким образом ограничение продажи алкоголя по возрасту имеет четкие нейрофизиологические основания!).
Под воздействием ПАВ развитие этих зон затормаживается и человеку уже и в зрелом возрасте сложно контролировать свое импульсивное поведение.
Более того, у ряда молодых людей, злоупотреблявших метамфетаминами по данным фМРТ (это способ, оценивающий уровень метаболизма глюкозы и соответственно активность конкретной мозговой зоны) активность префронтального кортекса была заметно снижена, что клинически выражалось во-первых, трудностью решения определенных аналитических тестовых заданий, во-вторых, быстрым рецидивированием после выхода из лечебной программы.
Вопрос, что в данной ситуации является первичным – повреждающее действие психостимуляторов или изначально невысокая активность центра принятия решений, остается открытым.
В любом случае нам необходимо помнить, что для «включения» аналитических зон (которые имеются у каждого!) требуется определенное время, после чего, в «холодном состоянии» нам будет проще проанализировать наши желания и прихоти на предмет того, являются ли они нашими истинными потребностями, или они продиктованы низшими подкорковыми структурами и мы, не включая кору, идем у них на поводу.
Как мозг заставляет нас достигать целей – открытие нейробиологов
Достичь желаемой цели нам помогают настойчивость и мотивация. Нейробиологам удалось установить нейронный путь, который заставляет добиваться желаемого, невзирая на сложности.
Даже самый волевой человек мало на что способен без хорошей мотивации. Но как она возникает? Какие участки мозга отвечают за нее? Почему бывает так сложно заставить себя что-то сделать? И наоборот, что помогает нам сдержаться и преодолеть искушение?
Международная группа ученых провела эксперименты с плодовыми мушками, чтобы определить, как в мозге зарождается мотивация. Наблюдения подтвердили существование нейронного пути, который контролируется двумя нейромедиаторами – они повышают или снижают готовность приложить усилие для достижения цели. Результаты работы опубликованы на сайте Мюнхенского технического университета.
Движение к конкретной цели
В ходе эксперимента мушки видели еду, до которой, однако, не могли добраться. Они были закреплены на месте и просто не имели возможности ее достичь.
Голодные мушки были намного более производительными, чем сытые, показали эксперименты. Ученые сделали вывод, что выносливость и настойчивость свойственны даже для простых организмов, а не только высших, как считалось ранее.
Но это было лишь началом исследования. Затем ученые обнаружили нейронный путь, который контролирует эту настойчивость. И это не просто чувство голода.
Механизм расположен в области мозга, отвечающей за обучение и память, и контролируется нейромедиаторами дофамином и оксопамином. Первый повышает мотивацию, а второй снижает ее.
В мозге млекопитающих работают те же самые механизмы, потому выводы могут быть потенциально адаптированы и для человека.
А если цель абстрактна?
Вместе с тем, исследователи считают, что процесс принятия решений на основе умозрительных целей и абстрактной выгоды для мозга труден. Он отнимает больше сил, требует больше времени.
Однако мотивация продолжать действие, идущее вразрез с рекомендациями лимбической системы, тоже поддерживается короткими всплесками дофамина. Они происходят, когда мы достигаем промежуточной цели, например, «преодолеваем искушение» или «потеряли еще один килограмм». Эти всплески действуют как аванс и обещают великолепное чувство достижения большой абстрактной цели, Цели с большой буквы (а также колоссальный объем дофамина, который сопровождает это событие). Оно не может сравниться с сиюминутным удовольствием от поедания пончика, так что мозг, по сути, обходится с человеком честно и просто предлагает ему выбрать большее удовольствие.
Но как же мозг выбирает абстрактную цель, чтобы мы могли к ней стремиться? Сегодня ответа на этот вопрос не существует, однако нейробиологи предполагают, что в основе выбора лежит оценка потенциального вознаграждения. Возможно, наш разум каждый раз оценивает свои возможности и индивидуальные пожелания, а потом выбирает самое приятное, а может, и самое труднодостижимое: ведь чем больше маленьких шагов придется сделать на пути к цели, тем больше дофамина получит мозг. И более того: чем больше работы будет вложено в реализацию поставленной задачи, тем сильнее будет эмоциональный и, вероятно, дофаминовый отклик в финале.
Опирается ли этот процесс на «эволюционные» стремления: быть сытым, найти подходящего партнера, победить врага? Вероятно, да. Стив Джобс советовал «оставаться голодным», Зигмунд Фрейд утверждал, что творчество – это сублимация либидо, различные монашеские ордены рекомендовали аскезу для поддержания духовного огня, в среде средневекового рыцарства были приняты ограничительные обеты, которые не снимались, пока герой не добивался поставленной задачи. В культуре можно найти бесчисленное количество примеров того, как самоограничение использовалось для достижения абстрактных целей. Очевидно, в основе этой интуитивной стратегии лежит интуитивное использование порожденного лимбической системой желания в качестве «топлива». Возможно, его наличие позволяет запустить дофаминовую «механику» и в результате мотивирует нас двигаться вперед.
От чего зависит мотивация? От того, как мозг реагирует на усталость
За это отвечает конкретная группа нейронов
Ученые долго представляли формулу мотивации в виде сочетания двух компонентов: объем усилий, который требуется для выполнения задачи, и вознаграждение, которое мы ожидаем получить в результате работы. Но недавно оксфордские исследователи в области экспериментальной психологии и нейробиологии решили рассмотреть третий компонент — уровень усталости. Они изучили, как утомление на нейронном уровне лишает нас мотивации, даже когда размер вознаграждения и требуемые усилия остаются прежними.
Для этого ученые провели эксперимент с участием 36 здоровых людей. В ходе эксперимента испытуемые должны были 216 раз выбрать между 5-секундным отдыхом (минимум усилий, минимальное вознаграждение), и 5-секундной работой, которая заключалась в сжимании в кисти руки цифрового динамометра с усилием от 30% до 48% от индивидуальной силы захвата — на выбор. За «работу» испытуемым предлагали денежное вознаграждение разного размера. В течение всего эксперимента за мозгом испытуемых следили с помощью фМРТ.
Ученые проанализировали данные и построили модель, которая показала, что уровень мотивации колеблется даже в рамках небольших промежутков времени, а наш мозг каждый раз по-разному оценивает энергозатратность одной и той же задачи и ценность вознаграждения за ее выполнение — это противоречит ранним представлениям ученых о мотивации. Кроме того, модель подтвердила, что колебания в мотивации зависят от уровня усталости, которую исследователи поделили на два вида: 1) обратимая — небольшая усталость, при которой силы можно восстановить коротким отдыхом, и 2) необратимая — сильное утомление, которое формируется в течение продолжительного времени и не снимается короткими паузами на отдых.
Анализ МРТ показал, что за этот компонент мотивации отвечают средние лобные извилины, которые анализируют уровень усталости, и нейроны ростральной поясной зоны, которые определяют тип усталости и решают, стоит ли работа усилий. По мере того, как растет утомление, наш мозг оценивает одну и ту же задачу как все более сложную и требующую все больших ресурсов, а также снижает субъективную ценность ожидаемого вознаграждения.
Авторы предполагают, что именно ростральная поясная зона может играть ключевую роль в сохранении мотивации к работе, а индивидуальные особенности ее работы могут объяснять, почему некоторые дольше остаются мотивированными. Ранее исследования показали, что стимуляция этой области у людей усиливает желание выполнить трудную задачу.
В «системе вознаграждения» найдены нейроны, возбуждающиеся от хороших предчувствий
Рис. 1. Важнейшие нейронные пути «системы вознаграждения» — мезолимбический (голубые стрелки) и мезокортикальный (синие стрелки) — образованы отростками дофаминовых нейронов вентральной области покрышки (VTA). По первому из них дофаминовые сигналы поступают из VTA в прилежащее ядро, миндалину, гиппокамп и префронтальную кору, по второму — только в префронтальную кору, включая ее орбитофронтальную область. Светло-оранжевым цветом показан средний мозг. Изображение с сайта www.cellbiol.net
Чувства радости и удовольствия зависят от активности дофаминовых нейронов вентральной области покрышки среднего мозга (VTA). Их активность, в свою очередь, определяется соотношением награды (положительного стимула) и наших ожиданий: неожиданная удача радует больше, чем та, в которой мы не сомневались. До сих пор не было известно, каким образом дофаминовые нейроны VTA вычисляют разницу между наградой и ожиданиями. Американские нейробиологи сделали важный шаг к разгадке этой тайны. Сложнейшие эксперименты с генно-модифицированными мышами, в мозг которых внедрялись электроды, световоды и искусственные вирусы, показали, что часть нейронов VTA специализируется на кодировании ожиданий, не реагируя на саму награду. Эти нейроны — тормозные (ГАМК‑эргические). Их регулярное возбуждение снижает активность дофаминовых нейронов VTA и тем самым притупляет чувство радости от «хороших новостей», которые были известны животному заранее.
Вентральная область покрышки (ventral tegmental area, VTA) — ключевой компонент «системы вознаграждения» (также известной как «система внутреннего подкрепления», см. reward system) в мозге млекопитающих. Примерно 55–65% нейронов VTA — это дофаминовые (дофаминэргические) нейроны, передающие сигналы другим нейронам при помощи нейромедиатора дофамина. Дофамин играет в мозге роль «вещества удовольствия». Дофаминовые сигналы из VTA поступают в префронтальную кору, где происходят сознательные психические процессы, в гиппокамп, управляющий запоминанием (это может быть связано с обучением на положительном опыте), в прилежащее ядро (nucleus accumbens), которое можно назвать «главным центром удовольствия» и которое отвечает за мотивацию, привязанности и зависимости, а также в другие «эмоциональные» отделы мозга, такие как миндалина (amygdala) (рис. 1).
Дофаминовые нейроны VTA активируются в ответ на положительные стимулы (информацию о которых они получают от других отделов мозга, в том числе от коры), а также на условные стимулы, предвещающие награду. Например, если животное знает, что после звукового сигнала ему дают что-нибудь вкусненькое, дофаминовые нейроны VTA будут возбуждаться в ответ на звуковой сигнал. Сама же награда («безусловный стимул») активирует их в зависимости от своей предсказуемости: неожиданная награда вызывает сильную активацию, но если животное точно знает, что угощение всегда появляется после звонка, то нейроны энергично ответят только на звонок, а на саму награду отреагируют слабее или не отреагируют вовсе. Ну а если после звонка положенная награда не появится, активность дофаминовых нейронов VTA отобразит разочарование, опустившись ниже базового («спокойного») уровня. Таким образом, работа этих нейронов кодирует не хорошие новости как таковые, а, скорее, степень их соответствия ожиданиям, «ошибку предсказания награды» (reward prediction error, RPE).
Этот механизм мешает нам радоваться привычным, стандартным достижениям — но не мешает огорчаться, когда ожидаемая награда вдруг ускользает из рук. Нарушения его работы могут быть связаны с различными психическими проблемами, такими как болезненная страсть к азартным играм или наркотическая зависимость. Известно, что некоторые наркотики подавляют активность тормозящих, ГАМК‑эргических, нейронов VTA, о которых пойдет речь ниже. Эти нейроны сдерживают активность дофаминовых нейронов, что, возможно, препятствует развитию устойчивых эйфорических состояний.
Рис. 2. Гипотетическая модель обработки информации дофаминовыми нейронами VTA. Нейрон реагирует на условный стимул (CS), предвещающий награду, но не на саму награду (капля воды). Это объясняется тем, что, хотя он получает два возбуждающих входных сигнала (об условном стимуле и о награде, черные линии), он также получает тормозящий сигнал от неких нейронов, активность которых кодирует ожидание награды (красная линия). Изображение из дополнительных материалов (PDF, 7,87 МБ) к обсуждаемой статье в Nature
О том, каким образом дофаминовые нейроны «вычисляют» ошибку предсказания награды, до сих пор можно было лишь строить гипотезы (рис. 2). Американские нейробиологи, опубликовавшие результаты своих исследований в недавнем выпуске журнала Nature, сделали важный шаг к расшифровке этого механизма.
Авторы вживили 12 мышам в мозг электроды для регистрации активности нейронов VTA. В общей сложности удалось проследить за работой 187 нейронов. Мышей приучили к тому, что после появления условного стимула (того или иного запаха) случается одно из четырех: либо в поилке спустя секунду появляется большая порция воды («большая награда»), либо маленькая, либо ничего не происходит, либо на мышь направляют струю воздуха («наказание»). Комбинации условных и безусловных стимулов (запахов и наград) для всех мышей были разные, но каждый запах для каждой мыши всегда предвещал что-то одно. Мыши быстро всё поняли, что было видно по их поведению: после условных стимулов, предвещающих воду, они начинали лакать из поилки еще до появления воды. Во время обучения и опытов мышей, конечно, ограничивали в питье, чтобы они были достаточно мотивированы (но без угрозы для здоровья).
Рис. 3. Активность (частота генерации нервных импульсов) трех типов нейронов VTA (Type I, II, III) в четырех ситуациях: большая награда (big reward), маленькая награда (small reward), ничего (nothing), наказание (punishment). По горизонтальной оси — время. Вертикальными серыми полосами показано время подачи условного стимула (запаха), пунктирными линиями — момент появления «результата» (награды или наказания). Три левых графика показывают работу одного произвольно выбранного нейрона каждого типа, три правых — усредненную картину по всем нейронам данного типа. Показаны данные по 6 мышам из 12. Изображение из обсуждаемой статьи в Nature
Анализ активности нейронов в четырех ситуациях (большая награда, малая награда, ничего, наказание) показал, что нейроны VTA четко подразделяются на три типа.
Нейроны типа I (рис. 3, верхние графики) — самые многочисленные. Они активируются в ответ на условный стимул, предвещающий награду. Затем их активность быстро возвращается к базовому уровню и остается низкой всё время, пока мышь ждет награду. На саму награду, появление которой было «предсказано» условным стимулом, реагирует только часть нейронов первого типа. При этом реакция на ожидаемую награду снижается день ото дня. Иными словами, по мере того, как мышь всё более привыкает к тому, что после данного условного стимула обязательно появляется награда, реакция на нее у нейронов первого типа уменьшается (хотя реакция на условный стимул остается сильной).
Таким образом, нейроны типа I ведут себя в точности так, как положено вести себя дофаминовым нейронам VTA: они кодируют «ошибку предсказания награды» (RPE). Это было дополнительно подтверждено экспериментами, в которых после «хорошего» условного стимула награда не появлялась. Нейроны типа I реагировали на разочарование уменьшением своей активности.
Нейроны типа II (средние графики) тоже увеличивают свою активность в ответ на условный стимул, предвещающий награду, но, в отличие от нейронов типа I, они продолжают активно работать в течение всего периода ожидания. При этом их активность коррелирует с размером ожидаемой награды. Реакция на саму награду выражена слабо. На отсутствие награды после положительного условного стимула («разочарование») эти нейроны не реагируют. Таким образом, нейроны типа II кодируют позитивные ожидания — ключевую величину, необходимую для вычисления RPE.
Нейроны типа III (нижние графики) уменьшают свою активность в ответ на «хорошие» условные стимулы и немного увеличивают в ответ на «плохие». Забегая вперед, скажу, что природа и функции этих нейронов остались неизвестными.
Теперь нужно было доказать, что нейроны типа I — это действительно дофаминовые нейроны. Эту чрезвычайно трудную задачу авторы решили при помощи генной инженерии. Шестерым мышам из 12 ввели в мозг вирусы, в геном которых был вставлен ген chr2, заставляющий нервные клетки возбуждаться от света (см. channelrhodopsin). Этот ген в геноме вируса находился в неактивной форме. Сделать его активным мог другой ген, cre (см. Cre recombinase), заранее внедренный в геном самих мышей, где он был поставлен под контроль промотора гена дофаминового транспортера DAT, который экспрессируется только в дофаминовых нейронах. В итоге получились мыши, у которых дофаминовые нейроны реагируют на свет генерацией нервных импульсов. В головы этих мышей, помимо электродов, вставили еще и световод, чтобы можно было осветить VTA.
Оказалось, что все нейроны, которые у этих мышей возбуждаются от света, относятся к типу I. Некоторые нейроны типа I от света не возбуждались, но это, скорее всего, объясняется тем, что вирусы проникли не в каждый нейрон. Таким образом, можно считать доказанным, что нейроны типа I — это действительно дофаминовые нейроны VTA, кодирующие ошибку предсказания награды.
Остальные шесть мышей тоже получили порцию вирусов в мозг, но эти мыши были модифицированы по-другому, так что у них стали реагировать на свет не дофаминовые, а ГАМК-эргические нейроны, вырабатывающие тормозной нейромедиатор ГАМК. Все нейроны VTA, которые у этих мышей возбуждались от света, оказались нейронами типа II.
Итак, авторы показали, что нейроны типа I — дофаминовые, а нейроны типа II — ГАМК‑эргические. Это открытие позволило соединить несколько фрагментов головоломки в относительно стройную картину. О существовании в вентральной области покрышки наряду с дофаминэргическими нейронами также и ГАМК‑эргических было известно и ранее. ГАМК‑эргические нейроны VTA посылают свои тормозящие сигналы во многие отделы мозга. Их окончания также имеются на дендритах дофаминовых нейронов VTA. Соответственно, возбуждение ГАМК‑эргических нейронов VTA ведет к торможению дофаминэргических. Поскольку теперь мы знаем, что возбуждение ГАМК‑эргических нейронов VTA отражает позитивные ожидания, становится понятно, откуда дофаминовые нейроны получают информацию об этих ожиданиях, и можно себе представить, каким образом вычисляется «ошибка предсказания награды».
По-видимому, сигнал об условном стимуле, предвещающем награду, получают все нейроны VTA. На этот сигнал реагируют повышением активности как нейроны типа I (дофаминовые), так и нейроны типа II (ГАМК‑эргические). Последние сохраняют высокий уровень активности в течение всего периода ожидания награды. При этом активность нейронов типа II, отражающая уверенность в получении награды, подавляет работу нейронов типа I — порой не сразу, а лишь по прошествии нескольких дней (для этого наверняка требуется перестройка структуры синаптических связей, см. синаптическая пластичность). Полученные дофаминовыми нейронами возбуждающие сигналы о «хороших новостях» за вычетом тормозящих сигналов об ожиданиях — это и есть искомая величина RPE, ошибка предсказания награды.
Рис. 4. Схема нейронных связей VTA, какой она представляется по итогам исследования. Серый квадрат — VTA, цветные кружки — три типа нейронов: DAergic — дофаминэргические, GABAergic — ГАМК‑эргические, Type III — нейроны типа III. VTA получает возбуждающие (Excitation) и тормозящие (Inhibition) входные сигналы о позитивных ожиданиях (Expectation) и негативных стимулах (Aversion) из префронтальной коры (PFC), латеральной уздечки (LHb), педункулопонтийного ядра (PPN), полосатого тела, или стриатума (Str). Сигналы дофаминовых нейронов VTA, несущие информацию об ошибке предсказания награды (RPE), поступают в кору (Сtx), стриатум, миндалину (Amy), гиппокамп (Hipp). Изображение из дополнительных материалов к обсуждаемой статье в Nature
Реальный алгоритм работы VTA наверняка сложнее грубой схемы, показанной на рис. 4. Но такое можно сказать практически о любом выводе или обобщении в нейробиологии (да и в биологии вообще), что не делает эти выводы менее важными и полезными. В частности, полученные результаты могут помочь в борьбе с наркоманией. Ведь некоторые наркотики, как говорилось выше, подавляют активность ГАМК‑эргических нейронов VTA. Поэтому расшифровка функции этих нейронов важна для понимания механизмов формирования наркотической зависимости.
Источник: Jeremiah Y. Cohen, Sebastian Haesler, Linh Vong, Bradford B. Lowell, Naoshige Uchida. Neuron-type-specific signals for reward and punishment in the ventral tegmental area // Nature. 2012. V. 482. P. 85–88.