§ 88. Формальная модель работы мозга, основанная на принципе предсказания.

Формальная модель работы мозга, вытекающая из принципа предсказания. В силу сформулированной выше гипотезы, нейроны обнаруживают все вероятностные закономерности между его входом и выходом для различных функциональных систем, в которые он включен. Для  выполнения принципа предсказания надо уметь обнаруживать все множество вероятностных закономерностей PR. Для этого необходимо, чтобы нейроны в мозге были связаны так, чтобы на их входы могла попасть любая из входных афферентаций мозга и их выход мог достигнуть любого эффекторного органа. Именно это и осуществляется решеточным принципом межнейронных связей [67]. «Мы считаем, что в самом фундаменте нейронной организации заложен биологически обусловленный принцип универсальной взаимосвязи всех воспринимающих раздражения элементов – рецепторов – со всеми элементами, реализующими ответные реакции на раздражения – эффекторами, которыми обладает организм. Любой рецептор или комбинация рецепторов, могут быть связаны с любым эффектором, или комбинацией эффекторов. Анатомически данный принцип выявляется в виде схемы всеобщего перекрёста («решетки») нервных путей, соединяющих отдельные рецепторные точки тела, или их группы, с эффекторными» [67; с. 101]. Рис. 33, приведенный в работе [67], иллюстрирует эту «решетку». Жирными точками обозначены нейроны, стоящие в узлах решетки. Нейроны не просто стоят в местах схождения афферентаций, но и возникают в таких местах: «Как видно на приведенной схеме...нейроны возникают и структурно закрепляются именно в пунктах взаимодействия различных по своему происхождению и назначению нервных импульсов. Таким образом, нейрон с самого начала его появления в эволюции живых организмов предстает перед нами как аппарат схождения (конвергенции) и расхождения (дивергенции) переключаемых в нем импульсов» [Там же; с. 102].

В дополнение к «переключающей» функции нейронов надо еще добавить, что нейроны в каждом «узле решетки» получают на вход не только возбуждения от нейронов предыдущего слоя, но и от всех предыдущих слоев и посылают свое возбуждение всем последующим слоям. Кора головного мозга достаточно тонка и возбуждения поступающие в нее или возникающие в ней в вертикальном направлении (перпен­ди­кулярно ее поверхности) пронизывают почти всю кору (в отличие от горизонтального направления). Таким образом, мозг устроен в достаточно точном соответ

ствии с необходимостью иметь максимально точные предсказания, которые можно получить обнаружением всех вероятностных закономерностей PR. Единственное ограничение, возникающее при обнаружении вероятностных закономерностей нейронами, состоит в том, что подкрепление нейронов осуществляется только в рамках некоторой функциональной системы, т. е. только тогда, когда достигается некоторая цель.

Определим понятие функциональной системы в терминах вероятностных закономерностей. Вспомним, что функциональные системы формируются для выполнения некоторых функций организма и достижения соответствующих результатов. «#Сос­тав функциональной системы не может быть определен каким-либо анатомическим принципом. Наоборот, самые разнообразные «анатомические системы» могут принимать участие и объединяться на базе одновременного возбуждения при выполнении той или иной функции организма#» [78; с. 19].

Используя формальную модель нейрона, можно объяснить как происходит формирование функциональной системы на нейрофизиологическом уровне. Пусть тройка áМ, Р, Эñ ставит цель по выполнению некоторой функции организма. Если функциональная система не определена генетически, то на начальном этапе формирования функциональной системы у нас нет высоко вероятного прогноза достижения цели и, следовательно, возникает ориентировочно-исследовательская реакция для обучения достижению данной цели, которая:

– во-первых, стремится к тому, что бы все окружающие животное раздражители были известны. «В новой неизвестной обстановке...поведение строится с использованием выраженной ориентировочно-исследовательской деятельности. На основе имею­­­­щей­­ся потребности животные активно исследуют все ранее неизвестные раздражители окружающей среды ...» [Там же; с. 124];

– во-вторых, все обследованные раздражители она «связывает» с по типу условного рефлекса с конечным результатом;

– в-третьих, она генерализованно поднимает и выравнивает активность нейронов коры головного мозга, что делает возможным возникновение условных связей между отдаленными нейронами коры: «ориентировочно-исследовательская реакция...всегда ведет к десинхронизации электрической активности коры...часто выражающееся на записи почти прямой линией...Эта десинхронизация является общепризнанным результатом активности ретикулярной формации ствола мозга...является выражением энергетического влияния на кору больших полушарий» [6; с. 346]; «...можно сказать, что без этого активирующего действия со стороны ретикулярной формации отдельные раздражения, приходящие в кору, были бы в значительной степени изолированными и не могли бы вступить между собой в непосредственную тесную связь так легко, как они вступают при повышении тонуса коры через подкорковое возбуждение ориентировочно-исследовательской реакции» [Там же; с. 351].

Нетрудно видеть, что все эти функции ориентировочно-исследовательской реакции так же направлены на то, что бы обнаружить максимальное число вероятностных закономерностей PR и сформировать такие функциональные системы, которые бы включали максимальные возможности предсказания результата, предоставляемые схемой соединения нейронов (см. рис. 33). Действительно, добиваясь чтобы все раздражители были известны, она максимально увеличивает «вход» мозга (см. рис. 33); поднимая и выравнивая активность нейронов коры, она обеспечивает равномерное увеличение числа активных нейронов, «срабатывающих» по не достаточно сильным вероятностным закономерностям, что еще больше увеличивает объем доступной информации и возможность ее передачи из одних отделов мозга в другие и, наконец, «связывает» условными связями всю эту информацию с конечным результатом путем обнаружения вероятностных закономерностей. Облегчается также выработка условных связей, так как даже при небольшом числе сочетаний условного сигнала с безусловным, когда вероятностная закономерность еще недостаточно сильна, мы получаем предсказание безусловного сигнала при срабатывании соответствующего нейрона по этой слабой закономерности.

При таком действии практически любая вероятностная закономерность из PR, полезная для предсказания какого-либо (этапного) результата  какой-либо из потребностей áМ, Р, Эñ, может быть обнаружена схемой нейронов рис. 33, и включена в функциональную систему (если только для этой вероятностной закономерности  существует нейрон , такой что { } Í { }). Теоретически в нашей модели мы будем считать, что такой нейрон всегда существует. Для обнаружения вероятностных закономерностей  некоторой функциональной системой áМ, Р, Эñ достаточно мотивации М, и того факта, что, если при условии  сработал нейрон , то это приблизит нас к достижению конечного результата , вызывающего положительную эмоцию Э. Каждая вероятностная закономерность из PR подкрепляется единственной тройкой áМ, Р, Эñ. Множество всех вероятностных закономерностей из PR и обнаруживающих их нейронов, подкрепляемых некоторой тройкой áМ, Р, Эñ, и есть та функциональная система, определяемая áМ, Р, Эñ. Обозначим через PR(М, Р, Э) все те вероятностные закономерности (и содержащие их нейроны), которые соответствуют этой функциональной системе. Пусть {áМ, Р, Эñ} – множество всех потребностей. Множество {áМ, Р, Эñ} разбивает все множество вероятностных закономерностей PR на непересекающиеся группы PR(М, Р, Э), так как каждая вероятностная закономерность закрепляется только одной потребностью áМ, Р, Эñ. Поэтому PR = È{PR(М, Р, Э)}. Однако, вырабатывающие их нейроны могут принадлежать разным группам, так как один и тот же нейрон может участвовать в работе нескольких функциональных систем. Множество {PR(М, Р, Э)} и есть все множество функциональных систем, обнаруживаемых мозгом и та математическая модель работы мозга, которая вытекает из принципа предсказания.

Это определение дает нам функциональные системы в полном объеме со всеми промежуточными результатами. Рассмотрим как развиваются функциональные системы. Это позволит нам дать подробную структуру данной формальной модели работы мозга и каждой функциональной системы в отдельности.

Структура формальной модели работы мозга {PR(М, Р, Э)}. Объясним формирование и совершенствование действий как оно описано в теории функциональных систем. Используя формальную модель работы мозга {PR(М, Р, Э)} и формальную модель нейрона, сделаем это на нейронном уровне, что раскроет нам структуру формальной модели. Это даст нам возможность в следующем разделе объяснить в целом организацию целенаправленного поведения в теории функциональных систем на нейронном уровне. Объясним также свойства акцептора результатов действия, которые не могут быть объяснены на основе принципа целеполагания. Это «пред­вос­хи­­щение» в акцепторе результатов действия и его автоматическое обогащение и совершенствование.

Приведем высказывания из теории функциональных систем о свойствах акцептора результатов действия, которые мы хотим объяснить: «Формирование «цели» в центральной архитектуре поведенческого акта связано с построением следующей стадии системной организации поведенческого акта аппарата предвидения будущего результата (всей последовательности и иерархии результатов), удовлетворяющего доминирующую потребность, – аппарата акцептора результатов действия» [78; с. 81]. «Он «предвосхищает» афферентные свойства того результата, который должен быть получен в соответствии с принятым решением, и, следовательно, опережает ход событий в отношениях между организмом и внешним миром... По сути он должен сформировать какие-то тонкие нервные механизмы, которые позволяют не только прогнозировать признаки необходимого в данный момент результата, но и сличать их с параметрами реального результата» [4; с. 95].

Как уже говорилось, под «предвидением» понимается предвосхищение в соот­ветствии с принципом опережающего отражения действительности [5], всей последовательности и иерархии результатов необходимых для достижения конечной цели. Более конкретно предвосхищение не определяется. Как показано в работах школы П. К. Ано­хи­на, нейрофизиологически предвосхищение реализуется специальными коллатеральными ответвлениями от произведенных действий и поступающих на «вход» мозга, конвергируя с афферентацией от входных стимулов: «Речь идет о коллатеральных ответвлениях пирамидного тракта, отводящих ко многим межуточным нейронам “копии” тех эфферентных посылок, которые выходят на пирамидный тракт...Таким образом, момент принятия решений и начала выхода рабочих эфферентных возбуждений (начало действий – Е. В.) из мозга сопровождается формированием обширного комплекса возбуждений, состоящего из афферентных признаков будущего результата и из коллатеральной “копии” эфферентных возбуждений, вышедших на периферию по пирамидному тракту к рабочим органам.» [4; с. 97]. Таким образом, рис. 33 преобразуется в более сложную схему рис. 34.

 МОЗГ

  МОЗГ

Внешний Мир

Внешний Мир


В рис. 34 добавился внутренний контур обратных связей, обозначенный малой пунктирной линией, посылающий по коллатералям возбуждения с «выхода» мозга на его «вход», а также внешний контур обратных связей от результатов осуществленных действий во внешней среде, обозначенный большой пунктирной линией. Добавились и нейроны вдоль внутреннего контура по возбуждениям которых осуществляется «предвосхищение» результатов действий акцептором результатов действий.

Рассмотрим выработку классического условного рефлекса. Пусть a – выбранный нами условный сигнал, например, звонок и b, c и d – стук кормушки, вид хлеба и действие хлеба на вкусовые рецепторы языка (безус­лов­ный раздражитель).

Фактически все пусковые стимулы являются результатами действий – действием является ожидание пускового стимула и настройка сенсорного аппарата (предвос­хи­щение в терминологии У. Найсера) на восприятие данного стимула, а результатом действия и обратной афферентацией является сам пусковой стимул. В соответствии с концепцией Схем восприятия У. Найсера, без такой настройки и предвосхищения мы просто не сможем воспринять (и не увидим и не услышим) соответствующий пусковой стимул. Например, чтобы воспринять звонок a, мы должны осуществить перцептивное действие da по настройке на его восприятие. Поэтому мы далее будем рассматривать пусковые стимулы как этапные результаты.

Верно и обратное – обратная афферентация об успешном завершении некоторого этапного действия и получение этапного результата является пусковой для начала следующего действия и продолжения достижения цели, так как мы не можем продолжить следующее действие, пока не совершено предыдущее. Например, после того как прозвучал звонок a, животное начинает следующее действие db – ожидание стука кормушки. Достижение результата b – стука кормушки, будет пусковым для начала следующего этапа действий – подхода к кормушке и восприятие хлеба dc. Получение результата c – вида хлеба, «запустит» последнее действие dd – поедание хлеба с целью получения конечного результата d – ощущение хлеба рецепторами языка.

«Запуск» действия db может быть осуществлен нейроном db при действии на него пускового стимула a по закономерности a Þ db. Эта закономерность будет закреплена в том и только в том случае, если действие db приведет к такой обратной афферентации Res(db) от результатов этого действия, которая вызовет результат b, для ко­то­рого закономерность b Þ d, обнаруженная нейроном d, будет иметь большую оценку условной вероятности, чем закономерность a Þ d от предыдущего этапного резуль­тата. В этом случае в соответствии с информационной теорией эмоций возникшая положительная эмоция, закрепит «запуск» дейст­вия a Þ db, активацию обратной афферентацией Res(db) результата b по закономерности Res(db) Þ b, а так же закономерность b Þ d. После получения условного стимула a и запуска действия db следующим пусковым стимулом станет уже стимул b, запускающий действие dc, а этапным результатом будет результат c. Этот следующий этап действий приведет к выработке аналогичных закономерностей b Þ dc, Res(dc) Þ c и c Þ d (35). «Запуск» действия da осуществляется самой мотивацией М, поскольку мотивация является не только активирующим возбуждением, но и стимулом. «Запуск» М Þ da закрепится по той же причине, что и другие запуски, так как приведет к этапному результату a, предсказывающему по закономерности a Þ d достижимость конечного результата с большей вероятностью, чем по закономерности М Þ d.

Полученные после рассмотрения всех этапов действия закономерности a Þ d, b Þ d и c Þ d будут иметь последовательно возрастающие оценки условных вероятностей. Таким образом, на нейронном уровне мы вместо последовательности a Þ b Þ c Þ d будем иметь следующую последовательность (графическое представление этой последовательности приведено на рис. 35:

 

М Þ da ® Res(da) Þ a Þ db ® Res(db) Þ b Þ dc ® Res(dc) Þ c Þ dd ® Res(dd) Þ d      (1)

 

где a Þ, b Þ, c Þ – условные связи «запуска» очередного этапа действий, выработанные нейронами dadbdc. Стрелка ® после действий dadbdcdd означает совершение действий во внешней среде. Res(da), Res(db), Res(dc), Res(dd) – обратные афферентации, поступающие на входы нейронов abcd из внешней (внутренней) среды и сигнализируюшие о достигнутом результате действий.

Каждое действие da, dbdcdd в соответствии с рис. 35 по коллатералям передает свое возбуждение на «вход» мозга и, следовательно, можно считать, что возбуждение от моторного нейрона da одновременно с активацией самого действия передает свое возбуждение на вход нейрона a, действие db на вход нейрона b, действие dc на вход нейрона c и действие dd на вход нейрона d. Значит, на входы нейронов результатов abcd поступит не только обратная афферентация Res(da), Res(db), Res(dc), Res(dd) от результатов осуществленных действий, поступающая по внешнему контуру, но и возбуждения от самих действий dadbdcdd, поступающая по внутреннему контуру мозга. Поэтому схема условного рефлекса (35) преобразуется в схему на рис. 35. В ней М – мотивация, «извлекающая из памяти» активацией ¯ (см. подробнее далее) всю цепочку действий (план действий) по достижению цели. Обстановочная афферентация Обс(da), Обс(db), Обс(dc), Обс(dd) представляет собой множество всех необходимых условий успешного совершения каждого отдельного действия и достижения в итоге конечного результата в данной обстановке. Никакого другого дополнительного смысла обстановочная афферентация не имеет. Обстановочная афферентация автоматически включится в закономерности М&Обс(da) Þ da, a&Обс(db) Þ db, b&Обс(dc) Þ dc, c&Обс(dd) Þ dd как «существен­ная» информация (повышающая условную вероятность прогноза (см. рис. 35)) о необходимых условиях возможности «запуска» очередного действия и получения соответствующего (этапного) результата.

 

      М,Обс(da)    М,Обс(db)    М,Обс(dc)   М,Обс(dd)

           ߯ ß             ¯ ß                ¯ ß               ¯ ß

            da Þ a  Þ   db Þ b  Þ     dc Þ  c  Þ dd  Þ d,         <==  Мозг

           ßÝ      Ý         ßÝ     Ý          ßÝ       Ý        ßÝ      Ý

                  Res(da)        Res(db)         Res(dc)         Res(dd)                  

                                                                                                           

                           

Внешний Мир

            Рис. 35


Как видно из рис. 35, достижение цели представляет собой последовательность «блоков» (см. отдельный блок на рис. 36), каждый из которых начинается и заканчивается двумя последовательными этапными результатами.

Как мы увидим при объяснении теории движений Н. А. Бернштейна, этот блок действий является основополагающим и называется «рефлекторным кольцом». В теории схем восприятия У. Найсера этот же блок действий называется «Перцептивным циклом». Более подробно этот блок действий будет рассмотрен далее.



Представим схему на рис. 35 через закономерности, возбуждающие соответствующие нейроны. Это следующие закономерности, вырабатываемые в процессе обучения.

Далее в этом и следующем разделе все эти закономерности будут объяснены. Определим сначала, что такое, например, действие dc. Для этого заметим, что вся совокупность обратных афферентаций от результатов действия dc, которую обозначим через GenRes(dc), поступает на «вход» мозга непрерывно во времени, начиная с момента начала действия и кончая достижением этапного результата c. Само действие dc в виде возбуждения отдельного нейрона или группы нейронов так же непрерывно во времени передает свои возбуждения эффекторным механизмам (мыш­цам, органам и т. д.) и одновременно по коллатералям на «вход» мозга. Рассмотрим подробнее взаимодействие обратной афферентации GenRes(dc) и действия dc в процессе обучения. Что будет первым во времени стимулом из GenRes(dc), контролирующим правильность осуществления действия dc? Первым стимулом будет сигнализация о таком первом результате совершенного действия, который не всегда достигается при совершении этого дей­ст­вия, т. е. это первый момент, в котором действие может отклониться от заданной цели и в итоге не достичь результата c. Если обратная афферентация подтвердит правильность совершения действия, то действие может быть продолжено. Следующей обратной афферентацией из GenRes(dc), контролирующей правильность совершения действия будет обратная афферентация от такого следующего момента действия, когда оно снова, в принципе, может отклониться от заданной цели. Зафиксируем множество моментов времени t1, t2,...,tk, в которых действие , i = 1, ..., k, в принципе, может отклониться от цели и в которых получаемую обратную афферентацию Res( ) следует контролировать. Разобьем действие dc на участки , i = 1, ..., k. Первый участок действия запускается как мы знаем закономерностью b&Обс(dc) Þ . После получения обратной афферентации Res( ) об успешном завершении этого первого участка действия , действие dc может быть продолжено. Продолжение действия «запус­кается» закономерностью Obc( )& &Res( ) Þ . Эта закономерность будет обнаружена автоматически, так как все условия «существенны» (удаление какого-либо условия строго уменьшает условную вероятность правила) в ней для продолжения действия. Далее действие продолжается по рекурентным закономерностям Obc( )& &Res( ) Þ , i = 1, ..., k-1, в которых действия  и  могут совпадать. Если для некоторых последовательных действий , ..., , i+l £ k совершается одно и то же действие , то закономерность примет вид Obc( )& & Res( ) Þ , т. е. действие  запускает само себя, если только обстановочная и обратная афферентации способствуют продолжению действия. Если же действие на каком-то участке отклонится от цели или будет достигнут конец действия dc, то это сразу же отразится на обратной афферентации Res, которая запустит другую закономерность. Таким образом, обратная афферентация будет сигналом для перехода к компенсаторным действиям, либо к запуску нового участка действия. Закономерности последовательного совершения участков действия обозначены на схеме рис. 35 двумя рядом стоящими стрелками ßÝ. На  рис. 37 эти закономерности представлены в явном виде.



При описании теории движений Н. А. Бернштейна мы объясним как автоматически строится иерархия действий в процессе обучения и какими закономерностями и возбуждениями эти действия выполняются. Но на самом верхнем уровне организация действий уже не может быть объяснена только закономерностями, так как зависит от целей достигаемых организмом. Так как цель ставится мотивационным возбуждением, то она является сугубо внутренней постановкой для организма цели. Однако после постановки цели, оценка вероятности ее достижения может быть осуществлена по обнаруженным закономерностям, что и осуществ­ляется переключающей функцией эмоций на стадии принятия решений. На стадии принятия решений действия представляют собой, как правило, линейную последовательность отдельных «блоков» действий. Поскольку в этой последовательности действий оценка вероятности предсказания конечного результата всегда строго возрастает, то принятие решений представляет собой своеобразный семантический “блочный” вероятностный вывод наилучшего плана действия. В результате получается та последовательность и иерархия результатов, которая описана в теории функциональных систем. Заметим, что эту последовательность и иерархию результатов мы вывели из анализа структуры предсказаний событий во внешней среде, которые улавливаются закономерностями из {PR(М, Р, Э)}. Схемы приведенных ресунков дают нам, таким образом, структуру и процесс функционирования формальной модели работы мозга, основанной на принципе предсказания.