Объяснение
целенаправленной деятельности в теории функциональных систем [65].
Рассмотрим и объясним на основе приведенных схем последовательно все стадии
организации целенаправленного поведения в
соответствии с теорией функциональных систем и информационной теорией эмоций, а
также некоторые из процитированных выше свойств акцептора результатов действия.
Афферентный синтез осуществляется
активацией ¯ мотивацией М различных последовательностей действий da, db, dc, dd, извлекаемых мотивацией из памяти.
Как видно из схем на рис.
35 и рис.
37, при этом автоматически учитывается вся обстановочная
афферентация и сама мотивация как стимул. «Извлечение из памяти» это не
возбуждение действий, а такая их активация, которая производится только
мотивационным возбуждением ввиду его химической специфичности и своеобразной
«пачкообразной» активности: «...Доминирующая мотивация отражается в
характерном распределении межимпульсных интервалов в нейронах различных отделов
мозга. Распределение межимпульсных интервалов носит характер, специфический для
различного биологического качества мотиваций» [78; с. 170]. «Таким образом, пачкообразная ритмика
центральных нейронов в условиях доминирующего пищевого мотивационного
возбуждения отражает процессы ожидания пищевого
подкрепления» [Там же; с. 182]. Такая активность есть как бы
«воображение», позволяющее мотивации по имеющимся закономерностям формировать
конкретную цель, акцептор результатов действий и план действий. Получение
реальных, а не в «воображении» результатов сразу же снимает специфическую
активацию ¯ мотивацией этих результатов: «удалось объективно
зафиксировать процесс ожидания параметров пищевого подкрепления и,
следовательно, прямо отнести их к аппарату акцептора результатов действия.
Такими оказались нейроны, которые у голодных животных проявляют выраженную
пачкообразную активность. Было установлено, что практически все нейроны с такой
формой активности немедленно переходят на регулярную разрядную деятельность,
как только животные удовлетворяют свою доминирующую пищевую
потребность...Причем было отмечено, что когда голодное животное видит пищу,
пачкообразная активность заменяется на регулярную преимущественно у нейронов
зрительной области коры мозга, при введении пищи в ротовую полость, – у
нейронов таламической области, при поступлении пищи в желудок – у нейронов
гипоталамической области, при введении глюкозы в кровь – у нейронов ствола
мозга». [Там же; с. 180]. Из приведенных схем видно, что все этапы
афферентного синтеза – мотивация, память, обстановочная и пусковая афферентации
естественным образом сливаются.
План действий. Мотивация «извлекает из памяти» не просто
последовательности действий da, db, dc, dd, а планы
действий, выполнение которых приводило раньше к достижению цели. Далее на
стадии принятия решений из всех «извлеченных из памяти» планов действий будет
выбран один план. Поскольку план действий «извлекается из памяти» до всяких
действий, то активация закономерностей плана может осуществляться только в
«воображении». Более точно план действий представляет собой последовательность
закономерностей на рис.
37, которые активируются в «воображении» по внутреннему
контуру работы мозга, обозначенному на рисунке стрелкой ®. На рис.
35 эта последовательность представлена средней цепочкой da Þ a Þ db Þ b Þ dc Þ c Þ dd Þ d. По этой
цепочке происходит «опережение хода
событий в отношениях между организмом и внешним миром». Эта цепочка представляет
собой последовательно «срабатывающие» в «воображении» закономерности (см. рис. 37)
Obc(da)&da&Res(da) Þ a,
Obc(db)&db& Res(db) Þ b, (1)
Obc(dc)&dc&Res(dc) Þ c,
Obc(dd)&dd&Res(dd)Þ d.
«Срабатывание» в «воображении»
означает передачу этими закономерностями пачкообразной активности, но не
регулярное возбуждение, переход на которое осуществляется только после
получения реальных результатов и безусловного
их срабатывания. Что значит «срабатывание» в «воображении», например,
закономерности Obc(da)&da&
Res(da) Þ a при
отсутствии результата Res(da)? Такое «срабатывание»
осуществляется по более слабым закономерностям (см. рис. 37)
Obc(da)&da Þ a, Obc(db)&db Þ b, Obc(dc)&dc Þ c, Obc(dd)&dd Þ d, (2)
которые в соответствии с формальной моделью нейрона и
семантическим вероятностным выводом, также обнаруживаются нейронами a, b,
c, d. Но «срабатывание» нейронов a, b, c, d
по закономерностям (37) не означает, что не будут ожидаться обратные
афферентации Res(da), Res(db), Res(dc), Res(dd) от
результатов действий, включенные в более «точные» закономерности (36) тех же самых нейронов a, b, c, d.
Более «точная» закономерность включает в себя менее «точную», как, например,
закономерность Obc(da)&da&
Res(da) Þ a включает в
себя закономерность Obc(da)&da Þ a. Более «точная» закономерность расположена на той же
ветке семантического графа, что и менее точная и, значит, если нейроном
обнаружена более «точная» закономерность, то всегда обнаружена и менее
«точная». Более «точная» закономерность всегда имеет строго большую оценку
предсказания и в этом смысле уточняет более слабую закономерность. «Срабатывание»
менее «точной» закономерности при наличии более «точной» всегда означает, что
в большинстве случаев в прошлом через какой-то момент времени приходила на
«вход» нейрона и «уточняющая» информация, позволяющая «сработать» и более
точной закономерности и тем самым сделать более точное предсказание как
этапного, так и конечного результата, в противном случае более «точная» закономерность
не смогла бы быть обнаружена на основании прошлого опыта. Поэтому, несмотря на
«срабатывание» менее точной закономерности, нейрон ожидает поступление
уточняющей информации. Его ожидание состоит в том, что он готов немедленно (с
меньшим латентным периодом срабатывания нейрона, ввиду более высокой
вероятности этой закономерности) «сработать» (увеличить частоту импульсаций в
соответствии с увеличением вероятности предсказания) по более «сильной»
закономерности. Но, как было объяснено ранее, закономерности (36) не просто являются более «точными», а сигнализируют
безусловно (с вероятностью, близкой
к 1, или по безусловному стимулу) о фактическом достижении результата, что
снимает «пачкообразную» активность и переводит нейрон на регулярную
активность, тем самым различая «воображение» и факт. Пока же обратные
афферентации от результатов не получены, «пачкообразная» активность мотивации
переводит нейроны a, b, c,
d в состояние ожидания этих
результатов, так как регулярной активностью (безусловной) эти нейроны
«сработать» не могут по той причине, что условия этих закономерностей не
выполнены в силу того, что одно из условий Res(da),
Res(db), Res(dc), Res(dd) не
выполнено. Поэтому нейроны a, b, c,
d, с одной стороны, передают
пачкообразную активность в «воображении» по закономерностям (37) а, с другой стороны, ожидают обратную афферентацию Res(da), Res(db), Res(dc), Res(dd), требуемую более сильными закономерностями (36), срабатывающими безусловно, после чего они переходят
в регулярную активность. Активация в «воображении» результатов a, b,
c, d, активирует следующие
действия по цепочке закономерностей на рис.
37. Тем самым
в «воображении» активизируется весь план действий, эффективность которого, в
целом, оценивается на следующем этапе – этапе принятия решений.
Принятие решений осуществляется при рассмотрении плана действий с учетом переключающей
функции эмоций, т. е. на основании качества возникшей эмоции и вероятности
прогноза достижения цели по данному плану. Вероятность прогноза оценивается
не по плану (3). Как было сказано, принципиально не существует хороших методов
пересчета вероятностей предсказания «вдогонку» логическому выводу, который
представлен здесь планом (3). Мозг «обходит» любой логический вывод, находя
всего одну вероятностную закономерность, предсказывающую конечный результат.
Такой закономерностью в данном случае является закономерность
M&da&Обс(da)&db&Обс(db)&dc&Обс(dc)&dd&Обс(dd) Þ d, (3)
выработанная нейроном d. Поэтому вероятность достижимости конечного результата по плану
действий da,db,dc,dd оценивается
закономерностью (38), учитываемой эмоциями. Это не означает, что план не
«проигрывается» в «воображении». Для «проигрывания» планов действий
достаточно в «воображении», моделируя, например, метод «проб и ошибок»,
выбрать некоторую последовательность действий da, db, dc, dd, по
которой, если «проиграть» закономерностями рис.
37 последовательность получаемых этапных результатов, то
эти действия, во-первых, приведут к достижению конечного результата, а
во-вторых, по закономерностям (38) дадут достаточно хорошую оценку предсказания
достижимости этого результата. План должен проигрываться с целью обеспечения
согласованности всех действий (и обеспечения его непротиворечивости, так как
есть еще тормозные закономерности). Таким образом, план может быть оценен
эмоциями по качеству мотивации и закономерности (38), дающей вероятностную оценку плана. Но для полной
реализации переключающей функции эмоций в процессе принятия решений, необходимо
допустить возможность произвольной вариации плана в «воображении». Это
осуществляется мозгом как своеобразный «блочный» семантический вероятностный
вывод, представленный рисунками рис.
35, рис.
36.
Рассмотрим более подробно
как мозг осуществляет «блочный» семантический вероятностный вывод. Это
одновременно объяснит, как совершенствуется план действий в целом путем его
локальных и / или глобальных изменений. Это происходят за счет
изменений «блочного» вывода путем вариации плана действий в соответствии с
переключающей функцией эмоций. Принятие решения состоит в том, что при данной
мотивации М и сопровождающей ее отрицательной эмоции, мозг стремится найти
такой план действий, который давал бы максимальную положительную эмоцию –
предвосхищение достижения результата определенного качества с максимальной оценкой
вероятности достижимости этого результата. За счет активирующего действия
мотивации М, мозг в «воображении» может «проигрывать» различные варианты
достижения цели. При этом все необходимые
для достижения конечной цели этапные результаты (строго увеличивающие
вероятность достижения конечного результата) включаются в результирующий план
действий. Поэтому принятие решений и есть процесс организации семантического
“блочного” вероятностного вывода, осуществляемого мозгом. «Проигрывая»
различные планы действий, мозг проигрывает тем самым различные семантические
вероятностные выводы, пытаясь найти такой, который обеспечил бы как требуемое
качество цели, так и максимальную оценку вероятности предсказания. Таким
образом, эмоции как интегральные
оценки решений являются в то же время теми оценками, которые организуют
семантический вероятностный вывод как отдельных нейронов, так и мозга в целом (находя наилучший «блочный» семантический
вероятностный вывод). Нейрон
организует семантический вероятностный вывод, а мозг – “блочный” вероятностный
вывод. Цепочка предсказаний рис.
35, рис.
36 отличается от «уточняющего» графа, во-первых, тем,
что она линейна в силу линейности последовательности действий, а во-вторых,
тем, что она связана с деятельностью во внешней среде, действия в которой надо
одновременно предвосхищать и контролировать. Но цель работы отдельного
нейрона и мозга в целом одна и та же – организация семантического
вероятностного вывода в целях достижения максимальной точности предсказания.
Конкретная цель ставится
активацией ¯ мотивацией М последовательности действий da, db, dc, dd, выбранной в процессе принятия
решения. Как уже говорилось, эта
активация в «воображении» передается всем нейронам результатов a, b,
c, d по закономерностям (37). Так как результаты Res(da), Res(db), Res(dc), Res(dd) действий еще не получены, то нейроны результатов a, b,
c, d перейдут в состояние ожидания
этих результатов в соответствии с закономерностями (36). Это и
есть постановка конкретной цели –
ожидание всеми нейронами результатов a,
b, c, d – всей совокупностью обратных
афферентаций о результатах совершенных действий Res(da), Res(db), Res(dc), Res(dd).
Акцептор результатов действия и есть вся ожидаемая обратная афферентация результатов Res(da), Res(db), Res(dc), Res(dd). Если
конкретная цель ставится всей совокупностью результатов a, b, c, d, как ожидание достижения этих
результатов, то обратная афферентация от всей совокупности действий и есть
акцептор результатов действия. После
совершения какого-либо действия мозг ожидает получение реального результата от
действий по внешнему контуру. После получения реального результата
осуществляется «сличение предсказания с параметрами реального результата». Это
сличение осуществляется закономерностями (36). «Сличение» состоит в том, что все эти
закономерности не смогут
«сработать», если не будет получена именно та обратная афферентация, которая
записана в закономерности. Если при каком-то действии будет получена другая
афферентация, то немедленно возникнет ориентировочно-исследовательская
реакция. Более точно, ориентировочно-исследовательская реакция возникает тогда
и только тогда, когда теряется или резко падает оценка предсказания конечного
результата, полученная на основании плана действий (см. рис. 37).
Формула
эмоций. Замещающая функция эмоций.
В формуле эмоций Э = f[П,
Как было сказано,
«нарастание эмоционального напряжения, с одной стороны, расширяет диапазон извлекаемых из памяти
энграмм, а с другой стороны, снижает критерии «принятия решения» при сопоставлении этих энграмм с
наличными стимулами». Происходит это автоматически, путем повышения уровня возбудимости нейронов при усилении
мотивации (сильный голод) и соответствующем усилении отрицательных эмоций. В
этом случае в соответствии с формальной моделью нейрона и «уточняющим» графом,
происходит активация тех вероятностных закономерностей, которые были обнаружены
на ранних этапах формирования функциональных систем и которые имеют не очень
высокую оценку условной вероятности. Эти вероятностные закономерности имеют
меньшее число предикатов в условиях закономерностей и, значит, являются более
генерализованными и применимыми в более широком числе случаев. Это в точности
реализует обратный, по сравнению с развитием функциональных систем, механизм
редукции функциональных систем. Если ориентировочно-исследовательская реакция
развивает функциональные системы и удлиняет ветви «уточняющего» графа в
вероятностных закономерностях, то поднятие уровня возбудимости нейронов,
позволяет «срабатывать» старым, «слабым» закономерностям (при неприменимости
более сильных в данной новой или неожиданной обстановке) и возбуждать нейрон,
приводя, таким образом, к более генерализованным способам действий.
Взаимосвязь
принципов целеполагания и предсказания. Формальная модель работы мозга, синтезирующая оба принципа.
Математическая модель работы мозга, вытекающая из принципа целеполагания,
представляет собой иерархию слабых формальных систем. Математической моделью
работы мозга, вытекающей из принципа предсказания, является множество
функциональных систем {PR(М, Р, Э)}. Принцип работы и содержание каждой
функциональной системы описан в предыдущих разделах. Как связаны между собой
эти две модели работы мозга?
Множество {PR(М, Р, Э)} вероятностных
закономерностей обнаруживается на множестве всех потребностей {áМ, Р, Эñ}, являющемся
множеством всех исходных целей организма. Как мы видели, эти исходные цели на
начальном этапе формирования функциональных систем достигаются «реагированием
по принципу доминанты» или методом «проб и ошибок», т. е. наименее
дифференцированными деятельностями. Дальнейшее совершенствование функциональных
систем организма происходит уже путем увеличения этапных результатов и обогащением
акцептора результатов действия при участии ориентировочно-исследовательской
реакции. Обученный организм имеет уже довольно сложную последовательность и
иерархию целей и подцелей для каждой функциональной системы. Эти
последовательности и иерархии целей и подцелей формируются из структуры
предсказаний во внешнем мире, которую улавливает мозг в виде множества
вероятностных закономерностей {PR(М, Р, Э)}.
Формальная модель работы
мозга, основанная на принципе целеполагания, и представляющая собой иерархию
слабых формальных систем предполагает,
что все множество целей каким-то образом задано. Принцип же предсказания только
начинает с задания множества исходных целей {áМ, Р, Эñ}, остальные цели получаются в результате длительного
процесса обучения. Кроме того, полученная по принципу предсказания иерархия
результатов, включающая интуицию, уже не может быть полностью осознана и, как
показано далее, даже не может быть «извлечена» из эксперта как знание. Поэтому
полученная в результате обучения по принципу предсказания иерархия целей
принципиально не может быть как-то изначально дана, как это требуется принципом
целеполагания и, следовательно, применение формальной модели, основанной на
иерархии слабых формальных систем, уже принципиально невозможно.
Предположим, что мы вывели
чисто формально иерархию и последовательность целей из анализа множества {PR(М, Р, Э)}. Какую лучше в
этом случае использовать формализацию работы мозга – основанную на слабых
формальных системах или на множестве {PR(М, Р, Э)}?
Как было сказано, множество PR
«сильнее» любого логического вывода с точки зрения получения предсказаний.
Несмотря на все эти
рассуждения, принцип целеполагания продолжает играть важную роль в модели {PR(М, Р, Э)}. Само обнаружение
вероятностных закономерностей невозможно без целей (М, Р, Э).
Фактически в модели {PR(М, Р, Э)}
принцип целеполагания и принцип предсказания синтезированы в одну модель,
которую мы и будем в дальнейшем считать формальной
моделью работы мозга, синтезирующей оба принципа.
В других работах, которые не
вошли в книгу, мы приводим объяснение теории движений
Н. А. Бернштейна [26]; процесса принятия решений и функции эмоций [37]; рефлексии и мышления [25]; логики работы мозга [27] как предсказывающего устройства, главной функцией
которого является организация предсказаний на всех уровнях его работы.