СОЗДАНИЕ СОЗНАНИЯ vs. МОДЕЛИРОВАНИЕ МОЗГА: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ВЕРНУЛСЯ НАТОЧКУ ВЕТВЛЕНИЯ

Время: 23-11-2012, 20:49 Просмотров: 1121 Автор: antonin
    
В начале 1950-х годов, когда вычислительные машины начинали получать признание, немногие мыслители-новаторы начали осозна¬вать, что цифровые компьютеры могут быть чек-то ббльшим, чем мельницами, перемалывающими числа. Тогда возникли и вступили в борьбу за признание два противоположных вйДения того, чем могли бы стать компьютеры, — каждое со свое! исследовательской програм¬мой. Одна партия видела в компьютерах систему манипулирования ментальными символами; другая — средство моделирования мозга. Одна стремилась использовать компьютеры для инешщиирования формальной репрезентации мира, другая — для моделирования взаи¬модействия нейронов. Одна рассматривала в качестве парадигмы ин¬теллекта решение задач, другая - обучение. Одна использовала логи¬ку, другая — статистику. Одна школа была наследницей рационалис¬тической, редукционистской традиции в философия, другая — рассмат¬ривала себя как векую идеализированную, холистскую иейронауку.
Боевой клич первой группы был: и сознания, н компьютеры суть физико-символьные системы. К 1955 году Аллен Ньюэлл и Герберт Саймон, работавшие * РЭНД Корпорейшн, пришли к выводу, что по¬следовательности бито*, которыми манипулирует цифровой компью¬тер, мшуг стоять вместо чего угодно — вместо чисел, конечно, ио также вместо тех или ИНЫХ черт действительного мира. Более того: программы можно испольаовать в качестве правил репрезентации от¬ношений между этими символами, так что система могла бы выводить дальнейшие факта о репрезентируемых объектах к отношениях меж¬ду ниш. Как иедавио^апнсал Ныоалл в своем рассказе об истории проблем AI,
Область цифровых компьютеров определяет компьютеры как маши¬ны, манипулирующие числами. «Вся грандиозность идеи компьютеров, — говорят их приверженцы, — состоит в том, что числами можно закодиро¬вать все что угодно, даже инструкции». Ученые же в области А1 рассмат¬ривали компьютеры как машины, манипулирующие символами. «Вся грандиозность идеи компьютеров, — говорили они, — в том, что символа¬ми можно закодировать асе что угодно, даже числа» (Afeiм01983: 196).
Этот взгляд на компьютеры стал основанием для соответствую-щего взгляда на сознание. Ньюалл и Саймой выдвинули гипотезу, что человеческий мозг ■ цифровой компьютер, будучи абсолютно различ¬ными ио струиуре и механизму, имеют на определенном уровне аб¬стракции одно и то же функциональное описание. На «ом уровне и мозг человека, и подходящим образом запрограммированный цифро¬вой компьютер можно рассматривать пас две различных инстанциа- ции устройства одногои того же рода — устройства, порождающего рйэумное поведение посредством манипулирования символами с по¬мощью формальных правил. Ньюэлл и Саймон сформулировали свой взгляд в виде гипотезы:
ГИпотеза о Системе фраичесхих Символов. Система физических символов обладает необходимыми и достаточными средствами для порождения разумных действий.
Под «необходимыми» мы имеем в виду, что любая система, выказы¬вающая общую разумность, окажется — по рассмотрении ее — системой физических символов. Под «достаточными» мы имеем в виду, что любую систему физических символов, имеющую достаточно большие размеры, можно далее организовать так, чтобм она выказывала общую разумность (НтеВаяЛЯтон 1981:41). 
Создание сознания.
Ньюэлл и Саймон возводят истоки своей пшохеэы к Готлобу Фреге, Бертрану Расселу и Альфреду Норту .Уайхеду (1981: 42), но, конечно, Фреге и компания сами были наследниками давней атоми-стической, рационалистической традиции. Уже Декарт выдвинул предположение, что: (1) понимание заключается' исключительно в по¬строении подходящих репрезентаций и манипулировании ими; (2) эти репрезентации можно разложить на простые элементы (natures simplices)-, и (3) все эти феномены можно понимать как сложные ком¬бинации простых символов. И у Гоббса, современника Декарта, име¬лось неявное допущение, согласно которому элементы суть формаль¬ные компоненты, связанные друг с другом чисто синтаксическими операциями, так что рассуждения можно свести к вычислениям. «Ког¬да человек рассуждает, он делает не что иное, как выводит целое нз сложения частей, — пишет Гоббс, — ибо РАЗУМ ... есть не что иное, как расчет...» (1958: 45). Наконец, Лейбниц, разрабатывая классиче¬скую идею матезиса — формализации всего, имел в виду обеспечить тем самым основания для построения универсальной системы симво¬лов, так чтобы «мы могли каждому объекту приписать соответствую¬щее ему определенное число» (1951:18). Согласно Лейбницу, в про¬цессе понимания мы разлагаем понятия на более простые элементы. Чтобы избежать регресса ко все более и более простым элементам, должны иметься простейшие, в терминах которых можно понять все более сложные понятия. Более того, если мы хотим, чтобы понятия были приложимы к миру, то Должны иметься некие простые призна¬ки предметов, репрезентируемые этими элементами. Лейбниц имел в виду построить «алфавит человеческих мыслей» (1951: 20), «буквы [ко-торого] должны демонстрировать, будучи употреблены в доказательст¬вах, связь, группировку и порядок, имеющие место также и в объек¬тах» (1951: 10).
Людвиг Витгенштейн, опираясь на Фреге и Рассела, сформули-ровал в своем «Л оги ко-философском трактате» в чистом виде этот синтаксический, репрезентационистский взгляд на отношение созна¬ния к действительности. Он определил мир как совокупность логиче¬ски независимых атомарных фактов:
1.1. Мир есть совокупность фактов, а не вещей.
Факты же, считал он, можно исчерпывающим образом разложить на простые объекты.
2.1. Атомарный факт есть объединение объектов...
2. Q124 Если даны все объекты, то тем самым даны также и все ато¬марные факты- 
Эти факты, их составные части « логические отношения между ними, утверждал Витгенштейн, репрезентируются в сознания.
Z1. Мы создаем для себя обрааы фактов.
2.15, То, что элементы образа соединяются друг с другом определен¬ным способом, показывает, что так же соединяются друг с другом и вещи (1Й60).
AI можно трактовать как попытку отыскать в субъекте (в челове¬ке или в компьютере) простые элементы и логические отношения, от¬ражающие те простые объекты и отношения между ними, из которых сделан мир. В сущности, гипотеза Ньюэлла и Саймона о системе фи¬зических символов превращает витгенштейновское видение (само яв¬ляющееся кульминацией философской традиции классического ра¬ционализма) в некую эмпирическую заявку и основывает на ней ис¬следовательскую программу.
Противопоставляемая этому интуиция, согласно которой нам следует создавать искусственный интеллект, моделируя мозг, а не символьные репрезентации мира в сознании, черпала свои побуди-тельные мотивы ие из философии, а из того, что вскоре назвали ней¬ронаукой. Непосредственным источником ее мотиваций были работы Д. О. Хебба, предположившего в 1949 году, что некоторая масса ней¬ронов способна обучаться в том случае, если при одновременном воз¬буждении нейрона А и нейрона В это возбуждение увеличивало силу связи между ними.
сЭта идея была подхвачена франком Розеиблаттом, рассудившим так: раз разумное поведение, основывающееся на нашей репрезента¬ции мира скорее всего трудно формализуемо, то AI должен , вместо этого пытаться автоматизировать те процедуры, с помощью которых сеть нейронов научается различать образы (patterns) и соответственно реагировать на них. Как писал Розенблатт,
неявное допущение [исследовательской программы манипулирования символами] состоит в том, что относительно легко специфицировать по¬ведение, которое мы хотели бы получить от машины, а самое трудное — построить такое устройство или механизм, который бы эффективно реа¬лизовал это поведение... [И] легче и полезнее аксиоматизировать физиче¬скую систему, а затем аналитически исследовать эту систему, чтобы де¬терминировать ее поведение, Чем аксиоматизировать поведение, а затем строить физическую систему с помощью техники логического синтеза (1962b: 386).
По-другому различие между этими двумя исследовательскими программами можно сформулировать так: те, кто ориентировались на
символьные репрезентации, искали такую формальную структуру, ко¬торая дала бы компьютеру возможность решать определенный класс проблем или различать определенные образы. Розенблатт же хотел построить такое физическое устройство (или смоделировать такое ус1ройство на компьютере), которое затем смогло бы генерировать свои собственные способности.
Многие обсуждавшиеся модели связаны с вопросом о том, какую ло¬гическую структуру должна иметь система, если мы хотим, чтобы она об¬ладала некоторым свойством X, По существу, это вопрос о статической системе...
Альтернативный подход к этому вопросу таков: какая система могла бы развить свойство X? Я думаю, что для ряда интересных случаев мож¬но показать, что второй вопрос можно решить, не имея ответа на первый (1962Ь: 387).
Оба подхода вскоре привели к поразительным успехам. К 1956 году Ньюэлл и Саймон преуспели в программировании компьютера с помощью символьных репрезентаций так, чтобы он решал простые головоломки и доказывал теоремы пропозиционального исчисления. Эти первые впечатляющие результаты наводили на мысль, что гипо¬теза о системах физических символов близка к подтверждению, и не¬трудно понять, что Ньюэлл и Саймон были в эйфорическом настрое¬нии. Саймон объявил:
Не собираюсь удивлять или шокировать вас... Но проще всего под¬вести итоги было бы так: теперь в мире существуют машины, которые мыслят, обучаются и творят. Больше того, все эти их способности будут быстро расти до той поры, когда — в обозримом будущем — диапазон проблем, с которыми они способцы справляться, совпадет с тем диапазо¬ном проблем, за которые вообще брался когда-либо ум человека (1958: 6).
Он и Ньюэлл объясняли:
[У] нас теперь имеются элементы теории эвристического (а не алго¬ритмического) решения задач; и мы можем использовать эту теорию как для понимания эвристических процессов у человека, так и для моделиро¬вания таких процессов с помощью цифровых компьютеров. Интуиция, инсайты и обучение не являются более только собственностью людей: любой большой высокоскоростной компьютер мы можем запрограммиро¬вать так, чтобы он выказывал эти свойства. (1958: 6)
Розенблатт воплотил свои идеи в устройство, названное им пер- цептроном . К 1956 году Розенблатт сумел научить перцептрон рас¬познавать подобие паттернов определенных видов и отделять их от других, неподобных, паттернов. К 1959 году он также ликовал и чув¬ствовал, что его подход оправдал себя:
Представляется ясным, что... с перцептроном на свет явились новые автоматы по обработке информации: впервые у нас имеется машина, спо¬собная обладать оригинальными идеями. В качестве аналога биологиче¬ского мозга, перцептрон, или, точнее, теория статистической отделимости, по-видимому, приближается к тому, чтобы удовлетворить требования функционального объяснения нервной системы больше, чем любая другая из ранее предлагавшихся систем ... В концептуальном плане, по-видимо- му, в перцептроне воплощена, без всякого сомнения, реальная осуществи¬мость, так и принципы отличных от человека систем, способных осуществ¬лять функции человеческого познания ... По-видимому, будущее информа¬ционных устройств, работающих ие на логических, а на статистических принципах, обозначилось достаточно ясно (1958: i.449)
В начале шестидесятых оба подхода выглядели в равной степени обещающими, и оба в равной степени подставлялись критике, выдви¬гая завышенные претензии. Тем не менее, результаты внутренней войны между этими двумя исследовательскими программами оказа¬лись удивительно несимметричными. К 1970 году подход моделиро¬вания мозга, с перцептроном в качестве парадигмы, был сведен к не¬многим разрозненным, малодатируемым усилиям, в то время как лю¬ди, предложившие использовать цифровые компьютеры в качестве символьных манипуляторов, обрели бесспорный контроль над ресур¬сами, аспирантскими программами, журналами и симпозиумами, что в совокупности и составляет процветающую исследовательскую про¬грамму.
Реконструкция того, как произошла такая перемена, осложняется мифом о неотвратимости того, что произошло, — мифом, порождае¬мым любой активно действующей исследовательской программой. Итак, победителям представляется, что символьная обработка инфор¬мации победила потому, что была на правильном пути, а нейронные сети или коннекционистский подход проиграл потому, что он попро¬сту не работал. Однако такая концепция истории данной области ис¬следований — не более чем ретроспективная иллюзия. У обеих иссле¬довательских программ имелись как достойные разработки идеи, так и глубокие, остававшиеся в тени проблемы.
У каждой из позиций были свои хулители, и говорили они, в сущности, одно и то же: данный подход показал свою способность решать некоторые легкие проблемы, но нет оснований полагать, что данная исследовательская группа сможет успешно распространить свои методы на сложные объекты. И в самом деле, имелись свиде-тельства, что по мере возрастания сложности проблем, вычисления, требуемые обоими подходами, будут расти по экспоненте и, стало быть, скоро станут нереалистическими. В 1969 году Марвин Минский и Сеймур Пейперт писали о Розенблаттовом перцептроне:
Розенблатгозы схемы быстро принялись, и вскорости появилось, по¬хоже, не меньше сотни трупп и группок, экспериментирующих с этой мо¬делью...
Результаты это сотеи проектов и экспериментов были в общем и целом разочаровывающими, а объяснения — половинчатыми. Обычно машины прекрасно работали с очень простыми проблемами» но быстро ухудшали свои показатели по мере роста трудности ставившихся перед ними задач.
Тремя годами позже сэр Джеймс Лайтхилл, отрецензировав рабо¬ты по использованию эвристических программ, например работы Саймона и Минского, пришел к поразительно сходным негативным выводам:
Большинство людей, работающих в AI и соседних областях, призна¬ются в ^етко выраженном чувстве разочарования в том, что достигнуто за последнее 25 лет. Люди пришли в эту область около 1950-го и даже око¬ло 1960-года с большими надеждами, которые в 1972-м году очень далеки от осуществления. Ни в одном из разделов этой области до сих пор сде¬ланные открытия не произвели того воздействия, которое было в свое время обещано...
[0]дна достаточно общая причина испытанных разочарований: не¬признание всех последствий «комбинаторного взрыва». Это общее пре¬пятствие на пути построения ... системы, основанной на крупной базе знаний, источником которого является взрывной poet — при увеличении размеров базы знаний — любого комбинаторного выражения, репрезенти¬рующего число возможных способов группировки элементов базы знаний в соответствии с теми или иными конкретными правилами.
Как лапидарно подытожили это Дэвид Румелхарт и Дэвид Зип- сер, «рано или поздно вас настигает комбинаторный взрыв, хотя ино¬гда скорее в различных вариантах параллельной, а не последователь¬ной обработки янфорцации» (Rumelhart and McClelland 1986: i.158). Обе стороны, как однажды выразился Джерри Фодор, ввязались в иг¬ру в трехмерные шахматы, воображая, что они играют в крестики-но¬лики. Отчего же на столь ранней стадии игры, когда еще столь мало познано и столь много еще только предстоит узнать, однаисследова¬тельская команда празднует победу за счет полного поражения другой стороны? Почему на этой решающей развилке проект символьной ре¬презентации стал единственной игрой в нашем городе?
Каждый знающий историю этой области сможет указать на бли-жайшую причину. Около 1965-го года Минский и Пейперт, руково-дившие лабораторией в Массачусетском Институте Технологии, рабо¬тавшей над проблематикой символьно-манипуляционного подхода и поэтому соревновавшейся с перцептронными проектами, начали рас¬пространять первые варианты книги, нападавшей на идею перц&тро- на. В этой книге они ясно застили о своей научной позиции:
Перцептроны были широко разрекламированы как машины, «распоз¬нающие образы (patterns)», или обучающиеся машины, и в качестве Лако¬вых они обсуждались в многочисленных книгах, журнальных статьях и объемистых «отчетах». Бблыпая часть этих писаний ... лишена научной ценности (1969: 4).
Но их нападки были также и философской кампанией: Они пра¬вильно понимали, что традиционному использованию редукции к ло¬гическим исходным элементам брошен вызов со стороны некоего но¬вого холизма:
Оба автора, пишущих эти строки (сначала по отдельности, а потом вместе), вовлеклись в некую процедуру терапевтического принуждения с целью рассеять то, что мы с опасением считали первыми предвестниками «холистического» или «гештальтного» заблуждения, угрожавшего нашест¬вием на поля технических исследований и исследований в области искус¬ственного интеллекта, подобным более раннему нашествию на биологию и психологию (1969: 19).
Они были вполне правы. Искусственные нейронные сети могут — хотя не обязаны — допускать интерпретацию своих скрытых узлов в терминах таких признаков, которые могли бы быть распознаны чело¬веком и использованы им для решений данной проблемы. Если само моделирование нейронной сети не связывает себя ни с какой точкой зрения, можно показать, что ассоциация не требует, чтобы скрытые узлы были интерпретируемы. Такие холисты, как Розенблатт, выдви¬нули удачное допущение, что индивидные узлы или паттерны узлов не выбирают фиксированных признаков данной предметной области.
Минскому и Пейперту так сильно хотелось устранить всякое со-перничество, и они были столь безмятежно убеждены в правоте ато-мистической традиции, идущей от Декарта к раннему Витгенштейну, что в их книге гораздо больше намеков, чем реальных доказательств. Они взялись за анализ способностей однослойного перцептрона и в то же время в математическом разделе своей книги абсолютно проиг¬норировали главы Розенблатта о многослойных машинах и его дока¬зательство о сходимости вероятностного обучающегося алгоритма, ос¬нованного на обратном размножении ошибок (1962а: 292) . Как пи¬шут Румелхарт и Маклелланд,
Минский и Пейперт поставили себе целью показать, какие функции могут, а какие не могут вычислять [однослойные] машины. Они, в част¬ности, показали, что подобные перцептроны неспособны вычислять такие математические функции, как функцию четности (находится ли на сет¬чатке четное или нечетное число точек) или топологическую функцию связности (все ли точки на сетчатке связаны со всеми остальными точка¬ми на сетчатке либо напрямую, либо через какие-то другие точки, кото¬рые также находятся на сетчатке) без того, чтобы использовать до неле¬пости большое число предикатов. Их анализ чрезвычайно изящен; он де-монстрирует важность математического подхода к анализу вычислитель¬ных систем (1986: i. 111).
Однако следствия этого анализа достаточно ограничены. Румел-харт и Маклелланд пишут далее:
В общем и целом, ... хотя Минский и Пейперт были абсолютно пра¬вы в своем анализе однослойною перцептрона, их теоремы неприложимы к таким системам, которые хотя бы немного сложнее. В частности, они неприложимы ни к многослойным системам, ни к системам, допускаю¬щим циклы обратной связи (1986: i. 112).
И несмотря на это, в заключении к Перцептроном, когда Мин-ский и Пейперт задаются вопросом: «Рассматривали ли вы перцеп-троны со многими слоями?», они, хотя и риторически, оставляют во¬прос открытым, создавая впечатление, что решили его:
Да, мы рассмотрели машины Гамба, которые можно описать как «два слоя перцептрона». Мы не обнаружили (размышляя над этим вопросом и просматривая Имеющуюся литературу) никакого другого по-настоящему интересного класса многослойных машин, — во всяком случае, никакого такого класса, принципы которого были бы существенно связаны с прин¬ципами перцептрона ... [М]ы считаем, что важной исследовательской про¬блемой является задача прояснения (или отвержения) нашего интуитив¬ного суждения, что расширение в направлении многослойности бесплодно (1969: 231-232).
Их атака на гештальтное мышление в AI преуспела так, как им и не снилось. Лишь очень немногие, чьи голоса остались неуслышан¬ными, — в том числе Стивен Гроссберг, Джеймс А. Андерсон и Теуво Кохонен — занялись эт;ой «важной исследовательской проблемой». В сущности, почти каждый работавший в AI считал, что нейронные сети похоронены навсегда. Румелхарт и Маклелланд отмечают:
Анализа Минским и Пейпертом ограниченностей однослойного пер¬цептрона, вкупе с некоторыми первыми успехами подхода в AI, базирую¬щегося на символьной обработке, оказалось достаточно для того, чтобы внушить большому числу работающих в этой области, что у перцептрон- ных вычислительных устройств нет никакого будущего в искусственном интеллекте и когнитивной психологии (1986: i. 112).
Но почему этого оказалось достаточно? Оба подхода выдали не-которые многообещающие результаты и некоторое количество необос¬нованных обещаний •. Было слишком рано подводить итоги. И все же в книге Минского й Пейперта оказалось нечто такое, что задело стру¬ну, готовую к ответу. Дело выглядело таким образом, будто люди, ра¬ботающие в AI, разделяли те квазирелигиозные философские пред¬рассудки против холизма, которые лежали в основании нападок Мин¬ского и Пейперта. Силу этой традиции можно увидеть, например, в статье Ньюэлла и Саймона о физико-символьных системах. Статья начинается с научной гипотезы о том, что сознание и компьютер ра¬зумны в силу того, что они Манипулируют дискретными символами, а заканчивается неким откровением:
«Исследование логики и компьютеров открыло нам, что разумность коренится в физико-символьных системах» (1981: 64).
Холизм ие совладал с такими сильными философскими убежде¬ниями. Розенблатт был дискредитирован вместе с сотнями менее от¬ветственных исследовательских групп, которые были обнадежены его работой. Его поток спонсирования иссяк, и ему было нелегко опубли¬ковать свои работы. К 1970 году 9 том, что касается А1, нейронные
сети были «мертвы». В своей истории AI Ньюэлл говорит, что спор «символы против числа» «определенно не имеет места сейчас и в те¬чение уже долгого времени» (1983: 10). Розенблатт даже ие упомина¬ется в историях AI, написанных Джоном Хогелэндом (1985) и Марга¬рит Боден (197Т) f.
Однако сваливать полный провал коннекционистов на антихоли- стские предрассудки значило бы слишком упрощать дело. Философ¬ские допущения повлияли на интуицию и привели к неоправданно высокой оцейке важности первых результатов символьно¬процессорного подхода и на некоем более глубоком уровне. В то вре¬мя Дело выглядело так, что перцептронщнкам приходилось выпол¬нять огромный объём математической) анализа и вычислений для ре¬шения даже самых простых проблем распознавания образов, напри¬мер, для отличения горизонтальных линий от вертикальных в раз¬личных частях поля восприятия, в то время как символьно манипуля- тивный подход относительно легко решал трудные когнитивные про¬блемы, например доказательство логических теорем и решение ком¬бинаторных задач. И что еще важнее, казалось, что при вычислитель¬ных возможностях того времени исследователе нейронных сетей мог¬ли заниматься лишь спекулятивной нейронаукой и психологией, в то
1 Работа по нейронным сетям маргинально продолжалась в психоло¬гии и в нейронауке. Джеймс А. Андерсон из Броунского Университета продолжил защищать нейронную модель в психологии, хотя ему прихо¬дилось жить за счет грантов других исследователей, а Стивен Гроссберг разработал изящную математическую реализацию элементарных когни¬тивных способностей. О позиции Андерсона см.: Anderson (1978). Приме¬ры работ Гроссберга, сделанных в эту мрачную годину, см. в его книге (1982). О ранней работе Кохонена рассказывается в книге «Associative Memory — A System-Theoretical Approach» (Berlin: Springer-Verlag, 1977). В Массачусетском Технологическом Институте Минский продолжал чи¬тать лекции по нейронным сетям и назначал своим студентам темы ди¬пломных работ об исследовании логических свойств нейронных сетей. Но согласно Пейцерту, Минский поступал так только потому, что сети обла¬дают интересными математическими свойствами, а насчет свойств сим¬вольных систем нельзя доказать ничего интересного. Кроме того, многие исследователи AI исходили из допущения, что раз машины Тьюринга суть символьные манипуляторы, а Тьюринг доказал, что машины Тью¬ринга Могут вычислять все что угодно, он доказал тем самым, что все умопостижимое может быть схвачено логикой. Если принять эту точку зрения, то для холистского (а в те дни - длА статистического) подхода нужно искать оправданий, а для подхода символьного AI не нужно. Од¬нако эта самоуверенность основывалась на смешении неинтерпретирован- ных символов машины Тьюринга (нулей и единиц] с семантически ин¬терпретированными символами искусственного интеллекта.
время как простые программы символьных репрезентациояистов уже вскоре обещали приносить пользу. Эта оценка ситуации основывалась на допущении, что мышление и распознавание образов — это две раз¬ных области, и мышление важнее. Как мы увидим ниже в нашем об¬суждении проблемы обыденного знания, так смотреть на веща — зна¬чит ие учитывать как преобладающую роль распознавания образов в общем наборе человеческих способностей, так и тот фон обыденного понимания, который является предпосылкой настоящего обыденного мышления людей. А вполне вероятно, что для того, чтобы учесть этот фон, понадобится распознавание образов.
Эта мысль возвращает нас к философской традиции. За символь¬ной обработкой информации стоял не просто Декарт и его последова¬тели, но вся западная философия. Согласно Хайдеггеру, традиционная философия с самого начала задана своим сосредоточением на фактах в мире, в то время как «игнорируется» сам мир как таковой (Heideg¬ger 1962;- §§14—21; Dreyfus 1988). Это означает, что философия с са¬мого начала систематическим образом игнорировала или искажала обыденный контекст человеческой деятельности 1в. К тому же та ветвь философской традиции, которая идет от Сократа через Платона, Декар¬та, Лейбница и Канта к классическому AI, считает само собой разу¬меющимся, что понимание некоторой предметной области состоит в том, что у нас есть теория этой области. Теория формулирует отноше¬ния между объективными, бесконтекстными элементами (простыми, исходными признаками, атрибутами, факторами, дискретными данными, сигналами и т. д.) в терминах абстрактных принципов (покрывающих законов, правил, программ и т. д.).
Платон считал, что в таких теоретических областях, как матема¬тика и, быть может, этика, люди, которые мыслят, пользуются явно выраженными, бесконтекстными правилами теорий, которые они уз¬нали в иной жизни, за пределами обыденного мира. Будучи познан¬ными, такие теории функционируют в нашем мире, управляя созна¬нием человека, который мыслит, — неважно, осознает ли сам человек эти теории или нет. Концепция Платона была приложима не к обы¬денным навыкам и умениям, а только к таким областям, в которых имеется априорное знание. Однако успех теорий в естественных нау¬ках подкреплял ту идею, что в любой упорядоченной области должен иметься некий набор бесконтекстных элементов и некоторых абст-рактных отношений между этими элементами, ответственных за упо-рядоченность этой области и за способность человека разумно дейст-
“ Согласно Хайдеггеру, ближе всех других философов к пониманию важности обыденной деятельности пошипел Аристотель, но даже и ов ие избежал искажения феномена обыденного мира, неявно содержащегося в здравом смысле.
вовать в ее пределах. Так, Лейбниц смело обобщил рационалистский подход на все формы разумной деятельности, даже и обыденной практики:
[Н]аиболее важные наблюдения и умения всех ремесел и профессий еще не записаны. Этот факт подтверждается тем опытом, который мы по¬лучаем, когда переходим от теории к практике и хотим нечто осущест¬вить. Конечно, мы можем и записать эту практику, поскольку, в сущно¬сти, она есть лишь еще одна теория, более сложная и конкретная... [кур¬сив наш — Дрейфусы] (1951: 48).
Подход, основывающийся на обработке символьной информации, черпает свою уверенность именно из этого переноса на все сферы тех методов, которые были развиты философами и оказались успешными в естественных науках. Поскольку, в согласии с этой точкой зрения, любая область формализуема, в любой области AI осуществляется тем, что отыскиваются бесконтекстные элементы и принципы и на этом теоретическом анализе базируется некая формальная, символьная ре¬презентация. В этом духе Терри Виноград описывает свою работу в области AI в терминах, заимствованных у физики:
Нам нужно построить такой формализм, или «репрезентацию», по-средством которой мы могли описывать ... знание. Нам нужно отыскать «атомы» и «частицы», из которых оно строится, и «силы», которые на не¬го действуют (1976: 9).
Несомненно, теории о Вселенной часто строятся постепенно, шаг за шагом, сначала моделируются относительно простые и изолиро¬ванные системы, а затем модель шаг за шагом усложняется и связы¬вается в одно целое с моделями других предметных областей. Это возможно потому, что все явления происходят, как считается, от за- коноподобиых отношений между «структурными примитивами», как называют их Пейперт и Минский. Поскольку никто не аргументиру¬ет в пользу атомистической редукции в AI, кажется, что те, кто рабо¬тает в AI, просто неявно допускают, что абстрагирование элементов от их обыденного контекста, задающее философию и работающее в естествознании, должно работать и в AI. Вполне возможно, что это допущение объясняет, почему гипотеза о физико-символьной системе так быстро превратилась в откровение и почему книга Пейперта и Минского с такой легкостью разгромила холизм перцептрона.
Один из нас — Хьюберт, — преподавая философию в Массачу¬сетском Технологическом Институте в середине 60-х годов, скоро был втянут в споры о возможности искусственного интеллекта. Было оче¬видно, что такие исследователи, как Ньюэлл, Саймой и Минский бы- ди наследниками этой философской традиции. Но с учетом выводов позднего Витгенштейна и раннего Хайдеггера, это не казалось хоро¬шим предзнаменованием для редукционистской исследовательской программы. Оба эти мыслителя поставили под вопрос саму ту тради¬цию, на которой основывалась обработка символьной информации. Оба были холистами, оба были под впечатлением важности обыден¬ных практик и оба считали, что у человека не может быть теории обыденного мира.
Ирония интеллектуальной истории заключалась в том, что сокру¬шительная критика Витгенштейном его собственного «Трактата», — его «Философские исследования», — были опубликованы в 1953 году, как раз в то время, когда AI воспринял ту абстрактную, атомистиче¬скую традицию, на которую нападал Витгенштейн. Написав свой «Трактат», Витгенштейн провел годы, занимаясь тем, что он называл феноменологией (1975), в тщетных поисках атомарных фактов и ба¬зовых объектов, требовавшихся его теорией. В конце концов он от-бросил свой «Трактат» и всю рационалистическую философию. Он аргументировал, что анализ обыденных ситуаций в терминах фактов и правил (а именно с этого, как считают большинство традиционных философов и исследователей AI, должна начинаться теория) сам име¬ет смысл лишь в том или ином контексте и для той или иной цели. Так, выбор элементов уже отражает те цели и задачи, для которых они отбирались. Когда мы пытаемся отыскать окончательные бескон¬текстные, независящие от конкретной цели элементы, — а мы должны это сделать, если мы хотим отыскать исходные символы для ввода в компьютер, — то на самом деле мы пытаемся освободить аспекты на¬шего опыта как раз от той прагматической организации, которая по¬зволяет нам разумно их использовать при столкновении с обыденны¬ми проблемами.
В «Философских исследованиях» Витгенштейн прямо критико¬вал логический атомизм «Трактата»:
«На чем основана идея, что имена на самом деле обозначают простые [элементы]?» — говорит Сократ в “Теэтете": «Если я не ошибаюсь, я слышал, некоторые люди говорят так: нет определения тех первичных элементов — так сказать — из которых состоим мы й все остальное... Но в точности подобно тому, как то, что состоит из этих первичных элементов, само сложно, так и имена этих элементов становятся описательным язы¬ком, если их сложить вместе». И Расселовы «индивиды» и мои «объекты» («Логико-философский трактат») были такими первичными элементами. Но что представляют собой те простые составляющие, из которых состав¬лена действительность?.. Совершенно бессмысленно говорить абсолютным образом о «простых частях стула» (1953: 21).
Уже в 1920-х годах Мартин Хайдеггер аналогичным образом реа¬гировал против своего учителя Эдмунд» Гуссерля, который считал свое учение кульминацией картезианской традиции и который был поэтому дедушкой AI (Dreyfus 1982). Гуссерль аргументировал, что акт сознания, или ноэзис, сам по себе не схватывает объект, такой акт имеет интенциональность (направленность) лишь в силу некоей «абстрактной формы», или смысла (meaning), в ноэме, коррелирован¬ной с данным актом и.
Этот смысл (meaning), или символьная репрезентация, как ее по¬нимал Гуссерль, есть некая сложная сущность, перед которой стоит трудная задача. В «Идеях к чистой феноменологии» (1982) Гуссерль сделал смелую попытку объяснить, каким образом ноэма решает эту задачу. Референция обеспечивается «предикатами-смыслами», кото¬рые, подобно Фрегевым Sinne, обладают замечательным свойством выбирать атомарные свойства' объектов. Эти предикаты комбиниру¬ются в сложные «описания» сложных объектов, как в Расселовой тео¬рии дескрипций. Для Гуссерля, близкого в этом вопросе к Канту, но¬эма содержит некую иерархию строгих правил. Поскольку Гуссерль представлял себе разумность как детерминированную контекстом це-ленаправленную деятельность, ментальная репрезентация объекта лю¬бой разновидности должна была обеспечить контекст, или «горизонт», ожиданий или «предначертаний» для структурирования входящих данных: «правило, управляющее возможным другим сознанием [объ¬екта] как тождественным — возможным, как экземплифицирующим существенно предначертанные типы» (1960: 45). Ноэма должна содер¬жать правило, описывающее все те признаки, которых можно с досто¬верностью ожидать, исследуя объект того или иного типа — призна¬ют, остающиеся «нерушимо одними и теми же: поскольку объектив¬ность остается подразумеваемой в качестве той объективности и в качестве объективности этого рода» (i960: 53). Данное правило долж¬но также предписывать предначертания свойств, ко*орые возможны, но не необходимы, признаков объекта этого типа: «Поэтому вместо абсолютно детерминированного смысла всегда имеется некая рамка (а frame) пустого смысла ...» (1960:51).
В 1973 году Марвин Минский предложил новую cipyicrypy дан¬ных ддя репрезентации обыденного знания, удивительно похожую на Гуссерлеву:
11 «Смысл ..., как мы его определили, не есть конкретная сущность в общем составе ноэмы и некий род живущей в ней абстрактной формы». См.: Husserl (1950). Свидетельство того, что Гуссерль считал, что ноэма ответственна за интенциональность ментальной деятельности, см. в статье Хьюберта Дрейфуса «Перцептуальная ноэма Гуссерля» // (Dreyfus 1982).
Фрейм есть структура данных дчя репрезентаций стереотипной си¬туации, например нахождения в гостиной определенного рода или похода на день рождения к ребенку...
Фрейм можно представлять себе как сеть узлов и отношений. Верх¬ние уровни фрейма фиксированы и репрезентируют такие вещи» которые всегда истинны относительно данной предполагаемой ситуации. Нижние уровни имеют много терминалов — автоматных щелей, которые должны быть заполнены конкретными инстанциями или данными. Для каждого терминала могут иметься особые условия, которым должны удовлетво¬рять его инстанции...
Немалая часть феноменологической силы трорик зависит от включе¬ния в нее ожиданий и презумпций других родов. Терминалы фрейма обычно уже заполнены руководствами "по умолчанию* (1981: 96).
В описанной Минским модели фрейма «верхний уровень» — это развитая версия трго, что, по терминологии Гуссерля, остается в ре¬презентаций «нерушимо одним и тем же», а Гуссерлевы предначерта¬ния становятся «инстанциями по умолчанию» - теми дополнитель¬ными признаками, которые могут в норме ожидаться. В результате в технике AI был сделан шаг от пассивной модели обработки информа¬ции к такой модели* которая пытается учесть взаимодействие по¬знающего субъекта и мира- Таким образом, задачи AI смыкаются с задачами трансцендентальной феноменологии. И тот, и другая долж¬ны пытаться отыскать в обыденных областях фреймы, построенные из множества исходных предикатов и их формальных отношений.
Хайдеггер, еще до Витгенштейна, осуществил, отвечая Гуссерлю, феноменологическое описание обыденного мира и таких обыденных объектов, как стулья и молотки. Подобно Витгенштейну, он обнару¬жил, что обыденный мир нельзя репрезентироэать посредством неко- торбго набора бесконтекстных элементов. Именно Хайдеггер заставил Гуссерля рассмотреть именно эту проблему, указав, что есть иные способы «встречи» с вещами, чем отнесение к ним как к объектам, за¬данным некоторым набором предикатов. Когда мы используем такой инструмент, как молоток, сказал Хайдеггер, мы актуализируем некое умение (которое необязательно должно быть репрезентировано в соз¬нании) в контексте социально организованной связи инструментов, целей и человеческих ролей (которые необязательно должны быть ре¬презентированы как некоторое множество фактов). Этот контекст, или мир, и наши обыденные способы умелого приспособления к нему, которые Хайдеггер называл «осмотрительностью» («circumspection»), суть не нечто такое, что мы лишь мыслим, но часть нашей социализа¬ции, формирующей то, каковы мы суть. Хайдеггер заключает:
Контекст ... можно понимать формально — как систему отношений. Но [феноменальное содержание этих «отношений» и их «членов» ... та¬ково, что они сопротивляются какой бы то ни было математической функционализации; не являются они также и чем-то таким, что мыслит¬ся, впервые постулируется в «акте мышления». Они суп такие связи, в которых уже живет озабоченная осмотрительность как таковая (1962: 121-122) .
Здесь расходятся пути Гуссерля и AI, с одной стороны, и Хайдег¬гера и позднего Витгенштейна — с другой. Решающим становится во¬прос: «Может ли иметься теория обыденного мира, как всегда считали философы-раДионалисты?» Или же фон, на который опирается здра¬вый смысл, — это комбинация умений, практик, различений и tax да¬лее, которые ие являются интенциональвыми состояниями и таким образом, a fortiori, не обладают каким-либо репрезентативным содер¬жанием, которое можно было бы или следовало бы эксплицировать в терминах элементов й правил?
Сделав шаг, который скоро стал общим местом в кругах AI, Гус¬серль попытался избежать проблемы, поставленной Хайдеггером. Гус¬серль заявил, что мир, фон значимости, обыденный контекст, — это Просто очень сложная система фактов, коррелированная с очень слож¬ной системой убеждений, которые — поскольку у них имеются усло¬вия истинности — он называл очевидностями. Он считал, что в прин¬ципе человек мог бы на время воздержаться от своего бытия в мире и достичь отстраненного описания системы человеческих убеждений. Таким образом человек мог бы выполнить ту задачу, которая неяв¬ным образом присутствовала В философии со времен Сократа: сде-лать явными те убеждения и принципы, которые лежат в основе вся¬кого разумного поведения. Как формулировал это Гуссерль,
[д]аже тот фон..., который мы Всегда совместно сознаем, но который в каждое данное мгновение иррелевантен и остается совершенно незаме¬ченным, все же функционирует в соответствии со своими неявными оче¬видностями (1970: 149).
Поскольку Гуссерль твердо верил, чем общий для людей фон можно сделать явным в качестве некоей системы убеждений, он опе¬редил свое время, подняв вопрос о возможности AI. Обсудив возмож¬ность того, что формальная аксиоматическая система могла бы опи¬сать опыт, и указав, что такая система аксиом и исходных элементов — по меньшей мере, как мы знаем ее в геометрии, — неспособна описать такие обыденные формы, как «зубчатый» или «линзообразный», Гус¬серль оставил открытым вопрос о том, можно ли все же формализо¬вать такие обыденные концепты. (Это было подобно тому, как в AI был поднят и оставлен открытым вопрос о том, можно ли аксиомати¬зировать обыденную физику.) Восприняв Лейбницеву мечту о Mdte- зисе всяческого опыта, Гуссерль добавляет:
насущный вопрос состоит ... в том, не может ли иметься ... некая идеализирующая процедура, заменяющая узреваемые интуицией данные на чистые и строгие идеалы и могущая ... служить ... основным средством для построения матезиса опыта (1952: v. 134).
Но, как предсказал Хайдеггер, задача создания полного теорети¬ческого описания обыденной жизни оказалась гораздо более трудной, чем это ожидалось сначала. Проект Гуссерля столкнулся с серьезны¬ми трудностями; и есть признаки, что с не менее серьезными трудно¬стями столкнулся и проект Минского. По ходу двадцатипятилетних попыток выявления компонентов субъективной репрезентации обы¬денных объектов, Гуссерль обнаруживал, что он должен включать в описание все новые и новые порции обыденного понимания субъек¬том повседневности:
Несомненно, даже те задачи, которые возникают, когда мы берем в качестве ограниченных ключевых данных некие отдельно взятые типы объектов, оказываются чрезвычайно сложными и всегда ведут к обшир¬ным дисциплинам по мере того, как мы все глубже проникаем в них. Так обстоит дело, например, с ... пространственными объектами (не говоря уже о Природе) как Таковыми, психофизическим бытием и человечеством как таковым, культурой как таковой (1960: 54—55).
Он говорил о «гигантской конкретности» ноэмы (1969: 244) и о ее «необъятной сложности» (1969: 246) и печально заключил, когда ему было семьдесят пять, что он вечный начинающий и что феноменоло¬гия — «бесконечная задача» (1970: 291).
В статье Минского «Концептуальный аппарат для репрезентации знания» Имеются намеки, что он взялся за ту же самую «бесконечную задачу», которая в конце концов сломила Гуссерля:
Просто построить базу знаний — сложнейшая интеллектуальная исследовательская проблема ... Мы еще слишком мало знаем о содержа¬нии и структуре обыденного знания. «Минимальная» система здравого смысла должна «знать» что-то о причине, следствии, времени, цели, ме¬стоположении, процессе и типах знания .... В этой области требуются серьезные эпистемологические исследовательские усилия (1981: 124),
».
Для исследователя современной философии наивность и вера Минского поразительны. Феноменология Гуссерля, как раз и была та* ким исследовательским усилием. В сущности, философы от Сократа до Лейбница и раннего Витгенштейна прилагали в этой области серь- оные эпистемологические усилия в течение двух тысячелетий без за¬метных успехов.
В свете радикального изменения взглядов Витгенштейном и со-крушительной Хайдеггеров ой критики Гуссерля одни из нас — Хью¬берт — предсказал трудность обработки символьной информации. Как отмечает Ньюэлл в своей истории AI, это предупреждение не было принято в расчет
Основное интеллектуальное возражение Дрейфуса ... состоит в том, что попытки разложения контекста человеческого действия на дискрет¬ные элементы обречены на провал. Это возражение основывается на фе¬номенологической философии. К сожалению, в том, что касается AI, это возражение осталось без внимания. Ответы, возражения и анализы, поя¬вившиеся как реакция на писания Дрейфуса, попросту прошли мимо это¬го вопроса, который на самом деле мог бы стать новшеством, если бы он попал в поле зрения (1983: 222—223).
Но попадания в поле зрения соответствующих трудностей не пришлось долго ждать, когда сам мир повседневности отомстил AI, как он отомстил и традиционной философии. Нам представляется, что исследовательская программа, выдвинутая Ньюэллом и Саймо¬ном, прошла три десятилетних стадии. С 1955 по 1965 гг. в этой об¬ласти исследований, которую тогда называли «когнитивным модели¬рованием», преобладали две исследовательские темы — репрезентация и поиск. Например, Ньюэлл и Смит показали, как компьютер может решать некий класс проблем, основываясь на одном общем эвристиче-ском принципе поиска, известном как анализ «средство-цель», именно использовать любую доступную ему операцию для сокращения рас¬стояния между описанием имеющейся ситуации и описанием цели. Затем они абстрагировали эту эвристическую технику и включили ее в свой Общий Решатель Проблем (ОРП).
Вторая стадия (1965—1975 гг.), на которой лидировали Марвин Минский и Сеймур Пейперт в Массачусетском Технологическом Ин¬ституте, была посвящена тому, какие факты и правила использовать для репрезентации. Идея заключалась в том, чтобы развить методы для систематической манипуляции знанием в изолированных облас¬тях, названных «микромирами». Среди знаменитых программ, напи¬санных в МТИ около 1970-го года, — SHRDLU Терри Винограда, ко¬торая умела выполнять команды, записывавшиеся на естественном языке и относившиеся к некоему упрощенному «миру кубиков»; про¬грамма проблем аналогии Томаса Эванса; программа анализа сцен Дэвида Уолтца; и программа Патрика Уиисгона, умевшая усваивать понятия из примеров.
Надеялись, что эти ограниченные и изолированные микромиры можно будет постепенно делать более реалистическими и комбиниро¬ванными, так чтобы приблизиться к пониманию в масштабах настоя¬щего мира. Однако исследователи спутали две области, которые, по Хайдеггеру, следует различать — «вселенную» и «мир». Множество взаимосвязанных фактов способно конституировать некую вселенную, подобную физической Вселенной, но оно не конституирует мира. Мир, например, мир бизнеса, мир театра или мир физиков, г это ор¬ганизованный массив объектов, целей, умений и практик, на ослове которых получает свой смысл или становится осмысленной человече¬ская деятельность. Чтобы понять, в чем различие, можно сопоставить лишенную смысла физическую Вселенную с наделенным смыслом ми¬ром дисциплины физики. Мир физики, мир бизнеса и мир театра по¬лучают смысл лишь на фоне общих человеческих забот и интересов. Они суть локальные конкретизации одного общего для всех нас мира здравого смысла. То есть подмиры связаны друг с другом не так, как изолированные физические системы с темн объемлющими системами, которые они составляют, а скорее как локальные конкретизации некое¬го целого, которое они предполагают в качестве своей предпосылки. Микромиры же это не миры, а изолированные, лишенные смысла об¬ласти, и постепенно стало ясно, что их нельзя объединить друг с другом и расширить так, чтобы получить в результате мир обыденной жизни.
На третьей стадии, примерно с 1975-го года по настоящее время, AI борется с тем, что получило название проблемы обыденного зна¬ния. Репрезентация обыденного знания всегда была одной из цен¬тральных проблем в AI, ио два первых периода — когнитивное моде¬лирование и микромиры - характеризовались попыткой избежать проблемы обыденного звания и попытаться получить максимум дос¬тижений с минимумом наличного знания. Однако к середине 1970-х годов этой проблемой уже стало необходимо заняться вплотную. Без особого успеха были испытаны различные структуры данных, напри¬мер фреймы Минского и сценарии Роджера Шенка. Проблема обы-денного знания не позволяла AI даже приступить к выполнению два-дцатилетней давности предсказания Саймона о том, что «не более чем через двадцать лет машины смогут выполнить любую работу, которую способен выполнить человек» (1965: 96).
В сущности, проблема обыденного знания не дала AI за послед¬нее десятилетне продвинуться ни на шаг вперед. Виноград одним из первых увидел ограниченности SHRDLU и всех этих попыток расши¬рить рамки микромирового подхода с помощью сценариев и фреймов. «Разуверившись» в AI, он теперь занят тем, что преподает Хайдеггера в рамках своего курса по computer science в Стэнфорде и указывает на «трудность формализации того обыденного фона, который детер¬минирует, какие именно сценарии, цели и стратегии имеют отношение к деяу и как именно они взаимодействуют друг с другом» (1984: 142).
В чем находит надежду и силы AI, забравшись в этот тупик, так это в фом убеждении, что раз люди, очевидно, как-то |>ешили пробле¬му обыденного знания* то, стало быть, она должна иметь решение. Но люди, в норме, могут и вообще не использовать обыденное знание. Как указали Хайдеггер и Витгенштейн, обыденное понимание вполне может состоять в обыденном ноу-хау (everyday know-how). Под «ноу- хау» мы понимаем Ие процедурные правила, а знание, что делать, в огромном Множестве частных случаев . Например, обыденную физи¬ку оказалось чрезвычайно трудно обстоятельно объяснить в форме некоторого набора фактов и правил. Если попытаться сделать это, то окажется, что либо для понимания найденных тобой фактов и правил тебе опять же потребуется здравый смысл, либо в результате получа¬ются формулы такой сложности, что представляется крайне малове¬роятным, чтобы они помешались в сознании ребенка.
Занятия теоретической фпзикой тоже требуют фоновых умений, которые могут оказаться неформализуемыми, однако саму эту область можно описать с помощью абстрактных законов, которые не апелли¬руют к фоновым умениям. Из этого обстоятельства AI-исследователи ошибочно заключают, что и обыденная физика должна быть выразима в виде некоторого набора абстрактных принципов. Но ведь может быть и так, что проблема нахождения теории обыденной физики неразрешима потому, что у этой области вообще нет никакой теоретической структу¬ры. Каждый день в течение нескольких лет играя со всяческими жид¬костями и твердыми телами, ребенок, возможно, просто научается раз¬личать прототипические случаи твердых тел, жидкостей и т. д. и науча¬ется типичным адекватным реакциям на их типичное поведение в ти¬пичных обстоятельствах; То же может быть верно и для социального мира. Если и в самом деле фоновое понимание — это некое умение, а умеем.основаны на цельных образах, а не правилах, то можно ожи¬дать, что символьные репрезентации окажутся неспособными ухватить наше обыденное понимание.
В свете этосо тупика, классический, символьный AI становится все более и более похожим на превосходный пример того, что Имре Лакатош (1978) назвал вырождающейся исследовательской програм¬мой. Как мы видели, AI начался при благоприятных предзнаменова¬ниях с работы Ньюэлла и Саймона в РЭНДе и к концу 1960-х годов превратился в процветающую исследовательскую программу. Мин¬ский предсказывал, что «еще при жизни этого поколения проблема
11 Эта концепция умения нашла свое выражение и защиту в книге: Dreyfus and Dreyfus (1986).
создания “искусственного интеллекта” будет в общем и целом реше¬на» (1977: 2). Затем, довольно-таки внезапно, вся эта область столк¬нулась с неожиданными трудностями. Сформулировать теорию здра¬вого смысла оказалось гораздо труднее, чем ожидалось. Вопрекц на¬деждам Минского, дело состояло не в том, чтобы каталогизировать несколько сотен тысяч фактов. Центральное значение приобрела про¬блема обыденного знания. Умонастроение Минского решительным образом поменялось за пять лет. Он сообщил одному репортеру, что «проблема AI - одна из труднейших, за какие когда-либо принима¬лась наука» (Kolata 1982: 1237).
В конце концов, рационалистская традиция предстала перед су¬дом эмпирической проверки — и провалилась. Идея построения фор¬мальной, атомистской теории мира обыденного здравого смысла и ре¬презентации такой теории в символьном манипуляторе столкнулась в точности с теми трудностями, которые были обнаружены Хайдеггером и Витгенштейном. Интуитивное убеждение Франка Розенблатта в том, что формализовать мир и таким образом формально специфици¬ровать разумное поведение будет безнадежно трудно, — это убежде¬ние оправдалось. Его исследовательская программа (состоявшая в том, чтобы использовать компьютер для Воплощения холистской мо¬дели идеализированного мозга), которая была загнала в подполье, но никогда не была по-настоящему опровергнута, вновь стала предметом реально возможного выбора.
Журналисты в своих описаниях истории AI приводят примеры того, как анонимные клеветники поливали грязью Розенблатта как «продавца змеиного жира»:
Нынешние исследователи помнят, как о Розенблатте и о работе его машины важным тоном делались резкие заявления. «Он был мечтой рек¬ламного агента, — говорит один ученый, — настоящий шаман. Послушать его, так Перцептрон способен делать прямо-тади фантастические вещи. И может быть, так оно и есть. Но вот работа Франка этого не доказывала» (McCotduck 1979: 87).
На самом же деле, он гораздо яснее говорил о способностях и ог-раниченностях различных типов перцептронов, чем Саймон и Мин¬ский о своих символьных программах 19. Теперь его реабилитируют.
13 Вот некоторые типичные цитаты из Розенблаттовых «Принципов нейро динамики»: «По ходу эксперименту обучения перцептрону, как пра¬вило, дается некая последовательность паттернов, содержащих представн- теля каждого типа или класса, который должен быть различен, и в соот¬ветствии с некоторым правилом модификаций памяти «подкрепляется» подходящий выбор ответной реакции. Затем перцептрон подвергают тес¬товому стимулированию, й устанавливается вероятность правильного от¬вета Для данного класса стимулов... Если тестовый стимул активирует множество сенсорных элементов, которые полностью отличаются от тех элементов, что были активированы в предыдущих случаях подвергания перцептрона стимулам того же самого класса, то эксперимент представля¬ет собой тест на «чистое обобщение». Простейший из перцептронов не обладает способностью к чистому обобщению, но можно показать, что вполне удовлетворительно ведет себя в экспериментах по различению, особенно если тестовый стимул почти тождествен одному из ранее вос¬принятых паттернов (с. 68) ... Рассматривавшиеся до сих пор перцептро- ны по своим способностям распознания фигур и тенденциям к организа¬ции гештальтов мало чем похожи на человеческие субъекты (с. 71) ... Рас¬познавание последовательностей в рудиментарной форме вполне под силу подходящим образом организованным перцептронам, однако проблема фигуральной организации и сегментации становится здесь столь же серь¬езной, как и в случае восприятия статического паттерна (с. 72) ... В слу¬чае простого перцептрона паттерны распознаются прежде «отношений»; в сущности, такие абстрактные отношения, как «Л выше, чем Вь или «этот треугольник находится внутри окружности», вообще не абстрагируются в качестве таковых, но могут быть усвоены лишь с помощью процедуры цсмиюго заучивания на память, по ходу которой каждый случай, в кото¬ром данное отнршение имеет место, преподается перцептрону отдельно (с* 73) ... Сеть, состоящая из менее чем трех слоев сигналопередающих блоков, или сеть, состоящая исключительно из линейных элементов, ли¬нейно соединенных друг с другом, неспособна обучиться различать клас¬сы паттернов в йзотропнбЙ среде (где любой паттерн мбжет появиться во всех возможных местоположениях сетчатки, без пограничных эффектов) (с. 575) ... В предыдущих главах был описан ряд умозрительных моделей, которые, вероятно, способны Научаться секвенциальным программам, раз¬ложению речи на фонемы, а также усваивать содержательный «смысл» имен существительных и глаголов с простыми сенсорными денотатами. Такие системы представляют верхний предел абстрактного поведения у перцептронов, рассматривавшихся по сей день. К их недостаткам отно¬сится отсутствие удовлетворительной «временной памяти», неспособность не слишком сложно воспринимать абстрактные топологические отноше¬ния я неспособность изолировать осмысленные фигуральные сущности или объекты, кроме как при некоторых особых обстоятельствах (с. 577)... Приложения, с наибольшей вероятность, осуществимые с перцептронами, описанным в этой книге, — это распознавание букв и «читающие маши¬ны», распознавание речи (для случаев членораздельно и отдельно друг от друга произносимых слов) и крайне ограниченные способности распозна¬вания рисунков или распознавание объектов на простом фоне. К «восприятию» в более широком смысле, возможно, окажутся способны потомки нынешних моделей, но предстоит добыть еще очень много фун¬даментального знания, прежде чем достаточно изощренное строение по-
Дэвид Румелхарт, Джефри Хинтон и Джеймс Маклелланд отражают эту новую оценку его новаторских работ:
Работы Розенблатта в то время были очень спорны, а конкретные модели, предложенные им, не оправдывали надежд, которые он возлагал на них. Но его видение человеческой системы по обработке информации как динамической, интерактивной, самоорганизующейся системы лежит в основе подхода PDP (1986:1.45).
Ясно, что исследования перцептрона ... предвосхитили многие ре¬зультаты, которые используются сегодня. Критику перцептронов Мин¬ским и Пейпертом широко и ошибочно интерпретировали как разрушаю¬щую доверие к ним, в то время как их работа всего лишь показывала ог¬раниченность способностей самого ограниченного класса перцептроно- подобных механизмов и ничего не говорила о более сильных, многослой¬ных моделях (1986: ii.535).
Обманутые в своих ожиданиях исследователи AI, уставшие цеп¬ляться за исследовательскую программу, которую Джерри Летвин в начале 1980-х годов охарактеризовал как «единственную соломинку на плаву», толпой набросились на новую парадигму. В первый день поступления на рынок было распродано шесть тысяч экземпляров книги Румелхарта и Маклелланда «Параллельная распределенная обработка информации», и сейчас печатается еще тридцать тысяч. Как сказал Пол Смоленский,
за последние лет пять кониекциоиистский подход к когнитивному моделированию из мало кому известного кулыа, к которому причислила себя горстка верных, превратился в движение столь мощное, что послед¬ние конференции Общества когнитивной науки стали походить на тусов¬ки коннекционистов (В печати).
Если многослойные сети успешно выполнят свои обещания, то исследователям придется расстаться с убеждением Декарта, Гуссерля и раннего Витгенштейна, будто единственный способ продуцировать разумное поведение — это отобразить Мир посредством некоей фор¬мальной теории. И хуже того, возможно, придется расстаться с еще более фундаментальным интуитивным взглядом, коренящимся в са¬мых истоках философии, согласно которому у каждого аспекта дейст¬вительности должна иметься своя теория, то есть должны иметься элементы и принципы, в терминах которых можно описать и объяс-нить умопостижимость любой области. Нейронные сети могут пока- за+ь, что Хайдеггер, поздний Витгенштейн и Розенблатт были правы
зволит перцептрону соревноваться с человеком в условиях нормальяой среды» (с. 583).
в том, что мы разумно ведем себя в этом мире, не имея никакой тео¬рии мира. Если наличие теории не необходимо для объяснения разум¬ного поведения, то мы должны быть готовы рассмотреть, вопрос о том, возможно ли вообще такое теоретическое объяснение в обыден¬ных областях.
' Люди, занимажмцеся моделированием нейронных сетей, под влиянием символьно-манипуляторного AI, прилагают значительные усилия — натренировав свои сети исполнять ту или иную задачу, — к поиску признаков, репрезентируемых индивидными узлами и множе¬ствами узлов. Результаты, полученные до сей поры, неоднозначны. Возьмем сеть Хинтона (1986), научающуюся понятиям посредством распределенных репрезентаций. Эту сеть можно натренировать коди¬ровать такие связи в предметной области, которую люди концептуа¬лизируют в терминах признаков, и при этом сети не сообщаются при¬знаки, используемые людьми. Хинтон дает примеры случаев, в кото¬рых некоторые узлы в натренированной сети можно интерпретиро¬вать как соответствующие признакам, используемым людьми, хотя эти узлы лишь приблизительно соответствуют данным признакам. Однако большая часть узлов вообще не поддается никакой семантиче¬ской интерпретации. Признак, используемый в символической репре¬зентации, либо присутствует, либо отсутствует. В сети же, хотя неко¬торые узлы более активны, когда в предметной области наличествует некий признак, степень активности Не только меняется в зависимости от присутствия или отсутствия данного признака, но на эту степень активности влияют также и другие признаки.
Хинтон выбрал такую предметную область — семейные отноше¬ния, - которую люди трактуют именно в терминах признаков, как пра¬вило, замечаемых людьми —принадлежность к тому или иному поколе¬нию и национальности. Затем он разбирает такие случаи, в которых, начиная с некоторых случайно выбранных величин сил в исходной конфигурации связей, некоторые узлы можно, после обучения, толко¬вать как репрезентирующие данные признаки. Вычисления, использую¬щие Хинтонову модель, показывают, однако, что даже его модель, как видно, научается своим ассоциациям в отношении некоторых случай¬но выбранных величин сил в исходной конфигурации связей, не ис¬пользуя сколько-нибудь очевидным образом эти обыденные признаки.
В некотором очень узком смысле любую успешно натренирован¬ную многослойную сеть можно интерпретировать в терминах призна¬ков — не обыденнык признаков, а тех, что мы будем называть высо¬ко-абстрактными признаками. Рассмотрим простой случай слоев би¬нарных элементов, активируемых посредством связей, но не боковых или обратных связей, а связей, направленных вперед. Чтобы сконст¬руировать подобное объяснение на основе сети, обученной определен¬ным ассоциациям, каждый узел, который размещается на один уро¬вень выше входных узлов, можно интерпретировать как распознаю¬щий наличие входного паттерна, принадлежащего некоторому набору таких паттернов. (Некоторые из этих паттернов использовались в хо¬де обучения сети, а другие никогда не использовались.) Если этому набору входных паттернов, распознаваемых некоторым данным узлом, дать какое-то выдуманное имя (почти наверняка никакое имя из на¬шего словаря ие будет ему подходить), то данный узел можно было бы интерпретировать как распознающий тот высоко-абстрактный при¬знак, которому мы присвоили это имя. Таким образом, каждый узел, который размещается на один уровень выше входных узлов, можно охарактеризовать как распознаватель некоторого признака. Точно так же, каждый узел, который размещается на один уровень выше этих узлов, можно охарактеризовать как распознаватель признака более высокого порядка, определяемого как наличие среди распознавателей признаков первого уровня паттерна из некоторого заданного множе¬ства. И так далее вверх по иерархии.
То обстоятельство, что интеллект, определяемый как знание не¬которого множества ассоциаций в данной предметной области, всегда можно описать в терминах отношений между высоко-абстрактными признаками данной области - это обстоятельство, однако, не сохра¬няет в себе рационалистическую интуицию, согласно которой эти объяснительные признаки должны схватывать существенную структу¬ру данной области — так, чтобы, основываясь на них, можно было по¬строить теорию данной области. Если обучить сеть еще одной ассо¬циации между входом и выходом (где до обучения данный вход про-дуцировал иной выход, чем тот, которому мы предполагаем научить сеть), то интерпретацию по меньшей мере некоторых узлов пришлось бы изменить. Таким образом, оказалось бы, что признаки, соответст¬вовавшие — до последнего тура обучения — некоторым узлам, не яв¬лялись инвариантными структурными признаками данной области.
Раз мы отбросили философский подход классического AI и при¬няли a-теоретический подход моделирования нейронных сетей, оста¬ется один вопрос: в какой мере такая нейронная сеть может смодели¬ровать обыденный интеллект? Исследователи AI в классической па¬радигме тут же скажут, — как, на самом деле, указывал уже и Ро¬зенблатт, — что люди, моделирующие нейронные сети досйх пор сталкивались с трудностями в области пошагового решения проблем. Коннекционисты отвечают, что они уверены, что со временем решат эту проблему. Однако этот ответ слишком уж напоминает тот ответ, который в шестидесятых годах давали сторонники символьной мани¬пуляции, реагируя на критические высказывания, что их программы- де очень слабы в распознаваний образов. Продолжается старинная борьба между интеллектуалистами, которые считают, что раз они за¬нимаются бесконтекстной логикой, то они ухватывают обыденное по¬знание, но которые слабы в понимании восприятия, и гештальтиста- ми, у которых имеются начатки объяснения восприятия, но отсутст¬вует какое-нибудь объяснение обыденного познания и. Можно пред-положить, используя метафору правого н левого [полушария] мозга, что, быть может, мозг или сознание применяет, когда нужно одну из этих двух стратегий, а когда нужно — вторую. В таком случае про¬блема состоит в том, как объединить эти две стратегии. Нельзя про¬сто переключаться с одной стратегии на другую и обратно, ибо, как показали Хайдеггер и гепггальтисты, решающую роль в определении релевантности играет прагматический фон, даже в обыденной логике и решении проблем; и специалисты в любой области, вплоть до логи¬ки, ухватывают операции в терминах их функциональных сходств.
Рассматривать объединение этих стратегий преждевременно, ибо по сей день ии эа одной из двух не числится достаточно свершений, чтобы можно было считать ее солидно обоснованной. Быть может, моделирование нейронных сетей попросту использует сейчас заслу¬женный им шанс на поражение, как ранее его использовал символь¬ный подход.
И все же по мере того, как каждый из двух подходов пробивает себе путь вперед, следует принимать в расчет одно важное различие между ними. Подход физико-символьных систем проваливается, по- видимому, потому, что попросту неверно предполагать, что для каж¬дой области должна иметься теория этой области. Но моделирование нейронных сетей не связывает себя с каким-нибудь иным философ¬ским допущением. Тем не менее, быть может, слишком трудно по¬строить интерактивную сеть, которая была бы существенно

| распечатать

Другие новости по теме:

Другие новости по теме: