Искусственные когнитивные системы, их архитектуры и модели - Обзоры
В этом разделе размещены обзоры когнитивных архитектур и моделей, связанных с исследованиями в предметной области "Интеллектуальные системы и искусственный интеллект" и доступных дистанционно для ознакомления.
Оглавление
Патрик Лэнгли, Джон Лэйрд, Сет Роджерс. Когнитивные архитектуры: вопросы и проблемы исследований (перевод)
Когнитивные архитектуры: вопросы и проблемы исследований Патрик Лэнгли, Джон Лэйрд, Сет Роджерс
Перевод КА01: Тимофеев А.В. (ред.), Тимофеев В.Ф., Project-AI.org Team, 2013 г.
Источник: Pat Langley /a, John E. Laird /b, Seth Rogers /a, Cognitive architectures: Research issues and challenges, Cognitive Systems ResearchVolume 10, Issue 2, June 2009, Pages 141–160. doi:10.1016/j.cogsys.2006.07.004 /a Computational Learning Laboratory, Center for the Study of Language and Information, Stanford University, Stanford, CA, USA /b EECS Department, The University of Michigan, Ann Arbor, MI, USA
1. Предыстория и мотивация
Когнитивная архитектура определяет базовую инфраструктуру интеллектуальной системы. Вкратце, архитектура включает в себя те аспекты когнитивного агента, которые постоянны во времени и в различных областях применения.
Они, как правило, включают в себя: - краткосрочную и долгосрочную память, в которых хранится содержимое об убеждениях (beliefs), целях и знаниях агента; - представление элементов, которые содержатся в этих видах памяти, и их организацию в крупномасштабные ментальные структуры; - функциональные процессы, которые действуют в этих структурах, в том числе механизмы обеспечения производительности, которые их используют, и механизмы обучения, которые их изменяют.
Поскольку содержимое видов памяти агента может меняться с течением времени, можно было бы не рассматривать знания и убеждения, закодированные в них для того, чтобы быть частью архитектуры этого агента. Так же, как различные программы могут работать на одной и той же архитектуре компьютера, так и различные базы знаний и убеждения могут быть интерпретированы одной и той же когнитивной архитектурой. Существует также прямая аналогия с архитектурой здания, состоящего из постоянных частей, таких как его основание, крыша и помещения, а не с мебелью и техникой, которые можно перемещать или заменять.
Как мы увидим, альтернативные когнитивные архитектуры могут отличаться в части конкретных предположений, которые в них сделаны по этим вопросам, так же, как различные здания отличаются схемами своего расположения. В дополнение к принятию различных обязательств о том, как представлять, приобретать или использовать знания и убеждения, могут потребоваться альтернативные структуры, более или менее встроенные в этот архитектурный уровень, так же, как в некоторых зданиях полки и шкафы вставлены в их стационарных сооружения, тогда как у других те же функции выполняются с помощью сменной мебели.
Исследования когнитивных архитектур важны, потому что они поддерживает главную цель искусственного интеллекта и когнитивной науки: создание и понимание искусственных агентов, которые поддерживают те же возможности, что и люди. Некоторые работы сосредоточены на моделировании инвариантных аспектов человеческого познания, в то время как в других работах архитектуры рассматриваются в качестве эффективного пути к созданию интеллектуальных агентов. Тем не менее, эти цели не противоположны друг другу; когнитивная психология и искусственный интеллект имеют долгую историю строительства на основе других идей [Langley, 2006], и исследования когнитивных архитектур сыграли ключевую роль в этом полезном обмене идеями.
В некотором смысле, когнитивные архитектуры составляют антитезу экспертным системам, которые обеспечивают квалифицированное поведение в узко определенном контексте. В противоположность этому, исследование архитектур направлено на широту охвата через разнообразный набор задач и областей. Что более важно, оно предлагает учет интеллектуального поведения на системном уровне, а не на уровне методов отдельных компонентов, предназначенных для решения специализированных задач. Ньюэлл [Newell, 1973b] убедительно доказывает это для исследования системного уровня в когнитивной науке и искусственном интеллекте, утверждая "Вы не можете играть с природой в игру на 20 вопросов и победить".
Вместо проведения микроисследований, которые адресованы лишь к одному вопросу в один момент времени, мы должны пытаться объединить множество полученных данных на единой теоретической основе, а затем переходить к проверке и уточнению этой теории.
Начиная с этого призыва к действию, наблюдается постоянный поток исследований когнитивных архитектур. Это движение было изначально связано с определенным классом архитектур, известных как продукционные системы [Newell, 1973b], [Neches, Langley, Klahr, 1987] и направленных на объяснение психологических явлений, причем многие нынешние архитектуры-кандидаты по-прежнему имеют ту же форму и аналогичные интересы.
Тем не менее, в течение последних трех десятилетий появилось множество других классов архитектур, которые меньше озабочены поведения человека, а делают совершенно разные предположения о представлении, организации, приобретении и использовании знаний.
По крайней мере, три проведенных симпозиума собрали приглашенных исследователей в этой области [Laird, 1991], [VanLehn, 1991], [Shapiro & Langley, 2004], и было издано, по крайней мере, два сборника статей [Sun, 2005], [VanLehn, 1991].
Это движение вышло за пределы фундаментальных исследований в коммерческий сектор с приложениями в виде правдоподобных агентов, действующих в среде тренажеров-симуляторов (например, [Tambe et al., 1995]), компьютерных обучающих систем [Koedinger, Anderson, Hadley, & Mark,1997] и интерактивных компьютерных игр (например, [Magerko, Laird, Assanie, Kerfoot, & Stokes, 2004]). Несмотря на этот прогресс, остается необходимость дополнительных исследований в области когнитивных архитектур. По мере созревания искусственного интеллекта и когнитологии, они раздробились на ряд четко определенных поддисциплин, каждая со своими целями и собственными критериями оценки.
Тем не менее, для коммерческих и государственных приложений все чаще требуются интегрированные системы, которые демонстрируют интеллектуальное поведение, а не только улучшение компонентов таких систем. Это требование может быть выполнено путем оказания повышенного внимания к архитектурам системного уровня, которые поддерживают сложное когнитивное поведение в широком диапазоне соответствующих задач.
В этой статье мы рассмотрим некоторые ключевые вопросы, которые возникают при проектировании и исследовании интегрированных когнитивных архитектур.
Поскольку мы не можем надеяться обследовать все пространство архитектурных теорий, мы сосредоточимся на способности генерировать интеллектуальное поведение, а не на соответствии результатам психологических экспериментов. /1
/1 В работе [Sun (2007)] предоставлено другое рассмотрение когнитивных архитектур, в котором эта вторая тема обсуждается более подробно.
Начнем с краткого обзора некоторых образцов архитектур, затем обсудим возможности и функции, которые такие системы должны поддерживать.
После этого, рассмотрим ряд проектных решений, которые относятся к свойствам когнитивных архитектур, затем приведем некоторые параметры, по которым их следует оценивать.
В заключение отметим некоторые открытые вопросы в этой области и предложим некоторые направления будущих исследований, которые следует предпринять для их решения.
2. Образцы когнитивных архитектур
Прежде чем перейти кабстрактным вопросам, которые возникают в исследованияхкогнитивныхархитектур, мы должны рассмотреть некоторые конкретные примеры, которые были описаны в литературе.Здесь мы рассматриваемчетыре различныеструктуры, которые попадают в различные точкипространства архитектур. Мы выбрали эти архитектуры, потому что каждая из них достаточно часто цитируется в литературе, а также потому, что онидемонстрируютразную степень связи собъяснением человеческого поведения. Мы выбрали их в связи именно сэтим измерением, а не более утонченные психологическиемодели, пришедшиераньше.
В каждом случаемы обсуждаем, каким образом данная архитектурапредставляет, организует, приобретает и использует знания, наряду с ее достоинствами.Посколькумы рассматриваемтолькомаленький образецсуществующих архитектур, мы кратко суммируеммножество другихструктурв Приложении.Тем не менее, этот набор должендать читателямнекоторое общее представлениеопространствекогнитивныхархитектур, которое в последующихразделахобсуждаетсяболее явно.
Одна общаяособенностьархитектур, которыемы рассматриваем, заключается в том, что, хотя у них естьнекоторые теоретические обязательства в отношении параллелизма, особенно при поиске в памяти, они также используютодин илинесколькомодулей принятия решений. Мы не включиливнаше рассмотрение коннекционистскиеподходы, потому что, насколько нам известно, они непродемонстрировали широкуюфункциональность, связанную с когнитивнымиархитектурами, втом смысле, который мы обсуждаемздесь.
Тем не менее,у них естьвозможность служитьважными компонентамив крупномасштабныхархитектурах, как в когнитивной структуре CLARION [Sun, MerrillиPeterson(2001)].
2.1. ACT
КогнитивнаяархитектураACT-R [Anderson & Lebiere, 1998], [Anderson et al., 2004] является последнейв семействекогнитивныхархитектур ACT, связанных, прежде всего,с моделированиемчеловеческого поведения, которое непрерывно развиваетсяс конца1970-х годов.
Версия ACT-R6 состоит изнабора модулей, каждый из которых обрабатываетразличные типыинформации. К ним относятсясенсорныемодули дляобработки визуальных данных, двигательные модули длядействий, модуль намерений дляцелейидекларативныймодуль длядолгосрочныхдекларативных знаний. Каждый модульимеет связанный с нимбуфер, который хранит реляционнуюдекларативнуюструктуру – порции памяти (часто называемую'куски' ‘chunks’, но отличающуюся от тех, которые имеются в архитектуреSoar). Взятые вместе, этибуферы составляют кратковременную памятьархитектуры ACT-R.
Долговременная память продукционных правилкоординируетобработкумодулей. Условиякаждой продукции тестируют порции памяти (chunks) вбуферах краткосрочной памяти, в то время какее действияизменяют применение этих буферов. Некоторые изменения модифицируют существующиеструктуры, тогда как другие инициируют действияв соответствующихмодулях, таких как выполнение командыдвигателяили извлечение порции памяти из долгосрочнойдекларативной памяти. Каждаяпорциядекларативной памяти имеет активацию соответствующейбазы, которая отражает ее прошлоеиспользованиеивлияет на ееизвлечениеиздолговременной памяти, в то время каккаждая продукцияимеетожидаемую стоимость(с точки зрения времени, необходимого для достижения целей) и вероятность успеха.
Вкаждом цикле АСТ определяет, какие продукции совпадают с содержимым кратковременной памяти. Этот процесспоисказависит отактивациибазыдлякаждой порции памяти, которая ему соответствует. ACTвычисляет полезность (utility) длякаждой соответствующейпродукции какразницу между ее ожидаемой пользой(желательность ее цели, помноженная навероятность ее успеха - the desirability of its goal times its probability of success) и ее ожидаемой стоимостью. Система выбираетпродукциюс самой высокойполезностью(последобавления шума к этому результату расчета) и выполняет ее действия. Новая ситуацияприводитновые продукции к соответствию и исполнению правила и цикл продолжается.
Обучение вACT-R происходит как на структурном, так и на статистическомуровнях.Например, активация базы порций декларативной памяти увеличивается сиспользованиемпродукций,но слабеет в противном случае, тогда какстоимость ивероятностьуспеха для продукций обновляетсяна основе ихнаблюдаемого поведения.
Архитектуруможно полностью обучить новымправилам изрешений-образцовв рамках процессакомпиляции продукции, который анализирует зависимости многократных исполнений правила,заменяетконстантыпеременными, и объединяет их вновые условияи действия [Taatgen, 2005].
СообществоACT-R используетсвою архитектурудля моделированияразличныхявленийэкспериментальнойпсихологии, взятыхиз литературы, включая аспектыпамяти, внимания, рассуждений,решения задачи обработки языка. В большинстве публикацийсообщалось о точном совпадении с полученными для человека количественнымиданнымио времени реакцииипроценте ошибок. Совсем недавно [Anderson (2007)] связалмодулиACT-R с различнымиобластями мозгаиразработал модели, которые согласуются с результатамиисследований визуализации мозга (brain-imaging studies).
Есть более прикладные применения: эта архитектура играет центральнуюроль вобучающих системах, которые нашли широкое применениев школах [Koedinger et al., 1997], и она также былаиспользована для управлениямобильными роботами, которые взаимодействуют с людьми[Trafton et al., 2005].
2.2. Soar
Soar[Laird, 2008], [Laird, Newell,& Rosenbloom, 1987], [Newell, 1990] – это когнитивнаяархитектура, непрерывное развитие которой ведется с начала1980-х годов. Процедурныедолгосрочныезнания вSoar принимают формупродукционных правил,которые в свою очередь, организованы в терминологии операторов, связанных спространствами задач. Некоторыеоператоры описываютпростые,примитивныедействия, которые изменяют внутреннее состояниеагентаилигенерируютпримитивныевнешние действия, в то время какдругие операторы описываютболее абстрактныедеятельности.На протяжении многих летSoar представлялавседолгосрочныезнания в этойформе, но в последнее времябыли добавлены отдельныеэпизодическая память и семантическая память. Эпизодическая память [Nuxoll & Laird, 2007] хранит историю предыдущихсостояний, в то время каксемантическая памятьсодержитранееизвестные факты.
Все задачи вSoar сформулированы какпопытки достиженияпоставленных целей.Операторывыполняют основные делиберативные актысистемы, знанияиспользуются для динамическогоопределения ихвыбора и применения. Основнойцикл обработки повторно предлагает,выбираети применяетоператорытекущего пространствазадач кпространству задач, продвигаясь вперед на одно решение за один момент времени.Однако, когдазнаний овыбореоператоранедостаточнодля определения следующегооператора, который следует применить,или когдаабстрактныйоператор не можетбыть реализован, возникаеттупик; в ответSoar создаетновую цель, чтобы определить, какой оператор должен быть выбран, или какдолжен быть реализован этот абстрактныйоператор.
Этот процесс можетпривести кдинамической генерациииерархиицелей, в которой задачи разлагаются наподзадачипо мере необходимости.«Состояние»конкретной целивключает в себя все свойства задач, находящихся выше нее в иерархии, плюс любые дополнительныекогнитивныеструктуры, необходимыедля выбора и примененияоператоровв этой подцели. Обработкавподцеливключаеттот же основнойциклобработкивыбора и примененияоператоров.
Подцелимогуттакже получать делиберативный (deliberately) доступ к эпизодическойилисемантическойпамяти, чтобы получить знания, необходимые для выхода из тупика.Верхнеесостояние включает в себявсе сенсорные данные, полученные из внешней среды, поэтому эта информациятакже доступнадля всехподзадач. В любом цикле, состояния на различныхуровнях иерархиицелеймогут изменяться,как правило,в связи с изменением сенсорных данных илив результатепримененийоператороввподцелях. Когда система разрешаеттупиковую ситуацию, созданную какой-либо целью, эта цельисчезаетвместе совсемиподзадачами, расположенными ниже.
Soar имеетнесколько механизмовобучения для различныхвидов знаний: разбиение данных на порции (chunking) и обучение с подкреплением позволяют приобрестипроцедурные знания, тогда как эпизодическоеисемантическоеобучениепозволяют приобрестисоответствующиеимвидыдекларативных знаний. Разбиение данных на порции (chunking)происходит, когда в подцели производится один или несколькорезультатов [Laird, Rosenbloom,& Newell, 1986].Когда это происходит,Soar узнаетновую порцию данных, представленную, как продукционное правило, которое суммируетобработку, которая сгенерировала этирезультаты. Действиякакой-либо порции данныхоснованына этих результатах, в то время какее условияоснованына тех аспектах целей, расположенных выше данной подцели, которые имеют отношение копределению этих результатов.
Как толькоагентузнал порцию данных (обучился), он добавляет ее (fires) и исполняет в новых ситуациях, которые подобны посоответствующим измерениям, что часто сразу даеттребуемые результаты,исключая таким образом тупик, который привел к его образованию.
Обучение с подкреплениемрегулируетчисловыезначения, связанные справилами, которые помогают выбратьоператоры [Nason &Laird, 2004]. Эпизодическоеобучениезаписываетсодержимоерабочей памятив моментальные снимки (snapshots), в то время каксемантическоеобучение хранитотдельные элементырабочей памятидля последующего извлечения.
Исследователи использовалиSoar для разработкиразнообразных изощренныхагентов, которыепродемонстрироваливпечатляющую функциональность. Наиболее заметнымбыл агент TAC-Air-Soar [Tambe et al., 1995], которыймоделировал пилотов истребителейввоенных учениях, в которых применялись сценарии воздушных боев.
Совсем недавно архитектураSoar стала поддерживатьсярядоминтеллектуальных агентов, которые управляют синтетическими персонажами винтерактивныхкомпьютерных играх [Magerko et al., 2004]. Другой успех связан с использованиемSoar в моделировании деталейобработкичеловеческогоязыка [Lewis, 1993], категоризации [Miller& Laird, 1996]идругих аспектовпознания, но акцент был сделанна демонстрациифункциональностивысокого уровня, а не на пригодности кколичественным измерениям.
2.3. ICARUS
ICARUSявляется более новойархитектурой [Langley, Cummings, & Shapiro, 2004], в которой хранятся две различные формызнаний. Концепции (понятия - concepts) описываютклассыситуаций окружающей среды в терминах другихпонятий и ощущений (percepts), в то время какнавыки (skills) указывают, какдостичь целейпутем декомпозицииихв упорядоченныеподцели. Как концепции, таки навыкивключаютотношения междуобъектами, и оба вызывают иерархическую организациюдолговременной памяти, причем концепцииосновываются на ощущениях, а навыки на исполняемыхдействиях. Кроме того,навыки относятсякконцепциям целей, которые достигаются, условиям их инициациии условиям ихпродолжения.
Базовый интерпретатор архитектурыICARUS работает в цикле "распознавание-действие" (recognize-act cycle).На каждом шагеархитектура помещает описания видимых объектоввперцепционныйбуфер.Система сравниваетпримитивныеконцепции (primitive concepts) с этими ощущениями и добавляетсовпадающие экземпляры (instances) вкратковременную память, как убеждения (beliefs).Это, всвою очередь запускает согласование концепций более высокого уровня, ипроцесспродолжается, покаICARUS не произведет дедуктивныйвыводвсех подразумеваемыхубеждений. Далее,начиная сцеливерхнего уровня, он находитпутьвнизпо иерархии навыков, в которой каждый поднавык (subskill)удовлетворял бы условиям, ноне удовлетворялцели.
Когда путьзаканчивается на примитивном навыкесисполнениемдействий, архитектура применяет этидействия, чтобы оказатьвоздействие наокружающую среду.Этоприводит к новым ощущениям, изменениям убежденийиреактивному исполнению путейдополнительныхнавыковдля достижения целейагента.
Если же ICARUS не может найтиприемлемыйпуть в иерархии навыков, который имеет отношение к целиверхнего уровня, он прибегаетк решению задачи с использованием варианта анализа "средства-цели" (means-ends analysis).Этот модуль следует за любымнавыком, которыйпозволил бы достичьтекущейцели, или за определениемконцепции цели, и этоперемежаетрешение задачис исполнениемвтом, чтовыполняютсявыбранныенавыки, когда они становятся применимыми.
Всякий раз, когдарешение задачи позволяет достичьцели, ICARUS создаетновый навык, индексированный по этой целиис одной или несколькимизаданнымиподцелями, которые основаны на этом решении задачи. Если же эта система столкнется с подобными задачами вбудущем, она исполняет приобретенные навыки, действуя реактивно, безнеобходимости делиберативного решения этой задачи [Langley &Choi, 2006b].
Исследователи использовалиICARUS для разработки агентов длярядаобластей, которые включают комбинациювывода, исполнения, решения задачи обучения.
К их числу относятсятакие задачи, какХанойская башня, вычитание в столбик, пасьянс Свободная ячейка (FreeCell solitaire) ипланирование логистики.Онитакже использовалиархитектурудля управлениясинтетическими персонажами вмоделируемыхвиртуальных средах, в том числе теми,которые связаны с вождением внутри города [Langley &Choi, 2006a]и персонажами игр-стрелялок [Choi, Konik, Nejati, Park, & Langley, 2007]. Текущая работа направлена на то, чтобы связать ICARUSсфизическимироботами, которые осуществляют совместную счеловеком деятельность.
2.4. PRODIGY
PRODIGY[Carbonell, Knoblock, & Minton, 1990] - еще однакогнитивнаяархитектура, получившая широкое развитиес середины1980-х доконца 1990-х. Эта архитектуравключает в себядва основных видазнания.Правила предметной области (domain rules) кодируютусловия, при которыхдействия имеют определенные последствия (effects), где последствия описываютсякакдобавление или удалениевыраженийпервого порядка. Они относятсякакк физическимдействиям, которыевлияют на окружающую среду, так и к правилам вывода, которые являются чисто когнитивными. Напротив,правила управленияуказываютусловия, при которых в процессепоиска эта архитектура должнавыбрать, отвергнуть или предпочесть заданный оператор, набор операторовпривязки (operator bindings), состояние задачи илицель.
Как и в архитектуре ICARUS, базовый модульрешения задач архитектурыPRODIGYвключает в себяпоиск в пространстве задач, чтобы достичь одну или несколько целей, которые он также рассматривает как выраженияпервого порядка. Этот поископирается на анализ "средства-цели", выбирающий оператор, который уменьшает некоторую разницумеждутекущим состояниемицелью, чтов свою очередь можетпривести кподзадачамс собственнымитекущими состояниямии целями.В каждом циклеPRODIGYиспользует своиправила управления, чтобы выбратьоператор, набор связей, состояние или цель,отвергнутьихилипредпочестьодни другим. В отсутствиетаких знанийуправления, эта архитектура делает выбор случайным образом ипроизводит поиск типа “сначала-вглубь” с возвратом при анализе "средства-цели".
Имеющийся в архитектуре PRODIGY модуль обучения на основе объясненийстроитправила управленияна основеего опыта решения задач [Minton, 1990]. Успешное достижениецелипослепоискаприводит к созданиюправил выбора илипредпочтения, связанных стой цельюи теми операторами, которые были применены.Неудача в достижениицелиприводит к созданиюправилотказа выбораилипредпочтениядля операторов, целей и состояний, которые не привели к решению. Для созданияэтихправил управленияPRODIGYвызывает методобучения, который анализирует следырешения задачидоказываетпричины (proves the reasons) успеха или неудачи. Эта архитектура такжесобирает статистикупоправилам обученияи сохраняеттолькоте,включение которыхприводит со временем кболее эффективномурешению задач.
Кроме того,PRODIGYвключает в себя отдельныемодули дляуправления поиском поаналогии с более раннимирешениями [Veloso & Carbonell, 1993], для обучения описанийоператоров, полученных отнаблюдаемыхрешений илиэкспериментов [Wang, 1995], и для повышения качестварешений [Perez & Carbonell, 1994].
Хотя большинство исследований в этих рамках посвящено исключительно планированию и решению задач, PRODIGY также легла в основу впечатляющей системы с перемежающимся планированием и выполнением для мобильного робота, который принимал асинхронные запросы от пользователей [Haigh & Veloso, 1996].
3. Возможности когнитивных архитектур
Любая интеллектуальная система предназначена для ведения определенных видов деятельности, которые, вместе взятые, составляют ее функциональные возможности. В этом разделе мы обсудим разнообразные возможности, которые когнитивная архитектура может поддерживать. Хотя только несколько способностей, таких как распознавание и принятие решений, строго необходимы для поддержки четко определенной архитектуры, по-видимому, требуется весь набор, чтобы охватить полный спектр интеллектуальной деятельности человеческих уровня.
Центральный вопрос, который стоит перед разработчиком когнитивной архитектуры, как обеспечить агентам доступ к различным источникам знаний. Многие из возможностей, которые мы обсудим ниже, дают доступ агенту к таким знаниям. Например, знания об окружающей среде приходят через ощущение, знания о последствиях нынешней ситуации приходят через планирование, рассуждения и предсказания, знания от других агентов приходят через общение, а знания из прошлого приходит через запоминание и обучение. Чем больше таких возможностей поддерживает архитектура, тем к большему количеству источников знаний она может получить доступ, чтобы информировать о своем поведении.
Другой ключевой вопрос заключается в том, поддерживает ли когнитивная архитектура какую-то возможность напрямую, используя встроенные процессы, или вместо этого она обеспечивает пути реализации этой возможности с точки зрения знаний. Проектные решения такого рода влияют на то, чему агент может учиться на собственном опыте, что разработчики могут оптимизировать в самом начале, и какую функциональность можно получить от специализированных представлений и механизмов.
В этом разделе мы попытаемся описать функциональность, не обращаясь к основным механизмам, которые обеспечивают их реализацию, но это важный вопрос, который заслуживает большего внимания в будущем.
3.1. Распознавание и категоризация
Интеллектуальный агент должен иметь какую-то связь между его окружением и его знаниями. Это требует умения распознавать ситуации или события как экземпляры известных или знакомых моделей. Например, читатель должен распознавать буквы и слова, из которых они составлены, шахматист должен идентифицировать значимые конфигурации на доске, а аналитик изображений должен обнаружить здания и транспортные средства на аэрофотоснимках. Однако не обязательно ограничивать распознавание только статическими ситуациями. Учитель фехтования может идентифицировать различные типы атак, а футбольный тренер может различать ведение отдельных игр командой противника, и оба они связаны с динамическими событиями.
Распознавание тесно связано с категоризацией, которая включает присваивание объектам, ситуациям и событиям известных понятий или категорий. Тем не менее, в исследованиях в области когнитивных архитектур обычно предполагают, что распознавание – это примитивный процесс, который происходит за один цикл, и который лежит в основе многих функций более высокого уровня, в то время как категоризация иногда рассматривается как функция более высокого уровня. Распознавание и категоризация тесно связаны с ощущениями, в том, что они часто действуют на выходе системы восприятия, и в некоторых архитектурах они рассматриваются как неразличимые. Тем не менее, оба процесса могут работать в абстрактных ментальных структурах, в том числе созданных внутри, поэтому мы будем рассматривать их как различимые.
Для поддержки распознавания и категоризации, когнитивная архитектура должна обеспечить некоторый способ представления паттернов и ситуаций в памяти. Так как эти паттерны должны применяться в похожих, но разных ситуациях, они должны кодировать общие соотношения, которые запоминаются в этих ситуациях. Архитектура должна также включать некоторый процесс распознавания, который позволяет определить, когда конкретная ситуация соответствует хранимому паттерну или категории и, возможно, измерить степень этого соответствия. В архитектурах с системой продукций, этот механизм определяет, когда условия каждой продукции совпадают, и конкретные способы различения отдельных экземпляров (instantiated). Наконец, полная архитектура должна включать в себя некоторые средства обучения новым паттернам или категориям на основании инструкций или опыта и, при необходимости, уточнения существующих паттернов.
3.2. Принятие решений и выбор
Для работы в некоторой среде интеллектуальной системе также необходима способность принятия решений и выбора между альтернативами. Например, студент должен решить, какая операция упростит задачу по интегрированию, выступающий должен выбрать, какое следующее слово использовать в высказывании, а бейсболист должен решить, какое следующее действие предпринять. Такие решения часто связаны с распознаванием ситуации или паттерна, и наиболее когнитивные архитектуры объединяют эти два механизма в цикле распознавание-действие (recognize-act cycle), что лежит в основе всего когнитивного поведения.
Такое одношаговое принятие решения имеет много общего с выбором на более высоком уровне, но отличается по своей сложности. Например, рассмотрим покупателя, решающего, какой бренд моющего средства выбрать, чтобы сделать покупку, водителя, выбирающего маршрут поездки, или генерала, выбирающего цель для бомбардировки. Каждое из этих решений может быть достаточно сложным в зависимости от того, сколько времени и энергии человек готов на него потратить. Таким образом, мы должны различать решения, которые принимаются на архитектурном уровне и более сложные решения, которые позволяет сделать эта архитектура.
Для поддержки принятия решений когнитивная архитектура должна обеспечивать некоторый способ представления альтернативных вариантов или действий, будь то внутренние когнитивные операции или внешние. Следует также предложить некоторый процесс выбора среди этих альтернатив, который в большинстве архитектур разделен на два шага. Первый определяет, является ли данный выбор или действие допустимым, как правило, связывая его с некоторым паттерном и рассматривая его только в случае сопадения с этим паттерном. Например, мы можем определить условия, при которых шахматный ход является законным, и затем рассматривать этот ход только тогда, когда эти условия будут выполнены. Второй шаг производит выбор среди допустимых альтернатив, часто путем вычисления некоторого числового показателя и последующего выбора одной или нескольких альтернатив с лучшими его значениями. Такое разрешение конфликтов принимает совершенно разные формы в разных архитектурах.
Наконец, идеальная когнитивная архитектура должна включать в себя некоторый способ улучшать свои решения путем обучения. Хотя она может, в принципе, включать в себя обучение новым альтернативам, большинство механизмов сфокусировано или на обучении или пересмотре условий, при которых существующее действие считается допустимым, или на изменении числовых функций, используемых на стадии разрешения конфликта. Полученные усовершенствования принятия решений будут затем отражаться в общем поведении агента.
3.3. Восприятие и оценивание ситуации
Познание не происходит изолированно; интеллектуальный агент существует в контексте некоторой внешней среды, которую он должен ощущать, воспринимать и интерпретировать. Агент может ощущать мир через различные виды ощущений (модальности), так же, как человек имеет зрение, слух и осязание. Чувствительные элементы (сенсоры) могут варьироваться от простых устройств, таких как термометр, который генерирует одно непрерывное значение, до более сложных механизмов, таких как стереоскопическое зрение или гидролокатор, которые генерируют карту рельефа дна для локального окружения в поле зрения агента. Восприятие может также включать в себя интеграцию результатов различных видов ощущений в единое оценивание или описание окружающей ситуации, которую какая-либо архитектура может представлять для использования другими когнитивными процессами.
Восприятие - это широкий термин, который охватывает многие типы обработки от недорогих типов, которые архитектура может поддерживать автоматически, до тех, которые требуют ограниченных ресурсов и поэтому должны вызываться осознанно.
Например, зрительная система человека может без особых усилий обнаруживать движение на периферии, но центральная ямка (сетчатки глаза) может извлекать информацию только из той малой области, на которую она направлена. Когнитивная архитектура, которая включает в себя эту вторую форму чувствительного элемента, должна решать вопрос внимания, то есть, принимать решение о том, как распределить и направить свои ограниченные ресурсы восприятия, чтобы обнаружить соответствующую информацию в сложной среде.
В архитектуре, которая поддерживает восприятие, также должен быть рассмотрен вопрос о том, что чувствительные элементы дают лишь неточную и частичную картину среды, окружающей агента, и часто на нее накладывается шум.
Динамическая окружающая среда еще более усложняет дело из-за того, что агент должен отслеживать изменения, которые иногда происходят с большой скоростью. Эти проблемы могут быть компенсированы с помощью перцептивных знаний о том, какие чувствительные элементы вызывать, где и когда их сосредоточивать, и какие выводы являются правдоподобными. Архитектура может также приобретать и улучшать эти знания путем обучения на основе предыдущего опыта восприятия.
Интеллектуальный агент должен также быть в состоянии выйти за рамки восприятия изолированных объектов и событий, чтобы понять и интерпретировать окружающую ситуацию более широко. Например, офицер корабля, управляющий огнем, должен понимать расположение, силу и траекторию орудийного огня в целях эффективного реагирования, в то время как генерал должен быть осведомлен о расположении, количестве и ресурсах противника, чтобы успешно от него защититься. Таким образом, оценивание ситуации требует, чтобы интеллектуальный агент объединял перцептивную информацию о многих сущностях и событиях, получаемую по возможности из многих источников, чтобы составить крупномасштабную модель текущего окружения. Как таковая, она опирается как на распознавание и категоризацию знакомых паттернов в этом окружении, которые мы обсуждали ранее, так и на механизмы вывода, которые мы вкратце рассмотрим.
3.4. Прогнозирование и мониторинг
Когнитивные архитектуры существуют во времени, что означает, что они могут получить выигрыш от способности точно предсказывать будущие ситуации и события. Например, хороший водитель примерно знает, когда топливо в его автомобиле закончится, успешный студент может предсказать, сколько он должен учиться, чтобы достичь финала, а опытный пилот может судить, насколько близко к земле он может лететь без аварии. Идеальный прогноз во многих ситуациях может оказаться невозможным, но совершенство редко необходимо, чтобы делать прогнозы, которые полезны для интеллектуальной системы.
Прогнозирование требует наличия определенной модели окружающей среды и последствий, которые действия вызывает в ней, а архитектура должна представлять эту модель в памяти. Один общий подход предполагает хранение некоторого отображения описания текущей ситуации и действия при описании ситуации, получившейся в результате. Другой подход кодирует последствия действий или событий с точки зрения изменений окружающей среды.
В любом случае, для этой архитектуры также требуется какой-то механизм, который использует эти структуры знаний для прогнозирования будущих ситуаций, скажем, путем распознавания класса ситуаций, в которых любое действие будет иметь определенные последствия. Идеальная архитектура должна также включать в себя способность к обучению прогнозных моделей на основании опыта и их усовершенствованию с течением времени.
Если какая-либо архитектура имеет какой-то механизм, чтобы делать прогнозы, его также можно использовать для мониторинга окружающей среды. Например, водитель танка может подозревать, что его танк имеет утечку топлива, если указатель уровня топлива показывает более быстрое снижение, чем обычно, и командир может заподозрить действия противника, если разведывательная команда не смогла представить отчет вовремя. Поскольку мониторинг соотносит данные чувствительных элементов с прогнозированием, это ставит вопрос о фокусе внимания, когда какая-то архитектура имеет ограниченные ресурсы восприятия. Мониторинг также обеспечивает естественную поддержку обучения, так как ошибки могут помочь агенту улучшить его модель окружения.
3.5. Решение задач и планирование
Поскольку интеллектуальные системы должны достигать своих целей в новых ситуациях, те когнитивные архитектуры, которые их поддерживают, должны быть в состоянии генерировать планы и решать задачи. Например, беспилотный летательный аппарат получает преимущество от наличия разумного плана полета, менеджер проекта хочет иметь план, который распределяет задачи конкретным людям в конкретное время, а генерал редко перемещается на территорию противника без какого-то хотя бы абстрактного плана наступления. Исполнение этих планов в реальности часто происходит не так, как запланировано, но это не делает их менее полезными для размышления интеллектуального агента в отношении будущего.
Планирование возможно только тогда, когда агент имеет модель окружающей среды, которая прогнозирует последствия его действий. Для поддержки планирования, когнитивная архитектура должна иметь возможность представлять какой-то план в виде упорядоченного (по крайней мере, частично) набора действий, ожидаемых последствий и того, каким образом эти последствия сказываются на более поздних действиях.
Этот план не обязательно должен быть полным, чтобы направлять поведение, т.к. он может распространяться в будущее лишь на короткое время или обращаться к абстрактным действиям, которые можно расширять различными способами. Его структура может также включать условные действия и ветвления, которые зависят от результатов более ранних событий, которые заметил агент.
Интеллектуальный агент должен также уметь строить план из компонентов, доступных в памяти. Эти компоненты могут относиться к низкоуровневым двигательным и сенсорным действиям, но чаще они будут более абстрактными структурами, в том числе предварительно сохраненными подпланами. Существует множество механизмов создания планов из компонентов, а также механизмов адаптации планов, которые извлекаются из памяти. Все эти методы имеют то общее, что они включают в себя решение задач или поиск.
То есть, они выполняют шаги в пространстве состояний задач, рассматривая на каждом шаге применимые операторы, выбирая один или несколько операторов и применяя его для создания состояния новой задачи. Этот процесс поиска продолжается, пока система не найдет приемлемый план или не решит отказаться от поиска.
Понятие решения задач является несколько более общим, чем планирование, хотя они, как правило, рассматриваются как тесно связанные. В частности, планирование обычно относится к когнитивной деятельности в “голове” агента, в то время как решение задач может также происходить в физическом мире. Особенно, когда какая-то ситуация является сложной и эта архитектура имеет ограничения памяти, агент может осуществлять поиск, применяя операторы или действия в окружающей среде, а не пытаясь построить какой-то план внутри.
Решение проблем может также основываться на смеси внутреннего планирования и внешнего поведения, но это, как правило, предполагает многоступенчатое построение решения проблемы. Подобно планированию решение задач часто характеризуется поиском в пространстве задач, который применяет операторы для генерации новых состояний, выбирает перспективных кандидатов и продолжается до достижения цели распознавания. Планирование и решение задач также могут извлекать пользу от обучения. Естественно, улучшенные модели прогнозирования действий могут приводить к более эффективным планам, но обучение может также происходить и на уровне поиска в пространстве задач, происходит эта деятельность в голове агента или в физическом мире. Такое обучение может опираться на разнообразные источники информации.
В дополнение к обучению на основе прямого инструктирования, архитектура может обучаться по результатам поиска в пространстве задач [Sleeman, Langley, & Mitchell, 1982], через наблюдение поведения другого агента или клонирование поведения [Sammut, 1996], через обучение с подкреплением (с отложенным подкреплением) [Sutton & Barto, 1998]. Обучение может быть направлено на усовершенствование поведения при решении задач двумя способами [Langley, 1995a]. Один способ направлен на сокращение коэффициента ветвления поиска либо путем добавления эвристических условий для операторов пространства задач, либо путем уточнения числовой функции оценивания, применяемой для руководства выбором. Другой способ направлен на формирование макро-операторов или сохраняемых планов, которые снижают эффективную глубину поиска за счет применения более протяженных шагов в пространстве задач.
Интеллектуальные агенты, которые работают в динамических средах и производят их мониторинг, часто приходится модифицировать существующие планы в ответ на непредвиденные изменения. Это может происходить в нескольких контекстах. Например, агент должен обновить свой план, когда он обнаруживает изменившуюся ситуацию, которая делает некоторые запланированные действия неприменимыми, и, следовательно, требует других действий. Другой контекст наблюдается, когда новая ситуация предполагает некоторый более желательный способ достижения цели агента; такое приспосабливаемое планирование может использовать преимущество этих неожиданных изменений.
Мониторинг выполнения плана также может приводить к пересмотру оценок эффективности плана, и в предельном случае к решению о выборе другого курса действий с более высоким потенциалом. Перепланирование может опираться на те же самые механизмы, что и при генерации плана с самого начала, но требует дополнительных операторов для удаления некоторых действий или их замены другими шагами. Подобные методы могут также адаптировать к текущей ситуации известный план, который агент извлек из памяти.
3.6. Обеспечение рассуждений и убеждений
Решение задачтесно связано срассуждениями, другойцентральнойпознавательной деятельностью, которая позволяет агентуувеличиватьсвое состояниезнаний. В то время какпланирование связанов первую очередь сдостижением целейв мире путем совершения действий, рассуждения производят умственные заключения издругих убеждений или предположений, которыми агент ужевладеет. Например, пилот можетсделать вывод, что, если другойсамолетменяет свой курс, чтобы пересечь его собственный, то это, вероятно,вражеский истребитель. Точно так жестудент, изучающий геометрию, можетсделать вывод, чтодватреугольника равны, потому что они имеют некоторые общиестороны ивершины, а генерал может сделать вывод, что еслионне получилни одногонедавнего сообщения одвижениипротивника, расположенные неподалекусилыпротивникапо-прежнему находятся в лагере, где они были днемраньше.
Для поддержки такихрассуждений, когнитивнаяархитектурадолжны сначалаиметь возможность представлятьотношения междуубеждениями. Общимформализмомдля кодированиятаких отношенийявляетсялогика первого порядка, но также используются и многие другие нотации, начиная с продукционных правил до нейронных сетей и байесовских сетей. Отношения, представленные таким образом, могутбыть описаны логическииливероятностно, но это не является обязательным; знания орассужденияхмогут быть также эвристическимиилиприблизительными и все еще будут весьмаполезными дляинтеллектуального агента. Не менее важно, чтобы этот формализм мог быть более илименее выразительным(например,ограниченнымлогикой высказываний) иливычислительноэффективным.
Естественно,когнитивнойархитектуретакже требуютсямеханизмы, чтобы делать выводы, используя эти структурызнаний. Дедуктивные рассужденияявляются важной и хорошо изученнойформойвывода, которая позволяет объединятьобщие и частныеубеждения, чтобы прийти к заключению о других убеждениях, которые следуют из них логически. Тем не менее,агент можеттакже участвовать виндуктивных рассуждениях, которые движутся от частных убеждений к более общимикоторые можно рассматриватькак одну из формобучения. Архитектура может также поддерживатьабдуктивный (правдоподобный) вывод, который объединяет в себеобщие знания и частные убеждения, чтобы выдвигать гипотезы одругих частныхубеждениях, как это происходит в медицинской диагностике.
Вситуациях с ограничениямиагент можетпросто делатьвсевыводы, которые следуют из егобазы знаний, но чаще он долженвыбрать, какой способ выводазнанийприменять. Этоподнимает вопросыпоиска, оченьсходные стеми, которые применяются в задачахпланирования, наряду с вопросамиобучения, которые позволяют сделать поиск более эффективным.
Рассужденияиграют важную рольне только привыводеновых убеждений, но и при принятии решения о поддержке существующих.Посколькуопределенные убеждения в какой-то степени зависят отдругих,агент долженотслеживать эти последние, чтобыопределить, должен ли он по-прежнему доверять им, отказаться от них, или иным образом изменитьсвое доверие к ним. Такоеобеспечение убежденийособенно важно вдинамическом окружении, в котором ситуации могут изменятьсясамым неожиданным образом, вызывая последствия вповеденииагента.Общий ответ наэтот вопросвключает в себя поддержаниев памяти структурзависимостей, которые соединяют убеждения, чтобы архитектура моглаиспользовать эти структуры дляраспространения измененийпо мере их возникновения.
3.7. Исполнение и действие
Познаниепроисходит для того, чтобыподдерживать активностьв окружающей среде иуправлять ею.С этой целью, когнитивнаяархитектура должнаиметь способность представлятьи хранитьдвигательные навыки, которые позволяют осуществлять такую деятельность.Например,мобильный наземный роботилибеспилотный летательный аппаратдолжны обладать навыкамиили политикойдля навигации при перемещении из одного места в другое, для манипулированияокружающими предметамис помощью эффекторов (исполнительных элементов), а также для координирования своего поведенияс другими агентами в ихкоманде. Они могутбыть закодированы только лишь с точки зренияпримитивныхилисоставныхдействий, но для них также могут быть заданы и более сложныемногошаговыенавыкиили процедуры. Эти процедуры могутпринимать формупланов, которые агент сгенерировал илиполучилиз памяти, особенно в архитектурах, которые выросли изработ порешению задачи планирования. Однако идругие концепцииисполнениядвигательных навыков, такие как контроллеры с обратной связью,также надо исследовать.
Когнитивная архитектура такжедолжнабыть в состоянии исполнятьнавыкии действияв окружающей среде.В некоторыхархитектурах, это происходит полностью реактивным способом, когда агентвыбирает одноили несколько примитивныхдействий в каждомцикле принятия решений, выполняетих и повторяет этот процесс во время следующего цикла. Этот подходсвязансо стратегиямиисполнения с обратной связью, когда агент можеттакжеощущатьокружающую среду в течение каждого шага во времени.
Использованиеболее сложныхнавыковподдерживает исполнениебез обратной связи, в котором агент обращается к хранимой процедуречерезмного цикловбез проверкиокружающей среды.Тем не менее,гибкаяархитектура должна, так же как и люди, поддерживать все пространство действий отполностьюреактивного поведения, поведения с обратной связьюдоавтоматизированного поведения без обратной связи.
В идеале,когнитивнаяархитектура должнатакже иметь способность обучаться навыкам иполитикам исполнения на основеобучения иопыта.Такое обучениеможет принимать различные формы, многие из которых параллельнытем, которые возникаютв процессе планированияи решения задач.Например,агент может обучаться, наблюдая за поведением другогоагента, путем успешногодостижениясвоих целейи путем отложенного подкрепления. Аналогично, онможет обучаться или уточнятьсвои знаниядля выборапримитивныхдействийлибо приэвристическихусловияхих применения либо используя числовуюфункцию оценки, которая отражает их полезность. В качестве альтернативы агент можетприобретать более сложныенавыкиилипересматривать их с точки зренияизвестныхнавыковили действий.
3.8. Взаимодействие иобщение
Иногдадля агента самый эффективный способ - получить знанияотдругого агента, обеспечивая общение - еще одну важную способность, которую архитектура должнаподдерживать. Например, командир можетотдавать приказы подчиненнымиполучать от них отчеты, в то время какпокупатель на блошиномрынке можетторговатьсяоцене товарасего владельцем.Точно так жепутешественникнауглу улицы может спрашивать о направлении и получать ответ, в то время какадвокатможет задавать ответчику вопросо том, гдеон был в эту ночь. Агенты существуютв среде вместе сдругими агентами, иесть много случаев, когда они должныпередаватьзнанияот одного к другому.
Какой бы ни быламодальность, в которой это общение происходит,общающийсяагент долженпредставлятьзнания, которыеонстремится передать,или то, что, как онсчитает,намеренпередать другой агент.Содержание,передаваемое таким образом,может включатьлюбой из видов когнитивной деятельности, которые мы обсуждали до сих пор.Таким образом,два агентамогут общаться по распознанным категориямипринятым решениям, ощущениям и действиям, прогнозами отклонениям, планам ивыводам.
Естественныйподход - привлечь для общения между агентами представления, которые дают результат для этих видов деятельности, вместе с их входными ивыходными данными.
Когнитивная архитектурадолжна такжеподдерживать механизмыпреобразованиязнаний в ту форму исреду, в которойонибудут передаваться. Наиболее распространенной формойявляется язык устной речи или письменного текста, который следует установленным соглашениям семантики, синтаксиса и прагматики, в соответствии с которыми агент долженотображать содержимое, котороеон хочетпередать.Даже тогда, когда некоторые сущностиобщаются с помощью чистоискусственных языков, они не имеют точно такой жементальной структуры и должны переводитьсодержание вкакой-то внешнийформат. Можно было бы считать, что генерация языка - это формапланирования и исполнения, тогда как понимание языкавключает в себявывод и рассуждения. Тем не менее, особая природа обработки языкаделаетэти взгляды ошибочными,поскольку эта задачавызывает многодополнительных вопросов.
Важная формаобщенияпроисходит в виде разговорныхдиалогов, которые требуют как генерацииестественного языка, так и его понимания, а также координации сдругим агентомв виде обратных действий.Обучениетакже является важнымвопросом вязыкеи другихформах общения, так как архитектура должнабыть в состоянии приобретатьсинтаксические и семантическиезнаниядля использования на уровнях как изложения, такидиалога.Более того, некоторыекоммуникативныезадачи, подобно вопросно-ответным системам, требуют доступа кпамятипрошлых событий ипознавательной деятельности, что в свою очередь дает выгоду отэпизодическойпамяти.
3.9. Запоминание, отражение и обучение
Когнитивная архитектура можеттакже извлечь выгоду из способностей, которые затрагивают те способности, которые описаныв предыдущих разделах, втом, что ониработают наментальных структурах, которые они производят или используют. Такие способности, которые Sloman (2001)называетмеханизмами метауправления, совсем не обязательны дляинтеллектуального агента, но их включениеможетзначительно расширитьгибкостьи надежностьархитектуры.
Одна из способностей такого родавключаетзапоминание- способностькодировать ихранить результатыкогнитивных процессовв памяти, апозже находить их или получать к ним доступ.Агентне может напрямую запоминать внешниеситуации илисвоифизические действия, он может тольковспомнитькогнитивные структуры, которые описывают этисобытия иливыводы оних. Эта идеяраспространяется, естественно, на память орешении задач, рассуждениях и общении.Чтобы помнитьлюбую когнитивную деятельность, архитектура должнахранитькогнитивные структуры, созданные в течение этойдеятельности,индексировать ихв памятии извлекатьих при необходимости. Полученное в результатесодержаниечасто называютэпизодической памятью (памятью эпизодов).
Другой способностью, которая требует доступа кследампознавательной деятельности, являетсяотражение. Оно может включатьобработкулибо недавних ментальных структур, которые все еще доступны, либо более старыхструктур, которыеагент долженизвлечь из своейэпизодической памяти.Один из типоврефлексивной деятельностикасаетсяобоснования илиобъяснениявыводовагента, планов, решений илидействийс точки зренияпознавательныхшагов, которые к ним привели. Другой тип связан с мета-рассуждениямио других когнитивных действиях, которые архитектураможет применять втех же областях, что и объяснение, нов которых особое внимание обращается на их порождение(например, формирование выводовили составление планов), а не на их обоснование. В той мере, в которой рефлексивные процессы оставляют свои собственные когнитивныеследы, они сами могутбыть предметом отражения.Тем не менее,архитектураможет также поддерживатьотражениечерезменеепрозрачныемеханизмы, такие как статистический анализ, которыесами по себе непроверяютсяагентом.
Последней важной способностью, которая применима ко многимпознавательным деятельностям, является обучение. Мы обсудилиранееразличные формы, которые оно можетпринимать, в контекстеразличных способностей архитектур, но мы должны также рассмотретьболее широкие вопросы.
Обучение, как правило, включает в себяобобщениеконкретных убеждений исобытий. Хотя большинствоархитектурпроизводитэто обобщениево времяхраненияи вводитобобщенныеструктурызнанийв память, некоторые механизмыобучения сохраняютконкретные ситуациии обобщениепроисходит во времяполучения данных с помощью рассуждений по аналогииили на основе прецедентов.
Каждый из подходовможет приводить кразличной степениобобщенияили передачи, начиная от очень похожихзадач, до решения других задачв пределах той же областии дажедозадач в имеющих некоторое отношение, но совсем другихобластях. Многиеархитектуры рассматривают обучение какавтоматический процесс, который не подлежит проверкеилисознательному контролю, но они также могут использоватьметарассуждения для поддержки обученияболее разумным образом.Данные, на которыхработает обучение,могутпоступать из многихисточников, включая наблюдения задругим агентом, собственноеповедение агента при решении задач илипрактические данныеизвестныхнавыков.Нонезависимо от источникаопыта, все они связаны собработкойструктур памяти для улучшения способностей агента.
4. Свойства когнитивных архитектур
Можно также охарактеризоватькогнитивныеархитектурыс точки зрениявнутренних свойств, которые производят способности, описанные в предыдущем разделе. Естественно, эти свойства архитектур подразделяются на их представление знаний, организацию размещения этих знаний, способ, которым системаиспользуетсвои знания,имеханизмы, которые поддерживаютприобретениеи пересмотрзнанийпутем обучения. Ниже мы рассмотримрядпроектных решений, которые возникают в пределах каждой из этихграней любой интеллектуальной системы, распределяя ихс точки зренияструктур данных и алгоритмов, которые поддерживаются на архитектурномуровне.
Хотямы представляембольшинство вопросовс противоположных точек зрения, многие изальтернатив, которыемы обсуждаем,дополняют друг друга имогут существоватьв одной и той же архитектуре.
4.1. Представление знаний
Важный классархитектурныхсвойств связан с представлением знаний. Напомним,что самизнанияне встроены в какую-либо архитектурупотому, чтоони могут изменятьсяв разных областяхиво времени. Однако формализм представления, в котором агенткодируетсвои знания, является центральным аспектом любой когнитивнойархитектуры.
Пожалуй, самоеосновное ввыборе представления - это выбор, использует лиархитектура единственную, единуюнотациюдля кодированиясвоих знанийилиона используетсмесьформализмов. Выбородногоформализмаимеет преимуществапростоты и элегантности, илегчеподдерживать способности, подобныеобучению иотражению, так как они должны работатьтолько с одним типомструктуры знаний.
Однако, как мыувидим ниже, различныевариантыпредставлениязнаний имеют свои преимущества инедостатки, поэтому сосредоточение на одном варианте может поставитьархитектурув неловкое положение приподходе копределенным проблемам. С другой стороны, дажесмешанныеархитектуры, как правило, ограничены несколькимитипамиструктурзнаний, чтобы избежать сложности.
Распространеннойтрадицией является различениедекларативных и процедурныхпредставлений. Знаниями в декларативнойкодировкекогнитивные механизмы могут манипулироватьнезависимо от их содержимого. Например, нотация для описанияустройствможет поддерживатьконструкцию, диагностику и управление. Классическим примеромтакого представления является логика первого порядка [Genesereth & Nilsson,1987]. Вообще говоря,декларативныепредставленияподдерживаюточеньгибкое использование, но они могут привестик неэффективнойобработке.В противоположность этому,процедурныеформализмыкодируютзнания отом, как выполнитьнекоторую задачу. Например,агентможет иметьпроцедуру, котораяпозволяет емурешатьалгебраическую задачуилиуправлять транспортным средством, но не распознаеттакую деятельность, когда она сделана другими. Правилапродукций [Neches et al., 1987] являются распространенным средствомпредставленияпроцедурных знаний. В общем случае,процедурныепредставленияпозволяютагентуэффективно применять знания, но, как правило, негибким способом.
Мы должны пояснить, чтокогнитивнаяархитектураможет поддерживать какдекларативные, так и процедурныепредставления, поэтому они не являются взаимоисключающими.Кроме того,все архитектурыимеют некоторыедекларативныеипроцедурные аспекты, т.к. имтребуются некоторыеструктуры данныхдля распознаванияи некоторые интерпретаторы для управления поведением.Тем не менее,мы, как правило, резервируем термин “знания” для ссылок наструктуры, которые являются довольно стабильными (не меняясь в каждом цикле) и которые невстроены вархитектуру. Кроме того, отнесение знанийкдекларативномуилипроцедурному типузависит не столько от их формата, сколько от того, какиемеханизмы архитектуры могутполучить к ним доступ. Например, продукционные правиламожно рассматривать какдекларативные знания,еслидругие продукционные правиламогут их проверять.
Хотя большая частьзнанийагентадолженсостоять изнавыков, концепций и фактов о мире, в котором он обитает, архитектураможет также поддерживатьмета-знания о собственных способностяхагента.Такое знаниеболее высокого уровняможет поддерживатьмета-рассуждения, позволяя агенту ''знать, чтоон знает"иобеспечивая естественныйспособ достижениякогнитивнойпроницаемости (cognitive penetrability), то есть понимания когнитивныхшагов во время деятельностиагентаи их причин. Кодированиезнаний декларативным способомявляется одним из путей достижениямета-знания, но акцент напроцедурныепредставленияне означает, что архитектуране может достигатьэтих целейдругими средствами.
Другое противопоставление сравнивает общееразличие междудействиями и сущностями, на которых они работают. Наиболее когнитивныеархитектуры, произошедшие изтеорийрешения задачи планирования, сфокусированы назнаниях о навыках, т.е. знаниях о том, как генерироватьили исполнятьпоследовательности действий, будь то в головеагентаилив окружающей среде.Однако не менееважным аспектомпознания являютсязнания о понятиях, которые имеют дело с категориями объектов, ситуаций и другихконцепций, менееориентированных на действия. Всепознавательныеархитектурыобращаются ктаким категориям, но они часто сводят ихк неразборчивымсимволам, а не представляютих значенияявным образом. Была проведена значительнаяработа надформализмамии методамиконцептуальнойпамяти, но редко в контекстекогнитивныхархитектур.
Еще одноразличие [Tulving, 1972]включает в себя вопрос, поддерживают ли накопленные знаниясемантическуюпамятьобщихпонятий, процедур и т.п., или они кодируются в эпизодическую памятьконкретных сущностей исобытий, с которымиагент встречается в окружающей среде.Большинствокогнитивныхархитектур фокусируется насемантической памяти, отчасти потому, чтоэто естественныйподход к получению обобщенного поведения интеллектуального агента, в то время какэпизодическая память, по-видимому, хорошо подходит дляпоискаконкретныхфактов исобытий.Тем не менее,методырассуждений на основеаналогий и прецедентовмогут производитьэффектобобщенногоповедения во время поиска, так что приверженностьархитектуры ксемантическойилиэпизодической памятисама по себе неограничивает ее способности. Не следуетограничивать привязку памяти только к одной архитектуре илидругой.
Исследователи вобласти искусственного интеллекта икогнитивных наукисследовалиэти проектные решенияс помощью различныхконкретныхформализмов представления знаний. Более ранняя нотация, известная каксемантические сети [Ali & Shapiro, 1993; Sowa, 1991], кодируеткак общие, такиконкретные знанияв декларативномформате, которыйсостоит из узлов(дляпонятийили сущностей) и связей (дляотношений между ними).
Еще одной раннейструктурой представления знаний, котораяпо-прежнему широко используется, является логика первого порядка; она кодируетзнания каклогические высказывания в видепредикатов иаргументов, вместе с утверждениями, которые соотносят эти выраженияв терминахлогических операторов, таких как конъюнкция,дизъюнкция, импликацияиотрицание.
Продукционные системы [Neches et al., 1987] обеспечивают болеепроцедурную нотацию, сохраняямодульностьлогики, они представляют знанияв виде набораправил “условие-действие”, которые описывают правдоподобные ответына различные ситуации.
Фреймы [Минский, 1975]и схемыпредлагаютструктурированныедекларативныеформаты, которые определяют понятияс точки зренияатрибутов (слотов) и ихзначений (заполнителей), в то время какпланы [Хендлер, Тейта, иDrummond, 1990 г.] предусматриваютструктурные рамкикодирования последовательностей действий.
Кроме того, некоторыеподходы наделяют символическиеструктуры весовыми (как внейронных сетях) или вероятностными(как вбайесовских сетях) характеристиками, хотя в типичной реализации они имеют ограниченнуювыразительность.
4.2. Организация знаний
Еще один важныйнабор свойствкасается способа, которымкогнитивнаяархитектураорганизуетзнанияв своей памяти. Один из вариантов выбора здесь - поддерживаетли базоваясхемапредставления знаний напрямую "плоские" или иерархические структуры. Продукционные системыилогика высказыванийявляются двумя примерамиплоскихструктур, втом смысле, что запоминаемые элементы памятине имеют никакогопрямого отношениядруг к другу.Это не означает,что они не могутвлиять друг на друга; ясно, что применениеодного продукционного правиламожет привести к выбору другого вследующем цикле, но это происходиткосвенно, черезработу интерпретатора архитектуры.
Вотличие от этого, запоминаемые элементы вструктурированных форматахделаютпрямую ссылку надругие элементы.Один из таких подходоввключаетиерархиюзадач,в которых одинплан или навык вызывает непосредственнозадачи компонент во многом так, как происходит вызов подпрограмм. Точно так же,иерархия отношений типа "целое – часть" ("part-of" hierarchy) описываетсложный объектили ситуациюс точки зрения еекомпонентов и отношений между ними. Несколько инаяорганизация существует в иерархии отношений типа "множество – подмножество" ("is-a" hierarchy), в которой любая категория относится кболееобщим понятиям(ее предков)иболееспециализированнымпонятиям (ее потомков). Большинство архитектур придерживается либоплоской,либо структурированнойсхемы, но выбираемые типы иерархииявляются взаимодополняющими, а не взаимоисключающими.
Второеорганизационноесвойствовключает в себястепень детализации (‘зернистости” - granularity) знаний, хранящихсяв памяти.Например, как продукционные системы, так илогика первого порядкасоставляютдовольнодетальныеформы знания. Архитектура, которая кодирует знания таким способом,должна использовать свой интерпретатор, чтобы сформировать ихдля достижениясложного поведения.
Другой вариантзаключается в храненииболеекрупнозернистыхструктур, таких какпланы имакро-операторы, которые эффективноописываютмногошаговоеповедение в единых структурахзнаний.Такой подход дает меньшую нагрузку на интерпретатор, но и обеспечивает меньшую гибкостьиобщностьв применении знаний. Структурированный форматпредлагает компромисс, описывая крупнозернистыеэлементы памятис точки зрениямелкозернистых элементов и, таким образом, давая доступ агенту к обоим видам.
Еще один организационный вопрос касается количества различных видов памяти, которые поддерживает архитектура, и их отношений друг с другом . Интеллектуальный агент требует определенной формы долговременной памяти для хранения своих общие навыков и понятий; она должна быть относительно стабильной в течение долгого времени, хотя ее может изменить с помощью инструкций и обучения. Агент также требует кратковременной памяти, которая содержит более динамичные и короткоживущие убеждения и цели. В большинстве архитектур на основе продукционных систем, эти два вида памяти структурно различны, но связаны через процесс совпадения, который сравнивает условия долгосрочных продукционных правил с краткосрочными структурами. Другие архитектуры рассматривают кратковременную память, как активную часть долгосрочного хранения, а некоторые заменяют единую кратковременную память некоторым количеством буферов для каждого специфического вида восприятия. Когнитивная архитектура может также распределять ее устойчивые знания между различными видами долгосрочной памяти, скажем, для процедурных, концептуальных и эпизодических структур, что, как представляется, и происходят у человека.
4.3. Использование знаний
Третий класссвойствкасаетсяиспользованиязнаний, хранящихсявдолгосрочной памяти. Как мы видели, оно может варьироваться отдеятельностинизкого уровня, такойкак распознавание ипринятие решений, додеятельности высокого уровня, такой как общение и отражение.Мы не можем охватить все проектные решения, которые возникают в использовании знаний, поэтому мы сосредоточимся здесь на вопросах, связанных с когнитивным поведением, которое происходит во время циклов, что, как правило, находится в центре вниманияразработчиков архитектур.
Одно из таких проектных решенийвключает в себя вопрос, основывается лирешение задачв первую очередь наэвристическом поиске в пространстве задач или на извлечении решенийили планов из долговременной памяти. Как обычно,этот вопрос неследует рассматриватькак строгуюдихотомиюв том смысле, чтосам по себе поиск в пространстве задачтребует извлечения из памяти соответствующихоператоров, но когнитивная архитектураможетпредпочестьодин подходдругому. Например,архитектуры на базе продукционныхсистемобычностроят решенияс помощьюэвристического поиска, в то время каксистемы на базе рассуждений по прецедентам извлекают решения из памяти, хотя последний способ часто необходимо адаптировать к извлекаемойструктуре, чтосамо по себе можетпотребоватьпоиска.
Когдакогнитивнаяархитектура поддерживаетмногошаговоерешение задачивывод, она может делать это разными способами.Одинподход, известный как прямой (логический) вывод, применяет соответствующиеоператоры иправила вывода к текущему состоянию задач и текущимубеждениям, чтобыпроизводитьновые состоянияи убеждения.Мы можем рассматривать прямой вывод какпродвижение от известногопсихического состоянияк какому-тоцелевому состояниюили описанию.
И наоборот,обратный вывод применяет соответствующиеоператоры иправила вывода к текущимцелям, чтобыгенерировать новыеподцели, что включает в себя продвижениеот некоторогоцелевого состоянияили описанияктекущим состояниями убеждениям.
Третий вариант, анализ "средства-цели",например [Carbonell et al., 1990; Ernst & Newell, 1969], сочетает в себеэти два подхода, путем выбора операторовчерезобратный вывод, но исполнения ихвсякий раз, когдаихпредпосылкиудовлетворены.
Чтобы прояснить этотаспект, архитектуры на основе продукционных системобычно работаютв режиме прямого вывода, в то время как язык PROLOG [Clocksin & Mellish, 1981]представляет собой хорошийпримеробратного вывода. Тем не менее,важно понимать различие между методами решения задач, которые поддерживаются непосредственно самой архитектурой и методами, которые реализуются знаниями, заявленнымив рамках этойархитектуры.
Например, поведение, присущее обратному выводу, можетвозникнуть впродукционной системе на базе прямого вывода через правила, которые дают совпадение с целямиипри исполнениидобавляютподцеливкратковременную память [например,Anderson & Lebiere, 1998]. Такое поведение, управляемое знаниями,не делаетсамуархитектуруменееприверженнойодному методуили другому.
Ученые - компьютерщикичасто делаютстрогоеразличие междупоследовательнойипараллельной обработкой, но, какправило,это указываемое разделение вводит в заблуждениев контекстекогнитивныхархитектур.Потому чтоинтеллектуальный агентсуществуетво времени, он не может избежать некоторойпоследовательной обработки, при которой должна быть предприняты некоторыекогнитивные ифизические шаги прежде, чем другие станут возможны. С другой стороны, большинство исследованийкогнитивныхархитектурпредполагает, чтоизвлечениеизструктур долговременной памятипроисходит параллельно или, по крайней мере, это происходит настолько быстро, что имеет тот жеэффект.Тем не менее, архитектуры могут изначально различаться по количествукогнитивных структур, которыеонивыбирают и применяют в каждом цикле.
Например,ранние архитектуры с продукционными системами [Newell, 1973b] находили все согласующиеся экземплярыправил в каждом цикле, но затемвыбирали толькоодно из них дляприменения. В противоположность этому некоторыеболее поздниеархитектуры, подобныеSoar [Newell, 1990], применяют все соответствующиеправила, новводятограниченияв других местах, например, в количестве целей, которыемогут быть одновременно у агента.Т.е.архитектурыотличаютсяне столько тем, поддерживают ли они последовательнуюилипараллельную обработку, но тем, где в них размещаютсяузкие места последовательной обработкиидетали этихограничений. Такие архитектуры, как ACT-R (Anderson et al., 2004),моделируюткогнитивныеузкие места, чтобы имитировать ограничения наработоспособность человека.
Учитывая, чтокогнитивнаяархитектураимеет некоторые ограниченияв ресурсах, которые требуют выборасреди альтернативныхцелей, правил или другихструктурзнаний, ей необходимспособ, как сделатьэтот выбор. Более ранние архитектуры с продукционными системамирешали этот вопросчерез процесс, известныйкакразрешение конфликтов, которыйвыбиралодно или несколькосоответствующихправилдля примененияна основе таких критериев, как новизнаихсоответствующих элементов, спецификации правил или их значения. Программы для компьютерных игр вместо этого выбирают движенияс некоторойчисловойоценочной функцией, которая сочетает характеристики прогнозируемых состояний, в то время как системы, включающие в себя рассуждения по аналогииили по прецедентам, обычновыбираютструктуры, которыенаиболее подобнынекоторойцели. И снова важноразличатьобщий механизм, которыйархитектураиспользуетдля выборасреди альтернативныхрешений илидействий, и знания, которые она использует дляреализации этой стратегии и которые могут отличаться для разных задачили изменятьсяс обучением.
Другим центральным вопросомиспользования знанийкасается отношениямеждупознанием и действием. Делиберативная (deliberative) архитектура - та, которая планируети рассуждает на основе курса действий, прежде чем начинает исполнение, в то время какреактивнаяархитектурапросто выбираетсвои действия в каждомцикле принятия решенийна основесвоего пониманиятекущей ситуации.
Делиберативная архитектура имеет преимуществавпредсказуемойсреде, но она требует точной моделиэффектов действий и заставляет агентастроитьпландля каждой новойзадачи, с которойон сталкивается. Реактивнаяархитектура имеет преимуществав динамическихи непредсказуемыхусловиях, но требует наличиязнаний об управлении длясамых разных ситуаций.Некоторые архитектуры,например, [Carbonell et al., 1990], склоняются к делиберативному варианту, потому что они выросли изисследований порешению задач ипланированию, в то время какдругие архитектуры, например, [Brooks, 1986],предпочитаютреактивное исполнение, чтобы исключить делиберативное. Обе позиции устанавливают предельные точки некоторого пространства значений, которое, в принципе, должно быть под управлениемзнаний агента, а не то, что встроено вархитектуру./ 2
/ 2Другое решениезаключается в поддержке делиберативного иреактивного управлениявотдельных модулях, как это сделано в архитектуре 3T [Bonasso et al., 1997].
Аналогичныйвопрос возникаетпо поводу отношения междувосприятием и действием [Schmidt, 1975]. Система управленияс замкнутым контуром управления (с обратной связью) получает ощущения окружающей среды в каждом цикле, давая, таким образом, агентувозможность отвечатьна последние изменения. В противоположность этому,системас открытым контуром управления (без обратной связи) осуществляетрасширенную последовательностьдействий в течение многих циклов, не занимаясь ощущениями окружающей среды.
Подходыс обратной связьючасто связывают среактивными системами, а методыбез обратной связи - с делиберативными системами, но в действительности это различные вопросы.Управлениес обратной связьюимеет преимуществобыстрого реагированиявдинамических областях, но требует постоянного контроля, чтобы не были превышеныресурсыагента в части восприятия.Поведение в системе с открытым контуром управления не требует работы с сенсорами и поддерживаетэффективное выполнение, но, по-видимому, наиболее подходиттолько длясложныхнавыков, которые требуют малого взаимодействияс окружающей средой.Опять же, этидве крайностиопределяют некоторое пространство значений, иархитектураможет использоватьзнания предметной области, чтобы определить, гдеее поведение не срабатывает, а не отдавать предпочтение одному или другому подходу.
4.4. Приобретение и совершенствование знаний
Заключительныйважный класссвойств связан с приобретениемзнаний путем инструктирования или из опыта. Хотятакие механизмыобучениямогут быть вызваны агентомнамереннои могут осуществляться в делиберативном режиме, ихвызови выполнение, как правило, рассматриваются на архитектурномуровне, хотя деталимогут сильно различаться.Одним из важных вопросовявляется то, поддерживает ли когнитивнаяархитектурамного такихмеханизмовилионаопираетсяна единственныйпроцесс обучения, который (в идеале)взаимодействуетсо знаниями и опытомдля достижениямножества различных эффектов. Например,ранние версии архитектуры ACTвключалипять различныхпроцессов обучения, в то время какранние версииSoar включалитолько один такоймеханизм.
В литературе покогнитивнымархитектурамобычноразличаютпроцессы, которые обучают совершенно новыеструктурызнаний,такие какправила продукций или планы,ите процессы, которыеточно настраивают ужесуществующие структуры, скажем, путем корректировкивесовых иличисловыхфункций.Например, архитектура Soar обучается новым правилам выбора, отверганияилипредпочтения, когдаона создаетрезультаты вподцели, в то время как архитектура ACT-R обновляет стандартные программы, связанные с правиламипродукций,на основе ихрезультатов. Архитектурныймеханизмобученияможет также исправлять существующие структуры, добавляя или удаляя компоненты. Например,ранние версииACTвключалиметоддискриминации, который добавлял условия дляправилпродукций,и методобобщения, который удалял их.
Еще одно распространенноеразличие связано с тем, является ли природа данногопроцесса обученияаналитическойилиэмпирической [Schlimmer & Langley, 1992]. Аналитическиеметоды опираются нату или иную формурассужденийоб опытеобученияс точки зрения знаний, доступных агенту.В противоположность этому,эмпирическиеметоды основываются наиндуктивныхоперациях, которые преобразуют опытв полезные знания, основываясь навыявленныхзакономерностях. В общем случаеаналитическиеметоды имеют болеепояснительный оттенок, а эмпирическиеметоды - болееописательный характер.На самом деле это не противоположные значения, а некоторое пространство значений, вкотором критическойпеременной являетсяобъем обработки, основанной на знаниях, которую выполняет обучаемый. Конечно, архитектуры могут использоватьгибридныеметоды, которые включают идеи из обоих подходов, и они могут такжеобъединять ихс помощью различных механизмовобучения. Например, архитектура PRODIGYиспользуетаналитический методдля построенияновых правил иэмпирическийметод для оцениванияих полезностипосле полученияопыта работы с ними.
Еще один вопрос касается того, работают лимеханизмыобученияархитектурыв “жадном” (eager) или “ленивом” (lazy) режиме. Большинство архитектур использует “жадный” подход, который формирует обобщенныеструктурызнанийиз опытаво время ввода последнего в память. Интерпретатор можетзатем обработатьполученные в результате опыта обобщенныеправила, планы или другие структуры знаний бездальнейшего преобразования. Хорошими примерамитакого подхода являются методы для правилиндукции истроительствамакро-оператора.Тем не менее,некоторые архитектуры используют “ленивый” подход [Aha, 1997], который сохраняетданные опыта впамяти без их преобразования, затем выполняетнеявноеобобщениев моментизвлеченияи использования. Важнымипримерами такого подходаявляются методы, основанные на аналогияхи прецедентах, например, [Veloso & Carbonell, 1993].
Заключительноесвойство связано с тем, происходит лиобучение инкрементным или неинкрементнымобразом.Инкрементныеметодывключаютобучающие примерыпо одному за один момент времени, сограниченным объемом памятидляпредыдущих примеров,и обновляют своибазы знанийпосле обработки каждогоопыта. В противоположность этому,неинкрементныеметодыобрабатывают все обучающие примеры за один шаг, который исполняется в процедуре пакетной обработки. Посколькуагентысуществуютво времени, они накапливаютопыт непрерывно, и их механизмыобучениядолжны иметь дело сэтим ограничением. Инкрементныеметоды обеспечиваютестественную реакцию, но порядок представления знаний можетвлиять на их поведение [Langley, 1995b]. Неинкрементыеподходыустраняют этот недостаток, но только за счетхранения ипереработки результатов всех опытов. Большинствоисследованийархитектур использует инкрементый подходк обучению, хотя остается место и для гибридныхметодов, которые работают с ограниченнымиподмножествами результатов опытов, например, [Pearson & Laird, 1999].
5. Критерии оценки когнитивных архитектур
Как и в любойнаучной теорииили техническом изделии, когнитивныеархитектуры требуютоценки.Однако, посколькуисследованиеархитектур происходит на уровнесистем, это вызываетбольше проблем, чем при оценкеструктур иметодов компонентовзнаний. В этом разделемы рассмотрим некоторые измерения, по которым можнооценитькогнитивныеархитектуры.В общем случае они включают в себя определение шкалы, что предполагает использованиеколичественных измерителей, а не тестов типа “всеили ничего”.ЛэнглииМессина [Langley and Messina (2004)]обсуждают дополнительныевопросы, которые возникаютпри оценкеинтегрированныхинтеллектуальных систем.
Напомним, что способность объяснятьпсихологические феноменыявляется важным измерением, по которому оцениваютархитектуры.Например, впоследние годы исследованияв рамках рядаархитектур [Anderson et al., 2004]; [Sun et al., 2001] подчеркнули совпадение с данными (о чувстве времении ошибках - timing and error data)из детальных психологических экспериментов, но нена это сейчас обращено наше внимание. Не менее важно продемонстрировать, что любая архитектура поддерживаеттакую же качественнуюнадежность, которую показывают люди. Критерии, которые мы обсудим вэтом разделе, основанынепосредственно натаких качественныхаспектах человеческого поведения, даже когдасистема можетпроизводитьих с помощьюсовершенно разныхсредств.
Когнитивныеархитектуры такжеобеспечивают различныйподход к построениюинтегрированныхинтеллектуальных систем. Обычные правила разработки программного обеспечения заключаются в том, чтонужноразрабатывать независимыемодули, которые имеют минимальное взаимодействие. В противоположность этомукогнитивнаяархитектурапредлагаетединую теориюпознания [Newell, 1990] с тесно связанными модулями, поддерживающими синергетические эффекты. Тем не менее,заявления осинергиивкогнитивныхсистемахтрудно проверитьэмпирически/3, так что здесь мысосредоточимся на другихкритериях, которые непосредственно связаны с функциональностью.
/3 ЛэнглииЧой(2006a) представляют качественныеаргументы, что их архитектура ICARUS выигрывает отвзаимодействия между ее модулями, но даже доказательствтакого рода не достаточно.
5.1. Общность, универсальность и разносторонность
Напомним, чтокогнитивныеархитектурыпредназначены для поддержкиобщего интеллектуального поведения. Таким образом,общность – это ключевое измерение, по которому оценивают архитектуру-кандидата. Мы можем измеритьобщностьархитектуры, используя еедля построенияинтеллектуальных систем, которые предназначены для широкогонабора задачи окружающих условий, а затем тестируяее поведениевэтих областях.Чем больше окружений, в которыхархитектураподдерживаетразумное поведение, и чем шире диапазонэтих окружений, тем выше ее общность.
Однако, демонстрирование общностиархитектурыможет требовать больше илименьше усилийсо стороныразработчикасистемы.Для каждой областиможно было бы реализовать новую систему в кодах низкоуровневого программирования, которая обеспечивала бы несколькотеоретическихобязательств илимеханизмов высокого уровня, но этот подход занял бы слишком много времени. Мы можем определитьуниверсальность какой-либо когнитивнойархитектурыс точки зрениятрудностей, с которыми сталкиваютсяпри построенииинтеллектуальных систем для заданных наборовзадачи окружений. Чем меньшеусилий надо приложить,чтобы заставитьархитектурупроизводитьинтеллектуальное поведениев этихокружениях, тем больше ее универсальность.
Общностьи универсальностьсвязаны стретьимпонятием -разносторонностью архитектуры, которое признает, что долгосрочное знание - неединственный фактор, определяющийповедениеагентав какой-либо предметной области. Короче говоря,это касается способности архитектуры выполнять различные задачив ответ нацелиили другие внешниекоманды отчеловекаилидругого агента.Чем большезадачможет выполнятьархитектура в ответ на такиекомандыи чем большеих разнообразие, тем больше ее разносторонность. Она в свою очередьможет влиять наобщностьи универсальность, так как можетпозволять архитектуре охватывать более широкийкруг задачс меньшими усилиямисо стороныразработчика.
5.2. Рациональность и оптимальность
Мы обычно считаем агента интеллектуальным, когда его поведение следует некоторым причинам, что делает рациональность архитектуры другим важным измерением для его оценивания. Мы можем измерить рациональность архитектуры, проверяя соотношение его целей, знаний и действий. Например, Newell (1982) заявляет, ‘‘Если у агента есть знание, что одно из его действий приведет к одной из его целей, то тогда агент выберет это действие”. Так как архитектура принимает много решений относительно действия в течение долгого времени, мы можем оценить этот смысл рациональности, отмечая процент времени, когда ее поведение удовлетворяет этому критерию.
Обратите внимание на то, что такое понятие рациональности не занимает никакой позиции в вопросе о том, как сделать выбормежду многократными действиями, которыеимеют отношение кцелямагента. Один из ответов наэтот вопросисходит отАндерсона (1991), который заявляет: '' когнитивная системаоптимизируетадаптациюповедения организма". Понятие оптимальностьпредполагаетнекоторуючисловуюфункцию в пространстве поведений, причем оптимальным поведением является то, которое дает лучшее значение этой функции. Хотя оптимальность является критерием типа “все-или-ничего”, мы можем измерить степень приближения архитектуры к оптимальности, отмечая процент времени, когда ее поведение оптимально во многих циклах принятия решения, или соотношение фактического иоптимального значения, которое достигается в среднем повремени.
ОднакоСаймон(1957) утверждал, что, посколькуинтеллектуальные агентыимеют ограниченныекогнитивныересурсы, понятие ограниченной рациональностиподходит больше для характеристикиих поведения, чемоптимальность.С его точки зренияагент имеет ограниченную рациональность, если он ведет себя так, что его поведение почтиоптимальнопо отношению к его целям, насколько это позволяют его ресурсы. Мы можем измерятьстепень, в которойкогнитивнаяархитектура проявляет ограниченную рациональность,тем же способом, что и для оптимальности, при условии, что мы можем включитьнекоторую меруресурсов, которые имеются в наличии длякаждого решения.
5.3. Эффективность и масштабируемость
Посколькукогнитивныеархитектурыдолжны использоватьсяна практике, они должны быть в состояниивыполнять задачив условиях определенныхвременных и пространственныхограничений.Таким образом, эффективностьявляется дургойважной метрикойдля использованияпри оцениванииархитектуры. Мы можем измерятьэффективностьв количественном выражении, как времяипространство, необходимоесистеме, или с точки зрения “все-или-ничего”, основанной натом, удовлетворяет лисистемажесткимограничениям повремени и пространству, как при работе в системах реального времени. Мы также можемизмерятьэффективностьлибона уровнецикла “распознавание-действие” архитектуры либона уровнеполныхзадач, которые могутдатьочень разные результаты.
Однако, посколькуархитектурыдолжен обрабатыватьзадачии ситуацииразличной сложности, мы также хотим знать ихмасштабируемость.Эта метрикатесно связана спонятиемсложности,используемымв формальноманализе алгоритмов. Таким образом,мы можем измерятьпространственную и временнуюэффективностьархитектурыс точки зрениятого, как на нихвлияют трудность задач, неопределенность окружающей среды, длительность работыи другиеосложняющие факторы. Мы можем исследоватьпрофильсложностиархитектурыв некотором диапазоне задач иколичествазнаний. Чем меньшее влияние на эффективностьархитектурыоказывают эти факторы, тем выше ее масштабируемость.
Особый случаймасштабируемости, привлекающий значительное внимание,возникает у когнитивныхархитектур, которые обучаются в течение долгого времени. По мере того, какмеханизмыобучениядобавляютзнания вихдолговременную память, многие такиесистемы работают все медленнеев частиповедения, связанного с решением задач, так как они имеютбольше альтернатив, из которых можно выбирать.Эта проблемаполезности (utility problem) [Minton, 1990]возникала вразличных архитектурах, которые используют разнообразныеформализмы представления занийи механизмы ихизвлечения. Созданиеархитектур,более масштабируемыхпо отношению к такому нарастаниюзнаний,остается открытымвопросом для исследования.
5.4. Реактивность и живучесть
Многиекогнитивныеархитектурынаправлены на поддержкуагентов, работающих во внешних средах, которые могут изменяться непредсказуемым образом. Таким образом,способность реагироватьна такие изменения является еще одним измерением для оценивания архитектур-кандидатов. Мы можем измерятьреактивностьархитектурыс точки зрения той скорости, с которойонареагируетна неожиданные ситуацииили события, или с точки зрениявероятности того, чтоона будет реагировать во время данногоцикла “распознавание-действие”.Чем быстрее реагирует архитектураили чем большеее шансы на реагирование, тем больше еереактивность. /4
Конечно,это определение должно учитыватьсвязь междуокружающей средой имодельюагентаэтой среды. Если эта модель предсказываетточното, что происходит, то реактивностьстановитсяменее важной проблемой. Но еслисреда являетсянеопределенной, или если агентимеет слабуюмодель, тореактивностьприобретает решающее значениедлядостижения целейагента.Альтернативныекогнитивныеархитектуры могутзанимать различные позиции в этомспектре, и мы должны понять ихпозициипри оцениванииихреактивности.
Вопрос, связанный с реактивностью, который получил значительное внимание,известен какпроблема фреймов(frame problem) [McCarthy, 1963]. Она возникает влюбой динамическойсреде, гдеагент должен поддерживатьсвоюмодель мирав соответствии ссамим миром, несмотря на неспособностьагента ощущать этот мир во всей его полноте. Даже тогда, когдасамо по себе обнаружениеизменений в окружающей среде не составляет труда, распространение влияния этих измененийна знания, цели идействияможет быть трудным. Усилия многих исследователей направлены на решение проблемы фреймов, но сделатьархитектурыболее надежными в этом направлении – это открытаяобластьисследований.
Несмотря на важностьреактивности, следует отметить, что во многих контекстахживучестьне менее важна. Архитектура, которая всегда немедленно реагирует намалыеизменения окружающей среды,может терять из вида свои долгосрочныецелии бесцельно колебатьсяот одноговида деятельности к другому. Мы можем измерять живучесть как определенный уровень, докоторогоархитектурапродолжаетследовать своимцелям, несмотря на изменения в окружающей среде.Реактивность и живучесть – это не противоположности, какими они могут показатьсяна первый взгляд.Агент можетреагировать накраткосрочные изменения, все еще продолжая следоватьсвоимдолгосрочным целям.
/4 Понятие “способность прерываний” (interruptability)тесно связано среактивностью, но в первую очередь связаносархитектурами, осуществляющими рассуждения или следующимиявнымпланам, которые могут быть прерваны, когда происходят неожиданные события.
5.5. Способность к совершенствованию
Мы ожидаем, чтоинтеллектуальные агентыдолжны улучшать свое поведениес течением времени.Одно из средствдостижения этой целиподразумевает непосредственноедобавлениезнанийпрограммистомили пользователемсистемы.Ключевой вопросздесьне в том,возможны ли такие дополнения, а насколько эффективно они улучшаютповедениеагента.Таким образом,мы можем измерятьспособность к совершенствованиюопределенного типа архитектурс точки зрения способностиагентавыполнятьзадачи, с которымион не могсправиться до этого добавлениязнаний.Более конкретно,мы можем измерятьскорость, с которойпроизводительностьповышается, как функцию отвремени, затраченногопрограммистом, так как некоторые архитектурымогут требоватьменьше усилий для улучшения, чем другие.
Другойпуть улучшения включает в себя обучение агента на основе его опыта взаимодействия с окружающей средойилис его собственнымивнутренними процессами. Мы можем измерять способность архитектуры к обучению таким же способом, как и при добавлениизнания– в терминах ееспособности выполнятьновые задачи. Так каккогнитивныеагентысуществуютв течение долгого времени, это означает измерение улучшения их производительности как функцию опыта.Таким образом, этот метод,обычно используемыйв области машинного обучения путем отдельной тренировки на прецедентах, здесьне имеет смысла, и мы должны вместо этого собиратькривые обучения, которые вычерчивают график зависимости производительности от опыта при удаленной настройке.
Следует отметить, чторазличные формыобучения фокусируются наразличных типахзнаний, поэтому нельзя ожидать, что данныймеханизм будет улучшатьповеденияна всех направлениях. Например, некоторыепроцессы обученияпредназначены для улучшенияспособностиагентаточно распознавать объектыили ситуации, другие сосредоточены наприобретении новыхнавыков, а третьистремятся сделатьэти навыки более эффективными. Чтобы оценивать способностьархитектурык обучению для различных типов знаний, мы должны использоватьразные тесты, хотя можно было бы ожидать, чтовсесторонняяархитектура проходит все эти тесты.
Посколькуобучение основанона опыте сконкретными объектамиили событиями, оцениваниеобобщения, передачи и многократного использования получаемых знанийтакже критически важно. Мы хотим, чтобы обучение включало в себябольше, чем запоминание конкретных опытных состояний, хотя такаяэпизодическая память также используется. Можноопределять степеньобобщенияи передачи, подвергая агента воздействию ситуаций изадач, которые по-разному отличаются от егопредыдущего опыта,и измеряя егопроизводительность для них. Опять же,ключевымивопросами являются скорость обученияили количествополученных знаний, которое необходимо, чтобы архитектура поддерживалажелаемое поведение.
5.6. Автономность и длительность работы
Хотя нам нужны интеллектуальные агенты, которые могут следоватьинструкциям, иногда мы такжеожидаем, чтобы ониработалисами по себев течение длительного периода. С этой цельюархитектуры, которые их поддерживают, должны быть в состоянии создаватьсвои собственныецели и задачи. Кроме того, они должны быть достаточно надежными, чтобы сохранять безотказную работу при столкновении с неожиданнымиситуациями,и не допускать замедления работы по мере накопленияопытав течение длительных периодоввремени.Другими словами,надежнаяархитектура должна обеспечиватькак автономность, так идлительную работу.
Можно измерять поддержку архитектурой автономии, представляя агентам задачи высокого уровня, которые требуют автономного принятия решений для достижения успеха и которые получают выгоду от знаний о предметной области. Например, можно снабдить агента способностью запрашивать инструкции, когда он не знает, как поступить, а затем измерить частоту обращений за помощью как функцию от его знаний. Можно измерять связанную с этим способность к длительной работе, помещая агента в открытые среды, такие как моделируемая межпланетная экспедиция, и отмечая, как долго, в среднем, он работает до полного отказа или попадания в неактивное состояние. Можно также измерять эффективность агента как функцию времени его работы в этой области, чтобы определить, хорош ли он по этому измерению.
6. Открытые вопросы в когнитивных архитектурах
Несмотря на наличие многих концептуальных достижений в течение трех десятилетий исследований в области когнитивных архитектур, а также, несмотря на практическое применение для реальных проблем, которое прошли некоторые архитектуры, остается значительной необходимость дополнительной работы по этой важной теме. В этом разделе мы отметим некоторые нерешенные вопросы, которые заслуживают внимания исследователей в этой области.
Наиболее очевидной ареной для улучшения является введение новых способностей. Существующие архитектуры демонстрируют многие из способностей, описанных в разделе 3, но немногие поддерживают их все, и даже они достигают определенных функциональностей только при значительных усилиях программистов.
Некоторый прогресс был достигнут в архитектурах, которые сочетают делиберативное решение задач с реактивным управлением, но нужно больше усилий по унификации с рядом других направлений: - Большинство архитектур делают упор на генерацию решений задач или исполнение действий, но категоризация и понимание также являются критически важными аспектами познания и необходимо увеличить внимание к этим способностям. - Фокусирование на решении задач и процедурных навыках отвлекает внимание от эпизодических знаний. Необходимо больше исследований архитектур, которые прямо поддерживают как эпизодическую память, так и рефлективные процессы, действующие на структурах, которые ее содержат. - Большинство архитектур уделяют особое внимание логике или тесно связанным с ней формализмам представления знаний, в то время как люди, по-видимому, используют также зрительные, слуховые, схематичные и другие специализированные схемы представления. Нужны расширенные архитектуры, которые могут кодировать знания в различных формализмах, связывать их друг с другом и использовать их для поддержки интеллектуального поведения более гибко и эффективно. - Хотя в рамках некоторых архитектур была продемонстрирована обработка естественного языка, немногие интеллектуальные системы объединили ее со способностью общаться по поводу своих решений, планов и других когнитивных действий общепринятым способом. - Физические агенты имеют ограниченные ресурсы для восприятия мира и влияния на него, но лишь немногие архитектуры заняты решением этого вопроса. Нужны расширенные архитектуры, которые управляли бы ресурсами агента, чтобы выборочно сосредотачивать его внимание на восприятии, его эффекторах и задачах, которые он преследует. - Хотя многие архитектуры взаимодействуют со сложной окружающей средой, они редко заняты взаимодействиями между телом и разумом, которые возникают в связи с реальным воплощением. Например, необходимо исследовать способ, которым физическое тело воздействует на мышление, и рассмотреть происхождение первичных целей агентов с точки зрения внутренних мотивов. - Эмоции играют центральную роль в поведении человека, но лишь несколько систем предлагают какой-либо учет своих целей или механизмов. Нужны новые архитектуры, проявляющие эмоции такими способами, которые связаны непосредственно с другими когнитивными процессами и которые модулируют интеллектуально поведение. - С технической точки зрения, архитектуры интересны, если они облегчают разработку интеллектуальных агентов через их повторное использование, но необходимо исследовать, как этого лучше достигать - через специализированные функциональные способности, которые используются повторно или через повторно используемые знания, которые поддерживают многие задачи. Архитектуры, которые демонстрируют эти новые способности, будут поддерживать более широкий класс интеллектуальных систем, чем те, для которых этот вопрос еще не удалось разработать. Необходимо также дополнительное исследование на структурах и процессах, которые поддерживают такие способности.
Существующие когнитивные архитектуры включают многие из основных свойств, которые мы описали в разделе 4, но ряд вопросов остается еще нерешенным: - Некоторые структуры представления знаний - продукционные системы и планы - доминировали в архитектурных исследованиях. Чтобы исследовать это пространство архитектур более полно, необходимо также рассмотреть проекты, которые построены на других структурах представления знаний, подобных фреймам (Minsky, 1975), базам прецедентов (Aamodt & Plaza, 1994), описательным логикам (Nardi & Brachman, 2002) и вероятностным формализмам (Richardson & Domingos, 2006).
Многие архитектуры занимают только одну позицию в свойствах, связанных с использованием знаний, но это не является единственной альтернативой. Необходимо также исследовать архитектуры, которые динамически меняют свое местоположение в заданном спектре (например, делиберативное поведение на реактивное) на основе их ситуации.
- Большинство архитектур включает в себя некоторую форму обучения, но ни одна из них не показала того богатства улучшения, которое демонстрируют люди. Нужны более надежные и гибкие механизмы обучения, которые предназначены для продолжительной работы в сложных, незнакомых областях, и которые построены с учетом накапливаемых результатов предыдущего обучения в течение длительных периодов времени. Эти дополнительные структуры и процессы должны как увеличить наше понимание пространства когнитивных архитектур, так и предоставить способности, которые не доступны в данный момент.
Исследовательское сообщество должно также уделять более серьезное внимание методам вдумчивого оценивания когнитивных архитектур. Метрики, подобные тем, которые предложены в Разделе 5, являются необходимым, но недостаточным условием, чтобы научно понять соотношение свойств архитектур и способностей, которые они поддерживают. Кроме того, необходимо определить или создать сложные среды, как физические, так и смоделированные, чтобы проверять эти способности и предоставлять реальные возможности для их измерения.
Также необходим экспериментальный метод, который признает тот факт, что когнитивные архитектуры включают в себя интеграцию многих компонентов, которые могут иметь синергетические эффекты, а не состоят из независимых, но не связанных между собой модулей (Langley & Messina, 2004). Экспериментальные сравнения архитектур играют важную роль, но в них следует тщательно контролировать задачи, которые выполняются, и количество знаний, которое закодировано, и они должны измерять зависимые переменные объективными и информативными способами.
Систематические эксперименты, которые предназначены для выявления источников мощи когнитивных архитектур, скажут нам гораздо больше об их природе, чем упрощенные соревнования.
Нам надо еще много пройти в данной области, прежде чем мы в полной мере поймем пространство когнитивных архитектур и тех принципов, которые лежат в основе их успешной разработки и использования. Тем не менее, теперь у нас есть опыт более чем двух десятилетий построения и использования множества таких архитектур для широкого круга задач, наряду с целым рядом проблем, которые возникли в этой гонке. Если пейзаж, обнаруженный на этих первоначальных шагах, чем-то показателен, дальнейшее путешествие обещает еще более интересные и интригующие места и достопримечательности.
Приложение. Представительные когнитивные архитектуры
Многие исследователи предлагали и изучали когнитивные архитектуры за последние три десятилетия. Некоторые из них были только мысленными экспериментами, другие были реализованы и использованы в качестве инструментов людьми во многих учреждениях. Здесь мы кратко рассмотрим ряд архитектур, которые описаны в литературе. Мы не пытались представить исчерпывающее описание, но этот набор должен дать читателям представление о большом разнообразии исследований в этой области.
- ACT-R [Anderson, 2007; Anderson et al., 2004], самый последний экземпляр семейства архитектур ACT, включает декларативную память для фактов и процедурную память, содержащую правила продукций. Архитектура работает путем сопоставления продукций с восприятиями и фактами, передаваемыми вещественными уровнями активации объектов, и их исполнения для воздействия на окружающую среду или изменения декларативной памяти. Обучение в ACT-R включает в себя создание новых фактов и продукций, а также обновление базовых активаций и стандартных программ, связанных с этими структурами.
- АрхитектураAIS [Hayes-Roth, Pfleger, Lalanda, Morignot, & Balabanovic, 1995] хранит процедурные знания в виде набора поведений, каждое со связанными условиями запуска, и планов управления, которые задают временные закономерности шагов плана. Они согласуются, изменяются и взаимодействуют через декларативную память, которая хранит фактические знания, намерения-деятельности и следы опыта агента. Во время каждого цикла мета-контроллер оценивает разрешенные поведения и выбирает, какие из них исполнить. Архитектура включает делиберативный когнитивный слой, который отвечает за оценивание ситуаций и планирование, и более быстрый физический слой, который обрабатывает восприятие и действия в окружающей среде.
- АрхитектураAPEX [Freed, 1998] организует знания в иерархические процедуры, причем элементы более высокого уровня индексируются по задаче, которой они адресованы, и ссылаются на подзадачи, которые они вызывают. Они согласуются с содержимым памяти восприятий с помощью процесса выбора, добавляющего задачи в повестку дня. Архитектура связана с когнитивными, воспринимающими и двигательными ресурсами; это может приводить к конфликтам между задачами в повестке дня, который система разрешает, выбирая задачи с наивысшим приоритетом. Это может приводить к прерыванию задач и последующему их возобновлению, когда ресурсы становятся доступными.
- Архитектура CIRCA [Musliner, Goldman, & Pelican, 2001] включает в себя статическую память для возможных действий, переходов, зависящих от времени и событий, а также динамическую память для конкретных планов и событий. Когнитивная подсистема генерирует планируемый курс действий, закодированный как граф недетерминированных конечных состояний, начиная сначала с абстрактного плана и улучшая его при необходимости. Архитектура передает эту структуру в подсистему, работающую в режиме реального времени, которая работает параллельно с когнитивной подсистемой, позволяя первой выполнять план, а второй пытаться его улучшить.
- Архитектура CLARION [Sun et al., 2001] хранит знания, как связанные с действиями, так и не связанные с ними, в неявном виде, используя многослойные нейронные сети, и в явном виде, используя символические правила продукций. Соответствующая краткосрочная память содержит активации в узлах и символические элементы, которые архитектура согласует с долгосрочными структурами. Поведение системы включает прохождение сенсорной информации в неявный слой, который генерирует альтернативные действия с высоким значением, и в явный слой, который использует правила, чтобы предлагать действия; затем архитектура выбирает кандидата с наивысшим ожидаемым значением. Обучение включает в себя пересмотр весовых коэффициентов в неявной системе путем использования комбинации обучения с подкреплением и метода обратного распространения ошибки для оценки функций значений и конструирования правил продукций путем извлечения из неявного слоя, управляемого ошибками исправления и конкретизации шаблонов правил.
- CogAff [Sloman, 2001] является архитектурной схемой или структурой, разработанной, чтобы поддержать взаимодействие между познанием и эмоциями. Хотя она не обязывает к конкретным представлениям, она постулирует три различных уровня обработки. Реактивный уровень использует ассоциации “условие-действие”, которые реагируют на непосредственные ситуации в окружающей среде. Делиберативный слой работает с ментальными целями, состояниями и планами, формируя рассуждения о будущих сценариях. Наконец, механизмы метауправления позволяют агенту думать о его собственных мыслях и переживаниях. Эмоциональный опыт связан с прерыванием некоторых слоев другими слоями с более сложными эмоциями, происходящими на более высоких уровнях.
- Архитектура Emile [Gratch, 2000] обеспечивает учет эмоций и их влияния на поведение. Долгосрочные знания включают в себя Strips-операторы для использования при генерации планов и фреймов связи (construal frames), которые определяют условия (касающиеся событий, ожиданий, целей и стандартов) для выявления различных эмоций. По мере того, как агент приобретает новую информацию об ожидаемых событиях, модуль оценивания генерирует в ответ эмоции с начальной интенсивностью, являющейся функцией их вероятности и важности, но убывающей со временем. Собственные эмоции агента фокусируются на усилиях модуля планирования и выбора действия из набора предубеждений, в то время как выводы об эмоциях других агентов направляют выбор его диалогов.
- The Entropy Reduction Engine (ERE) [Drummond, Bresina, & Kedar, 1991] включает долгосрочную память для операторов предметной области, описывающих последствия действий, область и ограничения поведения, а также правил управления, зависящих от ситуации, которые предлагают меры для достижения целей, и правил редукции энтропии, которые производят декомпозицию сложных задач на более простые. Архитектура использует свои операторы и ограничения, чтобы производить временные прогнозы, компилируемые затем в правила управления, которые интерпретатор “распознавание-действие” использует, чтобы определить, какое действие надо выполнить. К процессу прогнозирования добавлен модуль редукции задач, который использует правила декомпозиции, чтобы ограничить его поиск. Успешные результаты прогнозирования принуждают систему обучаться новым правилам управления, тогда как неудачи прогнозирования приводят к исправлению операторов и ограничений предметной области.
- Архитектура EPIC [Meyer & Kieras, 1997] кодирует долгосрочные знания в виде продукционных правил, организованных как методы выполнения целей, которые совпадают с элементами множества краткосрочных видов памяти, включая визуальные, слуховые и тактильные буферы. Работа заключается в выборе совпадающих правил и их применении, чтобы параллельно двигать глазами, управлять руками или изменять содержимое памяти.
Исследования архитектуры EPIC включали сильный акцент на достижение количественных совпадений с человеческим поведением, особенно в задачах, которые включают в себя взаимодействие со сложными устройствами.
- АрхитектураFORR [Epstein, 1992] включает в себя декларативную память для фактов и процедурную память, представленную как иерархия эвристики с весовыми коэффициентами. Эта архитектура согласовывает восприятия и факты с условиями эвристики, причем при совпадении структур предлагаются действия - кандидаты и оценивается их рейтинг. Исполнение влияет на окружающую среду или изменяет содержимое декларативной памяти. Обучение включает в себя создание новых фактов и эвристики, корректировку весовых коэффициентов и реструктурирование иерархии, основанное на фактах и метаэвристике для учета точности, полезности, риска и скорости.
- Архитектура GLAIR [Shapiro & Ismail, 2003] хранит содержимое на уровне знаний или когнитивном уровне, на чувственно-двигательном уровне и на сенсорно-приводном уровне. Самый верхний слой включает обобщенные структуры, которые определяют предикаты в логических терминах, предельно упрощая абстрактные понятия, а также процедуры в виде особенностей восприятия и стандартных программ поведения в среднем слое. Система поддерживает вывод, пересмотр убеждений, планирование, исполнение и обработку естественного языка, производя вывод убеждений высокого уровня из восприятий и формируя команды на сенсорно-приводном уровне из целей и планов агента.
- АрхитектураICARUS [Langley & Choi, 2006a; Langley et al., 2004], обеспечивает представление долгосрочных знаний в раздельных участках памяти для иерархических навыков и понятий, причем краткосрочные убеждения, цели и намерения хранятся как экземпляры этих общих структур. Исполнительный элемент сначала выводит все убеждения, подразумеваемые его понятиями и его восприятиями окружающей среды, затем выбирает применимый путь через иерархию навыков, чтобы их выполнить. Когда никакие навыки, относящиеся к текущей цели, не применимы, происходит решение задач методом анализа "средства-цели", тогда как обучение создает новые навыки, основанные на следах успешного решения задач.
- PolyScheme [Cassimatis, Trafton, Bugajska, & Schultz, 2004] является когнитивной архитектурой, направленной на достижение интеллекта человеческого уровня путем интеграции многих представлений, методов рассуждений и методов решения задач. У каждого представления есть связанный с ним модуль специалиста, который поддерживает прямой вывод, формирование подцелей и другие основные операции, которые согласуются с разделяемой динамической памятью с элементами, основанными на восприятии и действии. Архитектура PolyScheme берет на себя более сильные семантические обязательства, чем большая часть архитектур, кодируя все структуры с помощью базового набора отношений, касающихся времени, пространства, событий, идентичности, причинно-следственых связей и убеждений.
- АрхитектураPRODIGY [Carbonell et al., 1990] кодирует два вида долгосрочных структур – операторы предметной области, которые описывают последствия действий, и правила управления, которые определяют, когда система должна выбрать, отклонить или предпочесть заданный оператор, связь, состояние или цель. Краткосрочные структуры включают описания состояний и содержание стека целей. Решение задач включает анализ “средства-цели”, который неоднократно выбирает оператор, чтобы уменьшить различия между текущей целью и состоянием, пока не найдет последовательность, которая достигает цели верхнего уровня. Модуль обучения на основе объяснения анализирует следы решения задач и создает новые правила выбора, отклонения и предпочтения, чтобы уменьшить поиск в будущих задачах. Другие модули управляют поиском по аналогии с более ранними решениями, узнают описания оператора из экспериментов и обучаются повышению качества решений.
- PRS (Procedural Reasoning System) [Ingrand, Georgeff, & Rao, 1992] была ранней архитектурой, разработанной в парадигме BDI Намерения-Желания-Убеждения (Beliefs–Desires–Intentions). Эта структура хранит иерархические процедуры с условиями, эффектами и предписанными шагами, которые вызывают подпроцедуры. Динамические структуры включают в себя убеждения об окружающей среде, желания, которые агент хочет достигнуть, и намерения, которые агент планирует выполнить. В каждом цикле PRS решает, продолжить ли исполнять ее текущее намерение или выбрать новое намерение, которому необходимо следовать.
- Архитектура Remote Agent [Pell et al., 1997] была разработана для управления автономным, ориентированным на задания космическим кораблем. Долгосрочные структуры включают в себя цели задания, возможные действия и ограничения на их исполнение, а также качественные модели компонентов космического корабля, тогда как динамические структуры включают в себя планы действий, которым надо следовать, графики их выполнения и выводы о режимах работы или сбоев. Эта архитектура включает в себя процессы, которые производят поиск целей высокого уровня, генерируют планы и графики их достижения, исполняют эти графики путем вызова команд низкого уровня, контролируют режимы работы каждого компонента космического корабля и восстанавливают работу в случае сбоя.
- RCS [Albus et al., 1992] является структурой архитектур для разработки интеллектуальных физических агентов. Экспертные знания размещаются в иерархическом наборе модулей знаний, причем каждый имеет свою собственную долгосрочную и краткосрочную память. Представление знаний является неоднородным, включая фреймы, правила, изображения и карты. Модули работают параллельно, причем сенсорный интерпретатор проверяет текущее состояние, модель мира прогнозирует будущие состояния, модуль оценки значений производит выбор среди альтернатив, а модуль генерации поведения исполняет задачи. Модули более высокого уровня оказывают влияние сверху вниз на нижерасположенные модули, тогда как нижестоящие модули передают информацию назад своим родительским модулям.
- АрхитектураSoar [Laird et al., 1987; Newell, 1990] кодирует процедурную долгосрочную память в виде правил продукций, тогда как рабочая память содержит множество элементов с атрибутами и значениями. Исполнительная система согласовывает продукции с элементами в рабочей памяти и автоматически генерирует подцели, когда она не может продолжать свою работу. Когда обработка в подцели позволяет агенту преодолеть этот тупик, архитектура добавляет новую порцию (chunk) в долгосрочную память, которая суммирует обработку подцели. В недавних версиях эпизодическое и семантическое обучение сохраняет элементы рабочей памяти как структуры долгосрочной памяти, в то время как обучение с подкреплением изменяет весовые коэффициенты, связанные с правилами, которые выбирают операторы.
- Архитектура3T [Bonasso et al., 1997] хранит долгосрочное знание в трех слоях или рядах (tiers). Самый низкий уровень состоит из чувственно-двигательных поведений, которые эта архитектура выполняет реактивным образом, тогда как средний слой хранит пакеты реактивных действий (Firby, 1994), которые задают последовательность этих поведений. Самый верхний слой содержит абстрактные операторы, которые использует делиберативный планировщик, чтобы генерировать частный план, который средний слой преобразует в последовательность действий и исполняет. В дополнение к этому плану высокого уровня, каждый навык и пакет реактивных действий имеет свою собственную краткосрочную память. Предшественник архитектуры 3T архитектура ATLANTIS (Gat, 1991), организовывала свои знания и поведение очень похожим образом.
Литература - References
Aamodt, A., & Plaza, E. (1994). Case-based reasoning: Foundational issues, methodological variations, and system approaches. AI Communications, 7, 39–59. (pdf)
Aha, D. W. (1997). Lazy learning. Dordrecht, Germany: Kluwer.
Albus, J. S., Pape, C. L., Robinson, I. N., Chiueh, T.-C., McAulay, A. D., Pao, Y.-H., et al. (1992). RCS: A reference model for intelligent control. IEEE Computer, 25, 56–79.
Ali, S. S., & Shapiro, S. C. (1993). Natural language processing using a propositional semantic network with structured variables. Minds and Machines, 3, 421–451.
Anderson, J. R. (1991). Cognitive architectures in a rational analysis. In K. VanLehn (Ed.), Architectures for intelligence. Hillsdale, NJ: Lawrence Erlbaum.
Anderson, J. R. (2007). How can the human mind exist in the physical universe? New York: Oxford University Press.
Anderson, J. R., Bothell, D., Byrne, M. D., Douglass, S., Lebiere, C., & Qin, Y. (2004). An integrated theory of the mind. Psychological Review, 111, 1036–1060.
Anderson, J. R., & Lebiere, C. (1998). The atomic components of thought. Mahwah, NJ: Lawrence Erlbaum.
Bonasso, R. P., Firby, R. J., Gat, E., Kortenkamp, D., Miller, D., & Slack, M. (1997). Experiences with an architecture for intelligent, reactive agents. Journal of Experimental and Theoretical Artificial Intelligence, 9, 237–256.
Brooks,R.A. (1986).A robust layered control system fora mobile robot. IEEE Journal of Robotics and Automation, RA-2, 14–23.
Carbonell, J. G., Knoblock, C. A., & Minton, S. (1990). PRODIGY: An integrated architecture for planning and learning. In K. Van Lehn (Ed.), Architectures for intelligence. Hillsdale, NJ: Lawrence Erlbaum.
Cassimatis, N. L., Trafton, J., Bugajska, M., & Schultz, A. (2004). Integrating cognition, perception and action through mental simulation in robots. Journal of Robotics and Autonomous Systems, 49, 13–23.
Choi, D., Konik, T., Nejati, N., Park, C., & Langley, P. (2007). A believable agent for first-person shooter games. In Proceedings of the third annual artificial intelligence and interactive digital entertainment conference (pp. 71–73). Stanford, CA: AAAI Press.
Clocksin, W. F., & Mellish, C. S. (1981). Programming in PROLOG. Berlin: Springer Verlag.
Drummond, M., Bresina, J., & Kedar, S. (1991). The Entropy Reduction Engine: Integrating planning, scheduling, and control. SIGART Bulletin, 2, 61–65.
Epstein, S. L. (1992). For the right reasons: The FORR architecture for learning in a skill Domain. Cognitive Science, 18, 479–511.
Ernst, G., & Newell, A. (1969). GPS: A case study in generality and problem solving. New York: Academic Press.
Firby, R. J. (1994). Task networks for controllingcontinuous processes. In Proceedings of the second international conference on AI planning systems (pp. 49–54). Chicago: AAAI Press.
Freed, M. (1998). Managing multiple tasks in complex, dynamic environments. In Proceedings of the fifteenth national conference on artificial intelligence (pp. 921–927). Madison, WI: AAAI Press.
Gat, E. (1991). Integrating planning and reacting in a heterogeneous asynchronous architecturefor mobilerobots. SIGART Bulletin,2,17–74.
Genesereth, M. R.,& Nilsson, N. J. (1987). Logical foundations of artificial intelligence. Los Altos, CA: Morgan Kaufman.
Gratch, J. (2000). Emile: Marshalling passions in training and education. In Proceedings of the fourth international conference on autonomous agents (pp. 325–332). Barcelona, Spain.
Haigh, K., & Veloso, M. (1996). Interleaving planning and robot execution for asynchronous user requests. In Proceedings of the international conference on intelligent robots and systems (pp. 148–155). Osaka, Japan: IEEE Press.
Hayes-Roth, B., Pfleger, K., Lalanda, P., Morignot, P., & Balabanovic, M. (1995). A domain-specific software architecture for adaptive intelligent systems. IEEE Transactions on Software Engineering, 21, 288–301.
Hendler, J., Tate, A.,&Drummond, M. (1990). AI planning: Systems and techniques. AI Magazine, 11, 61–77.
Ingrand, F. F., Georgeff, M. P., & Rao, A. S. (1992). An architecture for real-time reasoning and system control. IEEE Expert, 7, 34–44.
Koedinger, K. R., Anderson, J. R., Hadley, W. H., & Mark, M. (1997). Intelligent tutoring goes to school in the big city. International Journal of Artificial Intelligence in Education,8, 30–43.
Laird, J. E. (1991). Preface for special section on integrated cognitive architectures. SIGART Bulletin, 2, 12–123.
Laird, J. E. (2008). Extending the Soar cognitive architecture. In Proceedings of the artificial general intelligence conference. Memphis, TN: IOS Press.
Laird, J. E., Newell, A., & Rosenbloom, P. S. (1987). Soar: An architecture for general intelligence. Artificial Intelligence, 33, 1–64.
Laird, J. E., Rosenbloom, P. S., & Newell, A. (1986). Chunking in Soar: The anatomy of a general learning mechanism. Machine Learning, 1, 11–46.
Langley, P. (1995a). Elements of machine learning. San Francisco: Morgan Kaufman.
Langley, P. (1995b). Order effects in incremental learning. In P. Reimann & H. Spada (Eds.), Learning in humans and machines: Towards and interdisciplinary learning science. Oxford: Elsevier.
Langley, P. (2006). Intelligent behavior in humans and machines (technical report). Computational Learning Laboratory, CSLI, Stanford University, CA.
Langley, P., & Messina, E. (2004). Experimental studies of integrated cognitive systems. In Proceedings of the performance metrics for intelligent systems workshop. Gaithersburg, MD.
Langley, P., & Choi, D. (2006a). A unified cognitive architecture for physical agents. In Proceedings of the twenty-first AAAI conference on artificial intelligence. Boston: AAAI Press.
Langley, P., & Choi, D. (2006b). Learning recursive control programs from problem solving. Journal of Machine Learning Research, 7, 493–518.
Langley, P., Cummings, K., & Shapiro, D. (2004). Hierarchical skills and cognitive architectures. In Proceedings of the twenty-sixth annual conference of the cognitive science society (pp. 779–784). Chicago, IL.
Lewis, R. L. (1993). An architecturally-based theory of sentence comprehension. In Proceedings of the fifteenth annual conference of the cognitive science society (pp. 108–113). Boulder, CO: Lawrence Erlbaum.
Magerko, B., Laird, J. E., Assanie, M., Kerfoot, A.,& Stokes, D. (2004). AI characters and directors for interactive computer games. In Proceedings of the sixteenth innovative applications of artificial intelligence conference (pp. 877–884). San Jose, CA: AAAI Press.
McCarthy, J. (1963). Situations, actions and causal laws (memo 2). Artificial Intelligence Project. Stanford, CA: Stanford University.
Meyer, M., & Kieras, D. (1997). A computational theory of executive control processes and human multiple-task performance. Part 1: Basic mechanisms. Psychological Review, 104, 3–65.
Miller, C. S., & Laird, J. E. (1996). Accounting for graded performance within a discrete search framework. Cognitive Science, 20, 499–537.
Minsky, M. (1975). A framework for representing knowledge. In P. Winston (Ed.), The psychology of computer vision. New York: McGraw-Hill.
Minton, S. N. (1990). Quantitative results concerning the utility of explanation-based learning. Artificial Intelligence, 42, 363–391.
Musliner, D.J., Goldman, R.P., & Pelican, M.J. (2001). Planning with increasingly complex models. In Proceedings of the international conference on intelligent robots and systems.
Nardi, D., & Brachman, R. J. (2002). An introduction to description logics. In F. Baader et al. (Eds.), Description logic handbook. Cambridge: Cambridge University Press.
Nason, S., & Laird, J.E. (2004). Soar-RL: Integrating reinforcement learning with Soar. In Proceedings of the sixth international conference on cognitive modeling (pp. 220–225).
Neches, R., Langley, P., & Klahr, D. (1987). Learning, development, and production systems. In D. Klahr, P. Langley, & R. Neches (Eds.), Production system models of learning and development. Cambridge, MA: MIT Press.
Newell, A. (1973a). You can’t play 20 questions with nature and win: Projective comments on the papers of this symposium. In W. G. Chase (Ed.), Visual information processing. New York: Academic Press.
Newell, A. (1973b). Production systems: Models of control structures. In W. G. Chase (Ed.), Visual information processing. New York: Academic Press.
Newell, A. (1982). The knowledge level. Artificial Intelligence, 18, 87–127.
Newell, A. (1990). Unified theories of cognition. Cambridge, MA: Harvard University Press.
Nuxoll, A. M. & Laird, J. E. (2007). Extending cognitive architecture with episodic memory. In Proceedings of the twenty-second AAAI conference on artificial intelligence. Vancouver, BC: AAAI Press.
Pearson, D. & Laird, J. E. (1999). Toward incremental knowledge correction for agents in complex environments. In K. Furakawa, D. Michie, & S. Muggleton (Eds.). Machine intelligence (Vol. 15, pp. 185–204). Oxford University Press.
Pell, B., Bernard, D. E., Chien, S. A., Gat, E., Muscettola, N., & Nayak, P. P. (1997). An autonomous spacecraft agent prototype. In Proceedings of the first international conference on autonomous agents (pp. 253–261). Marina del Rey, CA: ACM Press.
Perez, M. A.,& Carbonell, J. G. (1994). Control knowledge to improve plan quality. In Proceedings of the second international conference on AI planning systems (pp. 323–328). Chicago: AAAI Press.
Richardson, M. & Domingos, P. (2006). Markov logic networks. Machine Learning, 62, 107–136.
Sammut, C. (1996). Automatic construction of reactive control systems using symbolic machine learning. Knowledge Engineering Review, 11, 27–42.
Schlimmer, J. C. & Langley, P. (1992). Machine learning. In S. Shapiro (Ed.), Encyclopedia of artificial intelligence (2nd ed.). New York: John Wiley & Sons.
Schmidt, R. A. (1975). A schema theory of discrete motor skill learning. Psychological Review, 82, 225–260.
Shapiro, D. & Langley, P. (2004). Symposium on learning and motivation in cognitive architectures: Final report. Institute for the Study of Learning and Expertise, Palo Alto, CA. <http://www.isle.org/symposia/cogarch/arch.final.pdf>.
Shapiro, S. C. & Ismail, H. O. (2003). Anchoring in a grounded layered architecture with integrated reasoning. Robotics and Autonomous Systems, 43, 97–108.
Simon, H. A. (1957). Models of man. New York: John Wiley.
Sleeman, D., Langley, P., & Mitchell, T. (1982). Learning from solution paths: An approach to the credit assignment problem. AI Magazine,3, 48–52.
Sloman, A. (2001). Varieties of affect and the CogAff architecture schema. In Proceedings of the AISB’01 symposium on emotion, cognition, and affective computing. York, UK.
Sowa, J. F. (Ed.). (1991). Principles of semantic networks: Explorations in the representation of knowledge. San Mateo, CA: Morgan Kaufman.
Sun, R. (Ed.). (2005). Cognition and multi-agent interaction: Extending cognitive mdoeling to social simulation. Cambridge University Press.
Sun, R. (2007). The importance of cognitive architectures: An analysis based on CLARION. Journal of Experimental and Theoretical Artificial Intelligence, 19, 159–193.
Sun, R., Merrill, E.,& Peterson, T. (2001). From implicit skills to explicit knowledge: A bottom–up model of skill learning. Cognitive Science, 25, 203–244.
Sutton, R. S., & Barto, A. G. (1998). Reinforcement learning: An introduction. Cambridge, MA: MIT Press.
Taatgen, N. A. (2005). Modeling parallelization and speed improvement in skill acquisition: From dual tasks to complex dynamic skills. Cognitive Science, 29, 421–455.
Tambe, M., Johnson, W. L., Jones, R. M., Koss, F., Laird, J. E., Rosenbloom, P. S., et al. (1995). Intelligent agents for interactive simulation environments. AI Magazine, 16, 15–39.
Trafton, J. G., Cassimatis, N. L., Bugajska, M., Brock, D., Mintz, F., & Schultz, A. (2005). Enabling effective human–robot interaction using perspective-taking in robots. IEEE Transactions on Systems, Man and Cybernetics, 25, 460–470.
Tulving, E. (1972). Episodic and semantic memory. In E. Tulving & W. Donaldson (Eds.), Organization of memory. New York: Academic Press.
VanLehn, K. (Ed.). (1991). Architectures for intelligence. Hillsdale, NJ: Lawrence Erlbaum.
Veloso, M. M., & Carbonell, J. G. (1993). Derivational analogy in PRODIGY: Automating case acquisition, storage, and utilization. Machine Learning, 10, 249–278.
Wang, X. (1995). Learning by observation and practice: An incremental approach for planning operator acquisition. In Proceedings of the twelfth international conference on machine learning (pp. 549–557). Lake Tahoe, CA: Morgan Kaufman.
Источник: Langley, P. et al., Cognitive architectures: Research issues and challenges, Cognitive Systems Research (2008), doi:10.1016/j.cogsys.2006.07.004 Cognitive Systems ResearchVolume 10, Issue 2, June 2009, Pages 141–160 Pat Langley /a, John E. Laird /b, Seth Rogers /a /a Computational Learning Laboratory, Center for the Study of Language and Information, Stanford University, Stanford, CA 94305, USA /b EECS Department, The University of Michigan, 1101 Beal Avenue, Ann Arbor, MI 48109, USA
В когнитологии совместно используются компьютерные модели, взятые из теории искусственного интеллекта, и экспериментальные методы, взятые из психологии и физиологии высшей нервной деятельности, для разработки точных теорий работы человеческого мозга.
Источники информации:
[1] Величковский Б.М. Когнитивная наука. Основы психологии познания. В 2-х т. http://www.alleng.ru/d/psy/psy041.htm В первой на русском языке книге по когнитивной науке изложены результаты междисциплинарных исследований познавательных процессов у человека. Подробно рассмотрены восприятие и действие, внимание и сознание, речевое общение и мышление, память и представление знаний, взаимодействие интеллекта и аффекта, а также философские и прикладные проблемы, стоящие перед когнитивной наукой.
Для исследователей ИИ, психологов, лингвистов, информатиков, физиологов, философов и всех специалистов, работа которых связана с учетом познавательных возможностей человека, а также студентов и аспирантов соответствующих специальностей, углубленно изучающих эту область.
Когнитивная наука: Основы психологии познания: в 2 т. — Т. 1 / Борис М. Величковский. — М.: Смысл: Издательский центр «Академия», 2006. — 448 с. (Том 1. Формат: doc / zip Размер: 2,24 Мб Скачать) Когнитивная наука: Основы психологии познания: в 2 т. — Т. 2 / Борис М. Величковский. — М.: Смысл: Издательский центр «Академия», 2006. — 432 с. (Том 2. Формат: doc / zip Размер: 1,54 Мб Скачать)
Подробности
Категория: Approaches
Просмотров: 4345
Подходы
Искусственные когнитивные системы, их архитектуры и модели
В этом разделе размещены материалы, дающие представление о некоторых подходах к исследованиям в области интеллектуальных систем и искусственного интеллекта, в том числе обзоры по когнитивным архитектурам и моделям, применяемым в предметной области "Интеллектуальные системы и искусственный интеллект" и доступным дистанционно для ознакомления.
Список материалов составлен по результатам поиска в сети Интернет, в общедоступных базах данных и других информационных источниках. Составители не несут ответственности за точность представленной информации. Порядок размещения информации в списке выбран составителями.
Список ссылок непрерывно пополняется. Просьба присылать любые предложения, дополнения, изменения, уточнения информации, представленной в списке, по адресу E-mail: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.. Зарегистрированные авторы и редакторы разделов имеют прямой доступ к редактированию информации по разделу.
В когнитивной науке можно проследить развитие нескольких направлений в моделировании когнитивных систем.
Ключевые особенности направлений касаются принятых предположений о формате ментальных репрезентаций и о биологическом подобии модели.
1. Исторически ранее развивалась трактовка мышления как процесса оперирования символьной информацией, представленной в виде сети.
2. Коннекционистское направление уподобляет познание функционированию нейронной сети, в которой репрезентации распределены по элементам сети в виде паттернов активации.
3. Существует и третий вариант — смешанные (гибридные) модели, объединяющие свойства символьной и коннекционистской парадигм.
Наиболее известной смешанной моделью является подход к познанию, развиваемый Дж. Андерсоном (АСТ-R) (Anderson et al., 2004).
Две системы — декларативная память (семантическая сеть) и процедурная память (система продукций), работающие по активационному принципу, являются, по словам Дж. Андерсона, «когнитивным ядром» модели ACT-R.
Дополнительная информация: Когнитивные архитектуры - Постоянно пополняемый список когнитивных архитектур на сайте aihandbook.intsys.org.ru со ссылками на разработчиков, составлен по результатам поиска в сети Интернет, в общедоступных базах данных и других общедоступных информационных источниках. Особое внимание уделено европейским и более новым проектам. Другие порталы по теме Блоги и форумы по теме
2. Классификация архитектур и моделей когнитивных систем
За последние годы было много проектов, в которых исследователи стремились разработать когнитивные архитектуры и систематизировать эти разработки.
Рис. 1. Иерархия когнитивных архитектур
Источники: 1. http://
3. Обзоры когнитивных архитектур
Когнитивные архитектуры: вопросы и проблемы исследований
Источник: Pat Langley /a, John E. Laird /b, Seth Rogers /a, Cognitive architectures: Research issues and challenges, Cognitive Systems ResearchVolume 10, Issue 2, June 2009, Pages 141–160. doi:10.1016/j.cogsys.2006.07.004 /a Computational Learning Laboratory, Center for the Study of Language and Information, Stanford University, Stanford, CA, USA /b EECS Department, The University of Michigan, Ann Arbor, MI, USA
4. Архитектуры символьного типа (Symbolic architectures)
5. Архитектуры эмерджентного типа (Emergentist cognitive architectures)
6. Биологически инспирированные архитектуры
Подробности
Категория: Approaches
Просмотров: 3699
Полезные ссылки
Введение
В этом разделе размещены ссылки на ресурсы сети Интернет (порталы и сайты, блоги и форумы, школы, семинары, лекции), связанные с исследованиями в предметной области "Искусственные когнитивные системы, их архитектуры и модели" и доступные дистанционно для ознакомления.
Список составлен по результатам поиска в сети Интернет, в общедоступных базах данных и других информационных источниках. Составители не несут ответственности за точность представленной информации.
Разделы портала: • Обзор когнитивных архитектур и агентов - Введение • Обзор 1 Гипертекстовый обзор позволяет ознакомиться с общим и сравнительным описанием 11 когнитивных архитектур различных типов, проанализировать их характеристики, свойства, окружение, получить доступ к их базовой литературе (смотри архитектуры: Subsumption, Atlantis, Theo, Icarus, Prodigy, MAX, AIS, Homer, SOAR, RALPH, ERE). • Обзор 2 Когнитивная система - это интегрированная система, способная поддерживать интеллект. В данном разделе приводится сравнение рассматриваемых когнитивных архитектур и работоспособная структура классификации и сравнения будущих предлагаемых когнитивных архитектур. Описание каждой структуры разбито на различные категории. Для каждой частной архитектуры приведены ссылки на Архитектуры, их Авторов и соответствующие Публикации. Приведены принятые Теории интеллекта (Theories of Intelligence). • Обзор 3 Сравнительные данные рассматриваемых когнитивных архитектур (Comparative Reference of Cognitive Architectures). Составлены под руководством Джона Лэйрда (John Laird). • Обзор 4 Принятая терминология (Definition of Terms) • Обзор 5 Руководство пользователя для выбора когнитивных архитектур (The Consumer Reports Guide to Cognitive Architectures)
Цели группы: 1. Представлять обзор "недавних" (последнее десятилетие) разработок когнитивных архитектур в областях AI/Cog/Sci/Psych; 2. Представлять обзор событий, происходящих в Института креативных технологий в части разработки когнитивной архитектуры CAVH (Cognitive Architecture and Virtual Humans) и связанных с этим областях; 3. Исследовать частные разделы этой области, в которых достигнут значительный прогресс и которые были похоронены в связи с развитием когнитивных архитектур; 4. Обеспечить возможность широких дискуссий по вопросам, связанным с когнитивными архитектурами; 5. Сформулировать некоторые конкретные предложения, чтобы сделать следующие шаги в науке и технике, связанные с когнитивными архитектурами.
Смотри ссылки на последние обзоры, публикации и материалы дискуссий, в том числе:
Virtual Human Toolkit Набор программных средств для разработки виртуальных персонажей (доступен бесплатно для академического сообщества).
Это коллекция модулей, библиотек и инструментов, разработанных для помощи и поддержки исследователей и разработчиков, создающих виртуальные персонажи, действующие в режиме диалога. The Toolkit is an on-going, ever-changing, innovative system fueled by basic research performed at the University of Southern California (USC) Institute for Creative Technologies (ICT) and its partners. Загрузка после бесплатной регистрации: https://vhtoolkit.ict.usc.edu/download/