Авторским началом исследований в этой области можно считать начало 1980-х гг. Основным концептом этих исследований явился анализ принципа «структура определяет знания». Причиной поиска этого принципа явился ощутимый динамизм в сфере информационных технологий. А выражалось это принципиальной и частой сменой поколений технических средств: ЭВМ второго поколения (серии «Минск-22 (32)»); ЭВМ третьего поколения (серии ЕС); IBM совместимые компьютеры (в среде MS DOS, в среде MS Windows). Профессиональные неудобства от этого, безусловно, положительного эффекта научно-технического прогресса ощутили те разработчики, которые занимались проектированием различных систем автоматизации в конце 1960-х – начале 1970-х гг. Это явилось причиной вынужденного выполнения больших объёмов работ, связанных с перепрограммированием разработанных средств автоматизации, что явилось причиной ощутимых издержек, например, по времени – 3 с лишним года; по трудоёмкости – порядка 50 человеко-лет. На основании анализа полученных результатов и затрат было принято решение о необходимости повышения производительности труда разработчиков. В результате был разработан язык ТАЯ (табличный алгоритмический язык) [1]. Дальнейшие теоретические и практические наработки, их анализ и переосмысливание способствовали формированию данной теории представлений.
Цель исследования: обобщение накопленного теоретического и практического опыта разработки средств автоматизации технологического назначения в виде «Теории представлений», включающей понятийные, функциональные, структурные концепты и алгоритмический язык представления знаний.
Понятийные, функциональные и структурные концепты формируют теоретическую составляющую теории представлений, а табличный алгоритмический язык ТАЯ – практическую.
Цель разработки своего алгоритмического языка продиктована необходимостью повышения производительности труда разработчиков программных средств в критические моменты времени (при смене технического и программного обеспечения) в условиях ограниченного времени и людских ресурсов. Идея заключается в том, что все знания о предметной области должны быть написаны на своём языке – не зависящем от алгоритмических языков, имеющихся на рынке товаров и услуг. В этом случае при переходе на новые алгоритмические языки перепрограммировать необходимо только программу обработки таблиц знаний, что существенно сокращает время разработки новой версии программных средств.
Исходная база. Базой для отработки рассматриваемых в статье концептов явилась система автоматизированного проектирования норм труда САПР НТ «NORMA». В исторической хронологии разработчиком этой системы (конец 1960-х гг.) является Казанский филиал НИАТ (ныне КНИАТ), преемником – в настоящее время – КНИТУ – КАИ им. А.Н. Туполева.
Общие положения. Под представлениями, положенными в основу данной теории, подразумеваются определённые ассоциации, сформировавшиеся у субъекта в результате его взаимодействия с окружающей действительностью. В представлениях, если опираться на теорию категорий (как особый математический способ описания объектов через их соответствия (морфизмы) между собой [2, с. 43]), следует выделить четыре информационно-когнитивные категории (ИКК): данные, информацию, знания, интерфейсы. Данные, информация, знания являются структурными единицами (константами) теории. Доминантой интерфейсов, помимо того, что они тоже являются структурными единицами, является формирование понятийной и функциональной среды, определяющей условия существования «представлений» и разновидности их преобразований.
Теория представлений – это точка зрения понятийно-функционально-структурного характера, рассматривающая: общность и различия информационно-когнитивных категорий представлений (данных, информации, знаний, интерфейсов); их преобразования в процессе познания (и принятия решений); их структуризация.
Потребность в развёртывании этой теории возникла в результате того, что, несмотря на широкое использование этих понятий в различных приложениях теории и практики, методологически – в части анализа их общности и различий – они отработаны не окончательно. Методологическая незавершённость затрагивает как понятийный и функциональный аппараты, так и аппарат их структуризации.
Несовершенство понятийного аппарата проявляется в том, что существующие в литературных источниках определения (для данных, информации и знаний) переопределяются друг через друга. Встречаются определения, когда данные трактуются как некая информация; информация как данные и знания; знания как совокупность данных и сведений; и т.п. [3–6].
Несовершенство функционального аппарата подтверждается отсутствием вариаций преобразования данных, информации и знаний; отсутствием определения роли интерфейсов в этих преобразованиях и их классификации.
Несовершенство аппарата структуризации сводится к тому, что, несмотря на глубокие проработки «Баз данных» (которые с позиции теории представлений следовало бы называть «Базами информации») и «Баз знаний», нигде не анализируется ни структура информации, ни структура знаний. В таких условиях трудно обеспечить оптимальную вложенность этих ИКК в электронные базы, что может быть достигнуто только тождественностью их структур. Поэтому одной из задач теории представлений является структуризация ИКК и, как следствие, вторая задача – структуризация электронных информационных баз. Для демонстрации решения этих задач в статье показаны примеры структуризации и обобщённой модели процедуры принятия решений. Эта модель может быть классифицирована как информационно-когнитивная модель искусственного интеллекта (ИКМ ИИ).
Понятийный аппарат
В работе [7] в качестве объединяющего понятия для ИКК был предложен термин «представления». В связи с этим данные, информацию и знания следует рассматривать как некоторые модели представлений, обладающие различной потенцией и степенью достоверности, предназначенные для формирования образа окружающей действительности. Интерфейсы – это тоже определённые знания, но предназначенные для преобразования представлений и формирования новых представлений. Для субъекта-исследователя данные, информация и знания – это опорные точки идентификации окружающих процессов и явлений, а интерфейсы – его творческий потенциал. В этом контексте: данные – это неосознанные представления (которые, однако, имеют потенцию стать информацией); информация – это осознанные представления (характеризующие определённый атрибут объект или субъект, или некоторого процесса, выполняемого с их участием); знания – это руководство к действию (представляющее некоторую цепочку причинно-следственных связей с использованием некоторого множества информации).
Данные, ввиду их неосознанности, не имеют внутренней структуры, по этой причине они не могут быть систематизированы и классифицированы – они могут только конкатенироваться (в памяти субъекта-исследователя (естественного интеллекта) или в виртуальной памяти искусственного интеллекта). Только в результате совершенствования конкретного интерфейса, «данные» могут быть трансформированы в «информацию».
Информация имеет фактографический характер. Типовыми представителями информации (или базы информации) следует считать справочники, словари, каталоги. Ввиду своей осознанности информация может быть классифицирована, например: факты, сравнения, утверждения, отождествления. Более подробная классификация будет показана ниже – в аппарате структуризации.
Знания имеют директивный характер и представляют собой некий алгоритм принятия решений или достижения некоторых целей. То есть, если информация – это статическая модель «представлений», то знания – это динамическая модель. Если информация – осведомлённость, то знания – это умения. Если информация – это потенциальные возможности для принятия решений, то знания – это конкретный способ принятия решений.
Интерфейсы характеризуются творческим потенциалом: распознавания, преобразования или синтеза ИКК.
Объединяющим началом ИКК является субъективность природы их возникновения. Они существуют только в реальном или виртуальном (в виде компьютерных программ) сознании человека.
Различия ИКК заключаются в их потенциальных возможностях. Данные не имеют потенции – это некий неосознанный балласт, который, однако, имеет перспективу преобразования в информацию, при соответствующем усовершенствовании нужного интерфейса. Информация – это исходная посылка для формирования знаний. Никакая информация, никакое множество информации (в чистом виде) не могут сформировать принятие решения. Для принятия решений необходимы знания, формализующие переход от одной совокупности информации к новой информации или к новым знаниям.
Функциональный аппарат и аппарат структуризации
Рассматривать эти аппараты будем на примере процедуры познания, разворачивающейся во время взаимодействии некоторого «интеллекта» и «окружающей действительности» под воздействием общественных отношений. Для этого введём константы: D, I, K, Int (данные, информация, знания и интерфейсы, соответственно).
Аксиома 1. Существует четыре информационно-когнитивные категории представлений, p (от англ. perception – восприятие): ;
.
Аксиома 2. Существует восемь категорий интерфейсов
,
где Inta – интерфейс начального порядка, отвечающий за концентрацию внимания на определённых атрибутах предмета исследования (на уровне естественного интеллекта (ЕИ) – это желания, цели; на уровне искусственного интеллекта (ИИ) – постановка задачи);
IntI – интерфейс первого порядка, предназначенный для восприятия атрибутов предмета исследования, попавших в поле зрения исследователя, формирующий определённые данные (для ЕИ – органы чувств и восприятия; для ИИ – программы считывания, например, геометрического образа объекта), являющийся инструментом простого созерцания;
IntII(1) – интерфейс второго порядка первого рода, преобразующий данные в информацию нечёткую (для ЕИ – осознание созерцаемого, например, осознание того, что рассматриваемый предмет большой и тяжёлый), являющийся инструментом субъективно осознанного созерцания;
IntII(2) – интерфейс второго порядка второго рода, преобразующий информацию нечёткую в информацию чёткую (для ЕИ – доведение субъективно осознанного созерцания до объективно осознанного созерцания, например, «рассматриваемый предмет имеет габариты 200×300×125 мм и весит 21 кг»), являющийся инструментом объективно осознанного созерцания (например, средствами метрологии и стандартизации);
IntIII(1) – интерфейс третьего порядка первого рода, преобразующий информацию чёткую в знания потенциальные (знания субъекта исследователя, пока не прошедшие практическую апробацию, для ЕИ – формирование целенаправленной цепочки причинно-следственных связей между разрозненными множествами информации), являющийся инструментом формирования теоретических знаний;
IntIII(2) – интерфейс третьего порядка второго рода, преобразующий знания потенциальные в знания реальные (для ЕИ – это знания, сформировавшиеся на практике, например, теоретические знания, подтверждённые экспериментом; подтверждённые в результате апробирования производственного процесса в некоторых организационно-технических условиях), являющийся инструментом формирования практических знаний;
Intz – интерфейс завершающего порядка, отвечающий за формирование принятия решений (для ЕИ – убеждённость в эффективности использования потенциальных знаний (в случае невозможности их практической апробации) или реальных знаний (проверенных практикой), для достижения поставленной цели), являющийся инструментом практического принятия решений;
Intm – метаинтерфейс, совершенствующий все остальные интерфейсы (для ЕИ – учёба или самообучение, как инструмент повышения квалификации, для ИИ – корректировка (расширение) информационной базы или базы знаний, как инструмент совершенствования программной модели), являющийся инструментом развития.
Аксиома 3. Преобразование представлений осуществляется посредством соответствующих интерфейсов:
; ; ;
; ,
где – атрибуты окружающей действительности; – атрибуты окружающей действительности, попавшие в поле зрения исследователя; R – результат принятия решения.
Аксиома 4. Существуют две группы информации – информация нечёткая , информация чёткая (см. выше, комментарии по и ); .
Аксиома 5. Существуют две группы знаний – знания потенциальные и знания реальные (см. выше, комментарии по и ); .
Аксиома 6. Под информацией понимается факто-утверждающая функция – одноместная в правой части: a = b – утверждение; a ≠ b – отрицание; – сравнение; – принадлежность; – отсутствие; – включение; – исключение; – общность (пересечение); – расширение (сложение).
Аксиома 7. Следует различать знания параметрические и процессуальные. Первые относятся к категории безальтернативных (количество альтернатив равно единице), вторые – к категории альтернативных (предлагающих как минимум два решения):
– параметрические знания (с линейной функцией);
– параметрические знания (со степенной функцией);
– параметрические знания (с показательной функцией);
– процессуальные знания (в виде импликации).
Аксиома 8. Существует две группы памяти (M): экстернальная (внешняя, всеобщая), представляющая собой информацию и знания, накопленные всем сообществом исследователей – Mex; интернальная (внутренняя, личная), представляющая собой опыт конкретного субъекта исследователя – Min; .
Аксиома 9. Объём знаний измеряется количеством информации, разновидности которой показаны в аксиоме 6. , где Hинф – количество информации; Hнз.пер – количество независимых переменных, участвующих в описании знания; Aал.реш – количество альтернативных решений.
Информационно-когнитивная модель искусственного интеллекта
Рассматривая процедуру «Познания», с учётом представленных выше аксиом, можно формализовать следующее принципиальное правило принятия решений:
.
Читается это правило следующим образом. Предмет исследования , попавший в поле зрения исследователя – (сформированный интерфейсом начального порядка ), посредством интерфейса первого порядка IntI преобразуется в некоторое множество данных {da}. Это множество, совместно с подмножеством внешней памяти и подмножеством внутренней памяти , посредством интерфейса второго порядка первого рода , преобразуется во множество «информации нечёткой» . Это множество, с подмножеством внешней памяти и с подмножеством внутренней памяти , посредством интерфейса второго порядка второго рода , преобразуется в «информацию чёткую» . Это множество, с подмножеством внешней памяти и с подмножеством внутренней памяти , посредством интерфейса третьего порядка первого рода , преобразуется в «знания потенциальные» . Это множество, с подмножеством внешней памяти и с подмножеством внутренней памяти , посредством интерфейса третьего порядка второго рода , преобразуется во множество «знания реальные» , которое преобразуется посредством интерфейса завершающего порядка Intz в принимаемое решение. На некотором уровне абстракции это правило можно представить, как показано на рисунке. В рассмотренном примере можно выделить четыре разновидности преобразования представлений: функциональные ; совершенствование метаинтерфейса ; самосовершенствование интерфейсов ; пополнение внутренней и внешней памяти .
Информационно-когнитивная модель искусственного интеллекта
Результаты исследований (практическая составляющая теории представлений): структура базы знаний
Структура базы знаний показана в табл. 1, где в качестве примера приведён фрагмент записи алгоритма из табл. 2. Это таблица с двойным входом: по вертикали вход зависимый; по горизонтали – независимый. Вертикальный вход включает в себя двадцать одну переменную, где № п/п – порядковый номер записи, КСЗ – количество строк в одной записи, ТЗ – тип записи; ИП – искомая переменная. Типы записей (табл. 1) представляют собой служебные слова, например, т – тривиальная запись (простое присваивание); л – логическая запись; в – вычисления. Типы записей являются регулятором горизонтального входа.
Таблица 1
Пример заполнения базы знаний, с использованием языка ТАЯ
Комментарии |
Шифр таблицы: |
Имя файла: |
Маршрут файла: |
|||||||||||||||||||
Наименование технологической операции: |
Токарно-винторезная |
|||||||||||||||||||||
Наименование технологического перехода: |
Точение |
|||||||||||||||||||||
Входная информация |
км/добр/глуб/ |
|||||||||||||||||||||
Выходная (искомая) информация |
подо |
|||||||||||||||||||||
Идентификаторы |
глобальные: |
км/добр/глуб/ |
||||||||||||||||||||
локальные: |
к/а1/а2/с |
|||||||||||||||||||||
№ п/п |
КСЗ |
ТЗ |
1-й параметр |
Отношения |
2-й параметр |
ИП |
Результат |
|||||||||||||||
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
5 |
||||||
1 |
1 |
т |
км |
добр |
глуб |
= |
= |
= |
км |
добр |
глуб |
|||||||||||
2 |
2 |
л |
км |
= |
<= |
<= |
<= |
1 |
3 |
5 |
8 |
к |
0,9 |
1,0 |
1,1 |
1,4 |
||||||
3 |
0 |
<= |
13 |
1,7 |
2,0 |
|||||||||||||||||
4 |
1 |
т |
а1 |
а2 |
с |
= |
= |
= |
0,1 |
0,2 |
8,5 |
|||||||||||
5 |
1 |
в |
добр |
глуб |
** |
: |
** |
* |
а1 |
а2 |
к |
подо |
Примечание. В первой строке выполнено присваивание (для переменных км, добр, глуб) самим себе, с целью определения (для режима отладки программы) значений с которыми они пришли в эту таблицу.
Таблица 2
Фрагмент алгоритма расчёта подачи
Код обрабатываемого материала _____________________ Идентификатор: км |
Поправочный коэффициент к расчёту подачи режущего инструмента _____________________ Идентификатор: к |
Расчёт подачи инструмента на один оборот детали (So, мм/об) _____________________ Идентификатор: подо |
1 |
0,9 |
к |
<= 3 |
1,0 |
|
<= 5 |
1,1 |
|
<= 8 |
0,9 |
|
<= 13 |
1,7 |
|
> 13 |
2,0 |
|
Dобр – диаметр обработки (идентификатор – добр); t – глубина резания (идентификатор – глуб). |
Идентификаторы технологических параметров записываются последовательностью вида: a{bi}, где a – буквенный символ; – множество буквенных или цифровых символов. Структурными единицами языка ТАЯ являются записи, располагаемые в одной или нескольких строках таблицы. Если представить «запись» в виде графа-дерева, то это маршрут, включающий по одной вершине всех иерархических уровней, вплоть до всех «дочерних» вершин предпоследнего уровня. Тип записи – это указатель функции.
К числу положительных особенностей ТАЯ можно отнести то, что вертикальный вход обеспечивает структурность, компактность, наглядность и обозримость, свойственную таблицам, а горизонтальный – гибкость алгоритмических языков. Каждая таблица оформляется в виде отдельного файла. Последовательность обработки каждой таблицы определяется множеством управляющих векторов, также оформляемых в виде отдельных файлов.
Выводы
1. Сформулированы следующие определения:
представления – это некоторые ассоциации, формирующиеся у субъекта в результате его взаимодействия с окружающей действительностью, образующие информационно-когнитивные категории: данные, информация, знания, интерфейсы. Философичность определения: в окружающей действительности имеется множество «вещь в себе»; в сознании субъекта исследователя появляются «представления о вещи в себе»;
данные – это неосознанные представления, не имеющие внутренней структуры, конкатенирующиеся в сознании субъекта исследователя. Философичность определения: в окружающей действительности имеется множество «вещь в себе»; в сознании субъекта исследователя не формируется их понимание;
информация – это осознанные представления, характеризующие определённый атрибут объекта, субъекта или процесса, выполняемого с их участием, имеющие фактографический характер, категорируемые на информацию нечёткую и информацию чёткую. Философичность определения: в окружающей действительности имеется множество «вещь в себе»; в сознании субъекта исследователя формируются их некоторые атрибуты;
знания – это руководство к действию, показывающее некоторую цепочку причинно-следственных связей, имеющих директивный характер для принятия решений или достижения поставленной цели, формализующие переход от одной совокупности информации к новой информации или к новым знаниям, категорируемые на знания потенциальные и знания реальные. Философичность определения: в окружающей действительности имеется множество «вещь в себе»; в сознании субъекта исследователя формируется процесс распознавания их границ, выявления структуры и наполнения элементов структуры соответствующим содержанием; субъект-исследователь способен спроектировать модель вещи в себе; используя визуализацию модели, субъект-исследователь может принимать решения в конкретной области исследования;
интерфейсы – это творческий потенциал субъекта исследователя или его виртуальной модели, способный распознавать, преобразовывать или синтезировать представления, категорируемый на осознание, понимание, преобразование и самосовершенствование. Философичность определения: в окружающей действительности имеется множество «вещь в себе»; в сознании субъекта-исследователя формируется способ его исследования и накопления опыта для последующих исследований;
теория представлений – это точка зрения понятийно-функционально-структурного характера информационно-когнитивных категорий представлений: данных, информации, знаний, интерфейсов. Философичность определения: имеется некоторая окружающая действительность; субъект-исследователь может вступать с ней в определённые взаимоотношения (воздействовать на неё, воспринимать её воздействий), только руководствуясь собственными представлениями или представлениями, накопленными некоторым сообществом исследователей.
2. На основании теоретической составляющей теории представлений построена информационно-когнитивная модель искусственного интеллекта (рисунок), что подтверждает в некоторой мере объективность её положений;
3. На основании выявленных структур «информации» и «знаний» была спроектирована «База знаний» (табл. 1), практически апробированная в системе автоматизированного проектирования норм труда САПР НТ «NORMA».