От Данных к Знаниям

Быстрая и качественная оценка ситуации, поддержка и обоснование принятия решений, семантический анализ, прогнозирование и моделирование, создание интеллектуальных и экспертных систем, а так же множество других задач невозможны без системы представления и управления знаниями.
Наша цель: Создание эффективной системы представления и управления знаниями, и разработка на ее основе интеллектуальных и экспертных систем.

Что такое знания?


Сейчас наибольшее распространение получила трактовка понятия «знания», как совокупность всей доступной информации. В рамках этой трактовки, системы управления знаниями строятся на основе комбинирования существующих технологий, таких, как СУБД, e-mail, доски объявлений, дискуссионные форумы, общие каталоги документов, порталы и т.п. С нашей точки зрения «совокупность всей информации» не является знанием, а представляет собой те же данные, только объединенные в одну большую кучу (big data). Чтобы из «кучи данных» сделать знания необходимо обеспечить понимание смысла данных. Как из Данных сделать Знания и предназначена технология управления знаниями «БРАВО»!

А в чем проблема?


Для эффективного использования информации необходимо ясно представлять существующие проблемы представления и управления знаниями:

Только часть необходимой информации хранится в базах данных!

По оценкам Delphi Group

  • Только 24% информации компании сохраняется в бумажном или электронном виде!
  • 76% информации не сохраняется!
  • 42% информации содержится только в головах конкретных сотрудников и теряется при увольнении сотрудников!

При попадании в базу данных информация существенно упрощается и искажается!

  1. В процессе жизни информации постоянно меняются требования к ней, возникают новые требования, которые были неизвестны на этапе создания базы данных.
  2. Объекты предметной области - объекты реального мира, описание которых которых необходимо для решения задачи.
  3. При описании объектов предметной области в базе данных происходит упрощение представления объектов и перевод свойств объектов в цифровые значения с потерей связи между ними.
  4. В базе данных сохраняются отдельные свойства объектов предметной области, необходимые для решения задачи, на момент проектирования базы данных.
  5. В процессе использования базы данных растут требования к информации, появляются новые задачи, что приводит к необходимости изменения изначальных структур базы данных. Изменение структуры базы данных очень трудоемкая и дорогостоящая операция, поэтому, вместо перепроектирования базы данных для правильного отображения новых свойств объектов предметной области, создаются дополнительные таблицы для решения текущих проблем. С каждым обновлением базы данных изначальное представление объектов предметной области обрастает различными «заплатами».
  6. В результате постоянных изменений в структурах базы накапливаются искажения представления объектов предметной области. Эти искажения существенно затрудняют получение связанной информации и сдерживают развитие информационной системы.

Представление данных

  1. Объекты предметной области, описание которых необходимо для решения задачи.
    Чем сложнее задача, тем больше объектов предметной области и больше их свойств должны быть представлены в базе данных.
  2. Только часть информации о предметной области попадает в базу данных.
    Табличное представление данных не позволяет сохранить все существующие свойства объектов предметной области и связи между ними.
  3. Призма требований к решаемой задачи - структура базы данных формируется исходя из требований к задаче на момент проектирования. Требования к задаче определяют объем информации и способ представления ее в базе данных.
  4. База данный для сложных систем может содержать сотни и тысячи таблиц! В таблицах хранятся обезличенные данные, а интерпретация этих данных зашита в программном коде информационной системы (7). Связи между данными в таблицах задаются дополнительными ключевыми полями, которые образуют сильносвязанную сеть таблиц.
  5. Расширение базы данных приводит к реструктуризации таблиц и необходимости корректировки связей между таблицами.
  6. Выделение новых таблиц из существующих таблиц связано с большими затратами на пересогласование связей между таблицами и необходимостью изменения программного кода информационной системы.
  7. Информационная система, обеспечивает логическое связывание всех данных в базе данных и интерпретацию этих данных для пользователей.
    Для интерпретации данных в информационной системе создается множество программных классов, которые обеспечивают логическое представление данных и прикладную логику обработки этих данных. При необходимости изменения структуры базы данных необходимо перепрограммировать классы объектов в информационной системе.
  8. Пользователи системы. «Видят» базу данных только через информационную систему. Даже при необходимости получения дополнительной информации, уже существующей в базе данных, необходимо расширять функции информационной системы.

Интеграция данных

  1. База данных информационной системы состоит из сотен взаимосвязанных таблиц.
  2. Для интеграции двух информационных систем необходимо обеспечить согласование данных в этих системах.
  3. Часть информации дублируется в обоих информационных системах, при этом, как правило, дублирующиеся данные имеют разный формат.
  4. Обмен информацией между базами данных осуществляется в пакетном режиме путем выгрузки и последующей загрузке файла обмена данных.
  5. Получение консолидированных отчетов из 2-х информационных систем осуществляется "вручную", путем объединения отчетов из каждой системы.
  6. В связи с сильной связанностью данных в базе, добавление нового функционала осуществляется не изменением существующих таблиц, а созданием новых таблиц, дублирующих существующие таблицы. Это происходит, что бы не нарушать работающий функционал.
  7. Доработка системы приводит к "налепливанию" вокруг изначальной базы данных дополнительных таблиц, что существенно усложняет систему и уменьшает прозрачность данных.

Управление знаниями

Модель Предметной Области

Ключевым отличием системы управления знаниями от системы управления данными является организация знаний в Модель предметной области. Для управления знаниями недостаточно просто объединенить информацию в единую базу, необходимо дать семантическое определение всей используемой информацию и осуществить семантическое связывание информации.

  1. Объекты предметной области, описание которых необходимо для решения задачи.
  2. Выразительные возможности Базы Знаний позволяют отображать различные смысловые характеристики и связи объектов предметной области без потери информации.
  3. Объекты предметной области отображаются по семантическим правилам, в Модель Предметной Области, что обеспечивает их семантически-правильное представление, независимое от прикладных алгоритмов.
  4. Вся информация в Базе Знаний образует Модель Предметной Области, которая состоит из Базовой модели и Информационной Модели. Базовая модель обеспечивает определение информации в Модели и имеет иерархическую структуру. Информационная модель обеспечивает описание объектов предметной области.
  5. Для описания объектов предметной области разработан специализированный Язык представления декларативных знаний - DSL, обладающий свойствами естественного языка. Описания на языке DSL имеют вид перечня предложений, относящихся к какому-либо объекту. Список возможных предложений и их состав задаются в Базовой модели.
  6. Расширение описания любого объекта сводится к добавлению новых предложений. Каждый объект может иметь только необходимые для его описания предложения.
  7. База знаний не требует дополнительной интерпретации информации, что позволяет работать с информацией напрямую используя Монитор Модели. Это приводит к тому, что любые изменения сделанные в Модели Предметной Области сразу становятся доступны пользователям.

Не программа должна решать что из себя представляют данные и как они связаны,
а сами данные должны быть определены и организованы в семантическую Модель!

База Знаний «БРАВО»

Представление знаний

Модель Предметной Области состоит из описаний на языке DSL, которые обеспечивают определение знаний в системе и описание, на основе этих определений, объектов предметной области. Для расширения описания любых объектов в базе знаний достаточно внести в Базовую Модель определение новых свойств объектов предметной области, а потом свободно использовать эти свойства при описании конкретных объектов.

Описание на языке DSL имеет отображение в виде электронной карточки, содержащей предложения языка, которые объединены в «параметрическое дерево». Содержание электронной карточки объекта строится автоматически по описанию этого объекта. При изменении или расширении описания объекта вся новая информация будет автоматически отображаться в электронной карточке.

  1. Вся информация в описании объекта может быть разделена на смысловые закладки: личные данные, семья, работа и т.п.
  2. В качестве характеристик объекта могут выступать различные типы данных: числовые, текстовые, графические и др.
  3. Предложения языка DSL могут быть «императивными» - автоматически вычисляться системой в момент обращения к ним.
  4. Простые, характеристические, предложения языка DSL - обеспечивают представление простых свойств объектов предметной области.
  5. Составные предложения, обеспечивающие отображение составных характеристик или отображение разнообразных связей между объектами.
  6. В описание объекта возможно использование одного предложения несколько раз с различными значениям.

Управление Базой Знаний

  1. Модель Предметной Области - содержит информацию об объектах предметной области и определение всех используемых понятий в Базе Знаний.
    Построение Модели Предметной Области обеспечивает перенос прикладной логики программы непосредственно в Модель.
  2. Декларативный программный интерфейс - все операции с информацией в Базе Знаний осуществляются так же на языке DSL, что обеспечивает открытый интерфейс доступа к Базе Знаний. При необходимости, разработчик может расширить интерфейс к Базе Знаний или переопределить существующий интерфейс.
  3. Библиотека графических элементов - обеспечивает управление и отображение содержимым Базы Знаний и позволяет создавать пользовательский интерфейс для решения специализированных задач.
  4. Библиотека типовых решений - фрагменты Модели Предметной Области, которые можно использовать в различных прикладных задачах.
    Фрагменты созданной Модели Предметной Области для одной задачи могут быть успешно использованы при создании Модели другой задачи, что позволяет очень просто создавать новые прикладные решения из «кубиков» существующих решений.
  5. Библиотека ассоциированных процедур - прикладная логика Базы Знаний строится как набор процедур, ассоциированных с конкретными сущностями Базы Знаний. Вызов ассоциированных процедур выполняется автоматически Базой Знаний при обращении к Модели Предметной Области и результат работы процедуры так же заносится в Модель. Это обеспечивает изолированность процедур друг от друга и возможность простого изменения логики любой процедуры без необходимости корректировки остальных процедур. Ассоциированные процедуры могут быть написаны на различных языках программирования.
  6. Конструктор Модели Предметной Области - позволяет создавать и изменять Модель Предметной Области в соответствии с новыми требованиями к решению задачи в процессе всего времени эксплуатации Базы Знаний.
  7. Универсальный интерфейс отображения - Монитор Модели, обеспечивающий навигацию, отображение, редактирование и создание новых описаний в Модели Предметной Области в удобной форме. Монитор Модели автоматически отображает любые изменения в Модели Предметной Области.
  8. Универсальный интернет-интерфейс - веб-клиент к Базе Знаний, обеспечивающий функции Монитора Модели с учетом специфики веб-технологий.

Использование Базы Знаний

Применение технологии управления знаниями в организации обеспечит построение собственной Базы Знаний
для качественного анализа информации и принятия обоснованых решений.

  1. СМАРТ - отраслевая ERP система для управления производственными предприятиями, изготавливающими сложные технические изделия.
    «СМАРТ» обеспечивает эффективную организацию производства сложных технических изделий на заказ и прозрачность всех производственных и управленческих процессов на предприятии.
  2. ПЕРСОНАЛ - создание базы знаний сотрудников, создание досье любых субъектов.
    «Персонал» - это профессиональная кадровая программа, которая обеспечивает автоматизацию кадрового делопроизводства и поддержку управления персоналом на предприятиях с различными формами собственности и различной численностью сотрудников.
  3. БАЗИС - это База Знаний Информации о Студентах для управления учебной деятельностью ВУЗ и эффективного решения различных задач, стоящих перед ВУЗами.
  4. ЛИМС (Лабораторная Информационная Система) - система класса ERP, предназначенная для учета и управления лабораторными потоками работ и документов.
  5. ВЕТКОНТРОЛЬ - государственная информационная система для учета и контроля грузов, попадающих в страну, а так же обеспечения межрегионального документооборота.
  6. АНАЛИТИЧЕСКАЯ БАЗА ЗНАНИЙ - сбор, хранение и обработка разнородной информации по любым объектам предметной области, семантический анализ, создание Модели Предметной Области без программирования.
  7. АНАЛИЗ СИТУАЦИЙ - оценка ситуаций, выявление закономерностей, диагностика состояний.
  8. ПРОГНОЗИРОВАНИЕ - определение вероятного сценария развития ситуации.

Источник Знаний

К О Н Т А К Т Ы

Адрес:

Copyright © 2014 - Bravosoft