Анализ проблем, связанных с созданием систем с прямым наложением знаний. Тезисы доклада на "XVIII Международной научно-технической конференции "Информационные системы и технологии ИСТ-2012", г.Н.Новгород, НГТУ им.Р.Е.Алексеева
|
___Проведем анализ проблем, связанных с созданием интеллектуальных систем (ИС) на основе прямого наложения знаний. К таким ИС, как известно, пока относятся элинги, аналитические системы управления знаниями (АСУЗ) и спецсистемы, например, впервые использовавшая подобный подход – виртуальная астрономическая обсерватория Д.Грея.
___Достаточно длительный период работы над этим направлением с 2001 года выявил ряд непонятных (или даже нереализуемых, с чьей-то точки зрения) и спорных проблем, в т.ч. нуждающихся, в ряде случаев, в дальнейших, иногда длительных исследованиях и работах.
___Перечень этих проблем, в основном, следующий:
- объем используемых баз знаний (БЗ);
- проблема трудоемкости создания БЗ;
- проблема авторского права для используемых БЗ;
- проблема «вечности» создаваемых БЗ и изменения используемых технических средств;
- проблема корректировки БЗ;
- проблема синонимов при работе с БЗ;
- проблема корректировки создаваемого специального программного обеспечения;
- проблема незаконного копирования программного средства;
- использование особенностей психологии человека при решении задач;
- проблема ускорения вывода с такой БЗ;
-проблема повышения производительности труда пользователя при использовании такой технологии;
- проблема интереса потребителей, в т.ч. заказчиков и инвесторов, к данной технологии;
-проблема повышения общей производительности труда при использовании такой технологии;
- повышение интереса к применению ЭВМ пользователей;
- общие проблемы технологии создания программных средств и БЗ для данной технологии.
__Рассмотрим некоторые из указанных проблем.
___Начнем с объема БЗ.
___Среди ИС одни из самых широко известных - экспертные системы (ЭС). Хорошо известно, что в ЭС с наиболее высоким уровнем выдаваемых решений, БЗ имеют объем более 10 тысяч продукционных правил. В более мощных известных системах типа проекта CYC Лената объем БЗ превысил несколько миллионов статей, что в пересчете на продукционные правила – около 100 миллионов. Одна из последних и весьма успешных ИС - Watson компании IBM имеет БЗ с объемом 200 миллионов страниц текста, что в пересчете на продукционные правила составляет около 20 миллиардов продукционных правил. Объем БЗ для качественно работающих элинг (АСУЗ) начинается с объема БЗ в несколько сотен тысяч молинг (основный вид моделей знаний для элинг (АСУЗ)). Молинга моделирует каждое простое предложение в тексте. В пересчете (для сравнения) на продукционные правила объем БЗ элинги (АСУЗ) составляет, начиная с 1 миллиона продукционных правил.
___И хотя эти оценки объемов БЗ больше объемов БЗ для ЭС, они намного меньше уже давно достигнутых уровней БЗ развитых ИС с хорошо освоенным опытом работы с ними.
___Проблема трудоемкости создания БЗ.
___Известно, что средний срок создания хороших ЭС – не менее 3-5 лет, причем основная трудоемкость их разработки падает именно на наполнение БЗ ИС и ее отладку. Расчеты показывают, что для создания БЗ АСУЗ с прямым наложением знаний требуется около 5 лет с относительно небольшим количеством участвующих в этом, для выпуска элинг даже меньше. Т.е ничего необычного по трудоемкости по сравнению с традиционной при создании ИС для создания элинг (АСУЗ) – не требуется. И намного уступает по трудоемкости и сложности в сравнению с уже упомянутыми мощными ИС CYC и Watson .
___Проблема «вечности» создаваемых БЗ и изменения используемых технических средств.
___Известно, что, например, тексты на свитках папируса из Египта или пергамента из Греции сохранились в течение несколько тысяч лет, донеся отдельные знания до нынешнего периода.
___Пусть несколько тысяч лет будут считаться «практической вечностью» для современного периода развития. Опыт прошедшего продемонстрировал, что абсолютное большинство первоисточников не дошло до современного периода, значительный объем знаний и даже уже освоенные технологии, оказался утерянным. В некоторых первоисточниках, например, в буддийских монастырях сохранились первоисточники с описанием совершенно невероятных технологий, но трактовка используемых понятий и подходов утеряна, в результате суть описаний почти абсолютно непонятна.
___Особенность технологии создания БЗ элинг (АСУЗ) в том, что знания виде молинг из текстов заносятся лишь один раз и более не удаляются, лишь может меняться со временем их уровень достоверности (ложности). И постепенно в БЗ элинг (АСУЗ) добавляются все новые и новые, кроме тех, которые в семантическом смысле уже были введены ранее (фактор «интертекстуальности» научно-технических текстов). Элинга с постоянной периодичностью будет перевыпускаться (1 раз в 1-2 квартала) с дополненной БЗ в сотнях тысячах или даже миллионах экземплярах. Естественно переход на новые технические средства будет происходит плавно и без всяких потерь. Для АСУЗ несколько более сложная ситуация, но и здесь в большинстве случаев она будет передаваться (продаваться) от одного собственника к другому, как один из самых важных и дорогостоящих элементов, в виде интеллектуальной собственности. По сути это обеспечивает «практически вечный» период сохранности знаний в рамках данной технологии, а также ее практическую неуничтожимость (поскольку они одновременно будут храниться в разных местах в миллионах экземплярах)
___Проблема корректировки БЗ. Она является одной из ключевых , в частности, для ЭС и онтологическим систем. Из-за проблем с отладкой и корректировкой это вызывает ограниченный объем БЗ ЭС и нарушает основы принципов функционирования онтологических систем (в частности, непротиворечивости аксиом). Для элинг (АСУЗ) все резко упрощается. Предположим в БЗ введено ошибочное значение. Поскольку в процессе логического вывода пользователю выдается несколько вариантов решений, то он может обойти возникшую проблему и ее проверить разными способами без привлечения производителя или другого эксперта. Кроме того, он может обратиться с замечанием к самому производителю, чтобы внести в БЗ исправление. Внешне это будет выглядеть что-то вроде «опечатки» в книге, - некоторое неудобство, но не более.
___Проблема незаконного копирования программного средства. Это является «заразной болезнью» современного этапа развития ИТ-технологий. Опишем, как это решается для программной продукции массового потребления – элинги. Она будет часто перевыпускаться (1 раз в 1-2 квартала), иметь серьезную защиту от копирования в нескольких формах, в каждой новой версии элинги будут новые (или уточненные) знания. Это приведет к тому, что заниматься незаконным копированием будет сложно (дешевле недорого купить), а заниматься «пиратским» производством просто разорительно. Ведь неизвестно многочисленных случаев массовых продаж «пиратских» копий вчерашних газет, чужих ежемесячных журналов и т.п. Использование устаревших знаний элинг весьма чревато тем, что новые решения на основе устаревшей «пиратской» копии элинги могут приводить к негативным последствиям по сравнению с работой со знаниями «свежей» элинги. Достаточно 1-2 громких случаев такой ситуации и потребители быстро поймут вредность для себя покупки «пиратских» устаревших копий элинг.
___В докладе рассмотрены и остальные проблемы, связанные с созданием систем с прямым наложением знаний.
Главная страница
|