Бронфельд Г.Б. Анализ систем, основанных на интеграции знаний
|
(доклад в кратком виде на международной научно-технической конференции "Информационные системы и технологии ИСТ-2011", г.Н.Новгород)
___Проведем сравнительных анализ интеллектуальных систем (ИС), связанных с интеграцией знаний. Выполним анализ с точки зрения эффективного нахождения решений различных проблем, в основном, в рамках направления «искусственный интеллект» (ИИ).
Наиболее известны из них экспертные системы (ЭС). Основными элементами ЭС являются базы знаний (БЗ) и машина вывода. БЗ носит интегрированный характер и содержит знания из специализированных текстов и знания экспертов. Имплицитные знания выявляются. Ввод знаний обеспечивает инженер по знаниям. Предметная область – узкая, область применения – ограничена, обычно индивидуального применения. Результат расчетов и рекомендаций ЭС конкретен и достаточно точен. Отладка результатов доводится до ответов на уровне профессионального эксперта. Логический вывод прямой и обратный, на синонимах не застревает. Используются модели знаний – продукционные, семантические сети, фреймы, предикаты 1-го порядка и некоторые другие. Объем БЗ от тысяч до десятков тысяч правил. В разработке длительны (средний срок 5 лет) и дороги (средняя стоимость около 1 млн.долларов).
Более сложный вариант представляет собой концепция создания универсальной ЭС (УЭС). Исходная идея содержала предложение самообучаться «на все случаи жизни». Предполагалось, что УЭС может формировать бесчисленное количество БЗ, относящихся к совершенно разных предметным областям. Хотя отдельные попытки в этом направлении были, в целом этот подход остается нереалистичным и не развивается всерьез.
Один из первых подход, основанный на интеграции знаний, был в следующем. Тексты, касающиеся конкретных предметных областей, моделируются, например, с помощью продукционных моделей или семантических сетей. Создается специальная машина вывода, которая обеспечивает логический вывод на основе этих нескольких промоделированных текстовых источников. При этом встретились со следующими проблемами - проблемой синонимов и «проклятием размерности» (возникает много вариантов выводов и неясна предпочтительность одного варианта перед другим). Периодически такие попытки возникают вновь и вновь.
Интересным является подход, основанный на поиске связей определенных терминов по различным текстам. Здесь даже не используется моделирование знаний. Иногда выявление этих связей имеет серьезное значение, однако нахождение решений, как таковых, они не обеспечивают.
Получило свое развитие интеграция знаний и в рамках гипертекстовых систем. При этом используемые тексты моделируются моделями знаний, например, с помощью продукционных моделей. При этом также используются пометки необходимых терминов, как и в стандартном гипертекстовом подходе. Такое представление получило название «эксперттекст». Здесь также сталкиваются с «проклятием размерности» и излишней нагрузкой для пользователя при поиске решения.
Одним из широко развивающихся направлений по интеграции знаний является развитие технологии knowledge management - в российском варианте создание систем управления знаниями (СУЗ). В этом подходе идет объединение используемых в организации документов в единую корпоративную память. Для этого производится их обязательный перевод в электронный вид (если они исходно не имели таковой). Для допуска к документам используется достаточно сложное программное обеспечение, который обеспечивает доступ, как для индивидуальной работы работников организации, так и для совместной работы над ними. Достаточно широкие сервисные возможности СУЗ безусловно повышают эффективность деятельности организаций на основе повышения эффективности использования имеющихся в организации знаний. Тем не менее, этот подход не ликвидирует дублирование знаний, опять-таки в связи с большим объемом документов приходим к «проклятию размерности» при попытках углубленного автоматического поиска результатов с применением логического вывода. В большинстве практически применяемых СУЗ не используется моделирование знаний, содержащихся в документах. Абсолютное большинство крупных компаний мира СУЗ имеют. И хотя развитие СУЗ на них идет относительно недавно - немногим более 15 лет, уже явно наметился застой в дальнейшем развитии их возможностей и степени влияния на работу организаций.
Интересным является направление, развиваемое уже около 15 лет группой Цурикова (компания Invention Machine Corp., США). Это развитие программной системы «Изобретающей машины», созданной когда-то в СССР для реализации подхода «теории решения изобретательских задач», созданной в свое время Г.Альтшуллером . В США основное программное средство получило название вначале TechOptimizer, а потом Invention Machine Goldfire. Представителями этой компании получили уже более 30 патентов для развития своей новой технологии. Основой новой технологии является интеграция со знаниями, содержащимися во внешней среде в Интернете. Искомые источники находятся вначале по искомым терминам, потом моделируются на основе представления знаний в виде САО-структур. Затем на основе этих моделей проводится логический вывод с целью получения искомых результатов в виде семантически связанного текста. При работе с внешней среда возникает проблема синонимов и опять таки «проклятие размерности», как связанное с большим количеством дублирующих источников, так и с большим количеством возможных вариантов логического вовыода.
Существуют попытки на основе применения методов ИИ обеспечить выявление смысла текста, в частности, на основе частотного анализа, на основе получения текстов-результатов в виде семантических сетей или в виде лингвистических моделей. Но хотя всякий текст с точки зрения лингвистики есть пересечение текстов, - все равно прочтение текстов есть такая деятельность, когда пользователь находит и актуализирует такой смысл, который зависит от его культурного уровня, знаний, опыта и кругозора. Выводной смысл (решение) располагается между «строк» текста и служит фактором, связывающим данный текст на основе интертекстуальных связей с другими текстами. Т.е. пока попытки прямого нахождения смысла (решения) автоматически имеют весьма ограниченный характер, не сопоставимый с возможностями человека.
Интересный подход к интеграции знаний стал развивать Д.Грей в рамках своей виртуальной астрономической обсерватории, которая продемонстрировала серьезные успехи и оживленные обсуждение. Ее работа основана на наложении данных наблюдений за звездным небом разными обсерваториями друг на друга. И то, что на отдельной обсерватории выглядело, как просто «шум», при наложении разных наблюдений приводило к выявлению новой звезды или галактики. Для этой работы приходится обрабатывать большие объемы данных. Успехи настолько воодушевили Грея и его единомышленников, что они опубликовали что-то вроде манифеста к ученым и специалистам мира, призывающего обрабатывать большие объемы данных разных типов в ближайшие десятилетия на основе нового опробованного подхода с вертикально организованной структурным разделением.
Известно, что в рамках ИИ одно из наиболее модных представлений знаний Акоффа-Желены включает в качестве своей нижнего уровня просто данные. Т.е. опробованный подход можно было бы развернуть до уровня интеграции знаний, но в 2007 г. Д.Грей трагически погиб и уже частично опробованное направление продолжения без него не получило.
Развиваемый автором подход, используемый в элинге (АСУЗ), основан на прямом наложении знаний, который начал развиваться Д.Греем (в рамках наложения данных), и позволяет продвигаться по решению тех проблем и устранению недостатков, которые существуют в рассмотренных направлениях разработки ИС.
Главная страница
|