reforef.ru 1
Интеграция информации для решения задач в распределенных информационных системах
Спецкурс

Факультет Вычислительной математики и кибернетики МГУ

Кафедра АСВК

(проект программы)
Профессор Л.А.Калиниченко
Общее описание курса
В различных областях деятельности человека наблюдается экспоненциальный рост числа информационных ресурсов (баз данных, сервисов, процессов), разработанных для решения разнообразных задач – исследовательских и практических. Каждый из ресурсов представлен средствами некоторой информационной модели (некоторого языка – баз данных, программирования, спецификации процессов и пр.). Разнообразие таких языков велико – настоящий период развития ИТ характеризуется взрывоподобным процессом создания все новых, и новых информационных моделей. Это развитие происходит как в рамках конкретных инфраструктур (таких как архитектуры OMG, в частности архитектура CORBA, архитектуры, движимые моделями представления информации (MDA), архитектуры семантического Веба, сервис-ориентированные архитектуры, архитектуры электронных библиотек, архитектуры информационных грид систем), так и в стандартах конкретных информационных моделей — моделей данных (таких как, например, ODMG 2000, SQL 2006, UML, стеки XML и RDF моделей данных), моделей потоков работ (например, Staffware, COSA, InConcert, Eastman, FLOWer, Domino, Meteor, Mobile, MQSeries, Forte, Verve, Vis.WF,Changeng, IFlow, SAP/R3), языков процессной композиции сервисов (XPDL, BPEL, BPML, XLANG, WSFL, WSCI), семантических моделей (включая онтологические модели и модели метаданных), моделей цифровых репозиториев данных и знаний в конкретных областях бизнеса, торговли, науки и многих других. Основу таких моделей составляют разнообразные понятия и парадигмы, несовместимые между собой. Накопление большого числа неоднородных, распределенных информационных ресурсов вызывает все увеличивающуюся потребность совместного использования (интеграции) модельно неоднородных информационных компонентов и сервисов в различных применениях, а также их повторного использования и композиции для реализации интероперабельных информационных систем. Эта ситуация приводит к необходимости поиска новых путей создания информационных систем, в которых особое внимание было бы сосредоточено на специальных средствах организации решения задач над множеством распределенных информационных ресурсов (данных и программ), накапливаемых в разнообразных научных центрах.

Увеличивающийся разрыв между разработчиками информационных систем и информационными ресурсами приводит к необходимости поиска новых путей создания систем, в которых особое внимание было бы сосредоточено на специальных средствах организации решения задач над множеством распределенных информационных ресурсов (данных, программ, процессов), накапливаемых в разнообразных организациях. Разрабатывается ряд инфраструктур, которые технически способствуют организации решения задач в таких условиях. Среди них Веб-сервисы, Гриды данных, Семантический Веб, инфраструктуры онтологического моделирования, интеграции информационных ресурсов, интероперабельные инфраструктуры промежуточного слоя, и др.
Вместе с тем сложны и все еще далеки от решения проблемы семантики, возникающие при:


  1. определении предметных областей и их понятий;

  2. отображении и интеграции контекстов предметных областей информационных ресурсов в контекст предметной области задачи;

  3. идентификации релевантных задаче информационных ресурсов и формировании их композиций;

  4. доказательно правильном отображении информационных моделей ресурсов в общую информационную модель предметной области;

  5. интеграции схем ресурсов в схеме предметной области и устранении разнообразных конфликтов;

  6. выявлении семантически подобных компонентов ресурсов в процессе интеграции схем;

  7. адекватном преобразовании формул (запросов) программы решения задачи, выраженных в терминах предметной области задачи, в формулы, выраженные в схемах релевантных ресурсов, и пр.

В курсе будут рассматриваться новые языки и модели онтологического и концептуального моделирования, служащие в качестве унифицирующих (канонических) языков представления неоднородной информации, методы определения разнообразных предметных областей в таких канонических моделях, методы семантической интеграции распределенных информационных ресурсов в спецификации предметной области задач, методы синтеза канонических информационных моделей для такой интеграции, архитектуры предметных посредников для интеграции информации и решения задач над множеством неоднородных распределенных информационных ресурсов, инструментальные средства посредников, методы решения задач в таких архитектурах. Рассмотрение этих вопросов будет сопровождаться изучением существующих и разрабатываемых формальных методов и подходов, которые используются в составе названных средств. Такие формальные методы, опирающиеся на математическую логику и алгебру, используются в разнообразных предметных областях (науке, медицине, ядерной энергетике, телефонии, транспорте, космической технике и др.) в составе инструментальных средств спецификации и верификации разрабатываемых систем. Существенно, что формальные методы достигли индустриальной зрелости – они доведены до уровня масштабного их применения в промышленности.

Курс основан на значительном опыте создания новых архитектур и методов решения задач над множеством неоднородных распределенных ресурсов, их интеграции, применения формальных методов, накопленном в Лаборатории Методов композиционного проектирования информационных систем ИПИ РАН и в Лаборатории Открытых информационных технологий ВМК МГУ. С некоторыми проектами и публикациями можно познакомиться на сайте http://synthesis.ipi.ac.ru/synthesis/


Структура курса
Курс годичный
Первый семестр


  1. Информационные модели и их унификация

  2. Концептуальное моделирование предметных областей

  3. Онтологическое моделирование предметных областей


Второй семестр


  1. Технологии интеграции информационных ресурсов

  2. Инфраструктура промежуточного слоя предметных посредников для решения задач над множеством интегрируемых информационных ресурсов

  3. Методология решения задач над множеством интегрируемы информационных ресурсов


Детальное содержание курса
Информационные модели и их унификация


  • Разнообразие моделей представления информационных ресурсов (модели данных (структурированные, объектные, слабоструктурированные), фреймовые модели, модели сервисов, процессные модели, онтологические модели, и пр.)

  • Абстрактные типы данных

  • Методы коммутативного отображения информационных моделей на основе денотационной семантики и на основе логики предикатов

  • Язык СИНТЕЗ как ядро канонической информационной модели

  • Методы синтеза канонических информационных моделей, позволяющие унифицировать множество информационных моделей (языков) представления информационных ресурсов

  • Формальная семантика канонических моделей
  • Методы и средства уточнения1 для доказательства правильности интеграции информационных ресурсов


  • Архитектура унификатора неоднородных информационных моделей

  • Методы приведения процессных моделей (широко использующихся для управления корпоративной деятельностью) к унифицированной модели

  • Примеры отображения информационных моделей в каноническую

  • Отображение схем информационных ресурсов в каноническую схему



Концептуальное моделирование предметных областей


  • Архитектура ANSI/X3/SPARC

  • Языки концептуального моделирования

  • Формальные концептуальные модели

  • Соотношение концептуальных и онтологических моделей предметных областей

  • Примеры концептуальных схем предметных областей


Онтологическое моделирование предметных областей


  • Варианты определения понятия «онтология»

  • Языки онтологического моделирования

  • Дескриптивные логики и их роль в онтологических моделях

  • Методы согласования онтологических контекстов

  • Методы отображения неоднородных онтологических моделей в каноническую модель

  • Методы разработки, сопровождения и реинжиниринга онтологий

  • Онтологии предметных областей и их роль при интеграции информации и решении задач

  • Примеры онтологий предметных областей


Технологии интеграции информационных ресурсов


  • Технология материализации данных в хранилищах данных, интеграция схем баз данных, загрузка хранилища

  • Технология извлечения, трансформации, загрузки данных (ETL)

  • Технологии виртуальной интеграции данных

  • Методы интеграции схем баз данных

  • Технологии чистки данных (выявления дубликатов сущностей в различных интегрируемых ресурсах)

Технология промежуточного слоя предметных посредников для решения задач над множеством интегрируемых информационных ресурсов



  • Виды предметных посредников и методология интеграции неоднородных ресурсов в посредниках

  • Семантическая идентификация ресурсов, релевантных предметным посредникам (роль метаданных, онтологии и концептуальной схемы)

  • Методы поиска информационных ресурсов, максимальные фрагменты спецификаций которых доказательно уточняли бы фрагменты концептуального описания предметной области

  • Регистрация ресурсов в предметном посреднике (семантическая интеграция). Метод инверсных правил

  • Архитектура исполнительных механизмов слоя предметных посредников

  • Методы переписывания программ и планирования в предметных посредниках

  • Методы планирования исполнения программ в предметных посредниках

  • Пример реализации предметного посредника в Грид-инфраструктуре


Методология решения задач над множеством интегрируемы информационных ресурсов


  • Методы и средства семантической спецификации предметных областей (онтологические и концептуальные спецификации) как предметных посредников

  • Спецификации задач, движимые приложениями

  • Методы построения композиций фрагментов спецификаций разнообразных ресурсов, которые уточняли бы заданные спецификации предметной области

  • Программирование задач в контексте спецификации предметной области

  • Методы проектирования виртуальных организаций, обеспечивающих интероперабельность существующих информационных систем реальных организаций

  • Примеры решения задач над множеством распределенных информационных ресурсов


Список литературы
1. Средства концептуального моделирования предметных областей
Калиниченко Л.А. СИНТЕЗ – язык определения, проектирования и программирования интероперабельных сред неоднородных информационных ресурсов, ИПИ РАН, 1993, 115 стр.

Kalinichenko L.A. Compositional Specification Calculus for Information Systems Development Proceedings of the East-West Conference on Advances in Databases and Information Systems (ADBIS'99), Maribor, Slovenia, September 1999, Springer Verlag, LNCS

Ceri S., Gottlob B., Tanca L. Logic programming and databases. Springer-Verlag, 1990
Kalinichenko L.A., Stupnikov S.A., Martynov D.O. SYNTHESIS: a Language for Canonical Information Modeling and Mediator Definition for Problem Solving in Heterogeneous Information Resource Environments. Moscow: IPI RAN, 2007. - 171 p

2. Введение в онтологическое моделирование

Kalinichenko L.A., Missikoff M., Schiappelli F., Skvortsov N. Ontological Modeling. Proc. of the Fifth Russian Conference on Digital Libraries RCDL'2003. St.-Petrsburg: St.-Petrsburg State University, 2003. -- P. 7 - 13.

Ontolingua. http://ontolingua.stanford.edu

OWL Web Ontology Language Guide,  http://www.w3.org/TR/owl-guide/

The Object Database Standard: ODMG 3.0. Morgan Kaufmann Publishers, 2000, 260 pages
Kalinichenko L.A., Skvortsov N.A. Extensible ontological modeling framework for subject mediation In Proceedings of the 4-th Russian Scientific Conference "DIGITAL LIBRARIES: Advanced Methods and Technologies, Digital Collections, Oct. 15-17, 2002, Dubna
3. Методы и средства конструирования канонических информационных моделей
Калиниченко Л.А. Методы и средства интеграции неоднородных баз данных. Москва, Наука, 1983, 420 стр.
Kalinichenko L.A. Methods and tools for equivalent data model mapping construction

Proc. EDBT'90 Conference. Springer-Verlag, 1990. 92-119
L.A. Kalinichenko, N.A. Skvortsov Extensible ontological modeling framework for subject mediation. Proc. of the Fourth Russian Conference on Digital Libraries RCDL'2002. -- Dubna: JINR, 2002. V. 1. P. 99 - 119.

Калиниченко Л.А., Ступников С.А., Земцов Н.А. Методы синтеза канонических моделей, предназначенных для достижения семантической интероперабельности неоднородных источников информации. ИПИ РАН, Москва, 2005


Формальные методы и модели в композиционных инфраструктурах распределенных информационных систем. Системы и средства информатики, специальный выпуск, ИПИ РАН, 2005 г., 304 стр.

Ступников С.А. Формальная семантика ядра канонической объектной информационной модели. Системы и средства информатики: Спец. вып. Формальные методы и модели в композиционных инфраструктурах распределенных информационных систем. Под ред. И. А. Соколова. М.: ИПИ РАН, 2005. C. 40-68.
Ступников С.А. Моделирование композиционных уточняющих спецификаций.

Дисс. канд. техн. наук: 05.13.17, М.: ИПИ РАН, 2005
Захаров В. Н., Калиниченко Л. А., Соколов И. А., Ступников С. А. Конструирование канонических информационных моделей для интегрированных информационных систем Информатика и ее применения. – М., – Т. 1, Вып. 2, 2007 г.
4. Инфраструктура предметных посредников и методы спецификации предметных областей и решения задач над множеством неоднородных распределенных информационных ресурсов
Калиниченко Л.А. Методология организации решения задач над множественными распределенными неоднородными источниками информации. Сборник трудов Международной конференции «Современные информационные технологии и ИТ-образование». - М.: МГУ, 2005. - С. 20 – 37
Briukhov D.O., Kalinichenko L.A., Skvortsov N.A. Information sources registration at a subject mediator as compositional development Advances in Databases and Information Systems: Proc. of the 5th East European Conference. Berlin-Heidelberg: Springer-Verlag, 2001. P. 70-83
Брюхов Д.О. Конструирование информационных систем на основе интероперабельных сред информационных ресурсов: Дисс. канд. техн. наук: 05.13.11 -- М.: ИПИ РАН, 2003. 158 с.

Ступников С.А. Автоматизация верификации уточнения при композиционном проектировании информационных систем и посредников. Системы и средства информатики: Спец. вып. Формальные методы и модели в композиционных инфраструктурах распределенных информационных систем. Под ред. И. А. Соколова. М.: ИПИ РАН, 2005. C. 96 -119


Stupnikov S.A., Kalinichenko L.A., Bressan S. Interactive discovery and composition of complex Web services. In Proceedings of the East-European Conference on “Advances in Databases and Information Systems" (ADBIS'06), Thessaloniki, Springer, LNCS, 2006.
Д.О. Брюхов, А.Е. Вовченко, В.Н. Захаров, О.П. Желенкова, Л.А. Калиниченко, Д.О. Мартынов, Н.А. Скворцов, С.А.Ступников. Архитектура промежуточного слоя предметных посредников для решения задач над множеством интегрируемых неоднородных распределенных информационных ресурсов в гибридной грид-инфраструктуре виртуальных обсерваторий. Информатика и ее применения. – М., – Т. 2, Вып. 1, 2008 г.
5. Формальные методы и языки спецификации и проектирования ИС
Abrial J.-R. The B-Book. Assigning programs to meanings. Cambridge, University Press. 1996
Abrial J.-R. B-Technology: Technical overview. B-Core (UK) Ltd., 1993

Lano K. The B Language and Method: A Guide to Practical Formal Development. Springer-Verlag, 1996.

Beckert B., Keller U., Schmitt P. Translating the Object Constraint Language into First-order Predicate Logic. Proc. VERIFY: Workshop at Federated Logic Conferences.

Copenhagen, 2002.
Ledang H., Souquieres J. Integration of UML and B Specification Techniques: Systematic Transformation from OCL Expressions into B. Proc. of APSEC 2002. Washington: IEEE Computer Society, 2002. P. 495-506.

Morgan C. Programming from Specifications. Prentice Hall, 1994

Back J.R., Von Right J. Refinement Calculus. N.Y.: Springer-Verlag, 1998.

Butler M. J. csp2B: A Practical Approach To Combining CSP and B. Formal Aspects of Computing. 2000. N. 12. P. 182-198.

Хоар Ч. Взаимодействующие последовательные процессы. М.: Мир, 1989.

Spivey J.M. The Z Notation (A reference manual). Prentice Hall, 1989

Stepney S., Barden R., Cooper D. (Eds). Object Orientation in Z. Springer Verlag, WiC series, 1992

R. Duke and G. Rose. Formal Object Oriented Specification Using Object-Z. Macmillan, 2000


Kim S., Carrington D. A Formal Mapping between UML Models and Object-Z Specifications.
ZB2000 Formal Specification and Development in Z and B: Proc. First International Conference of B and Z users. Springer-Verlag, 2000. P. 2-21

Fitzgerald J., Larsen P.G., Mukherjee P., Plat N., Verhoef M. Validated Designs for Object-oriented Systems. Springer-Verlag, 2005.


1 Неформально понятие уточнения определяется следующим образом. Говорят, что система B уточняет систему A, если пользователь может использовать систему B вместо системы A, не замечая факта замены A на B.