Автоматизация управления обработки данных: частотный и лексический анализ, графовая структура данных, правила логического следования

RDF представляет собой способ описания данных в формате субъект-отношение-объект, в котором в качестве любого элемента этой тройки используются только идентификаторы ресурсов. Модель данных RDF опирается на следующие базовые понятия: графовая структура данных, словарь идентификаторов URIref, типы данных, литералы, факты, правила логического следования. Однако большая часть накопленной информации, хранимой в Интернете, представлена в реляционных БД, доступ к которым семантическими средствами затруднен.

Для решения двух задач внедрения технологии RDF (интеграции с существующими реляционными БД и повышения производительности обработки данных) может быть использована система хранения RDF-данных, сочетающая подходы на основе отображения реляционных схем данных на модель RDF, на основе таблицы триплетов «субъект-предикат-объект». Для ее построения необходимо разработать модель адаптации реляционных данных для отображения на структуру RDF и обеспечить обработку RDF-запросов на доступ и обновление реляционных данных.

Модель адаптации реляционных данных представим в виде двойки: (M, N), где M — отображения реляционной модели данных на модель RDF, позволяющего создавать утверждения RDF на основе значений полей записей реляционных таблиц, (реляционная таблица соответствует классу RDF-ресурсов, запись — RDF-ресурсу, значение первичного ключа — субъекту, имя поля — предикату, значение — объекту утверждения RDF); N — единое пространство имён (первичных ключей) для всех RDF-ресурсов, отображённых из записей реляционных таблиц, а также RDF-ресурсов, описываемых утверждениями, хранимыми в таблице триплетов, что позволит вносить в нее утверждения, использующие в позициях субъекта, предиката и объекта, любые RDF-ресурсы.

Обработку RDF-запросов определим тройкой: (Aq, An, P), где: Aq — алгоритм преобразования запросов к данным RDF в запросы SQL; An — алгоритм обновления реляционных данных по запросу RDF; R — разбор и преобразование RDF-запросов и команд обновления данных в запросы и команды к реляционной СУБД на стандартном языке SQL.

По мере востребованности в конкретных приложениях от системы хранения RDF-данных также может потребоваться поддержка дополнительных возможностей. Набор алгоритмов, входящих в метод, обеспечивает поддержку следующих расширений:

  • — реификация (представление в виде самостоятельных ресурсов) утверждений RDF;
  • — применение правил логического вывода при преобразовании RDF-запросов для учёта в результатах выполнения запросов отношений подкласс-суперкласс, заданных предикатом rdfs:sub Class Of (вышеупомянутое создание единого пространства имён равносильно включению всех отображаемых классов ресурсов RDF на суперкласс; rdfs.-Resource);
  • — применение правил логического вывода для учёта подотношений, определённых при помощи предиката rdfs: sub Property Of, указывающего, что все утверждения, верные для подотношения, также верны и для базового отношения;
  • — применение правил логического вывода для учёта транзитивных отношений, входящих в класс предикатов owlTransitiveProperty (примером практического применения транзитивного отношения может быть выборка всех комментариев к заданному сообщению вне зависимости от уровня вложенности).

Суть метода заключается в интеграции новой модели адаптации реляционных данных для отображения на модель данных RDF; процедур логического вывода на основе известных алгоритмов; обработке RDF-запросов на доступ и обновление данных. Для реализации обработки разработаны новые алгоритмы преобразования запросов к данным RDF в запросы SQL и обновления реляционных данных по запросу RDF.

Следует отметить, что существующие системы хранения RDF-данных ограничиваются применением правил логического вывода на уровне приложения, что упрощает реализацию таких систем, но существенно снижает производительность обработки запросов.

Например, выполнение запроса с учётом правил для подклассов и подотношений в подобной системе подразумевает перебор всех возможных комбинаций подклассов и подотношений, используемых в RDF-запросе, и выполнение отдельного запроса SQL для каждого варианта.

Читайте также:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *