Бутакова М.А.
1
Климанская Е.В.
1
Янц В.И.
2
1 ФГБОУ ВПО «Ростовский государственный университет путей сообщения»
2 ФГБОУ ВПО «Ростовский государственный строительный университет»
В статье предложена новая мера информационного подобия для анализа слабоструктурированных документов, базирующаяся на интерференционно-волновом подходе. Дано описание предметной области исследований слабоструктурированных данных. Приведены примеры возникновения явления слабой структурированности документов. Представлены принципы организации хранения слабоструктурированных документов в базах данных и описан существующий инструментарий бессхемных баз данных и баз данных с изменяемой схемой данных. Подробно изложен принцип построения интерференционной волны и векторов интерференции. Приведена формула вычисления меры на основе векторов интерференции. Описан процесс индексации и нахождения релевантной информации по мере. Предложена модификация интерференционно-волновой меры информационного подобия в обобщенном виде. Проведено тестирование модели на экспериментальной базе данных. Установлено, что алгоритм вычислений по предложенной мере имеет линейную сложность вычислений Сделаны выводы о возможности применения предложенного метода в больших базах данных.
Библиографическая ссылка
Бутакова М.А., Климанская Е.В., Янц В.И. МЕРА ИНФОРМАЦИОННОГО ПОДОБИЯ ДЛЯ АНАЛИЗА СЛАБОСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ // Научное обозрение. Технические науки. 2014. № 1. С. 90-91;URL: https://science-engineering.ru/ru/article/view?id=100 (дата обращения: 13.07.2025).