Программа определения степени визуальной постраничной релевантности текста, реализующая метод заметающей кривой

Грехов Максим Михайлович
14 сентября 2018
99
Предметная область
Отрасли по ОКВЭД
Страна, регион, город Российская Федерация, Москва
Отличия от конкурентов
Вид документа об охране ИС программа для ЭВМ
Номер документа ИС 201466063
Дата регистрации документа ИС 2014-10-13
Необходимые инвестиции для внедрения договорная
Сроки внедрения
Стоимость предоставления технологии договорная
Наличие экспертного заключения Нет

Польза для потенциального потребителя

Программа реализует метод заметающей кривой, известный как «Lgloo», в котором дискретное двухмерное пространство нумеруется и обрабатывается его каждая точка подобно развертке в кинескопе, в результате формируются распознающие матрицы хешей слов. Слова на странице рассматриваются как точечные объекты с координатами: номер строки и смещение первого символа слова относительно начала строки. Для представления каждого слова как единого объекта, от него берется хеш-значение, которое также является уникальным идентификатором слова. Релевантность, как степень визуального сходства страниц текста, определяется двумя величинами: количеством совпавших хеш-значений, чьи координаты находятся в пределах дельты отклонения и максимальным количеством хеш-значений среди двух распознающих матриц. Программа может быть применена для поиска в текстовой информации после постраничного сканирования и распознавания.