Программа определения степени визуальной постраничной релевантности текста, реализующая метод заметающей кривой
Грехов Максим Михайлович
14 сентября 2018
257
Предметная область | — |
Отрасли по ОКВЭД | — |
Страна, регион, город | Российская Федерация, Москва |
Отличия от конкурентов | — |
Вид документа об охране ИС | программа для ЭВМ |
Номер документа ИС | 201466063 |
Дата регистрации документа ИС | 2014-10-13 |
Необходимые инвестиции для внедрения | договорная |
Сроки внедрения | — |
Стоимость предоставления технологии | договорная |
Наличие экспертного заключения | Нет |
Польза для потенциального потребителя
Программа реализует метод заметающей кривой, известный как «Lgloo», в котором дискретное двухмерное пространство нумеруется и обрабатывается его каждая точка подобно развертке в кинескопе, в результате формируются распознающие матрицы хешей слов. Слова на странице рассматриваются как точечные объекты с координатами: номер строки и смещение первого символа слова относительно начала строки. Для представления каждого слова как единого объекта, от него берется хеш-значение, которое также является уникальным идентификатором слова. Релевантность, как степень визуального сходства страниц текста, определяется двумя величинами: количеством совпавших хеш-значений, чьи координаты находятся в пределах дельты отклонения и максимальным количеством хеш-значений среди двух распознающих матриц. Программа может быть применена для поиска в текстовой информации после постраничного сканирования и распознавания.