Программа определения степени подобия текстов, реализующая метод семантической нормализации

Грехов Максим Михайлович
14 сентября 2018
258
Предметная область
Отрасли по ОКВЭД
Страна, регион, город Российская Федерация, Москва
Отличия от конкурентов
Вид документа об охране ИС программа для ЭВМ
Номер документа ИС 201466050
Дата регистрации документа ИС 2014-10-09
Необходимые инвестиции для внедрения договорная
Сроки внедрения
Стоимость предоставления технологии договорная
Наличие экспертного заключения Нет

Польза для потенциального потребителя

Программа включает следующие этапы обработки текстов: морфологический анализ текстов, нормализацию сравниваемых текстов посредством замены слов-синонимов обоих текстов на какой-либо один, сравнение нормализованных текстов методом шинглов. Программа реализована как WEB-приложение. В программе используются возможность лемматизации (получение нормальной формы слова) библиотеки Morphy языка РНР, язык запросов СУБД MySQL для замены в базе данных синонимов. Результатом работы программы является оценочная величина похожести текстов, приведенная к процентному выражению. Программа может быть применена для нечеткого поиска в текстовой информации, решения задач плагиата и искусственного интеллекта.