Программа определения степени подобия текстов, реализующая метод семантической нормализации
Грехов Максим Михайлович
14 сентября 2018
317
Предметная область | — |
Отрасли по ОКВЭД | — |
Страна, регион, город | Российская Федерация, Москва |
Отличия от конкурентов | — |
Вид документа об охране ИС | программа для ЭВМ |
Номер документа ИС | 201466050 |
Дата регистрации документа ИС | 2014-10-09 |
Необходимые инвестиции для внедрения | договорная |
Сроки внедрения | — |
Стоимость предоставления технологии | договорная |
Наличие экспертного заключения | Нет |
Польза для потенциального потребителя
Программа включает следующие этапы обработки текстов: морфологический анализ текстов, нормализацию сравниваемых текстов посредством замены слов-синонимов обоих текстов на какой-либо один, сравнение нормализованных текстов методом шинглов. Программа реализована как WEB-приложение. В программе используются возможность лемматизации (получение нормальной формы слова) библиотеки Morphy языка РНР, язык запросов СУБД MySQL для замены в базе данных синонимов. Результатом работы программы является оценочная величина похожести текстов, приведенная к процентному выражению. Программа может быть применена для нечеткого поиска в текстовой информации, решения задач плагиата и искусственного интеллекта.