Программа определения степени подобия текстов, реализующая метод семантической нормализации
Грехов Максим Михайлович
14 сентября 2018
375
| Предметная область | — |
| Отрасли по ОКВЭД | — |
| Страна, регион, город | Российская Федерация, Москва |
| Отличия от конкурентов | — |
| Вид документа об охране ИС | программа для ЭВМ |
| Номер документа ИС | 201466050 |
| Дата регистрации документа ИС | 2014-10-09 |
| Необходимые инвестиции для внедрения | договорная |
| Сроки внедрения | — |
| Стоимость предоставления технологии | договорная |
| Наличие экспертного заключения | Нет |
Польза для потенциального потребителя
Программа включает следующие этапы обработки текстов: морфологический анализ текстов, нормализацию сравниваемых текстов посредством замены слов-синонимов обоих текстов на какой-либо один, сравнение нормализованных текстов методом шинглов. Программа реализована как WEB-приложение. В программе используются возможность лемматизации (получение нормальной формы слова) библиотеки Morphy языка РНР, язык запросов СУБД MySQL для замены в базе данных синонимов. Результатом работы программы является оценочная величина похожести текстов, приведенная к процентному выражению. Программа может быть применена для нечеткого поиска в текстовой информации, решения задач плагиата и искусственного интеллекта.