Мера близости

Материал из NLPub
Перейти к: навигация, поиск

Мера близости — это численная мера, показывающая степень схожести двух объектов. Как правило, она выражается в виде скалярной величины в диапазоне [0; 1] или [0; +\inf].

Мера семантической близости

Мера семантической близости — это особая мера близости, предназначенная для количественной оценки семантической схожести лексем, например, существительных или многословных выражений. Такая мера показывает высокие значения для пар слов, находящихся в семантических онтошениях (синонимия, гипонимия, ассоциативность, когипонимия), и нулевые значения для всех остальных пар.

Меры семантической близости успешно применяются в различных задачах обработки текста на естественном языке, таких как определение схожести текстов, расширение поисковых запросов, автоматические ответы на вопросы, снятие семантической неоднозначности слов. Практическое применение мер близости обусловлено пробелом между лексическим покрытием текста и заложенным в него смыслом: одно и то же понятие может быть выражено разными словами. Меры семантической близости могут быть также полезны в лингвистических и филологических исследованиях.