Томита-парсер

Материал из NLPub
Перейти к: навигация, поиск

Томита-парсер — это инструмент для извлечения структурированных данных (фактов) из текста на естественном языке. Извлечение фактов происходит при помощи контекстно-свободных грамматик и словарей ключевых слов. Парсер позволяет написать свою грамматику, добавить свои словари и запустить на текстах.

Доступность

Исходный код «Томита-парсера» закрыт и принадлежит ООО «ЯНДЕКС». Программа доступна как для некоммерческого, так и для коммерческого использования, за исключением трёх случаев, оговорённых в лицензионном соглашении[1]:

  1. в целях создания и распространения спама и массовых рассылок;
  2. в целях поисковой оптимизации в Интернете (SEO);
  3. в целях разработки программного обеспечения, конкурирующего с продуктами «Яндекса».

Установка

Использование

Ссылки

См. также

Примечания

  1. Лицензионное соглашение на использование программы «Томита-парсер».