Stanford CoreNLP

Материал из NLPub
Перейти к: навигация, поиск

Stanford CoreNLP - библиотека, предоставляющая набор инструментов для обработки текста, основанный на работах Stanford NLP.

Код библиотеки написан на языке Java и доступен под лицензией GPL для использования в некоммерческих проектах[1]. Так же существует биндинги к некоторым другим языкам программирования.

В основном разрабатывается для работы с английским, но так же поддерживает арабский, китайский, французский и немецкий. Вместе с библиотекой отдельным пакетом доступен набор моделей языков.

Основные части: POS-тэгер, NER, парсер, система разрешения связей, анализатор тональности.

Ссылки

Примечания

  1. Исходный код на GitHub