BabelNet

Материал из NLPub
Перейти к: навигация, поиск
BabelNet.svg
BabelNet — большая многоязычная лексическая онтология, полученная путём автоматического сочетания WordNet, Википедии и других семантических ресурсов.[1]

Материалы BabelNet доступны на 271 языке, в том числе русском.

Доступность

BabelNet доступен на условиях лицензии CC BY-NC-SA 3.0, допускающей только некоммерческое использование. Доступ к материалам онтологии ограничен и требует регистрации. Допускается скачивание индексных файлов по запросу от исследовательской группы. Продажей лицензий на коммерческое использование BabelNet занимается компания Babelscape, основанная создателями ресурса.

Использование

На сайте BabelNet имеется поле для ввода запросов, позволяющее ознакомиться с материалами ресурса. Кроме того, имеется приложение Babelfy, демонстрирующее извлечение именованных сущностей в текстах.

JavaScript

Существует библиотека BabelNet.js, позволяющая делать запросы к BabelNet через HTTP.

Java

Машиночитаемая версия BabelNet распространяется в виде индексных файлов Lucene. Предоставляется программный интерфейс, упрощающий манипуляции с материалами ресурса на языке программирования Java: http://babelnet.org/data/3.7/BabelNet-API-3.7.zip.

Вероятно, создатели BabelNet не очень хотят, чтобы сторонние разработчики использовали их ресурс. Сборка прикладных программ с использованием программного интерфейса BabelNet для Java при помощи Maven требует некоторых предварительных действий после распаковки архива.

mvn install:install-file -Dfile=lib/jltutils-2.2.jar -DgroupId=it.uniroma1.lcl.jlt -DartifactId=jltutils -Dversion=2.2 -Dpackaging=jar
unzip -p babelnet-api-3.7.jar META-INF/maven/it.uniroma1.lcl.babelnet/babelnet-api/pom.xml | grep -vP '<(scope|systemPath)>' >babelnet-api-3.7.pom
mvn install:install-file -Dfile=babelnet-api-3.7.jar -DpomFile=babelnet-api-3.7.pom

Кроме того, доступна программа для извлечения информации из сетевой или локальной версии BabelNet: https://github.com/tudarmstadt-lt/babelnet-extract.

Контейнер

Существует Docker-образ контейнера с настроенным BabelNet Java API и программой BabelNet Extract: https://hub.docker.com/r/nlpub/babelnet/.

$ docker run --rm -it -v './BabelNet-3.7:/babelnet/index' -v './output:/babelnet/output' nlpub/babelnet babelnet-extract

Ссылки

См. также

Примечания

  1. R. Navigli, S. P. Ponzetto (2012), BabelNet: The automatic construction, evaluation and application of a wide-coverage multilingual semantic network