DKPro WSD

Материал из NLPub
Перейти к: навигация, поиск

DKPro WSD — инструментальная среда, содержащая реализацию различных методов разрешения лексической многозначности, вывода значений слов, а также вспомогательных инструментов для выполнения и оценки этих методов.[1]

DKPro-WSD.png

Доступность

DKPro WSD является свободным программным обеспечением. Часть модулей, отмеченных суффиксом -asl, распространяется на условиях Apache License 2.0. Часть модулей, отмеченных суффиксом -gpl, распространяется на условиях GNU General Public License 3.

Установка

Процесс сборки DKPro WSD из исходников достаточно сложен. Версия из репозитория dkpro/dkpro-wsd не компилируется без доработок. В настоящее время код не собирается при помощи Java 9, хотя на Java 8 проблем нет. Потребуется Ant для сборки одной из зависимостей и Maven для всего остального.

Версии модулей

Сначала нужно исправить версии модулей в pom.xml, для этого можно выполнить команду patch -p1 в корневой директории репозитория.

diff --git a/de.tudarmstadt.ukp.dkpro.wsd.graphconnectivity.wikipedia/pom.xml b/de.tudarmstadt.ukp.dkpro.wsd.graphconnectivity.wikipedia/pom.xml
index 236e674..44de947 100644
--- a/de.tudarmstadt.ukp.dkpro.wsd.graphconnectivity.wikipedia/pom.xml
+++ b/de.tudarmstadt.ukp.dkpro.wsd.graphconnectivity.wikipedia/pom.xml
@@ -57,7 +57,7 @@
                        <artifactId>
                                dkpro.similarity.algorithms.wikipedia-asl
                        </artifactId>
-                       <version>2.2.0-SNAPSHOT</version>
+                       <version>2.1.0</version>
                </dependency>
                <dependency>
                        <groupId>de.tudarmstadt.ukp.dkpro.wsd</groupId>
diff --git a/de.tudarmstadt.ukp.dkpro.wsd.wsi/pom.xml b/de.tudarmstadt.ukp.dkpro.wsd.wsi/pom.xml
index 40f723f..8e44d86 100644
--- a/de.tudarmstadt.ukp.dkpro.wsd.wsi/pom.xml
+++ b/de.tudarmstadt.ukp.dkpro.wsd.wsi/pom.xml
@@ -93,7 +93,7 @@
                        <artifactId>
                                dkpro.similarity.algorithms.core-asl
                        </artifactId>
-                       <version>2.2.0-SNAPSHOT</version>
+                       <version>2.1.0</version>
                </dependency>
                <dependency>
                        <groupId>de.tudarmstadt.ukp.dkpro.core</groupId>

Установка OpenNLP Maxent

Теперь нужно установить одну из зависимостей: maxent из старой версии OpenNLP 2.5.1.

$ wget 'https://downloads.sourceforge.net/project/maxent/Maxent/2.5.1/maxent-2.5.1.tgz'
$ tar zxf maxent-2.5.1.tgz
$ cd maxent-2.5.1
$ ./build.sh
$ mvn install:install-file -Dfile=$PWD/output/maxent-2.5.1.jar -DgroupId=opennlp -DartifactId=maxent -Dversion=2.5.1 -Dpackaging=jar

Компиляция DKPro WSD

Затем можно приступить к сборке пакета DKPro WSD без выполнения тестов и генерации документации. Компиляция с успешным прохождением модульных тестов требует дополнительных исправлений.

$ mvn -T $(nproc) install -Dmaven.test.skip=true -Dmaven.javadoc.skip=true

После этого в локальном репозитории Maven появятся пакеты DKPro WSD.

Использование

Примеры использования DKPro WSD на Java представлены в модуле de.tudarmstadt.ukp.dkpro.wsd.examples.

Ссылки

См. также

Примечания

  1. T. Miller et al. (2013), DKPro WSD: A Generalized UIMA-based Framework for Word Sense Disambiguation