Викисловарь

Материал из NLPub
(перенаправлено с «Wiktionary»)
Перейти к: навигация, поиск

Викисловарь — многофункциональный многоязычный словарь и тезаурус, в обсуждении и пополнении которого может участвовать каждый. Словарь был открыт 1 мая 2004 года, и сейчас в нём содержится более 789 тысяч статей о словах, словообразовательных единицах и словосочетаниях русского языка.

Доступность

Материалы Викисловаря доступны на условиях лицензии CC BY-SA без регистрации и SMS. Возможно загрузить официальный дамп Викисловаря в формате XML для локальной обработки.

Использование

Машиночитаемый формат

Андрей Крижановский подготовил машиночитаемый вариант Викисловаря в виде базы данных MySQL.[1] Наборы данных в виде SQL-файлов публикуются на странице http://whinger.krc.karelia.ru/soft/wikokit/. Чтобы внести эти данные в базу MySQL необходимо создать базу, например, под названием ruwikt и при развёртывании SQL-файла использовать двоичный режим представления строк. Это можно делать при помощи консольного клиента mysql.

MariaDB [ruwikt]> SET NAMES binary;
MariaDB [ruwikt]> SOURCE ruwikt20160210_parsed.sql

Например, для извлечения всех семантических отношений между русскоязычными словами в машиночитаемой версии Викисловаря, достаточно выполнить следующий SQL-запрос.

SELECT lang_pos.id AS id, page_title AS entry1, wiki_text.text AS entry2, relation_type.name AS relation_name FROM lang_pos JOIN page ON lang_pos.page_id = page.id JOIN meaning ON meaning.lang_pos_id = lang_pos.id JOIN relation ON relation.meaning_id = meaning.id JOIN wiki_text ON wiki_text.id = relation.wiki_text_id JOIN relation_type ON relation_type.id = relation.relation_type_id WHERE wiki_text.text IS NOT NULL AND lang_id = 804;

Ссылки

Примечания

  1. A. A. Krizhanovsky, A. V. Smirnov (2013), An approach to automated construction of a general-purpose lexical ontology based on Wiktionary