YARN
Yet Another RussNet (сокр. YARN) — проект создания нового открытого электронного тезауруса русского языка. Разрабатывается усилиями представителей УрФУ, ВШЭ, ИММ УрО РАН и Kontur Labs.
Тезаурус русского языка в формате XML можно скачать по адресу http://russianword.net/yarn.xml с официального сайта проекта.
Цитирование
Для цитирования проекта просим использовать следующую публикацию:
- YARN: Spinning-in-Progress / P. Braslavski, D. Ustalov, M. Mukhin, Y. Kiselev // Proceedings of the Eight Global Wordnet Conference. — Bucharest, Romania, 2016. — P. 58–65. (PDF)
Публикации по проекту
2018
- Fighting with the Sparsity of the Synonymy Dictionaries for Automatic Synset Induction / D. Ustalov, M. Chernoskutov, A. Panchenko, C. Biemann // Analysis of Images, Social Networks and Texts: 6th International Conference, AIST 2017, Moscow, Russia, July 27-29, 2017, Revised Selected Papers. — Cham : Springer International Publishing, 2018. — P. 94–105. (Springer, arXiv)
2017
- Mnogoznal: an Unsupervised System for Word Sense Disambiguation / D. Ustalov, D. Teslenko, A. Panchenko, M. Chernoskutov // 2017 International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON). — Novosibirsk, Russia : IEEE, 2017. — P. 147–150. (IEEE)
- Chernoskutov M., Ustalov D. Synonymy Graph Connectivity in Graph-Based Word Sense Induction // Proceedings of the 2017 Siberian Symposium on Data Science and Engineering (SSDSE). — Novosibirsk, Russia : IEEE, 2017. — P. 14–17. (IEEE)
- Zakharov V. Comparative Evaluation and Integration of Collocation Extraction Metrics // Text, Speech, and Dialogue: 20th International Conference, TSD 2017, Prague, Czech Republic, August 27-31, 2017, Proceedings. — Cham : Springer International Publishing, 2017. — P. 255–262. (Springer)
- Ustalov D., Panchenko A., Biemann C. Watset: Automatic Induction of Synsets from a Graph of Synonyms // Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). — Vancouver, Canada : Association for Computational Linguistics, 2017. — P. 1579–1590. (PDF)
- Zakharov V., Mikhailova V. A Construction Grammar Approach to Russian Prepositions // 4th International Multidisciplinary Scientific Conference on Social Sciences and Arts (SGEM 2017). — Sofia, Bulgaria : 2017. P. 279–286. (DOI)
- Усталов Д., Созыкин А. Комплекс программ автоматического построения семантической сети слов // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. — 2017. — Т. 6, № 2. — С. 69–83. (DOI)
- Zakharov V. Evaluation and Combining Association Measures for Collocation Extraction // Proceedings of the International Conference IMS-2017. — Saint Petersburg, Russia : ACM, 2017. P. 125–134. (ACM)
- Усталов Д. Семантические сети и обработка естественного языка // Открытые системы. СУБД. — 2017. — № 2. — С. 46–47. (HTML)
- Zakharov V. Automatic Collocation Extraction: Association Measures Evaluation and Integration // Computational Linguistics and Intellectual Technologies: Papers from the Annual conference “Dialogue”. Volume 1 of 2. Computational Linguistics: Practical Applications. — Moscow : RSUH, 2017. — P. 396–407. (PDF)
- Ustalov D. Expanding Hierarchical Contexts for Constructing a Semantic Word Network // Computational Linguistics and Intellectual Technologies: Papers from the Annual conference “Dialogue”. Volume 1 of 2. Computational Linguistics: Practical Applications. — Moscow : RSUH, 2017. — P. 369–381. (PDF)
- Усталов Д. Обнаружение понятий в графе синонимов // Вычислительные технологии. — 2017. — Т. 22, Спецвып. 1. — С. 99–112. (PDF)
- Negative Sampling Improves Hypernymy Extraction Based on Projection Learning / D. Ustalov, N. Arefyev, C. Biemann, A. Panchenko // Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 2, Short Papers. — Valencia, Spain : Association for Computational Linguistics, 2017. — P. 543–550. (PDF)
2016
- YARN: Spinning-in-Progress / P. Braslavski, D. Ustalov, M. Mukhin, Y. Kiselev // Proceedings of the Eight Global Wordnet Conference. — Bucharest, Romania, 2016. — P. 58–65. (PDF)
- Kiselev Y., Ustalov D., Porshnev S. Eliminating Fuzzy Duplicates in Crowdsourced Lexical Resources // Proceedings of the Eight Global Wordnet Conference. — Bucharest, Romania, 2016. — P. 161–167. (PDF)
- Усталов Д. Коллективные потоковые вычисления: реляционные модели и алгоритмы // Моделирование и анализ информационных систем. — 2016. — Т. 23, № 2. — С. 195–210. (DOI)
- Интеграция ресурсов RussNet и YARN / И. В. Азарова, П. И. Браславский, В. П. Захаров и др. // Компьютерная лингвистика и вычислительные онтологии: сборник научных статей. Труды XIX Международной объединённой научной конференции «Интернет и современное общество» (IMS-2016), Санкт-Петербург, 22–24 июня 2016 г. — СПб : Университет ИТМО, 2016. — С. 7–13. (OpenBooks)
- Ustalov D., Igushkin S. Sense Inventory Alignment Using Lexical Substitutions and Crowdsourcing // 2016 International FRUCT Conference on Intelligence, Social Media and Web (ISMW FRUCT). — IEEE, 2016. — P. 56–61. (PDF)
- Ustalov D. Joining Dictionaries and Word Embeddings for Ontology Induction // Proceedings of the Open Conference of the ISPRAS (Труды первой научно-практической Открытой конференции ИСП РАН). — М. : ИСП РАН, 2016. — P. 381–388. (PDF)
2015
- Ustalov D. Crowdsourcing Synset Relations with Genus-Species-Match // Proceedings of the AINL-ISMW FRUCT. — 2015. — P. 118–124. (PDF)
- Ustalov D., Kiselev Y. Add-Remove-Confirm: Crowdsourcing Synset Cleansing // Application of Information and Communication Technologies (AICT), 2015 IEEE 9th International Conference on. — IEEE, 2015. — P. 143–147. (IEEE)
- Киселёв Ю., Поршнев С., Мухин М. Ю. Современное состояние электронных тезаурусов русского языка: качество, полнота и доступность // Программная инженерия. — 2015. — № 6. — С. 34–40.
- Ustalov D. A Crowdsourcing Engine for Mechanized Labor // Proceedings of the Institute for System Programming. — 2015. — Vol. 27, № 3. — P. 351–364. (DOI)
- Russian Lexicographic Landscape: a Tale of 12 Dictionaries / Y. Kiselev, A. Krizhanovsky, P. Braslavski et al. // Computational Linguistics and Intellectual Technologies: papers from the Annual conference “Dialogue”. — Moscow : RGGU, 2015. — Vol. 1. — P. 254–271. (PDF)
- Ustalov D. Russian Thesauri as Linked Open Data // Computational Linguistics and Intellectual Technologies: papers from the Annual conference “Dialogue”. — Moscow : RGGU, 2015. — Vol. 1. — P. 616–625. (PDF)
2014
- Ustalov D. Enhancing Russian Wordnets Using the Force of the Crowd // Analysis of Images, Social Networks and Texts. — Springer International Publishing, 2014. — Vol. 436 of Communications in Computer and Information Science. — P. 257–264. (Springer)
- Ustalov D. Words Worth Attention: Predicting Words of the Week on the Russian Wiktionary // Knowledge Engineering and the Semantic Web. — Springer International Publishing, 2014. — Vol. 468 of Communications in Computer and Information Science. — P. 196–207. (Springer)
- Sabirova K., Lukanin A. Automatic Extraction of Hypernyms and Hyponyms from Russian Texts // Supplementary Proceedings of the 3rd International Conference on Analysis of Images, Social Networks and Texts (AIST'2014). — Vol. 1197. — Yekaterinburg, Russia : CEUR-WS.org, 2014. — P. 35–40. (PDF)
- Усталов Д. Автоматическая генерация заданий для краудсорсингового тезауруса // Четырнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2014 (24–27 сентября 2014 г., г. Казань, Россия): Труды конференции.— Т. 3.— Казань : Изд-во РИЦ «Школа», 2014. — С. 237–242.
- Усталов Д. А., Блинов П. А., Черноскутов М. А. Очистка текстов на естественном языке с использованием Apache Spark // Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конференции (22–27 сентября 2014 г., г. Новороссийск). — М. : Изд-во МГУ, 2014. — С. 218–220.
- Braslavski P., Ustalov D., Mukhin M. A Spinning Wheel for YARN: User Interface for a Crowdsourced Thesaurus // Proceedings of the Demonstrations at the 14th Conference of the European Chapter of the Association for Computational Linguistics. — Gothenburg, Sweden : Association for Computational Linguistics, 2014. — P. 101–104. (PDF, BibTeX)
2013
- Браславский П. И., Мухин М. Ю., Ляшевская О. Н., Бонч-Осмоловская А. А., Крижановский А. А., Егоров П. YARN: начало. Труды конференции Диалог-2013. (PDF)
Ссылки
См. также
- Инструкция по работе с открытым электронным тезаурусом
- Инструкция по установке программного обеспечения
- Формат импорта и экспорта данных (see YARN/Format for the English version)
- Описание схемы данных
- Руководство по добавлению нового словаря
- Спецификация программного интерфейса
Благодарности
Исследование выполняется при финансовой поддержке РГНФ (проект № 13-04-12020 «Новый открытый электронный тезаурус русского языка» и проект № 16-04-12019 «Интеграция тезаурусов RussNet и YARN»). Поддержка данного проекта осуществлена в рамках благотворительной деятельности, на средства, предоставленные Фондом Михаила Прохорова. Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 16-37-00354 мол_а «Методы автоматизации процесса коллективного построения лингвистических ресурсов».