YARN

Материал из NLPub

Yet Another RussNet (сокр. YARN) — проект создания нового открытого электронного тезауруса русского языка. Разрабатывается усилиями представителей УрФУ, ВШЭ, ИММ УрО РАН и Kontur Labs.

YARN.svg

Тезаурус русского языка в формате XML можно скачать по адресу http://russianword.net/yarn.xml с официального сайта проекта.

Цитирование

Для цитирования проекта просим использовать следующую публикацию:

  • YARN: Spinning-in-Progress / P. Braslavski, D. Ustalov, M. Mukhin, Y. Kiselev // Proceedings of the Eight Global Wordnet Conference. — Bucharest, Romania, 2016. — P. 58–65. (PDF)

Публикации по проекту

2018

  • Fighting with the Sparsity of the Synonymy Dictionaries for Automatic Synset Induction / D. Ustalov, M. Chernoskutov, A. Panchenko, C. Biemann // Analysis of Images, Social Networks and Texts: 6th International Conference, AIST 2017, Moscow, Russia, July 27-29, 2017, Revised Selected Papers. — Cham : Springer International Publishing, 2018. — P. 94–105. (Springer, arXiv)

2017

  • Mnogoznal: an Unsupervised System for Word Sense Disambiguation / D. Ustalov, D. Teslenko, A. Panchenko, M. Chernoskutov // 2017 International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON). — Novosibirsk, Russia : IEEE, 2017. — P. 147–150. (IEEE)
  • Chernoskutov M., Ustalov D. Synonymy Graph Connectivity in Graph-Based Word Sense Induction // Proceedings of the 2017 Siberian Symposium on Data Science and Engineering (SSDSE). — Novosibirsk, Russia : IEEE, 2017. — P. 14–17. (IEEE)
  • Zakharov V. Comparative Evaluation and Integration of Collocation Extraction Metrics // Text, Speech, and Dialogue: 20th International Conference, TSD 2017, Prague, Czech Republic, August 27-31, 2017, Proceedings. — Cham : Springer International Publishing, 2017. — P. 255–262. (Springer)
  • Ustalov D., Panchenko A., Biemann C. Watset: Automatic Induction of Synsets from a Graph of Synonyms // Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). — Vancouver, Canada : Association for Computational Linguistics, 2017. — P. 1579–1590. (PDF)
  • Zakharov V., Mikhailova V. A Construction Grammar Approach to Russian Prepositions // 4th International Multidisciplinary Scientific Conference on Social Sciences and Arts (SGEM 2017). — Sofia, Bulgaria : 2017. P. 279–286. (DOI)
  • Усталов Д., Созыкин А. Комплекс программ автоматического построения семантической сети слов // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. — 2017. — Т. 6, № 2. — С. 69–83. (DOI)
  • Zakharov V. Evaluation and Combining Association Measures for Collocation Extraction // Proceedings of the International Conference IMS-2017. — Saint Petersburg, Russia : ACM, 2017. P. 125–134. (ACM)
  • Усталов Д. Семантические сети и обработка естественного языка // Открытые системы. СУБД. — 2017. — № 2. — С. 46–47. (HTML)
  • Zakharov V. Automatic Collocation Extraction: Association Measures Evaluation and Integration // Computational Linguistics and Intellectual Technologies: Papers from the Annual conference “Dialogue”. Volume 1 of 2. Computational Linguistics: Practical Applications. — Moscow : RSUH, 2017. — P. 396–407. (PDF)
  • Ustalov D. Expanding Hierarchical Contexts for Constructing a Semantic Word Network // Computational Linguistics and Intellectual Technologies: Papers from the Annual conference “Dialogue”. Volume 1 of 2. Computational Linguistics: Practical Applications. — Moscow : RSUH, 2017. — P. 369–381. (PDF)
  • Усталов Д. Обнаружение понятий в графе синонимов // Вычислительные технологии. — 2017. — Т. 22, Спецвып. 1. — С. 99–112. (PDF)
  • Negative Sampling Improves Hypernymy Extraction Based on Projection Learning / D. Ustalov, N. Arefyev, C. Biemann, A. Panchenko // Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 2, Short Papers. — Valencia, Spain : Association for Computational Linguistics, 2017. — P. 543–550. (PDF)

2016

  • YARN: Spinning-in-Progress / P. Braslavski, D. Ustalov, M. Mukhin, Y. Kiselev // Proceedings of the Eight Global Wordnet Conference. — Bucharest, Romania, 2016. — P. 58–65. (PDF)
  • Kiselev Y., Ustalov D., Porshnev S. Eliminating Fuzzy Duplicates in Crowdsourced Lexical Resources // Proceedings of the Eight Global Wordnet Conference. — Bucharest, Romania, 2016. — P. 161–167. (PDF)
  • Усталов Д. Коллективные потоковые вычисления: реляционные модели и алгоритмы // Моделирование и анализ информационных систем. — 2016. — Т. 23, № 2. — С. 195–210. (DOI)
  • Интеграция ресурсов RussNet и YARN / И. В. Азарова, П. И. Браславский, В. П. Захаров и др. // Компьютерная лингвистика и вычислительные онтологии: сборник научных статей. Труды XIX Международной объединённой научной конференции «Интернет и современное общество» (IMS-2016), Санкт-Петербург, 22–24 июня 2016 г. — СПб : Университет ИТМО, 2016. — С. 7–13. (OpenBooks)
  • Ustalov D., Igushkin S. Sense Inventory Alignment Using Lexical Substitutions and Crowdsourcing // 2016 International FRUCT Conference on Intelligence, Social Media and Web (ISMW FRUCT). — IEEE, 2016. — P. 56–61. (PDF)
  • Ustalov D. Joining Dictionaries and Word Embeddings for Ontology Induction // Proceedings of the Open Conference of the ISPRAS (Труды первой научно-практической Открытой конференции ИСП РАН). — М. : ИСП РАН, 2016. — P. 381–388. (PDF)

2015

  • Ustalov D. Crowdsourcing Synset Relations with Genus-Species-Match // Proceedings of the AINL-ISMW FRUCT. — 2015. — P. 118–124. (PDF)
  • Ustalov D., Kiselev Y. Add-Remove-Confirm: Crowdsourcing Synset Cleansing // Application of Information and Communication Technologies (AICT), 2015 IEEE 9th International Conference on. — IEEE, 2015. — P. 143–147. (IEEE)
  • Киселёв Ю., Поршнев С., Мухин М. Ю. Современное состояние электронных тезаурусов русского языка: качество, полнота и доступность // Программная инженерия. — 2015. — № 6. — С. 34–40.
  • Ustalov D. A Crowdsourcing Engine for Mechanized Labor // Proceedings of the Institute for System Programming. —  2015. —  Vol. 27, № 3. —  P. 351–364. (DOI)
  • Russian Lexicographic Landscape: a Tale of 12 Dictionaries / Y. Kiselev, A. Krizhanovsky, P. Braslavski et al. // Computational Linguistics and Intellectual Technologies: papers from the Annual conference “Dialogue”. —  Moscow : RGGU, 2015. —  Vol. 1. —  P. 254–271. (PDF)
  • Ustalov D. Russian Thesauri as Linked Open Data // Computational Linguistics and Intellectual Technologies: papers from the Annual conference “Dialogue”. — Moscow : RGGU, 2015. — Vol. 1. — P. 616–625. (PDF)

2014

  • Ustalov D. Enhancing Russian Wordnets Using the Force of the Crowd // Analysis of Images, Social Networks and Texts. — Springer International Publishing, 2014. — Vol. 436 of Communications in Computer and Information Science. — P. 257–264. (Springer)
  • Ustalov D. Words Worth Attention: Predicting Words of the Week on the Russian Wiktionary // Knowledge Engineering and the Semantic Web. — Springer International Publishing, 2014. — Vol. 468 of Communications in Computer and Information Science. — P. 196–207. (Springer)
  • Sabirova K., Lukanin A. Automatic Extraction of Hypernyms and Hyponyms from Russian Texts // Supplementary Proceedings of the 3rd International Conference on Analysis of Images, Social Networks and Texts (AIST'2014). — Vol. 1197. — Yekaterinburg, Russia : CEUR-WS.org, 2014. — P. 35–40. (PDF)
  • Усталов Д. Автоматическая генерация заданий для краудсорсингового тезауруса // Четырнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2014 (24–27 сентября 2014 г., г. Казань, Россия): Труды конференции.— Т. 3.— Казань : Изд-во РИЦ «Школа», 2014. — С. 237–242.
  • Усталов Д. А., Блинов П. А., Черноскутов М. А. Очистка текстов на естественном языке с использованием Apache Spark // Научный сервис в сети Интернет: многообразие суперкомпьютерных миров: Труды Международной суперкомпьютерной конференции (22–27 сентября 2014 г., г. Новороссийск). — М. : Изд-во МГУ, 2014. — С. 218–220.
  • Braslavski P., Ustalov D., Mukhin M. A Spinning Wheel for YARN: User Interface for a Crowdsourced Thesaurus // Proceedings of the Demonstrations at the 14th Conference of the European Chapter of the Association for Computational Linguistics. — Gothenburg, Sweden : Association for Computational Linguistics, 2014. — P. 101–104. (PDF, BibTeX)

2013

Ссылки

См. также

Благодарности

Исследование выполняется при финансовой поддержке РГНФ (проект № 13-04-12020 «Новый открытый электронный тезаурус русского языка» и проект № 16-04-12019 «Интеграция тезаурусов RussNet и YARN»). Поддержка данного проекта осуществлена в рамках благотворительной деятельности, на средства, предоставленные Фондом Михаила Прохорова. Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 16-37-00354 мол_а «Методы автоматизации процесса коллективного построения лингвистических ресурсов».