TagBag

Материал из NLPub
Перейти к: навигация, поиск

TagBag — метод автоматического перевода меток с одного языка на другой при помощи двуязычных словарей.

Алгоритм

Вход: I — метки изображения на исходном языке, \mathcal{B} — двуязычный словарь, S — множество синсетов целевого языка, f — пороговое значение для исключения маловероятных вариантов.

Инициализация: мешок слов изображения B \gets \emptyset.

Алгоритм:

   for t \in I
   
       for s \in \mathcal{B}(t)
       
           B_w \gets B_w + 1
       
   for w \in B
   
       if B_w < f
       
           B \gets B \setminus w
   
   \hat{I} \gets \arg\max_{s' \in S} \cos(B, s')

Выход: \hat{I} — синсет, соответствующий меткам изображения I.

Цитирование

@inbook{Ustalov:15:aist,
  author    = {Ustalov, D.},
  title     = {{TagBag: Annotating a Foreign Language Lexical Resource with Pictures}},
  booktitle = {Analysis of Images, Social Networks and Texts: 4th International Conference, AIST 2015, Yekaterinburg, Russia, April 9--11, 2015, Revised Selected Papers},
  editor    = {Khachay, Mikhail Yu. and Konstantinova, Natalia and Panchenko, Alexander and Ignatov, Dmitry I. and others},
  year      = {2015},
  publisher = {Springer International Publishing},
  address   = {Cham},
  pages     = {361--369},
  isbn      = {978-3-319-26123-2},
  doi       = {10.1007/978-3-319-26123-2_35},
  language  = {english},
}

Ссылки

См. также