Head-Driven Phrase Structure Grammar

Материал из NLPub
(перенаправлено с «HPSG»)
Перейти к: навигация, поиск

Head-Driven Phrase Structure Grammar (HPSG) — формальная грамматика — надстройка над грамматикой составляющих, которая включает в себя лексическую информацию. Разработана Карлом Поллардом (Carl Pollard) и Иваном Сагом (Ivan Sag) [1].
Любой объект языка (слово, составляющая, предложение и др.) представляется структурой — ориентированным ациклическим графом, в узлах которого объекты.

Объекты

Задается универсальный список типов объектов. Примеры типов: знак, морфема, слово, группа, предложение, synsem. Задается универсальная иерархия типов: например, объект типа слово — частный случай объекта типа знак. Для типа T определяется структура: объекты каких типов входят в объект типа T. Есть атомарные типы (например, именительный падеж).

Примеры типов и их структур

Тип Структура
word (слово) PHON (означающее — транскрипция), SYNSEM (означаемое)
SYNSEM LOC(AL)(свойства на уровне слова), NONLOC(AL)(свойства на уровне предложения)
LOC(AL) CATEGORY (лексика), CONTENT(семантика), CONTEXT (прагматика)
CATEGORY HEAD(часть речи и соответствующая ей лексическая информация), SUBCAT (аргументная структура — список SYNSEM. Если необходимо структурировать, то может также обозначаться как VAL(ENCE))
VAL(ENCE) SUBJ (субъект), COMPS (остальные аргументы)
CONTENT для существительных: чему референтно, для глаголов: список семантических ролей
CONTEXT список пресуппозиций
phrase (составляющая) PHON (означающее — транскрипция), SYNSEM (означаемое), DTRS (список непосредственных составляющих, первой идет вершина HEAD)

Элементы структуры могут снабжаться метками для соотнесения (унификации). На рисунке SeemStructure.png
метка [1] указывает на то, что в конструкции to seem to X субъекты seem и X совпадают

Описание языка с помощью HPSG

  • Задается лексикон описание всех слов как объектов типа word (задает ограничения на сочетаемость)
  • При порождении накладываются ограничения:
    • Универсальный принцип HEAD: HEAD составляющей = HEAD вершины составляющей
    • Универсальный принцип SUBCAT: SUBCAT вершины составляющей X = SUBCAT составляющей X + конкатенация SYNSEM остальных элементов DTRS для X (задает согласование)
    • Специфический для каждого языка принцип ID (непосредственного доминирования): составляющие каких типов (согласно классификации составляющих) могут входить друг в друга (задает порядок составляющих)
  • Интерпретация предложения происходит с помощью различных принципов передачи CONTENT, квантификаторов и других элементов структуры вверх по составляющим к составляющей-предложению

HPSG для русского языка

Russian Resource Grammar — HPSG-грамматика для русского языка для использования в LKB. Как морфологический парсер используется Mystem

Ссылки

Примечания

  1. Pollard, Carl and Ivan A. Sag. 1994. Head-Driven Phrase Structure Grammar. Chicago: University of Chicago Press and Stanford: CSLI Publications.