Using Distributional Similarity for Lexical Expansion in Knowledge-based Word Sense Disambiguation

Miller, Tristan; Biemann, Chris; Zesch, Torsten; Gurevych, Iryna

doi:10.17185/duepublico/72185

Tagungsbeitrag 2012 CC BY-NC-SA 3.0

Veröffentlicht

Using Distributional Similarity for Lexical Expansion in Knowledge-based Word Sense Disambiguation

Miller, Tristan ; Biemann, Chris ; Zesch, Torsten ; Gurevych, Iryna

Englisch
Deutsch

We explore the contribution of distributional information for purely knowledge-based word sense disambiguation. Specifically, we use a distributional thesaurus, computed from a large parsed corpus, for lexical expansion of context and sense information. This bridges the lexical gap that is seen as the major obstacle for word overlap–based approaches. We apply this mechanism to two traditional knowledge-based methods and show that distributional information significantly improves disambiguation results across several data sets. This improvement exceeds the state of the art for disambiguation without sense frequency information—a situation which is especially encountered with new domains or languages for which no sense-annotated corpus is available.

Wir untersuchen den Einfluss distributioneller Informationen auf die rein wissensbasierte Lesartendisambiguierung. Basierend auf einem distributionellen Thesaurus, den wir aus einem großen geparsten Korpus erzeugen, erweitern wir die Definition der Lesart und deren Kontext mit lexikalischen Expansionen. Dadurch schließen wir die ‘lexikalische Lücke’, die sich als Haupthindernis für Ansätze basierend auf Wortgemeinsamkeiten herausgestellt hat. Wir erweitern zwei klassische wissensbasierte Ansätze um lexikalische Expansionen und zeigen, dass dadurch die Qualität der Lesartendisambiguierung deutlich erhöht wird. Wir erzielen die bisher besten veröffentlichten Ergebnisse für Disambiguierung ohne Nutzung der Lesartenhäufigkeiten, was besonders für Domänen oder Sprachen relevant ist, für die keine Lesarten-annotierten Korpora zur Verfügung stehen.

Vorschau

Einordnung

Titelübersetzung:: Über die Bestimmung lexikalischer Expansionen mittels distributioneller Ähnlichkeit und deren Einsatz in der wissensbasierten Lesartendisambiguierung (Deutsch)
Konferenz:: COLING 2012, 24th International Conference on Computational Linguistics, 8-15 December 2012 Mumbai, India
Datum der Veröffentlichung:: 2012
DOI:: 10.17185/duepublico/72185
URN:: urn:nbn:de:hbz:464-20211028-145339-3
Sprache:: Englisch
Ressourcentyp:: Text
Schlagwörter:: word sense disambiguation, distributional thesaurus, lexical expansion; Lesartendisambiguierung, distributioneller Thesaurus, lexikalische Expansion
Kollektion:: E-Publikationen
Sachgruppen der Deutschen Nationalbibliographie:: 004 Informatik
Link URL:: https://aclanthology.org/C12-1109
Einrichtung:: Fakultät für Ingenieurwissenschaften, Informatik und Angewandte Kognitionswissenschaft, Informatik, Sprachtechnologie
Informationen zur Erstveröffentlichung:: Miller, T., Biemann, C., Zesch, T., Gurevych, I. (2012) Using Distributional Similarity for Lexical Expansion in Knowledge-based Word Sense Disambiguation. In: Proceedings of COLING 2012: Technical Papers, pp. 1781–1796. The COLING 2012 Organizing Committee. https://aclanthology.org/C12-1109