000K  utf8
1100  $c2012
1500  eng
2050  urn:nbn:de:hbz:464-20211028-145339-3
2051  10.17185/duepublico/72185
3000  Miller, Tristan
3010  Biemann, Chris
3010  Gurevych, Iryna
3010  Zesch, Torsten
4000  Über die Bestimmung lexikalischer Expansionen mittels
distributioneller Ähnlichkeit und deren Einsatz in der
wissensbasierten Lesartendisambiguierung  [Miller, Tristan]
4000  Using Distributional Similarity for Lexical Expansion in Knowledge-based Word Sense Disambiguation  [Miller, Tristan]
4209  We explore the contribution of distributional information for purely knowledge-based word sense disambiguation. Specifically, we use a distributional thesaurus, computed from a large parsed corpus, for lexical expansion of context and sense information. This bridges the lexical gap that is seen as the major obstacle for word overlap–based approaches. We apply this mechanism to two traditional knowledge-based methods and show that distributional information significantly improves disambiguation results across several data sets. This improvement exceeds the state of the art for disambiguation without sense frequency information—a situation which is especially encountered with new domains or languages for which no sense-annotated corpus is available.
4209  Wir untersuchen den Einfluss distributioneller Informationen auf die rein wissensbasierte Lesartendisambiguierung. Basierend auf einem distributionellen Thesaurus, den wir aus einem großen geparsten Korpus erzeugen, erweitern wir die Definition der Lesart und deren Kontext mit lexikalischen Expansionen. Dadurch schließen wir die ‘lexikalische Lücke’, die sich als Haupthindernis für Ansätze basierend auf Wortgemeinsamkeiten herausgestellt hat. Wir erweitern zwei klassische wissensbasierte Ansätze um lexikalische Expansionen und zeigen, dass dadurch die Qualität der Lesartendisambiguierung deutlich erhöht wird. Wir erzielen die bisher besten veröffentlichten Ergebnisse für Disambiguierung ohne Nutzung der Lesartenhäufigkeiten, was besonders für Domänen oder Sprachen relevant ist, für die keine Lesarten-annotierten Korpora zur Verfügung stehen.
4950  https://doi.org/10.17185/duepublico/72185$xR$3Volltext$534
4950  https://nbn-resolving.org/urn:nbn:de:hbz:464-20211028-145339-3$xR$3Volltext$534
4961  https://duepublico2.uni-due.de/receive/duepublico_mods_00072185
5051  004
5550  Lesartendisambiguierung, distributioneller Thesaurus, lexikalische Expansion
5550  word sense disambiguation, distributional thesaurus, lexical expansion