UKP: Computing Semantic Textual Similarity by Combining Multiple Content Similarity Measures

Bär, Daniel; Biemann, Chris; Gurevych, Iryna; Zesch, Torsten

doi:10.17185/duepublico/72186

Tagungsbeitrag 2012 CC BY-NC-SA 3.0

Veröffentlicht

UKP: Computing Semantic Textual Similarity by Combining Multiple Content Similarity Measures

Bär, Daniel ; Biemann, Chris ; Gurevych, Iryna ; Zesch, Torsten

We present the UKP system which performed best in the Semantic Textual Similarity (STS) task at SemEval-2012 in two out of three metrics. It uses a simple log-linear regressionmodel, trained on the training data, to combine multiple text similarity measures of varying complexity. These range from simple character and word n-grams and common subsequences to complex features such as Explicit Semantic Analysis vector comparisons and aggregation of word similarity based on lexical-semantic resources. Further, we employ a lexical substitution system and statistical machine translation to add additional lexemes, which alleviates lexical gaps. Our final models, one per dataset, consist of a log-linear combination of about 20 features, out of the possible 300+ features implemented.

Vorschau

Einordnung

Konferenz:: SEM 2012: The First Joint Conference on Lexical and Computational Semantics, June 7-8, 2012 Montréal, Canada. Sixth International Workshop on Semantic Evaluation (SemEval 2012)
Datum der Veröffentlichung:: 2012
URN:: urn:nbn:de:hbz:464-20211028-151631-5
DOI:: 10.17185/duepublico/72186
Sprache:: Englisch
Ressourcentyp:: Text
Kollektion:: E-Publikationen
Sachgruppen der Deutschen Nationalbibliographie:: 004 Informatik
Link URL:: https://aclanthology.org/S12-1059
Einrichtung:: Fakultät für Ingenieurwissenschaften, Informatik und Angewandte Kognitionswissenschaft, Informatik, Sprachtechnologie
Informationen zur Erstveröffentlichung:: Bär, D., Biemann, C., Gurevych, I., Zesch, T. (2012) UKP: Computing Semantic Textual Similarity by Combining Multiple Content Similarity Measures.. In: *SEM 2012: The First Joint Conference on Lexical and Computational Semantics.Vol. 2: Proceedings of the Sixth International Workshop on Semantic Evaluation (SemEval 2012), pp. 435–440. Association for Computational Linguistics. https://aclanthology.org/S12-1059