Stammdaten

Titel: Exploiting Emojis for Abusive Language Detection
Untertitel:
Kurzfassung:

We propose to use abusive emojis, such as the "middle finger'' or "face vomiting'', as a proxy for learning a lexicon of abusive words. Since it represents extralinguistic information, a single emoji can co-occurwith different forms of explicitly abusive utterances. We show that ourapproach generates a lexicon that offers the same performance in cross-domainclassification of abusive microposts as the most advanced lexicon induction method. Such an approach, in contrast, is dependent on manually annotated seedwords and expensive lexical resources for bootstrapping (e.g. WordNet). We demonstrate that the same emojis can also be effectively used in languages other than English. Finally, we also show that emojis can be exploited forclassifying mentions of ambiguous words, such as "fuck" and "bitch'', into generally abusive and just profane usages.

Schlagworte: Computerlinguistik, Informatik, Digital Humanities
Publikationstyp: Beitrag in Proceedings (Autorenschaft)
Erscheinungsdatum: 01.04.2021 (Online)
Erschienen in: Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume
Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume
zur Publikation
 ( Association for Computational Linguistics; )
Titel der Serie: -
Bandnummer: -
Erstveröffentlichung: Ja
Version: -
Seite: S. 369 - 380

Versionen

Keine Version vorhanden
Erscheinungsdatum: 01.04.2021
ISBN (e-book): -
eISSN: -
DOI: -
Homepage: https://www.aclweb.org/anthology/2021.eacl-main.28
Open Access
  • Online verfügbar (Open Access)

Zuordnung

Organisation Adresse
Universität Klagenfurt
 
Digital Age Research Center (D!ARC)
 
Computerlinguistik
Universitätsstr. 65-67
A-9020 Klagenfurt
Österreich
zur Organisation
Universitätsstr. 65-67
AT - A-9020  Klagenfurt

Kategorisierung

Sachgebiete
  • 102 - Informatik
  • 602011 - Computerlinguistik
  • 605007 - Digital Humanities
Forschungscluster
  • Humans in the Digital Age
Peer Reviewed
  • Ja
Publikationsfokus
  • Science to Science (Qualitätsindikator: n.a.)
Klassifikationsraster der zugeordneten Organisationseinheiten:
  • Für die zugeordneten Organisationseinheiten sind keine Klassifikationsraster vorhanden
Arbeitsgruppen Keine Arbeitsgruppe ausgewählt

Kooperationen

Organisation Adresse
Leibniz-Institut für Deutsche Sprache
R5, 6-13
68161 Mannheim
Deutschland
R5, 6-13
DE - 68161  Mannheim

Beiträge der Publikation

Keine verknüpften Publikationen vorhanden