Articles producció científicaFilologies Romàniques

Compilación y etiquetado de corpus para el análisis de la violencia lingüística en Twitter: problemas y soluciones

  • Dades identificatives

    Identificador:  imarina:9443071
    Autors:  Susana María Campillo Muñoz; María Dolores Jiménez-López
    Resum:
    The interest in the study of verbal violence is increasing in linguistics and computational branches. However, investigators try to face some issues, such as conceptual definitions, and the categories included in the analysis. In computational analysis specially, there are problems with the annotation task and the linguistic features extracted. In order to detect the problems in verbal violence corpora analysis and to propose some solutions, we simulate a tagging task with a sample corpus of 100 tweets between three annotators. They must tag every tweet as violent or non-violent. Our results confirm these differences in the comprehension of verbal violence and some problems related to hashtags and emojis in the computational analysis. Then, we propose some solutions related to the annotation task and the computational analysis. With the aim of getting a common concept of verbal violence in the annotation task, we need to use an annotation scheme. Also, it is necessary to create a list of different linguistic features, from emojis to situational attributes, for improving the computational analysis. To sum up, linguistics and computation need to work together so that we could achieve best results in the analysis of verbal violence.
  • Altres:

    Enllaç font original: https://cvc.cervantes.es/lengua/eaesla/eaesla_08.htm
    Referència de l'ítem segons les normes APA: Susana María Campillo Muñoz; María Dolores Jiménez-López (2022). Compilación y etiquetado de corpus para el análisis de la violencia lingüística en Twitter: problemas y soluciones. E-Aesla, (8), 2 -
    Referència a l'article segons font original: E-Aesla. (8): 2 -
    Any de publicació de la revista: 2022
    Entitat: Universitat Rovira i Virgili
    Versió de l'article dipositat: info:eu-repo/semantics/publishedVersion
    Data d'alta del registre: 2025-02-19
    Autor/s de la URV: Jiménez López, María Dolores
    Departament: Filologies Romàniques
    URL Document de llicència: https://repositori.urv.cat/ca/proteccio-de-dades/
    Tipus de publicació: Journal Publications
    Autor segons l'article: Susana María Campillo Muñoz; María Dolores Jiménez-López
    Accès a la llicència d'ús: https://creativecommons.org/licenses/by/3.0/es/
    Adreça de correu electrònic de l'autor: mariadolores.jimenez@urv.cat
  • Paraules clau:

    Filologías. generalidades
    Filologías
  • Documents:

  • Cerca a google

    Search to google scholar