Articles producció científicaFilologies Romàniques

Compilación y etiquetado de corpus para el análisis de la violencia lingüística en Twitter: problemas y soluciones

  • Datos identificativos

    Identificador:  imarina:9443071
    Autores:  Susana María Campillo Muñoz; María Dolores Jiménez-López
    Resumen:
    The interest in the study of verbal violence is increasing in linguistics and computational branches. However, investigators try to face some issues, such as conceptual definitions, and the categories included in the analysis. In computational analysis specially, there are problems with the annotation task and the linguistic features extracted. In order to detect the problems in verbal violence corpora analysis and to propose some solutions, we simulate a tagging task with a sample corpus of 100 tweets between three annotators. They must tag every tweet as violent or non-violent. Our results confirm these differences in the comprehension of verbal violence and some problems related to hashtags and emojis in the computational analysis. Then, we propose some solutions related to the annotation task and the computational analysis. With the aim of getting a common concept of verbal violence in the annotation task, we need to use an annotation scheme. Also, it is necessary to create a list of different linguistic features, from emojis to situational attributes, for improving the computational analysis. To sum up, linguistics and computation need to work together so that we could achieve best results in the analysis of verbal violence.
  • Otros:

    Enlace a la fuente original: https://cvc.cervantes.es/lengua/eaesla/eaesla_08.htm
    Referencia de l'ítem segons les normes APA: Susana María Campillo Muñoz; María Dolores Jiménez-López (2022). Compilación y etiquetado de corpus para el análisis de la violencia lingüística en Twitter: problemas y soluciones. E-Aesla, (8), 2 -
    Referencia al articulo segun fuente origial: E-Aesla. (8): 2 -
    Año de publicación de la revista: 2022
    Entidad: Universitat Rovira i Virgili
    Versión del articulo depositado: info:eu-repo/semantics/publishedVersion
    Fecha de alta del registro: 2025-02-19
    Autor/es de la URV: Jiménez López, María Dolores
    Departamento: Filologies Romàniques
    URL Documento de licencia: https://repositori.urv.cat/ca/proteccio-de-dades/
    Tipo de publicación: Journal Publications
    Autor según el artículo: Susana María Campillo Muñoz; María Dolores Jiménez-López
    Acceso a la licencia de uso: https://creativecommons.org/licenses/by/3.0/es/
    Direcció de correo del autor: mariadolores.jimenez@urv.cat
  • Palabras clave:

    Filologías. generalidades
    Filologías
  • Documentos:

  • Cerca a google

    Search to google scholar