Tesis doctoralsDepartament d'Enginyeria Informàtica i Matemàtiques

Ontology based semantic anonymisation of microdata

  • Dades identificatives

    Identificador:  TDX:4256
    Autors:  Martínez Lluís, Sergio
    Resum:
    La explotación de microdatos compilados por los Institutos de Estadística es de gran interés para la comunidad de minería de datos. No obstante, este tipo de datos frecuentemente incluyen información sensible que puede ser, directa o indirectamente, relacionada con los individuos. Por tanto, se necesita realizar un proceso de anonimización apropiado para minimizar el riesgo de revelación de las identidades y/o los datos confidenciales. En el pasado, muchos métodos de anonimización han sido desarrollados para tratar datos numéricos, pero los enfoques que abordan la anonimización de datos no numéricos (por ejemplo datos categóricos) son escasos y superficiales. Como que la utilidad de este tipo de datos está cercanamente relacionada con la preservación de su significado, en este trabajo se utiliza la noción de similitud semántica para conseguir una interpretación semántica coherente. Las ontologías son el pilar básico para proponer un entorno de trabajo semántico que permita el manejo y transformación de atributos categóricos, definiendo diversos operadores que tienen en cuenta la semántica subyacente de los valores de los datos. La aplicación de los operadores definidos en este entorno de trabajo semántico para tareas de anonimización, permite el desarrollo de tres métodos diseñados especialmente para atributos categóricos: Recodificación semántica, Microagregación adaptativa y Remuestreo semántico. Además, se propone un nuevo método de enlazamiento de registros, el cual considera la semántica de los datos con la finalidad de evaluar de una forma más precisa el riesgo de revelación de loa datos no numéricos anonimizados. Los métodos propuestos han sido evaluados extensamente con conjuntos de datos reales con resultados alentadores. Los resultados experimentales muestran que el tratamiento basado en la semántica de atributos categóricos mejora significativamente la interpretabilidad semántica y la utilidad de los datos anonimizados.
  • Altres:

    Editor: Universitat Rovira i Virgili
    Data: 2013-02-26, 2013-04-04T11:53:48Z, 2013-04-04T11:53:48Z
    Identificador: T.451-2013, http://hdl.handle.net/10803/108961
    Departament/Institut: Departament d'Enginyeria Informàtica i Matemàtiques, Universitat Rovira i Virgili.
    Idioma: eng
    Autor: Martínez Lluís, Sergio
    Director: Sánchez Ruenes, David, Valls, Aïda
    Font: TDX (Tesis Doctorals en Xarxa)
    Format: application/pdf, application/pdf, 189 p.
  • Paraules clau:

    Semàntica
    Ontologies
    Intel·ligència Artificial
    Privacitat
  • Documents:

  • Cerca a google

    Search to google scholar