Treballs Fi de Grau> Bioquímica i Biotecnologia

New insights into DNA methylation mechanics using high throughput computing algorithms for epigenomics data analysis

  • Identification data

    Identifier: TFG:2967
    Handle: http://hdl.handle.net/20.500.11797/TFG2967
  • Authors:

    Eizaguirre Suarez, German Telmo
  • Others:

    Creation date in repository: 2020-12-16
    Abstract: La regulació epigenòmica és un procés complex mediat per múltiples factors. Entendre la funcionalitat de les seqüències d'ADN implicades en aquest procés és crucial per als objectius clínics i de recerca. La metilació de l'ADN és una marca epigenètica crucial responsable del silenciament gènic. Per tant, els motius extrets dels llocs de metilació de l'ADN inclouen paraules específiques d'ADN relacionades amb molts processos biològics crucials, inclosa la reprogramació i la diferenciació cel·lular. Com que es suggereix que la regulació de la metilació és un mecanisme cooperatiu entre diferents molècules i dominis proteics, els motius de metilació no necessàriament han d'aparèixer centrats en l'objectiu de metilació. En canvi, s'ha de tenir en compte l'obstacle estèric entre diferents dominis d'unió a l'ADN a l'hora d'analitzar els motius de metilació de l'ADN. Si les proteïnes reguladores de la metilació es veuen afectades per un obstacle estèric, els motius de metilació de l'ADN s'han de col·locar en algunes bases de desplaçament de l'objectiu de metilació. Hem implementat un ampli canal de descobriment de motius de metilació a tot el genoma que es pot executar en clústers HPC basats en Slurm. Hem optimitzat el pipeline per a l'anàlisi de centenars de desplaçaments en una tirada. El nostre pipeline revela motius independentment del seu posicionament en relació amb l'objectiu de metilació de l'ADN. Estudiem la prevalença de motius de metilació desplaçats a les línies cel·lulars a nivells de diferenciació múltiples i revelem tendències valuoses de la qualitat dels motius en desplaçaments específics de l'objectiu de metilació. Relacionem el nostre resultat amb mecanismes moleculars implicats en la diferenciació i proposem nous models per a la repressió de gens implicats en la pluripotència. Epigenomic regulation is a complex process mediated by multiple factors. Understanding the functionality of DNA sequences involved in such process is crucial for clinical and research aims. DNA methylation is a crucial epigenetics mark responsible for gene silencing. Hence, motifs extracted from DNA methylation sites include specific DNA words relatable to many crucial biological processes, including cell reprogramming and differentiation. As methylation regulation is suggested to be a cooperative mechanism between different molecules and protein domains, methylation motifs do not necessarily need to appear centred on the methylation target. Instead, steric hindrance between different DNA binding domains should be considered when analysing DNA methylation motifs. If methylation regulator proteins are affected by steric hindrance, then DNA methylation motifs should be positioned at some bases of displacement from the methylation target. We implemented an extensive, genome-wide methylation motif discovery pipeline runnable in Slurm-based HPC clusters. We optimized the pipeline for the analysis of hundreds of displacements in one run. Our pipeline discloses motifs independently of their positioning relative to the DNA methylation target. We study the prevalence of displaced methylation motifs in cell lines at multiple differentiation levels and disclose valuable trends of motif quality at specific displacements from the methylation target. We relate our result to molecular mechanisms involved in differentiation and propose new models for the repression of genes involved in pluripotency. La regulación epigenómica es compleja y está mediada por múltiples factores. Comprender la funcionalidad de las secuencias de ADN involucradas en dicha regulación es esencial tanto en el ámbito clínico como en el de investigación. La metilación del ADN es una marca epigenética responsable de silenciar la expresión génica. Por lo tanto, la definición de motivos relacionados con sitios de metilación implica la obtención de palabras de ADN relacionadas con diversos procesos biológicos que incluyen la diferenciación y la pluripotencia. La regulación de la metilación del ADN es un mecanismo cooperativo entre diferentes moléculas, lo que podría implicar que los motivos no siempre aparezcan centrados en el potencial sitio de metilación. Debemos considerar las limitaciones estéricas entre los diferentes dominios proteicos que interaccionan simultáneamente con el ADN a la hora de definir motivos. Si las proteínas reguladoras de la metilación del ADN estuvieran afectadas por dichas limitaciones estéricas, los motivos de ADN deberían emerger desplazados en un cierto número de bases del potencial sitio de metilación. Hemos implementado un algoritmo de descubrimiento de motivos en la extensión completa del genoma, ejecutable en clústeres de computación de alto rendimiento basados en Slurm. Hemos optimizado el algoritmo para analizar cientos de desplazamientos en una sola ejecución. Nuestro programa identifica motivos independientemente de su posición respecto a los potenciales sitios de metilación. Estudiamos la prevalencia de motivos desplazados en células a diferentes niveles de diferenciación y revelamos tendencias de calidad de los motivos de ADN respecto al valor del desplazamiento. Relacionamos nuestros resultados con mecanismos moleculares de diferenciación y proponemos nuevos modelos para la represión de genes involucrados en la pluripotencia.
    Subject: Bioquímica i biotecnologia
    Language: en
    Subject areas: Bioquímica i biotecnologia Biochemistry and biotechnology Bioquímica y biotecnología
    Department: Bioquímica i Biotecnologia
    Student: Eizaguirre Suarez, German Telmo
    Academic year: 2019-2020
    Title in different languages: New insights into DNA methylation mechanics using high throughput computing algorithms for epigenomics data analysis
    Work's public defense date: 2020-07-15
    Access rights: info:eu-repo/semantics/openAccess
    Keywords: motius de DNA, metilació, bioinformàtica DNA motifs, methylation, bioinformatics motivos de DNA, metilación, bioinformática
    Confidenciality: No
    TFG credits: 9
    Title in original language: New insights into DNA methylation mechanics using high throughput computing algorithms for epigenomics data analysis
    Project director: Torija Martínez, María Jesús; Araúzo Bravo, Marcos
    Education area(s): Biotecnologia
    Entity: Universitat Rovira i Virgili (URV)
  • Keywords:

    Bioquímica i biotecnologia
    Biochemistry and biotechnology
    Bioquímica y biotecnología
    Bioquímica i biotecnologia
  • Documents:

  • Cerca a google

    Search to google scholar