Genomweite Untersuchungen zur Evolution und Methylierung von CpG-Inseln

CpG-Inseln sind, im Vergleich zum übrigen Genom, DNA-Regionen mit einem hohen GC-Gehalt und einer hohen Frequenz an CpG-Dinukleotiden. Sie können die Expression von Genen beeinflussen, in dem sie z.B. die Aktivität benachbarter bzw. überlappender Promotoren unterstützen und spielen auch bei der genomischen Prägung eine Rolle. Die genomische Prägung des humanen RB1-Gens beruht z.B. auf einem differentiell methylierten CGI im Intron 2 des RB1-Gens. Dieses CGI ist Teil einer durch Retrotransposition eingefügten Sequenz des PPP1R26-Gens von Chromosom 9 und hat sich zu einem differentiell methylierten alternativen RB1-Promotor entwickelt. Ziel dieser Arbeit ist es weitere geprägte Loci im Humangenom mit denselben Eigenschaften, wie denen des RB1-Locus, zu finden, wenn möglich den evolutionären Zeitpunkt der Entstehung dieser CGIs zu bestimmen und darüber hinaus alle CGIs, die mit einer Retrokopie überlappen auf genomische Prägung hin zu untersuchen. Zusammenfassend wurde im ersten Teil dieser Arbeit herausgefunden, dass das humane Genom nicht nur mehr CGIs als das murine Genom besitzt, sondern auch das Verhältnis von ausschließlich intronischen CGIs mehr als doppelt so hoch ist (7,7% humane intronische CGIs zu 3,5% murinen intronischen CGIs). Mindestens 2.033 humane intronische CGIs sind nicht im murinen Genom vorhanden. Von diesen haben 104 CGIs Sequenzähnlichkeiten zu anderen Regionen im humanen Genom und mindestens 45 sind assoziiert mit einer Retrokopie. Insgesamt konnte von 86 der 104 human/nicht-murin intronischen CGIs der evolutionäre Ursprung näher bestimmt werden. Im Galago-Genom (Buschbaby) konnten nur sieben dieser CGIs nachgewiesen werden. Dies weist darauf hin, dass der Großteil der 104 CGIs nach der Spaltung der Unterordnungen Haplorrhini und Strepsirrhini entstanden sind, und unterstützt die Idee, dass CGIs Teil der retrotranspositional explosion sind. Die meisten der human/nicht-murin intronischen CGIs sind methyliert (~75%) oder unmethyliert (~15%). Nur 14 CGIs zeigten ein mittleres Methylierungsniveau zwischen 20% und 80% in Monozyten und auch anderen Geweben, wovon nur fünf (14414_1_hg19, 15224_1_hg19, 16634_1_hg19, 19100_1_hg19 und 20632_1_hg19), einschließlich des intronischen CpG85 des RB1-Gens (16634_1_hg19), weitere Kriterien für eine mögliche differentielle Methylierung erfüllten. Diese CGIs sind, bis auf CGI 20632_1_hg19, alle durch Retrotransposition entstanden. Mit Hilfe der hochquantitativen Hochdurchsatz-Bisulfitsequenzierung konnten bei CGI 14414_1_hg19 (ASRGL1) und 19100_1_hg19 (PDXDC1) allelische Methylierungsunterschiede gezeigt werden. Im Gegensatz zu der geprägten Methylierung des CpG85 des RB1-Gens, waren die allelischen Methylierungsunterschiede bei ASRGL1 und PDXDC1 jedoch deutlich geringer, so dass ihre differentielle Methylierung sequenzspezifisch ist. Die Hypothese von einer allelspezifischen Methylierung von CGI 15224_1_hg19 (PARP11) konnte verworfen werden. Die Ergebnisse der vorliegenden Arbeit zeigen, dass der RB1/Rb1-Locus einzigartig in seinen Eigenschaften ist. Es gibt jedoch weitere CGIs, die allelische Methylierungsunterschiede aufweisen, die aber nicht elternspezifisch sind, sondern abhängig von der DNA-Sequenz. Im zweiten Teil der vorliegenden Arbeit konnte ermittelt werden, dass insgesamt nur 10% (1.319 von 13.173) aller Retrokopien mit einem CGI assoziiert sind (R-CGI). Der Großteil dieser R-CGIs war entweder vollständig methyliert (588) oder vollständig unmethyliert (384), wobei bei 152 R-CGIs die Methylierung aufgrund schlechter genomischer Abdeckung nicht ermittelt werden konnte. Ein mittleres Methylierungsniveau (zwischen 20% und 80%) konnte bei 195 dieser R-CGIs festgestellt werden, wobei neben der geprägten Methylierung des CpG85 des RB1-Gens auch eine geprägte Methylierung des R-CGIs 9261_1_hg19 des RPS2P32-Gens identifiziert werden konnte. Methylierung in Oozyten, keine Methylierung in Sperma, Methylierung nur des maternalen Allels in DNA aus Blut und ein Verlust der Methylierung in vier von sechs Patienten mit einem MLID weisen stark auf eine genomische Prägung hin. Untersuchungen der Expression in Blut zeigten jedoch eine biallelische Expression des RPS2P32-Gens. Daher ist es möglich, dass RPS2P32 in einem anderen Gewebe monoallelisch exprimiert wird. Auch konnte keine monoallelische Expression des benachbarten IGF2BP3-Gens, weder in Blut noch in Plazenta, nachgewiesen werden. Auch in diesem Fall kann eine monoallelische Expression von IGF2BP3 in anderen Geweben nicht ausgeschlossen werden. Es konnte ein starker Zusammenhang zwischen dem Methylierungsgrad eines R-CGIs und der genomischen Umgebung festgestellt werden. Einerseits ist es möglich, dass die Methylierung der Integrationsstelle einen starken Effekt auf die Methylierung des R-CGIs hat, wobei ein potentieller Einfluss von repetitiven Sequenzen ausgeschlossen werden konnte. Andererseits kann sich auch die Methylierung der Retrokopie z.B. durch Abwehrmechanismen ausgebreitet haben. In diesem Fall würde man dann von einer de novo Methylierung infolge der Retrotransposition sprechen.

CpG islands (CGIs) are CpG-rich sequences which meet specific criteria, like CG-content and length. They are mainly located at the 5’-end of a gene and can influence the expression of a gene for example by supporting the activity of a neighbouring or overlapping promoter. CGIs can also play a role in genomic imprinting. Imprinting of the human RB1 gene is due to the presence of a differentially methylated CGI in intron 2. This CGI is part of a retrocopy derived from the PPP1R26 gene on chromosome 9 and developed into an alternative promoter of the RB1 gene. The aim of this study was to identify further imprinted loci of like the RB1 locus showing the same characteristics as the RB1 locus, to determine the time point of origin of these CGIs and furthermore to analyse all retrocopy associated CGIs with regard to genomic imprinting. The first part of this study showed that the human genome contains more CGIs than the murine one and also the proportion of intronic CGIs is higher (7.7% human intronic CGIs vs. 3.5% murine intronic CGIs). Sequence comparison of human and murine intronic CGIs resulted in 2,033 human intronic CGIs which are not present in the murine genome (human/nonmurine intronic CGIs). Out of these, 104 CGIs showed high sequence similarities to other regions in the human genome and 45 are associated with a retrocopy. Overall the time points of 86 CGIs (out of 104 CGIs with an additional hit in the human genome) could narrow down. For the remaining 18 CGIs it was not possible to detect the evolutionary time points because of sequence gaps in several primate genomes. Only seven human/nonmurine intronic CGIs are present in the bushbaby genome, suggesting that most of the 104 CGIs appeared after the split between Haplorrhini and Strepsirrhini and supports the idea of the retrotranspositional explosion. Most of the 104 human/nonmurine CGIs are heavily methylated (~75%; methylation level over 80%) or unmethylated (~15%; methylation level below 20%). Only 14 CGIs show an intermediate methylation level (methylation level between 20% and 80%) in human monocytes and other tissues. Out of these 14 CGIs five CGIs (14414_1_hg19, 15224_1_hg19, 16634_1_hg19, 19100_1_hg19 und 20632_1_hg19), including CpG85 of the RB1 gene (16334_1_hg19), fulfil further criteria for a potential differential methylation. Only CGI 20632_1_hg19 does not appear to be associated with a retrocopy. Deep bisulfite sequencing of DNA from human monocytes showed allelic methylation differences at the CGI 14414_1_hg19 (ASRGL1) and 19100_1_hg19 (PDXDC1). In contrast to the imprinted methylation of CpG85 of the RB1 gene the allelic methylation differences at ASRGL1 and PDXDC1 were less marked. The observed allelic methylation differences at these two loci are sequence specific and not parent-of-origin-specific. Allelic methylation of CGI 15224_1_hg19 (PARP11) could not be verified. The results of this part of the study showed that the RB1 locus is unique in respect of its characteristics. There are further CGIs showing allelic methylation differences which are not parent-of-origin-specific, but sequence specific. The second part of this study showed that only 10% (1,319 out of 13,173) of all human retrocopies are associated with a CGI (R-CGI). Most of these R-CGIs are either methylated (588) or unmethylated (384) whereas the methylation level of 152 R-CGIs could not be analyzed due to insufficient coverage. Of all R-CGIs, 195 showed a methylation level between 20% and 80%. In addition to the imprinted methylation of CpG85 of the RB1 gene this study identified an imprinted methylation at the R-CGI 9261_1_hg19 of the RPS2P32 gene. Full methylation in oocytes, no methylation in sperm, only methylation of the maternal allele in DNA from blood and loss of methylation in four out of six patients with MLID indicate genomic imprinting. Expression analysis of RPS2P32 in blood showed biallelic expression of the gene, but it is possible that RPS2P32 is monoallelically expressed in other tissues. In addition the expression of the neighboring IGF2BP3 gene was analyzed in blood and placenta and a biallelic expression was detected. Again, it is possible that IGF2BP3 is monoallelically expressed in other tissues. Furthermore a strong correlation between the methylation state of the environment and the R-CGI could be detected. On the one hand it is possible that the methylation at the integration site has a strong effect on the methylation state of the R-CGI (an influence of repetitive sequences could be excluded). On the other hand it is also possible that the methylation of the retrocopy has spread into adjacent regions due to e.g. host defense mechanisms. In this case the methylation would be a de novo methylation resulting from retrotransposition.

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten