Diplomarbeit, 2011
145 Seiten, Note: 1,3
Zusammenfassung
1. Einleitung
1.1 Pharmakologische Forschung in der Post-Genom Ära
1.1.1 Arzneimittelmetabolismus durch humane Cytochrom P450 Enzyme
1.1.2 Die Cytochrom P450 Monooxygenase 2B6
1.1.3 Sequenz- und Struktur-Funktionsbeziehungen von P450 Enzymen
1.1.4 Genotyp-Phänotyp Vorhersagen von nicht-synonymen SNPs
1.1.5 Rekombinante Expression humaner P450 Enzyme
1.1.6 Aufgabenstellung und Motivation
2. Ergebnisse
2.1 Analyse neuer CYP2B6 Varianten ruandischer HIV Patienten
2.1.1 Validierung von in silico Phänotyp Vorhersagen aufgrund experimenteller CYP2B6 Daten
2.1.2 Phänotyp Vorhersagen der neuen CYP2B6 SNPs
2.1.3 Sequenz und Struktur- Funktionsanalyse von CYP2B6
2.2 Rekombinante Expression von nativem CYP2B6 in E. coli „Walker Stämmen“
2.2.1 Expression in E. coli C41 und C43 mit dem Expressionsvektor pLW01
2.2.2 Quantifizierung des P450 Gehaltes in den Kulturen
2.2.3 Bestimmung der CYP2B6 Bupropionhydroxylase-Aktivität mittels LC-MS
2.2.4 Expression des ortholgen CYP2B4 in E. coli C41
2.2.5 Vergleich der Bupropion-Hydroxylase Aktivität von CYP2B4 und CYP2B6
2.2.6 Fraktionierung und Verteilung des exprimierten CYP2B6 im E. coli Lysat
2.3 Das E. coli pET SUMO Expressionssystem
2.3.1 Expression von SUMO-CYP2B6 und N-terminalen Varianten
2.3.2 Fraktionierung von pET-SUMO exprimiertem CYP2B6
2.3.3 Aufreinigung von SUMO-CYP2B6del mittels Magnetic Beads
2.3.4 Fazit der Expression von CYP2B6 in E. coli
2.4 Expression und Charakterisierung der neuen CYP2B6 Varianten
2.4.1 Expression der Varianten CYP2B6.G110V, -I114T, -V183G und CYP2B6.6 in E. coli C41
2.4.2 Bupropionhydroxylase-Aktivität der in E. coli C41 exprimierten Varianten
2.4.3 Expression der neuen CYP2B6 Varianten in COS-1 Zellen
2.4.4 Bupropionhydroxylase-Aktivität der in COS-Zellen exprimierten Varianten
2.4.5 Enzymparameter der CYP2B6.R253H, -R487S und CYP2B6.6 Varianten
3. Diskussion
3.1 Validierung der CYP2B6 Phänotyp Vorhersagen
3.2 In silico Analyse neuer CYP2B6 Varianten in ruandischen HIV Patienten
3.3 Expression von membrangebundenem CYP2B6 in E. coli C41
3.3.1 Aktivität des nativen CYP2B6
3.4 pET-SUMO Expressionssystem in E. coli zur Expression von nativem P450 Enzymen
3.5 Zusammenfassung der in vitro und in silico Analyse neuen CYP2B6 Varianten
3.6 Ausblick
4. Materialien und Methoden
4.1 Experimentelle Arbeiten
4.1.1 Klonierung von CYP2B6 in pLW01
4.1.2 Konstruktion der pET-SUMO-2B6 Expressionsvektoren
4.1.3 Ortspezifische Mutagenese der neuen CYP2B6 cDNA Varianten
4.1.4 Expression in E. coli
4.1.5 Zellaufschluß und Zentrifugationsschritte
4.1.6 Aufreinigung der SUMO-CYP2B6 Proteine mit der Magentic Beads ® Technologie
4.1.7 Rekombinante Expression von CYP2B6 in COS-1 Zellen
4.1.8 Western Blot
4.1.9 Reduzierte CO-Differenzspektroskopie zur Quantifizierung von exprimiertem CYP2B6
4.1.10 LC/MS Analyse
4.2 In silico Arbeiten
4.2.1 Datenbanken
4.2.2 PCR, DNA Sequenz Tools
4.2.3 Protein Primär- und Tertiärstruktur Tools
4.2.4 Online Genotyp-Phänotyp Vorhersage Programme
5. Literaturverzeichnis
6. Anhang
7. Arbeitsgruppen
7.1 AG Zanger
7.2 AG Pleiss
Die Aufklärung der Variabilität von Arzneimittelwirkungen aufgrund von genetischen Unterschieden gehört zum Forschungsbereich der Pharmakogenetik. Etwa 80 % der Arzneimittel in der Leber werden durch Cytochrom P450 Monooxygenasen (CYPs) verstoffwechselt. Aus diesem Grund sind Mutationen in den CYP Genen von besonderer Wichtigkeit. Die meisten dieser Mutationen werden durch Einzelnukleotid Polymorphismen (SNPs) hervorgerufen. Zur Untersuchung der interindividuellen Medikamtenverträglichkeit werden in vivo, in vitro und in silico Methoden zur Genotyp-Phänotyp Bestimmung und ihrer Vorhersage eingesetzt. In dieser Arbeit wurden in silico und in vitro Versuche zur Charakterisierung neuer CYP2B6 Enzymvarianten durchgeführt. Die Bedeutsamkeit von CYP2B6 Polymorphismen ist besonders in der HIV Therapie gegeben. Mit Efavirenz und Nevirapin werden zwei wichtige anti-HIV Medikamente durch CYP2B6 metabolisiert.
Die Sequenzanalyse von CYP2B6 in einer Kohorte von HIV erkrankten ruandischen Patienten durch einen Kooperationspartner, führte zu einer Vielzahl von neuen Mutationen. Diese neuen SNPs sollten in dieser Arbeit analysiert werden.
Bioinformatische Vorhersagen von Genotyp-Phänotyp Beziehungen können aufgrund von Sequenz- und Strukturanalysen erfolgen. Zu diesem Zweck wurden zunächst sieben frei zugängliche Algorithmen zur Phänotyp Vorhersage validiert. Der Validierung lagen 25 bekannte nicht-synonyme CYP2B6 SNPs und deren experimentell bestimmte Phänotypen zugrunde. Die Vorhersage Programme unterschieden sich in der Qualität der CYP2B6 Phänotyp Vorhersagen deutlich mit einer Korrektklassifizierungsrate (ac curacy) im Bereich von 50 bis 80 %. Die besten Werte erzielte die PolyPhen2 Vorhersage mit einer Sensitivität von 100 % und einer ac curacy von 80 %. Die Phänotypen der sieben neu identifizierten nicht-synonymen CYP2B6 SNPs von ruandischen HIV-Patienten wurden mit den zuvor validierten Algorithmen vorhergesagt. Dabei wurden drei SNPs (329G>T, 548T>G, 758G>A) besonders häufig als loss of function Phänotypen vorhergesagt. Dieses SNPs führten zu den Aminosäuresubstitutionen G110V, V183G und R253H im CYP2B6 Protein.
Zusätzlich zu den Vorhersagen wurden die Aminosäuresubstitutionen der neuen CYP2B6 Varianten mittels Sequenz-, Struktur- und Funktionsbeziehungen in silico analysiert. Dabei konnten Sequenz- und Strukturdaten zeigen, dass sich drei der neuen Aminosäuresubstitutionen (G110V, I114T, F213L) in der Substratbinderegion befinden. Die Aminosäuresubstitution an der Position 114 ist besonders interessant, da diese mit hoher Wahrscheinlichkeit die Substratspezifität und Regioselektivität beeinflusst.
Für die in vitro Untersuchung wurden mittels ortsspezifischer Mutagenese der CYP2B6 cDNA acht neue CYP2B6 Varianten erzeugt. Um die neuen CYP2B6 Enzymvarianten biochemisch zu charakterisieren, sollte das E. coli Expressionssystem etabliert werden. Die E. coli Stämme C41 und C43, welche besonders geeignet sind für die Überexpression von Membranproteinen, sollten dabei das native CYP2B6 in ausreichenden Mengen exprimieren. Western Blot Analysen und die spektrale Quantifizierung ergaben einen CYP2B6 Gehalt von 100-500 nmol/ Liter Kultur, wobei durch die spektrale Quantifizierung oft kein Holoprotein identifizieren wurde. Dennoch konnte das rekombinant exprimierte CYP2B6 als aktives Enzym exprimiert werden. Dies zeigte die Hydroxylierung von Bupropion, einem Arzneimittel das spezifisch durch CYP2B6 eliminiert wird. Die maximale Umsatzgeschwindigkeit entsprach dabei 40 pmol Hydroxybupropion pro Milligramm Gesamtprotein in einer Minute. Hiermit konnte zum ersten Mal überhaupt gezeigt werden, dass unmodifiziertes CYP2B6 in seiner funktionellen Form in E. coli exprimiert werden kann Zum Vergleich setzte in E. coli exprimiertes orthologes CYP2B4 jedoch 1200 pmol Hydroxybupropion in der gleichen Zeit um. Die niedrige Umsetzung, zusammen mit dem Problem der spektralen Quantifizierung des CYP2B6 Holoproteins, ließ vermuten, dass CYP2B6 zum größten Teil als Apoprotein in E. coli C41 exprimiert wird.
Aufgrund dieser Tatsache wurden die Varianten im bereits etablierten COS-Zell-System exprimiert. Sechs neue Varianten wurden durch die Substratumsetzung von Bupropion und anschließender LC/MS Analyse charakterisiert. Insgesamt wurden vier der neuen Varianten (G110V, I114T, V183G, F213L) als loss of function Phänotyp identifiziert. Die Variante R253H zeigte eine um 75 % reduzierte Aktivität im Vergleich zum Wildtyp. Einzig die Variante CYP2B6.R487S wies eine vergleichbare Aktivität wie der Wildtyp auf.
Die in silico Vorhersagen konnten mit CYP2B6.G110V und CYP2B6.V183G zwei der vier Null-Phänotypen richtig vorhersagen. Die deutlich reduzierte Aktivität von CYP2B6.R253H wurde ebenfalls von vielen Algorithmen erkannt. Mit CYP2B6.I114T und CYP2B6.F213L wurden die zwei Substitutionen im Substraterkennungsbereich nicht als aktivitätsbeeinflussend vorhergesagt, führten in vitro aber zum Verlust der Bupropionhydroxylierung.
Die neu identifizierten loss of function CYP2B6 Varianten können insbesondere in Kombination mit häufig vorkommenden bekannten loss of function Allelen (CYP2B6*6, CYP2B6*18) für die Metabolisierung der anti-HIV Medikamente Efavirenz und Nevirapin von bedeutender klinischer Relevanz sein.
Die Wissenschaft der Pharmakologie beschäftigt sich mit den Wechselwirkungen zwischen Arzneistoffen und dem Organismus. Teilgebiete der Pharmakologie sind die Pharmakodynamik, Pharmakokinetik und die Pharmakogenetik (Abb. 1). Die Pharmakokinetik ist eng mit der Pharmakodynamik verknüpft und analysiert die Aufnahme (Absorption), die Verteilung (Distribution), die Metabolisierung (Metabolism) und die Ausscheidung (Excretion). In der Pharmakologie werden diese Prozesse unter dem Begriffe ADME zusammengefasst. Die Pharmakodynamik beschäftigt sich dabei mit der Dosis-Wirkungsbeziehung des Arzneimittels und damit verbundene mögliche Arzneimittelnebenwirkungen. Die interindividuelle Variabilität der Arzneimittelwirkung und der damit verbunden Nebenwirkungen hängen von Patienten-Faktoren (Alter, Geschlecht, Hormonstatus etc.), den gegebenen Umwelteinflüssen (Ernährung, Komedikation etc.) und von der unterschiedlichen genetischen Ausstattung der Patienten ab [1]. Die Pharmakogenetik analysiert genetischen Faktoren und ihre Auswirkungen auf die Pharmakodynamik und –kinetik.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1: Teilgebiete der Pharmakologie und Ursachen der interindividuellen Variabilität der Arzneimittelwirkung
Im Zeitalter der Hochdurchsatz-Sequenzierungen (next-generation-sequencing) und Voranschreiten der personalisierten Medizin werden vermehrt Unterschiede in der genetischen Grundausstattung des Menschen identifiziert. Dabei handelt es sich oftmals um Einzelnukleotidaustausche (single nucleotide polymorphisms, SNPs), die bei den sogenannten nicht-synonymen Polymorphismen (nsSNPs), zu einem Aminosäureaustausch des Proteins führen. Dies kann unter Umständen zur interindividuellen Variabilität im Arzneistoffwechsel beitragen. Neben den Transkriptionsfaktoren, Rezeptoren und Ionenkanälen sind für die Pharmakogenetik vor allem Membranproteine der P-Glykoprotein/ABC-Transporterfamilie (MDR-Proteine) und die arzneimittelabbauenden Enzyme der Phase I und – II von besonderem Interesse.
Der Fokus in dieser Diplomarbeit ist auf die Enzymklasse der Cytochrom P450 Monooxygenasen (CYPs) gerichtet. Durch das humane Genom Projekt wurden 57 aktive CYP Gene identifiziert, die anhand ihrer Sequenzidentität in 18 Proteinfamilien (CYP1-51) und 43 Proteinsubfamilien (CYP1A etc.) eingeteilt wurden [2].
Neben der Metabolisierung von endogenen Substanzen wie Steroiden und Fettsäuren (CYP4-51), sind die humanen CYPs der Proteinfamilie CYP1-3 vor allem an der Umsetzung von Xenobiotika beteiligt [3]. Cytochrom P450 Enzyme werden in vielen Geweben exprimiert, ein Großteil des humanen CYP-Anteils befindet sich jedoch in der Leber. Dort sind sie in der Membran des endoplasmatischen Retikulums N-terminal verankert und werden als mikrosomale CYPs bezeichnet. Die zur Enzymklasse der Monooxygenasen (EC: 1.14.x.y) gehörenden P450 Enzyme katalysieren folgende allgemeine Redoxreaktion ( I ):
( I ) RH + O2 + NADPH + H+ → ROH + H2O + NADP+
Dabei wird mit Hilfe des molekularen Sauerstoffs und dem Reduktionsmittel NADPH das Substrat (RH) oxidiert. Die zwei benötigten Elektronen werden über eine Elektronen-transportkette auf das Häm Eisen des P450 Enzyms übertragen. Proteine, die in der Elektronentransportkette von mikrosomalen CYPs vorkommen, sind die NADPH:P450-oxidoreduktase (POR) und Cytochrom b5 (Abb. 2).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2: Schematische Darstellung des P450 Monooxygenase Systems: Interaktion des mikrosomalen Cytochrom P450 (orange) mit den Proteinen der Elektronentransportkette; Grafik verändert: aus Zanger und Eichelbaum 2008 [3]
Diese von den CYPs ausgeführte Reaktion ( I) nennt man Phase-I-Reaktion oder auch Funktionalisierungsreaktion. Durch das Anfügen der funktionellen Gruppe, meist einer Hydroxyl-Gruppe, wird das Substrat polarer. Diese Biotransformation führt vorwiegend zur Inaktivierung und anschließenden Eliminierung des Substrates, wodurch das Arzneimittel seine pharmakologische Wirkung verliert. Das bevorzugte Organ für die Arzneimittelelimination ist die Leber. Hier werden ca. 70 % der Fremdstoffe (Xenobiotika) eliminiert, wobei der Rest über die Niere beseitigt wird (Abb. 3).
Beispiele für die Bioaktivierung durch P450 Enzymen gibt es auch. So kann das Pilzgift Aflatoxin durch die Oxidation in seine Epoxidform umgewandelt werden und lebertoxische bzw. krebserregende Wirkung entfalten [4].
Im Gegensatz dazu ist eine P450 vermittelte Aktivierung aber auch bei der Krebstherapie einsetzbar. In der sogenannte Enzym/Prodrug Krebstherapie können P450 Enzyme spezifisch inaktive Arzneimittel („ Prodrug “) durch ihre Oxidation aktivieren [5].
Die humanen P450 Enzyme der Proteinfamilien CYP4-51 sind an der Metabolisierung von endogenen Substanzen beteiligt, wie zum Beispiel an der Hormon-, Fettsäure- und Vitaminsynthese [3].
Zum Großteil (ca. 80 %) werden die Arzneimittel über die Phase-I-Reaktionen der P450 Enzyme in der Leber metabolisiert (Abb. 3). Nur ein kleiner Prozentsatz (ca. 5 %) wird durch Phase-II-Enzyme, wie die Glutathion-S-Transferase oder die N-Acetyltransferase, inaktiviert.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 3: Eliminierung der 200 meist verschriebenen Arznei- mittel in den USA (RxList Data 2008); Grafik aus: [6]
Die 200 am häufigsten verschriebenen Arzneimittel in den USA werden zu einem Prozentsatz von circa 35 % durch die CYP3A4/5 Isoenzyme metabolisiert. Zusammen mit CYP2C9 und CYP2D6 machen diese vier Enzyme 70 % der hepatischen P450 Eliminierungsreaktionen aus (Abb. 3) [6, 7].
Eines der weniger gut untersuchten und charakterisierten P450 Enzyme war CYP2B6. Anfang 2000 war noch relativ wenig über dieses Isoenzym bekannt [8]. Zwanzig Jahr nach der Entdeckung der ersten Polymorphismen, welche den Arzneimittelstoffwechsel des Menschen beeinflussen [9], existierten für CYP2B6 keine phänotypische Charakterisierung von pharmakogenetischen Effekten. Da CYP2B6 nur ca. 3-6 % des P450 Lebermikrosomen Anteils ausmacht [10], wurde es lange Zeit weniger beachtet als andere humane P450 Enzyme. Aber auch fehlende selektive Substrate und Inhibitoren machten die CYP2B6 Erforschung zu einer schwierigen Aufgabe. 2001 wurden die ersten CYP2B6 Polymorphismen von der Forschungsgruppe um Prof. Dr. Ulrich Zanger am Institut für klinische Pharmakologie Stuttgart publiziert [11]. Von diesem Zeitpunkt an nahm die Zahl der neuen CYP2B6 Polymorphismen stetig zu. Das Cytochrom 2B6 stellte sich als ein sehr polymorphes Gen heraus. Zu diesem Zeitpunkt sind 29 Allel[1] beschriebenen und mehr als 100 SNPs veröffentlicht. Zudem zeigte sich die klinische Relevanz dieses Enzyms, indem es mit mehr als 100 xenobiotischen Substraten interagiert [8, 12]. Die wichtigsten darunter sind das Antimalariamittel Artemisinin, das Anästhetikum Propofol, das Antidepressivum Bupropion und die nichtnukleosidischen Reverse-Transkriptase-Inhibitoren (NNRTI) Nevirapin und Efavirenz zur HIV Therapie [13]. Auch die zuvor angesprochene Prodrug Strategie zur Krebstherapie wird mit CYP2B6 verfolgt. Bei der sogenannten P450-Gene-Directed-Enzyme-Prodrug Therapie (GDEPT) aktiviert CYP2B6 das Zytostatikum Cyclophosphamid spezifisch in Tumorzellen. Da CYP2B6 nur in geringen Umfang im Organismus exprimiert wird und zudem eine geringe Affinität für Cyclophosphamid besitzt, sind die zytotoxischen Effekte im gesunden Gewebe niedrig [5, 14]. Die durch rationales Design verbesserte CYP2B6 Enzymvariante 114V/477W könnte durch einen retroviralen Vektor direkt im Krebsgewebe exprimiert werden und damit in hohem Masse Cyclophosphamid aktivieren [14, 15].
Viele klinisch relevante interindividuelle Unterschiede von P450 Enzymen und die damit verbundenen unvorhersehbaren Arzneimittelwirkungen konnten mit organspezifischen Proben und klinischer Patientendokumentation aufgeklärt werden. Die humane Leberbank mit über 300 Leberproben am Institut für klinische Pharmakologie in Stuttgart konnte zu diesem Zwecke bereits für eine Vielzahl von Analysen eingesetzt werden [16]. Zusätzlich zu den in vivo bzw. ex vivo gewonnen Daten konnten humane P450 Enzyme anhand rekombinant exprimierter Enzyme in vitro charakterisiert werden.
In der Post-Genom-Ära hat die Bioinformatik einen besonders großen Stellenwert eingenommen. Die Hochdurchsatz-Identifizierung von krankheitsrelevanten Genen in Genom- und Exomsequenzen ist dabei eine wichtige Aufgabe in der Pharmakogenetik und Pharmakogenomik. In der Protein Strukturaufklärung von klinisch relevanten Molekülen konnte die Bioinformatik ebenfalls große Fortschritte erzielen. So wurde 1987 mit CYP101 (P450cam) die erste Röntgenstruktur eines P450 Enzyms aus Pseudomonas putida aufgeklärt [17]. Mikrosomale und mitochondriale CYPs bereiteten Schwierigkeiten bei der Kristallisation da sie nicht löslich und membrangebunden sind. Im Jahr 2000 konnte die erste Röntgenkristallstruktur von CYP2C5 (Oryctolagus cuniculus) aufgeklärt werden [18]. Drei Jahre später folgte das humane CYP2C9 [19]. Für die rekombinante Expression in E. coli sind in allen Fällen Modifikation der P450 Proteinsequenz nötig. Für die Aufreinigung und Kristallisation aller bisher veröffentlichen Säugetier CYPs wurden die N-terminalen Membrananker deletiert, C-terminale Polyhistidinsequenzen eingefügt und oftmals auch interne Modifikationen vorgenommen.
Ende 2010 waren 50 humane CYP Strukturen aufgeklärt[2]. Davon sind viele P450 Enzyme mit mehreren Substraten bzw. Inhibitoren komplexiert. Alleine von CYP2A6 existieren 10 Strukturen. Bisher existieren von 16 verschiedenen humanen P450 Enzymen Röntgenkristallstrukturen (Tab. 1). Von CYP2B6 existiert bislang eine Struktur mit einer Auflösung von 2 Angström (PDB Code: 3IBD) [20].
Tab. 1: Übersicht der PDB Suchanfrage über bisher veröffentlichte humane P450 Strukturen
Abbildung in dieser Leseprobe nicht enthalten
Existieren von einem Enzym mehrere Strukturen, so ist jeweils die erste veröffentlichte Struktur aufgelistet.
Bevor die CYP2B6 Proteinstruktur existierte, wurden Homologiemodelle erstellt, die auf dem orthologen CYP2B4 (Oryctolagus cuniculus) basierten. Um das humane CYP2B6 zu exprimieren und zu kristallisieren, mussten die thermische Stabilität und die Löslichkeit des Enzyms verbessert werden. Deswegen wurde CYP2B6 als Doppelmutante mit den Mutationen Y226H und K262R exprimiert [20]. Die Struktur ist mit dem Inhibitor 4-(4-chlorophenyl)imidazol (4-CPI, 178 kDa) kristallisiert. Zwei weitere CYP2B6 Strukturen stehen zur Veröffentlichung bereit (PDB unreleased). Eine Struktur (PDB ID: 3QU8) ist mit dem Inhibitor 4-(4-Nitrobenzyl)pyridin [214 Da] komplexiert und die andere Struktur (PDB ID: 3QOA) mit 4-Benzylpyridin [169 Da] [21]. Mit Hilfe der Sequenzen und Strukturinformationen sind Einblicke in die Diversität der P450 Substratspezifität möglich [22].
Mit genomweite Assoziationsstudien (GWAS) können dabei komplexe, genetisch bedingte Erkrankungen analysiert werden. Strukturinformationen von ADME Proteinen können dazu beitragen Substratspektren mit einem hohen Durchsatz zu analysieren und auszuwerten. Außerdem könnten Strukturinformationen zur Verbesserung von Arzneimitteln in der präklinischen Phase eingesetzt werden. In diesem Zusammenhang werden vor allem das Molekulare Docking, Molekulardynamische (MD) Simulationen und quantitative Struktur-Aktivitäts-Beziehungen (QSARs) eingesetzt [23, 24].
Durch Verbesserung der Sequenziertechnologien steigt die Zahl an sequenzierten humanen Genomen rasant an und liefert so eine Fülle von Daten für die Pharmakogenetik. Um diese enorme Informationsmenge sinnvoll nutzen zu können, bedarf es Techniken die diese Ergebnisse zu filtern. Im Bezug auf interindividuelle Unterschiede im Arzneimittelstoffwechsel würde dies bedeuten, die zugrundeliegenden genetischen Unterschiede in den Genomen zu identifizieren. Das 1000 Genom Projekt zeigte, dass jeder Mensch im Durchschnitt ca. 250 bis 300 genetische Variationen trägt, die zu einem Ausfall (loss of function) des jeweiligen Proteins führen [25]. Eine besondere Rolle kommen dabei den nicht-synonymen SNPs zu. Mit Hilfe der Bioinformatik können Vorhersagen über die funktionellen Auswirkungen der Aminosäuresubstitutionen gemacht werden. Die Phänotyp Vorhersagen basieren dabei auf phylogenetischen Analysen und/oder auf strukturellen Eigenschaften der Proteine [26]. Die phylogeniebasierte Vorhersage analysiert dabei die Sequenzkonservierung an der Stelle wo der Aminosäureaustausch stattfindet. Konservierte Sequenzbereiche in einem multiplen Sequenzalignments (MSAs) von homologen Proteinen nehmen meist eine funktionell wichtige Aufgabe innerhalb des Proteins ein. Aminosäuresubstitutionen in konservierten Bereichen führen deswegen sehr wahrscheinlich zu unfunktionellen Proteinvarianten. Phänotyp Vorhersagen können auch auf strukturelle Proteineigenschaften basieren. Yue et al. fanden heraus, dass etwa 75 % der krankheitsassozierten Mutationen strukturell destabilisierenden sind [27]. Einige Programme zur Phänotyp Vorhersage kombinieren Sequenz- und Struktur-Analysen zur Vorhersage. Eines dieser Programme ist PolyPhen2 mit Hilfe der Referenzsequenz ein Alignment aus homologen Sequenzen erstellt und wenn vorhanden Strukturinformationen mit einbezieht [28] (Abb. 4).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 4: Schematischer Aufbau des PolyPhen2 Algorithmus zur Phänotyp-Vorhersage von nicht-synonymen SNPs. Schema entnommen aus [28]
Phänotyp Vorhersageprogramme können zur schnellen Identifizierung von funktionell bedeutsamen Mutationen innerhalb von Sequenzierprojekte beitragen. Ihr Einsatz ist aber nur sinnvoll wenn die Vorhersagen mit einer hohen Genauigkeit erfolgen. Validierungen von verschiedenen Algorithmen zeigten, dass die Vorhersagegenauigkeit (accuracy) im Bereich von 70-80 % liegt, jedoch große Unterschiede zwischen den Programmen vorhanden sind [29]. In der Validierung von Genotyp-Phänotyp Vorhersagen von humanen CYPs wurden etwa 40 % der nsSNPs als funktionsbeeinflussend vorausgesagt [30].
Anhand der Genotyp-Phänotyp Vorhersagen ist es möglich funktionell wichtige von neutralen Mutationen zu unterscheiden und dadurch zeit- und kostenintensive Laborarbeiten zu priorisieren.
Zur pharmakologischen Charakterisierung von humanen P450 Enzymen werden in vivo und in vitro Modellsysteme benötigt. Für reproduzierbare Ergebnisse sind besonders in vitro Methoden geeignet, da sie unter definierte Bedingungen ablaufen. Die biochemische Charakterisierung eines bestimmten P450 Enzyms kann dabei am besten durch die rekombinante Expression und die anschließende Aufreinigung des Enzyms durchgeführt werden. In der Zwischenzeit sind viele Expressionssysteme für die Synthese rekombinanter humaner P450 Enzyme etabliert worden. Jedes dieser Expressionssysteme hat Vor- und Nachteile die bei der Auswahl zu beachten sind (Abb. 5). Säugetierzellen (mammalian cells), wie zum Beispiel für die rekombinante Expression eingesetzte COS-Zellen oder Insektenzellen (insect cells) haben den Vorteil, dass sie postranslationale Modifikationen einfügen können. Zudem sind der zelluläre Aufbau und die Proteinausstattung innerhalb dieser Zellsysteme mit denen humaner Zellen vergleichbar. Da die Phosphorylierungen einen möglichen Einfluss auf die Aktivität und den Abbau von humanen P450 Enzymen haben, könnte dies ein wichtiges Kriterium sein [31]. Wie auch Hefezellen (yeast) enthalten viele Zellsysteme endogene P450 Systeme mit den entsprechenden Oxidoreduktasen und endogenen CYPs. Ein großer Vorteil des Hefeexpressionssystem ist das im Vergleich zum Säugetier- und Insektenzellsystem um ein Vielfaches gesteigerte Expressionslevel. Die höchsten Expressionslevel mit über 60 Milligramm aktivem P450 Holoprotein können jedoch in E. coli erreicht werden [32]. Zusammen mit dem Hefeexpressionssystem ist dieses bakterielle System kostengünstig und mit geringem labortechnischem Aufwand zu realisieren.
Die rekombinante Expression in E. coli ist für Proteine, die in großen Mengen produziert werden sollen, ein etabliertes und über Jahre verbessertes System [33]. Nachdem die rekombinante Expression von eukaryotischen CYPs in Hefe [34], COS-1 Zellen [35] und Insekten-Zellen [36] etabliert war, ergaben sich bei der bakteriellen Expression einige Hürden die es zu überwinden galt. Schließlich gelang es 1991 Barnes et al. die P450 17α-Hydroxylase (P45017 α) aus dem Rind in E. coli rekombinant zu exprimieren [37].
E. coli ist in der Lage die prosthetische Häm Gruppe in den rekombinanten CYPs einzubauen und somit das Holoprotein mit dem charakteristischen Absorptionsmaximum von 450 nm [38] zu synthetisieren. Zur Überexpression ist jedoch die Zugabe der Hämvorstufe δ-Aminolevulinic Säure (δ-ALA) zum Kulturmedium nötig.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 5: Vor- und Nachteil von Expressionssystemen für die rekombinante Expression von humanen P450 Enzymen; entnommen aus Yun et al. 2006 [32]
Da E. coli kein endogenes P450 System besitzt, muss die Reduktase der Elektronentransportkette entweder koexprimiert werden oder später mit dem rekombinanten CYP in vitro rekonstituiert werden, um Substrate umsetzen zu können. Möglicherweise ist in einigen Fällen aber auch das E. coli Elektronentransportsystem in der Lage, Elektronen auf das P450 Enzym zu übertragen [37]. Bei der Überexpression von eukaryotischen P450 Enzymen, die zum größten Teil membranverankert sind, zeigte sich, dass vor allem Modifikationen am N-terminus notwendig waren. So modifizierten Barnes und seine Kollegen den N-terminus des P45017α durch den Austausch der zweiten Aminosäure Tryptophan durch das von E. coli bevorzugte Alanin und beachtete die c odon usage von E. coli [37].
Verschiedenste Expressionsvektoren, E. coli Stämme, Kultivierungsbedingungen, Koexpression mit Faltungshelfern und N-terminale Modifikationen wurden analysiert (reviewed [32]). Am meisten Probleme bereitete jedoch der hydrophobe Membrananker der Säugetier CYPs der modifiziert oder deletiert werden musste [32]. Diese Modifikationen und Expressionsbedingungen müssen für jedes CYP experimentell ermittelt und oftmals optimiert werden.
Ein Fortschritt in der Expression von Säugetier CYPs konnte durch die Publikation von Saribas et al. verzeichnet werden [39]. Diese Gruppe zeigte, dass es möglich war, CYP2B4 (Oryctolagus cuniculus) als unmodifiziertes membrangebundenes Enzym (800 nmol Holoprotein/Liter Kultur) in E. coli zu exprimieren. Dazu benutzten sie ein von Miroux und Walker identifiziertes E. coli BL21 (DE3) Derivat, E. coli C41 (DE3), welches für die Expression von Membranproteinen geeignet ist [40]. In den meisten Fällen ist die Überexpression von Membranproteinen in E. coli BL21 toxisch und somit nicht möglich. Mit der gleichen Methode konnte eine andere Forschungsgruppe natives CYP2E1 (Oryctolagus cuniculus) ebenfalls in E. coli C41 (DE3) in hohem Maße exprimieren [41]. Zusätzlich konnten beide unmodifizierten Enzyme mit einer Ausbeute von 30 bzw. 45 % spezifisch und ohne Hilfe einer fusionierten Erkennungssequenz aufgereinigt werden.
Die Überexpressionen von Säugetier CYPs und ihre anschließende Aufreinigung sind besonders für die biochemische Charakterisierung in der klinischen Forschung interessant und erlauben gezielte Hochdurchsatz in vitro Arzneimittelanalysen.
In dieser Diplomarbeit sollten bioinformatische und labortechnische Analysen zur Untersuchung der interindividuellen Variabilität von CYP2B6 im Arzneimittelmetabolismus zum Einsatz kommen.
Die Validierung von Genotyp-Phänotyp Vorhersageprogrammen mit experimentellen CYP2B6 Phänotypen sollte die Qualität der einzelnen Programme testen. Die anschließende Analyse sieben neuer CYP2B6 Varianten mit den zuvor validierten Programmen und zusätzliche Sequenz-Struktur-Funktionsbeziehungen sollten den praktischen Einsatz von in silico Methoden im Bereich der Pharmakogenetik aufzeigen.
Die in silico Untersuchungen der sieben neuen CYP2B6 Varianten sollten durch in vitro Experimente verifiziert werden. Dazu wurde die rekombinante Expression von nativem CYP2B6 in E. coli C41 angestrebt. Diese Methode würde es erlauben CYP2B6 Varianten ohne Sequenzmodifikationen in ausreichenden Mengen zu exprimieren. Da das für P450 Enzyme etablierte COS-Zell System nur geringe Mengen an rekombinantem Protein synthetisiert, sollte die Möglichkeit des bakteriellen E. coli Systems etabliert werden.
Beim Anfertigen der Diplomarbeit waren 29 CYP2B6 Allele in der Nomenklaturdatenbanken[3] aufgenommen. Durch die rasant wachsende Anzahl von Sequenzierungsprojekten wird diese Zahl weiter steigen. Vor allem in Afrika werden noch nicht identifizierte CYP2B6 Genotypen vermutet. Diese Diplomarbeit soll dazu beitragen, sieben kürzlich neu entdeckte nicht-synonyme CYP2B6 Polymorphismen zu charakterisieren.
In einer ruandischen Mutter-Kind-HIV-Übertragungs-Studie wurden, 366 DNA Proben per MALDI-ToF MS (matrix assisted laser desorption/ionization time-of-flight mass spectrometry) analysiert, um den pharmakogenetischen Einfluss des CYP2B6 Genotyps auf die medikamentöse Behandlung mit antiretroviralen Arzneimitteln (Efavirenz, Nevirapin) zu untersuchen. Die dort gewonnenen Daten wurden mittels Sanger-Sequenzierung aller neun CYP2B6 Exons und einigen Introns von 39 Patienten verifiziert (Carole Deveaux, CRP Santé, Luxemburg). Neben vielen neuen Intron-Polymorphismen und synonymen Mutationen in den Exons, wurden zu den bereits bekannten nicht-synonymen missense Mutationen auch 7 neue nicht synonyme missense Mutationen identifiziert (Tab. 2, Tab. 3).
In Exon 2 wurde in vier Patienten der neue 329G>T Einzelnukleotid-Austausch (SNP) identifiziert. Als Folge wird die Aminosäure Glycin an Position 110 zu Valin substituiert. In den gleichen 4 Patienten kommt ebenfalls der neue SNP 341T>C in Exon 3 vor und führt zum Austausch von Isoleucin gegen Threonin und der Aminosäure Position 114. Ein Patient aus der Gruppe (KLC286) zeigte zudem einen neuen Nukleotidaustausch an der Position 548 (T>G), welche Valin an der Stelle 183 durch Glycin ersetzt. Im Exon 6 führte der neue 835G>C SNP in 3 Patienten zu dem Austausch von Alanin zu Prolin. Dieses Nukleotid (Cytosin) ist im Gegensatz zu den anderen SNPs auch im Pseudogen 2B7 an dieser Stelle präsent. Im einem vierten Patienten (KLM684) konnte diese Position nicht sequenziert werden, ist aber womöglich im Genotyp vorhanden. Zusammen mit den bereits bekannten Allel *22, *6 und *27 kann davon ausgegangen werden, dass sich für diese vier Patienten (KLC286, KLM684, KLC264, GLC269) neue Haplotypen ergeben, die sich durch allelspezifische Sequenzierung oder Klonierungen und anschließender Sequenzierung der Bereiche aufklären lassen.
Der Einzelnukleotid-Austausch an der Position 1459 C>A im Exon 9 führt zu der Aminosäure Substitution Arginin zu Serin an der Position 487 und trat homozygot in zwei Patienten (KLM 164, KLC 675) auf. Ein bereits beschriebener SNP (3211371) an dieser Position führt zu der Substitution von Arginin zu Cystein (CYP2B6.5). Da die R487S Substitution homozygot auftritt und beim Patienten KLC675 ebenfalls die Allele *6 und *22 identifiziert werden konnten, muss der neue SNP mit diesen verlinkt sein.
Im Patienten KLM 688 wurde in Exon 5 eine neue missense Mutation identifiziert. Dieser SNP an Position 758G>A substituiert Arginin 253 zu Histidin. Dieser Patient ist zudem heterozygot für das Allel *9.
Patient KLM 178 der heterozygot für *6 und *11 ist, zeigte ebenfalls eine neue missense Mutation in Exon 4 (637T>C) welche zum Austausch von Phenylalanin 213 zu Leucin führt.
Um die genauen Haplotypen zu bestimmen, müssten Allel spezifische PCRs oder Klonierungen der chromosomalen Bereiche mit anschließender Sequenzierung durchgeführt werden.
Tab. 2: Übersicht der neuen CYP2B6 SNPs (in grau) in ruandischen Patienten
Abbildung in dieser Leseprobe nicht enthalten
Tab. 3: Genotyp Übersicht von bekannten Allelen und neuen Substitutionen (fett: homozygot)
Abbildung in dieser Leseprobe nicht enthalten
2010 publizierten Jamshidi et al. [42] zwei der neuen SNPs (341T>C, 1459 C>A) und den noch nicht in der CYP Allel Nomenklatur[4] aufgenommenen SNP 444G>T. In dieser Studie wurden Haplotypen von Populationen aus Uganda und Simbabwe bestimmt, die Implikationen auf die Efavirenz Dosierung von HIV infizierten Patienten haben könnten. Dabei konnten die SNPs 341T>C und 444G>T mit einer Allel Frequenz von jeweils 1,3 % bei den simbabwischen Patientenproben (=36) ermittelt werden. Dagegen konnten diese SNPs nicht in der ugandischen Kohorte (n=74) identifiziert werden. Der Austausch 1459 C>A wurde mit einer Allelfrequenz von 0,7 % in einem Patient der ugandischen Bevölkerung nachgewiesen. Mit G835C (A279P,[5] ) konnte ein weiterer neuer CYP2B6 nsSNP im 1000 Genom Projekt identifiziert werden. Dieser trat mit einer Allefrequenz von 1,1% in der afrikanischen Bevölkerung auf.
Diese Sequenzierungs-Ergebnisse von bisher weniger gut untersuchten afrikanischen Populationen zeigten, dass selbst bei einem sehr gut genotypisierten Gen wie CYP2B6 noch neue Genotypen mit missense Mutationen identifiziert werden können. Diese treten aber meist, wie in diesem Fall, mit einer niedrigen Frequenz auf.
Zum jetzigen Zeitpunkt liegen uns zu den neu identifizierten Mutationen keine in vivo Pharmakokinetik Daten vor. Interessante Methoden zur Identifizierung des CYP2B6 Phänotyps wären somit die in vitro Phänotypbestimmung mittels ortsspezifischer Punktmutagenese und die in silico Analyse von CYP2B6.
Die rasant wachsende Anzahl von Genomprojekten und die Erkenntnisse der Pharmakogenetik ließen eine Vielzahl von Genotyp-Phänotyp Vorhersage-Algorithmen entstehen. Mit dieser Möglichkeit kann man schnelle und wissenschaftlich fundierte Aussagen über resultierende Phänotypen treffen. Mit der Aufklärung der CYP2B6 Röntgenkristallstruktur [20] können zudem Struktur-Funktions-Beziehungen der einzelnen Aminosäuresubstitutionen untersucht werden.
Mit experimentellen in vitro Pharmakogenetik Daten zu CYP2B6 besteht die Möglichkeit die zur Verfügung stehenden bioinformatischen Phänotyp-Vorhersage Tools zu validieren. Dies würde Aussagen über die Verlässlichkeit der Vorhersagen erlauben, sowie gute von weniger guten Vorhersage-Tools spezifisch für CYP2B6 abgrenzen. Aufgrund dieser Validierung wäre die Verlässlichkeit der vorhergesagten Phänotypen für die neuen Mutationen besser einzuordnen als ohne.
Die experimentellen Daten zur CYP2B6 Phänotyp-Bestimmung wurden einer von Watanabe et al. 2010 publizierten Studie entnommen [43]. In dieser Publikation sind Enzymkinetikdaten von 26 rekombinant exprimierten CYP2B6 Varianten (Allele CYP2B6 *2-28 ohne *22) in COS-7 Zellen aufgelistet. Dabei wurden die CYP2B6 Varianten mit zwei verschiedenen Substraten (7-ethoxy-4-trifluoromethyl coumarin und Selegilin) und daraus drei verschiedene Metabolite analysiert. Die Rohdaten dieser Publikation wurden analysiert und grafisch aufbereitet (Abb. 6, App. 1).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 6: Grafische Auswertung der Substratumsetzung für die verschiedenen CYP2B6 Varianten basierend von den Watanabe et al. [43] publizierten Enzymkinetikdaten
Darüber hinaus stehen für eine Vielzahl von CYP2B6 Varianten auch Daten der Bupropionhydroxylierung zur Verfügung [44-47]. Die Daten zur intrinsischen Clearance (Km/vmax) wurden ebenfalls mit in die Analyse einbezogen (Tab. 4).
Tab. 4: Übersicht und Vergleich der experimentell bestimmten CYP2B6 Phänotypen aufgrund der publizierten CYP2B6 Enzymkinetikdaten [43] [44-47]
Abbildung in dieser Leseprobe nicht enthalten
Nach der Auswertung der experimentellen Daten bestand der erste Schritt der Validierung der CYP2B6 Phänotyp-Vorhersage darin, die experimentellen Phänotypen in zwei Gruppen einzuordnen. Aufgrund der binären Einteilung konnten dann die Vorhersagen ausgewertet werden (Abb.7)
Eine Gruppe enthält die loss of function Phänotypen (Null Phänotyp) welche im Konsensus keinen Umsatz zeigten (Tab. 4). Die anderen Varianten wurden den neutralen Phänotypen (positiver Phänotyp) zugeordnet die einen enzymatischen Umsatz zeigten, welcher aber durchaus reduziert oder erhöht sein konnte.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 7: Konzept der CYP2B6 Phänotyp Validierung
Die Null Phänotypen waren CYP2B6.3, -.8, -.11, -.12, -.13, -.15, -.18, -.21, -.24 und -.28 (Tab. 4). Die als positiver Phänotyp bezeichnete Gruppe setzte sich aus folgenden Varianten zusammen: CYP2B6.2, -.4,-.5, -.6,-.7, -.9, -.10, -.20, -.23, -.25, und -.26 (Tab. 4). Die Proteine der Allele *14, *16, *17, *19, *27 zeigten im Konsens eine reduzierte Aktivität. Da sie eine Aktivität zeigten, wenn auch teilweise deutlich reduziert, wurden sie der Gruppe der positiven Phänotypen zugeordnet.
Tab. 5: Übersicht der CYP2B6 Allele *1 bis*28 (Überlassen von Dr. Kathrin Klein, angepasst)
Abbildung in dieser Leseprobe nicht enthalten
Rot hervorgehoben sind CYP2B6 Proteinvarianten, die einen experimentellen Null Phänotyp aufweisen. Die dazugehörigen SNPs und Aminosäuresubstitutionen sind ebenfalls rot markiert (*13: Mutation Q172H und K262R sind aufgrund der experimentellen Daten neutrale Mutationen). Die nonsense Mutation (rs34097093, R378stop) ist mit grau hinterlegt, da diese nicht mit Phänotyp Vorhersagen ausgewertet werden kann.
Die einzelnen Aminosäuresubstitutionen der Varianten sollten nun mit einer breiten Auswahl von publizierten Vorhersage-Tools in silico phänotypisiert werden. Die verwendeten Phänotyp Vorhersage Tools waren PolyPhen-2 [28], SIFT [48], SNPs3D [49], nsSNPAnalyzer [50], Panther [51], SNPs&GO [52], MutPred [53]. In einer von Thusberg et al. durchgeführten Evaluierung lieferten SNPs&GO und MutPred die besten Leistungen [29]. Wang et al. [30] evaluierten 2009 die Vorhersage Performanz von PolyPhen-1 [54] und SIFT für humane CYP Polymorphismen. Die Vorhersage Genauigkeit (prediction accuracy) lag hier bei 70 % korrekten Vorhersagen.
Um die Leistung der Vorhersage Programme für CYP2B6 zu ermitteln, mussten die Vorhersagen zuerst klassifiziert werden. Im Null Phänotyp Set wurden die wahr positiven (TP) Vorhersagen ermittelt. Diese entsprachen richtig vorhergesagten Aminosäuresubstitutionen, die einen aktivitätszerstörenden (damaging) Einfluss haben. Ebenfalls wurden die falsch negativen (FN) Vorhersagen identifiziert, welche die Vorhersagen beinhaltet die in silico fälschlicherweise als neutral (non-damaging) phänotypisiert wurden (Tab. 6).
Mit dem positiv Phänotyp Set konnte die Rate an wahr negativen (TN, non-damaging Substitution) Vorhersagen und die der falsch positiven (FP, damaging Substitution) Vorhersagen ermittelt werden (Tab. 7).
Die Ergebnisse zeigten deutlich Unterschiede in der Phänotyp Vorhersage zwischen den einzelnen Programmen (Tab. 6, Tab. 7) welche sehr unterschiedlich korrelierten. Die unterschiedliche Verteilung der vorhergesagten Phänotypen zwischen den beiden Sets war hoch signifikant (Fisher Test p-Wert <0,0001, Abb. 8). Im Null Phänotyp Set war das Verhältnis von zerstörenden zu neutralen vorhergesagten Phänotypen (dam/non) größer ist (1,6). Hingegen war dieses Verhältnis im positiven Phänotyp Set wie zu erwarten mit 0,52 sehr viel kleiner.
Tab. 6: Vorhersagen für das positive ,,Phänotyp” Set
Abbildung in dieser Leseprobe nicht enthalten
Tab. 7: Vorhersagen für das „Null Phänotyp“ Set
Abbildung in dieser Leseprobe nicht enthalten
Abb. 8: Übersicht der Vorhersagen in den jeweiligen Sets mit der signifikant unterschiedlichen Verteilung von damaging und neutralen Vorhersagen (Exakter Fisher Test p>0,0001 Statistik mit R, Grafik erstellt GraphPad Prism)
Mit den gewonnen Informationen der Vorhersagen konnte man die Güte der einzelnen Vorhersage Tools bestimmt werden. Dazu mussten im ersten Schritt die Gütekriterien bestimmt werden. Diese beinhalteten die Korrektklassifikationsrate (accuracy) ( II), Genauigkeit (precision) ( III), Spezifität (specificity) ( IV), Sensitivität (sensitivity) ( V), negativen Vorhersagewert (NPV) ( VI) und den Matthew Korrelations-Koeffizient (MCC) ( VII).
Abbildung in dieser Leseprobe nicht enthalten
Zur Beurteilung der Vorhersage Güte sind besonders die Accuracy und der Matthew Korrelations-Koeffizient geeignet. Diese beinhalten alle Parameter (TP, TN, FP, FN) wodurch keine Informationen verloren gehen [55]. Der Matthew Korrelations-Koeffizient kann in einem Bereich von -1 bis +1 liegen, wobei +1 eine perfekte Vorhersage Güte bedeutet, 0 eine zufällige Vorhersage und -1 eine inverse Vorhersage Güte impliziert. Der MCC Wert bezieht dabei richtig Positive und richtige Negative in die Auswertung der erfolgreichen Vorhersagen mit ein. Außerdem wird er wenig von der Probengröße der Sets beeinflusst [56]. Die Größen ( II) bis ( V) liegen im Bereich 0 bis 1, wobei 1 eine perfekte Vorhersage in diesem Bereich anzeigt.
Tab. 8: Mittelwerte der Gütekriterien aller Programme
für die CYP2B6 Phänotyp Vorhersage
Abbildung in dieser Leseprobe nicht enthalten
Bei der Analyse der Vorhersage Performanz wird deutlich, dass die Genauigkeit der Vorhersage nur bei 52 % liegt und somit von einer signifikanten Zahl von falsch positiven Vorhersagen ausgegangen werden kann. Der Matthew Korrelations-Koeffizient von 0,29 zeigt, dass die Vorhersage Programme in ihren Ergebnissen nicht sehr gut Korrelieren. Im Gegensatz dazu zeigen Korrektklassifikationsrate (0,66), Spezifität (0,69) und der negative Vorhersagewert (0,76) bessere Ergebnisse (Tab. 8).
Um Aussagen über die einzelnen Programme machen zu können wurden die Gütekriterien für jedes Vorhersage Programm ermittelt (Tab. 9, Abb. 9). In fünf der sechs Gütekriterien zeigte PolyPhen-2 (HumVar) die besten Ergebnisse. Da es alle loss of function Mutationen korrekt vorhersagte, waren die Sensitivität (1) und der negative Vorhersagewert (1) ausgezeichnet. Durch fünf falsch Positive Vorhersagen war der Wert für die Spezifität 0,69 im Mittelfeld angesiedelt (0,69) (Tab. 8). Die beste Spezifität zeigte SNPs&GO (0,88) mit nur zwei falsch positiven Vorhersagen und 14 korrekt erkannten neutralen Mutationen.
Tab. 9: Gütekriterien für die einzelnen Vorhersage Programme (Kategoriebest- und -minimalwert in gelb bzw. grau)
Abbildung in dieser Leseprobe nicht enthalten
Der Matthew Korrelations-Koeffizient der einzelnen Vorhersagen liegt im Bereich von -0,04 (MutPred) bis 0,66 für PolyPhen-2 (HumVar). Bei der MutPred Analyse ist dies vor allem durch die hohe Anzahl von falsch positiven und falsch negativen Vorhersagen zurückzuführen. Der nsSNPAnalyzer erlaubt zusätzlich das Hinzufügen von PDB Strukturinformationen. Mit der CYP2B6 Struktur (PDB Code: 3ibd) zeigten sich meist eine leichte Verschlechterung der Gütekriterien (Tab. 9, Abb. 9).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 9: Gütekriterien für die einzelnen Vorhersage Programme
Die Validierung der Phänotyp Vorhersage für CYP2B6 zeigt, dass die Vorhersagen sehr unterschiedlich für die jeweiligen Programme ausfallen und nicht sehr gut miteinander korrelieren. Bei keiner Phänotyp Vorhersage zeigte sich eine vollständige Übereinstimmung aller Vorhersageprogramme (Tab. 6, Tab. 7). Jedoch waren bei den jeweiligen SNP Vorhersagen die Verhältnisse von damaging zu non-damaging signifikant unterschiedlich (Tab. 6, Tab. 7). Das positive Phänotyp Set zeigte einen Mittelwert für das damaging zu non-damaging Verhältnis von 0,82. Im Null Phänotyp Set ist dieses Verhältnis um das 4-fache (3,18) höher. Dieses Maß kann somit unter Einschränkungen als Indikator für die Vorhersage des Phänotyps dienen. Die Einschränkungen bestehen darin, dass bei Vorhersagen in denen keine non-damaging Substitutionen ermittelt werden ein Null Division Problem auftritt. Um dieses Problem zu umgehen, könnte man als Indikator einer Vorhersagewahrscheinlichkeit das Verhältnis der positiven Vorhersagen dividiert durch die Gesamtheit der Anzahlvorhersagen heranziehen. Für das positive Phänotypset würde diese Verhältnis die Spezifität darstellen und bei dem Null Phänotyp Set die Sensitivität. Ein Beispiel verdeutlicht dies. Die Wahrscheinlichkeit ist hoch, dass die CYP2B6.5 Variante (R487C) einen positiven Phänotyp darstellt, da von acht Vorhersageprogrammen sieben einen non-damaging Phänotyp vorhersagen. Das Verhältnis [dam/(dam+non-dam)] würde damit einen Wert von 0,88 annehmen (Tab. 6) welcher im Bereich von 1 liegt.
Aufgrund der ermittelten Gütekriterien der einzelnen Vorhersage Tools, ist es ratsam bei einer Vorhersage von neuen Mutationen die PolyPhen-2 Vorhersage zusammen mit der SNPs&GO Vorhersage zu analysieren. Die hohe Spezifität der SNPs&GO Vorhersage (0,88) könnte somit die guten PolyPhen2 Vorhersage Parameter unterstützen. Damit wäre die Wahrscheinlichkeit größer, falsch positive Vorhersagen zu identifizieren.
Die gewonnen Erkenntnisse zur in silico CYP2B6 Phänotyp Bestimmung sollten nun für die Bestimmung der neuen CYP2B6 Varianten eingesetzt werden.
Die in der Ruanda Studie neu identifizierten nicht synonymen Polymorphismen (Tab. 2) wurden jetzt mit den validierten Programmen analysiert. Insgesamt wurden 63 Vorhersagen getroffen, wobei 22 als damaging und 41 als non-damaging Phänotypen vorhergesagt wurden (Tab. 10). Achtzehn der 22 damaging Vorhersagen (81%) fielen auf die Aminosäuresubstitutionen G110V, V183G mit jeweils 7 Vorhersagen und 4 damaging Vorhersagen für die Substitution R253H (Tab. 10, Abb. 10).
Tab. 10: In silico Vorhersage von Phänotypen neuer CYP2B6 SNPs
Abbildung in dieser Leseprobe nicht enthalten
Die mit hoher Wahrscheinlichkeit vorhergesagten Null Phänotypen kommen in fünf HIV Patienten vor (Tab. 2). Die Substitution G110V ist in den Patienten KLC286, KLM684, KLC264, GLC 269 heterozygot vertreten, wobei KLC286 zusätzlich die Mutation V183G auf einem Allel trägt. Der Patient KLM688 trägt als einziger die Mutation für den Aminosäureaustausch R253H auf einem Allel.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 10: Verteilung der damaging Vorhersagen (rot) und der non-damaging Vorhersagen der neuen CYP2B6 Aminosäuresubstitutionen. Die Größe der jeweiligen Kugel entspricht dem Verhältnis der jeweiligen Vorhersage für diese Variante. Bsp. I114T ist neun mal als non - damaging vorausgesagt und null mal als damaging (Tab. 10).
Die Ergebnisse der Phänotyp Vorhersage für die neuen Aminosäuresubstitutionen sollten Anhand von Sequenzalignments und der CYP2B6 Röntenkristallstruktur (PDB-code: 3ibd) rational analysiert werden. Da die Phänotyp Vorhersagen auf Aminosäurekonservierung und/oder strukturellen Eigenschaften des Proteins basieren, soll diese Analyse zum Verständnis der vorhergesagten Phänotypen beitragen. Zusätzlich sollen aber auch die gut charakterisierten CYP spezifischen strukturellen Besonderheiten mit in die Untersuchung einfließen[57-59]. Dies könnte die Vorhersage unterstützen, aber auch mögliche Fehlvorhersagen aufspüren.
Mit Hilfe der CYP2B6 Struktur und der SWISS-MODEL Software [60] konnten die sieben substituierten Aminosäuren in silico mutiert und somit in der Struktur visualisiert werden. Mit der in silico Mutation des CYP2B6 Proteins konnten die Positionen der neuen Aminosäuresubstitutionen innerhalb der tertiär Struktur visualisiert werden (Abb. 11). Die strukturelle Visualisierung zeigt, dass die Aminosäuresubstitutionen über das gesamte Protein verteilt sind. Fünf der sieben Substitutionen sind dabei an der Proteinoberfläche (blaue Kugelmodelle Abb. 11) und zwei der Substitution im Inneren des Proteins (rote Kugelmodelle Abb. 11). Die Substitutionen G110V und I114T liegen dabei in der Nähe der prosthetischen Hämgruppe und des Substrates (buntes Stäbchenmodell Abb. 11).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 11: Übersicht der neuen CYP2B6 Aminosäuresubstitutionen. Die substituierten Aminosäuren an der Oberfläche sind als blaue Kugelmodelle dargestellt. Substitutionen im inneren des Proteins sind rot gekennzeichnet. Zur besseren Darstellung sind die Loop Regionen geglättet dargestellt.
Ein Sequenzalignment mit Vertretern der CYP2B Subfamilie zeigt die Lage der Substitutionen in der Primärsequenz (gelb hinterlegt Abb. 12) und in der darüberliegenden CYP2B6 Sekundärsequenz. Für spätere strukturelle Analysen ist die CYP2B6 Sequenz vor allem für die Navigation innerhalb der nummerierten Sekundärstrukturelemente geeignet. Ebenfalls gibt das Multisequenzalignment der CYP2B Sequenzen einen Einblick in die Konservierung von einzelnen Aminosäuren innerhalb der sehr ähnlichen Sequenzen.
Da nicht alle Aminosäuren in der Primärsequenz von P450 Enzymen für die katalytische Funktion gleich wichtig sind, definierte Osamu Gotoh 1991 sechs mögliche Substrat Erkennungsbereiche (SRS) in der CYP2 Familie [61]. Seine Analysen beruhten auf Gen- und Aminosäuresequenzen. In den sechs identifizierten Bereichen traten innerhalb der CYP2B Familie nicht-synonyme Substitutionen häufiger auf als im Rest der Sequenzen. Unterschiede in den SRSs führen zu veränderten Substratspezifitäten und sind somit ein wichtiger Faktor für die Diversifikation der P450 Enzyme. Die sechs Substraterkennungsstellen umgeben das Substrat oberhalb der Häm-Gruppe und bilden somit die Substratbindetasche von CYP2B6 (Abb. 13). In den SRSs befinden sich auch die mutierten Aminosäuren Valin110, Threonin 114 und Leucin 213 (gelb Abb. 13).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 13: Architektur der sechs CYP2B6 Substratbindetaschen, von SRS1 in schwarz bis SRS6 in weiß. Gelb markierte Aminosäuren sind neue Ruanda Varianten, die in den SRSs liegen (vgl. Abb. 12).
[...]
[1] http://www.cypalleles.ki.se/cyp2b6.htm
[2] http://www.pdb.org
[3] http://www.cypalleles.ki.se/cyp2b6 (letzte Aktualisierung 12.11.2007)
[4] http://www.cypalleles.ki.se/
[5] http://browser.1000genomes.org/index.html (1KG_19_41515911)
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!
Kommentare