279 51 12MB
German Pages IX, 238 [236] Year 2020
Marco F. Schmidt
Chemische Biologie und Wirkstoffentwicklung
Chemische Biologie
Marco F. Schmidt
Chemische Biologie und Wirkstoffentwicklung
Marco F. Schmidt Falkensee, Deutschland
ISBN 978-3-662-61115-9 ISBN 978-3-662-61116-6 (eBook) https://doi.org/10.1007/978-3-662-61116-6 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung/Lektorat: Désirée Claus Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Vorwort
Dieses Buch ist nicht als klassisches Lehrbuch konzipiert worden. Im Zentrum steht nicht die reine Wissensvermittlung der Ergebnisse aller chemisch-biologischer Arbeiten (was auch den Rahmen eines Buches sprengen würde). Im Zentrum steht die Anwendung. Es wird versucht durch die gezielte Auswahl von chemisch-biologischen Techniken und Konzepten dem Leser das nötige Rüstzeug zu geben, um in dem komplexen Spannungsfeld der Chemischen Biologie in der Wirkstoffentwicklung neue Denkweisen und damit hoffentlich neue Therapiemöglichkeiten entwickeln zu können. Erklärtes Ziel dieses Buches ist es, Studenten, (Post-)Doktoranden sowie erfahrene Wissenschaftler an Universitäten sowie in der Industrie bei ihren Problemen konkret Lösungen aufzuzeigen und zu inspirieren. Als roter Faden dieses Buches dienen nach einer Einführung in die Problematik, die die Chemische Biologie in der Wirkstoffentwicklung adressiert, die drei Ebenen des Molekularbiologischen Dogmas: DNA, RNA und Proteine und ihre Rolle als Wirkstoffziele: Teil 1: Einführung konkretisiert das Problem, Wirkstoffe für die in der Genomforschung neu identifizierten Gene zu entwickeln. Es werden die Teilgebiete der Chemischen Biologie vorgestellt: die Wirkstoff- und Wirkstoffzielsuche der Chemischen Genomik, die Wirkstoffzielcharakterisierung der Chemischen Proteomik und die Wirkstoffzielvalidierung der Chemischen Genetik sowie wie diese zur Chemischen Biologie zusammengefasst werden. Teil 2: DNA konzentriert sich auf die Genomforschung. Beginnend mit der Rolle von Genomweiten Assoziationsstudien zur Identifizierung krankheitsrelevanter Gene über die DNA als Wirkstoffziel bis hin zu Gen-Editierung und Gentherapien. Dieser Teil greift die zurzeit mit sehr großen Hoffnungen verbundenen Methoden wie künstliche Intelligenz bei der Analyse von Genomdaten und der Gen-Editierungsmethode CRISPR/ Cas als Schlüssel zu neuen Therapien auf.
V
VI
Vorwort
Teil 3: RNA befasst sich mit der Rolle von RNAs als neue Wirkstoffziele. Da viele Proteine nicht mit einem Wirkstoff in ihrer Funktion manipuliert werden können, fokussieren sich Wirkstoffentwickler vermehrt auf RNA-Moleküle. RNA-Wirkstoffziele in der Translation oder der Genregulation (bspw. der RNA-Interferenz: RNAi) bieten ungeahnte Möglichkeiten. Geordnet nach RNA-Subgruppen werden an erfolgreichen Fallstudien die Herausforderungen und Potenziale erörtert. Teil 4: Peptide & Proteine stellt den zentralen Teil dieses Buches dar. Proteine sind die Funktionsträger in lebenden Systemen. Die Modulation ihrer Funktionen durch einen Wirkstoff ist das zentrale Konzept der Wirkstoff- und Medikamentenentwicklung. Die meisten Wirkstoffe binden an Proteine. Nach einer kurzen Einführung in die Struktur, Funktion und Synthese von Peptiden und Proteinen werden die Chemische Genomik, die Chemische Proteomik, die Chemische Genetik und die Chemische Biologie der Proteine ausführlich beschrieben. Für wen ist das Buch gedacht? Das Buch bezieht die neuen Herausforderungen in der Wirkstoffentwicklung mit ein, die die Chemische Biologie zu beantworten versucht. Dem Leser wird erstmalig ein Navigator durch die Chemische Biologie zur Hand gegeben, welcher sich auf die neuen Ansätze der Wirkstoffentwicklung vom Gen zum Medikament fokussiert. Kurzum: Es umfasst das „Must-know“ für heutige und zukünftige Pharma-Forscher und richtet sich sowohl an Studenten und (Post-)Doktoranden der Lebenswissenschaften als auch an erfahrene Wissenschaftler in der pharmazeutischen Industrie. Marco F. Schmidt
Inhaltsverzeichnis
1 Einleitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Teil I Chemische Biologie und Wirkstoffentwicklung 2
Chemische Biologie – eine holistische Wissenschaft . . . . . . . . . . . . . . . . . . . 5 2.1 Reduktionismus und Holismus in den Biowissenschaften . . . . . . . . . . . 6 2.2 Chemische Biologie ist keine Wirkstoffentwicklung. . . . . . . . . . . . . . . . 9 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3 Wirkstoffentwicklung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1 Die Medikamentenentwicklung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.2 Gründe für das Scheitern einer Medikamentenentwicklung. . . . . . . . . . 16 3.3 Die Lücke zwischen Laborexperimenten und klinischer Wirkung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4
Von der Genomforschung zur Chemischen Biologie. . . . . . . . . . . . . . . . . . . 19 4.1 Chemische Genomik: Identifizierung neuer Wirkstoffe und Wirkstoffziele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 4.2 Chemische Proteomik: Charakterisierung des Wirkstoffziels. . . . . . . . . 25 4.3 Chemische Genetik: Validierung des Wirkstoffziels. . . . . . . . . . . . . . . . 27 4.4 Chemische Biologie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Teil II DNA 5
DNA – Bauplan der Proteine. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5.1 Funktion und Struktur der DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5.2 Oligonukleotidsynthese. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 5.3 DNA-Sequenzierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
VII
VIII
Inhaltsverzeichnis
6
Genomische Variation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 6.1 Genomweite Assoziationsstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 6.2 Feinkartierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.3 Polygenic Risk Score. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4 Drug Target Linkage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 6.5 Phänomen-weite Assoziationsstudie – PheWAS. . . . . . . . . . . . . . . . . . . 63 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7
Gentherapie und Genom-Editierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 7.1 Gentherapie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 7.2 Genom-Editierung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Teil III RNA 8
RNA – Informations- und Funktionsträger. . . . . . . . . . . . . . . . . . . . . . . . . . 79 8.1 RNA-Interferenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
9
RNA-Interferenz in der Wirkstoffentwicklung. . . . . . . . . . . . . . . . . . . . . . . 83 9.1 Oligonukleotide als Wirkstoffe – Antisense. . . . . . . . . . . . . . . . . . . . . . . 83 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Teil IV Proteine 10 Peptide & Proteine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 10.1 Aminosäure → Peptid → Protein. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 10.2 Peptidsynthese. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 10.3 Festphasenpeptidsynthese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 10.4 Proteinsynthese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 10.5 Post-translationale Modifikationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 11 Proteine als Wirkstoffziele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 11.1 Rezeptoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 11.2 Enzyme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 11.3 Enzymkinetik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 11.4 Nicht-Michalis-Menten-Kinetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 11.5 Enzyminhibition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 12 Chemische Genomik – Vom Zielprotein zum Wirkstoff. . . . . . . . . . . . . . . . 157 12.1 Das Konzept des niedermolekularen Wirkstoffs. . . . . . . . . . . . . . . . . . . 158 12.2 Kombinatorische Chemie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 12.3 Hochdurchsatzscreening . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
Inhaltsverzeichnis
IX
12.4 Fragmentbasierte Wirkstoffentwicklung. . . . . . . . . . . . . . . . . . . . . . . . . 168 12.5 Templatbasierte Wirkstoffentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . 172 12.6 Computergestütztes Wirkstoffdesign. . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182 13 Vom Zielprotein zum makromolekularen Wirkstoff – Biologika. . . . . . . . . 183 13.1 Peptide. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 13.2 Stappled Peptide. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 13.3 Monoklonale Antikörper. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 13.4 Aptamere. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 14 Chemische Proteomik: Vom Wirkstoff zum Zielprotein. . . . . . . . . . . . . . . . 195 14.1 Affinitätschromatografie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 14.2 Polypharmakologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 15 Chemische Genetik: Validierung des Wirkstoffziels durch Aufklärung des Signalweges. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 15.1 Thalidomid und die Fehlbildung bei Embryonen . . . . . . . . . . . . . . . . . . 203 15.2 FK506 und der Ca2+-Calcineurin Signalweg. . . . . . . . . . . . . . . . . . . . . . 205 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210 16 Chemische Biologie – Adressierung neuer Wirkstoffziele. . . . . . . . . . . . . . . 211 16.1 Protein-Protein-Interaktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 16.2 Chemisch-induzierte Dimerisierung (CID). . . . . . . . . . . . . . . . . . . . . . . 214 16.3 Pharmakologische Chaperone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 16.4 Antikörper-Wirkstoff-Konjugate. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 16.5 Chimäre Antigen-Rezeptor-T-Zell-Therapie – CAR-T. . . . . . . . . . . . . . 220 16.6 Hydrophobes Tagging zur gezielten Proteindegradierung – Halo-Tag . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224 16.7 Gezielte Proteolyse durch Chimären – PROTAC. . . . . . . . . . . . . . . . . . . 226 16.8 Alte Wirkstoffe – neue Indikationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Stichwortverzeichnis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
1
Einleitung
Die Chemische Biologie ist keine neue Wissenschaft, obwohl der Begriff erst in den 1990er-Jahren formuliert wurde. Erste chemisch-biologische Experimente, in denen Wirkstoffe zur Untersuchung biologischer Systeme genutzt wurden, liegen beinahe 200 Jahre zurück. Dennoch hat die Chemische Biologie erst Ende des 20. Jahrhunderts in diesem Sinne ihren Namen erhalten und seitdem einen beispiellosen Siegeszug weltweit an den Universitäten sowie in der pharmazeutischen Industrie begonnen. Heute werden an fast allen Universitäten Lehrveranstaltungen zur Chemischen Biologie angeboten. Mehr noch, an vielen Universitäten wurden Lehrstühle eingerichtet bzw. Institute und Fakultäten neu gegründet. Das Chemische Department der Universität Harvard ist beispielsweise zum Department der Chemie & Chemischen Biologie erweitert worden. Gleichzeitig haben heute alle großen pharmazeutischen Unternehmen neben den etablierten Forschungsabteilungen der Wirkstoffentwicklung Abteilungen der Chemischen Biologie aufgebaut. Die unzähligen Biotech-Gründungen im Bereich der Chemischen Biologie in den letzten 20 Jahren sind hier nicht einmal berücksichtigt. Was hat dazu geführt, dass die Chemische Biologie in so kurzer Zeit an Universitäten und vor allem in der Wirtschaft nicht mehr wegzudenken ist? Die Gründe für diese Entwicklung liegen zum einem in den technischen Möglichkeiten und zum anderen im wirtschaftlichen Bedarf begründet: Erst zum Ende des 20. Jahrhunderts konnten sowohl In-vitro- als auch In-vivo-Experimente von Wirkstoffen mit Hilfe neuer Techniken der Bioanalytik wie der Spektroskopie oder der Mikroskopie besser oder überhaupt beobachtet werden. Davor war es nicht sinnvoll, Wirkstoffe systematisch bioanalytisch zu testen, da die ausgelösten Veränderungen in lebenden Organismen wie einer Zelle nicht detektiert werden konnten. Dazu kam ein wirtschaftlicher Grund. Die Zulassungsvoraussetzungen für neue Medikamente wurden durch die Regulierungsbehörden seit den 1960er-Jahren sukzessiv erhöht. In der Vergangenheit wurden Medikamente zugelassen, ohne deren Wirkmechanismus zu kennen. Dies hatte © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. F. Schmidt, Chemische Biologie, https://doi.org/10.1007/978-3-662-61116-6_1
1
2
1 Einleitung
vereinzelt zur Folge, dass es nach der Zulassung zu schweren Nebenwirkungen bis hin zu Todesfällen kam. Ein in Deutschland bekanntes Beispiel ist der Contergan-Skandal. Dies zwang die pharmazeutische Industrie, neue Techniken zu entwickeln (oder aufzugreifen), die die Wechselwirkungen ihrer Wirkstoffkandidaten mit den Biomolekülen vor der klinischen Testung im Organismus aufklären konnten – und welche klinischen Folgen das haben kann. Zusammengefasst trafen in den 1990er-Jahre neue Technologien der Bioanalytik auf den Bedarf der pharmazeutischen Industrie, ihre Wirkstoffkandidaten sorgfältiger auf ihre Sicherheit vorab zu testen – mit der Hoffnung, die Erfolgsrate in teuren klinischen Tests zu erhöhen. Dennoch erklären diese Gründe nicht, warum die Chemische Biologie heute in der Wirkstoffentwicklung die entscheidende Rolle spielt. Im Jahr 2001, als erstmals Teile des humanen Genoms publiziert wurden, erklärte der wissenschaftliche Leiter des Humanen Genomprojektes Francis Collins: „Das menschliche Genom ist ein revolutionäres Lehrbuch der Medizin mit Einsichten, die den Gesundheitsdienstleistern immense neue Kräfte zur Behandlung, Vorbeugung und Heilung von Krankheiten gibt.“ Der Satz spiegelt die Hoffnungen der damaligen Zeit wider, dass mit den Fortschritten in der Molekularbiologie eine neue Ära der Medizin begonnen hätte. Dagegen ist zwanzig Jahre später leider festzuhalten, dass die Sequenzierung des humanen Genoms nicht den erhofften Effekt gehabt hatte, eine Vielzahl neuer Medikamente in kürzester Zeit entwickeln zu können. Woran liegt das? In der Tat wurde durch die Genomforschung eine Vielzahl krankheitsrelevanter Gene gefunden. Die Identifizierung eines krankheitsrelevanten Gens macht aber noch kein Medikament. Es zeigte sich schnell, dass die meisten Proteine, für die die gefundenen Gene codieren, aufgrund ihrer Struktur keinen Wirkstoff binden und damit nicht in ihrer Funktion moduliert werden können. Man spricht von der Ligandenbindungsfähigkeit (Ligandability) eines Makromoleküls. Des Weiteren führt die Bindung eines Wirkstoffs an ein Genprodukt nicht unweigerlich zu einer klinischen Wirkung. Proteine krankheitsrelevanter Gene assoziieren mit der Krankheit, müssen aber nicht die zentrale Position im Signalweg einnehmen, so dass durch die Intervention mit einem Wirkstoff ein klinischer Effekt nicht zwingend die Folge ist. Die Fähigkeit, mit Hilfe eines Wirkstoffs ein Genprodukt in seiner Funktion zu manipulieren und damit eine klinische Wirkung zu erzielen, bezeichnet man als Medikamentenfähigkeit (Drugability). Der Herausforderung, die Ligandenbindungs- und Medikamentenfähigkeit der Genprodukte zu untersuchen, stellt sich die Chemische Biologie in der Wirkstoffentwicklung. Zusammengefasst schließt die Chemische Biologie in der Wirkstoffentwicklung die Lücke zwischen der modernen Genomforschung, wie den gefundenen krankheitsrelevanten Genen, auf der einen Seite und dem gesellschaftlichen und wirtschaftlichen Anspruch, aus diesem Wissen neue Medikamente zu entwickeln, auf der anderen Seite. Das erklärt letztlich die enorme Bedeutung der Chemischen Biologie für die Wirkstoffentwicklung im Zeitalter der Genomforschung.
Teil I Chemische Biologie und Wirkstoffentwicklung
2
Chemische Biologie – eine holistische Wissenschaft
Inhaltsverzeichnis 2.1 Reduktionismus und Holismus in den Biowissenschaften . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.2 Chemische Biologie ist keine Wirkstoffentwicklung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Die Chemische Biologie ist die Wissenschaft, die chemische, meist synthetisch hergestellte, Stoffe nutzt, um komplexe Systeme der Biologie zu verstehen und zu manipulieren. Die Chemische Biologie ist eine wissenschaftliche Disziplin, die die Bereiche Chemie und Biologie umfasst. Die Disziplin beinhaltet die Anwendung chemischer Techniken und Analysen sowie die Verwendung chemischer Verbindungen, die meist organisch-synthetisch hergestellt wurden, um biologische Systeme zu untersuchen und zu manipulieren. Im Gegensatz zur Biochemie, die Chemie der Biologie, bei der Biomolekülen und die Regulation biochemischer Signalwege innerhalb von und zwischen den Zellen untersucht werden, beschäftigt sich die Chemische Biologie mit der Anwendung von Chemie in der Biologie. Die Chemische Biologie ist eine interdisziplinäre Wissenschaft. Darüber hinaus grenzt sie sich von reduktionistischen Wissenschaften ab, die versuchen zusammengesetzte Systeme als Summe ihrer Komponenten und deren Eigenschaften zu beschreiben. Im Gegensatz dazu folgt die Chemische Biologie als neue Wissenschaftsdisziplin dem Ansatz des wissenschaftlichen Holismus (Ganzheitslehre), also der Annahme, dass biologische Systeme und deren Eigenschaften als Ganzes und nicht als einfache Addition ihrer einzelnen Teile zu betrachten sei. Die Chemische Biologie ist wissenschaftlich, historisch und philosophisch in der Bioorganischen Chemie, der Medizinischen Chemie und der Pharmakologie sowie der Supramolekularen Chemie und © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. F. Schmidt, Chemische Biologie, https://doi.org/10.1007/978-3-662-61116-6_2
5
6
2 Chemische Biologie – eine holistische Wissenschaft
insbesondere der Genetik, der Molekularbiologie und der Biochemie verwurzelt. Die Chemische Biologie greift daher viele Methoden der genannten Wissenschaften auf.
2.1 Reduktionismus und Holismus in den Biowissenschaften Dennoch unterscheidet sich die Chemische Biologie vor diesem Hintergrund in ihrem holistischen Ansatz von ihren Wurzeln in den klassischen, reduktionistischen Biowissenschaften wie der Genetik, der Molekularbiologie und der Biochemie erheblich: Es wird davon ausgegangen, dass sich die Biologie auf die Chemie reduzieren lässt, und die Chemie auf die Physik. Beispielsweise werden in biochemischen, genetischen oder molekularbiologischen Experimenten durch Erzeugung von Mutationen in Genen (Mutagenese) neue beobachtbare Veränderungen (Phänotyp) der Genprodukte in Organismen, in Zellen oder in Biomolekülen eingeführt und intensiv untersucht. Damit setzt man im reduktionistischen Sinne voraus, dass das Gesamtsystem durch die Veränderung eines einzelnen Elementes beeinflusst werden kann: Durch die Mutagenese eines Gens wird der Bauplan des Organismus verändert (siehe Abb. 2.1). Allerdings wird die Gesamtheit des Organismus ignoriert. Phänotypische Veränderung können erst die Folge der Genmutagenese in Abhängigkeit von bestimmten Umweltfaktoren sein oder Unterbrechungen in einem Signalweg durch die Mutagenese können durch das Netzwerk
HOLISMUS
REDUKTIONISMUS
Abb. 2.1 Vergleich der Ansätze von Reduktionismus (komponentenbasiert) und Holismus (systembasiert)
2.1 Reduktionismus und Holismus in den Biowissenschaften
7
Tab. 2.1 Reduktionismus und Holismus in den Biowissenschaften Reduktionismus
Holismus
Ein komplexes System kann durch das Studium Das Prinzip einer höheren Ordnung kann seiner einzelnen Komponenten verstanden nicht durch isolierte Prüfung der einzelnen werden Komponenten sinnvoll erklärt werden Beispiel: Die Rolle der DNA bei der Vererbung Beispiel: Eine nach ihren chemischen Bestandwurde durch Untersuchung ihrer molekularen teilen zerlegte Zelle ist keine Zelle mehr. Es ist Struktur abgeleitet auch schwierig, einen komplexen Prozess zu analysieren, ohne ihn zu zerlegen
DNA
RNA
Transkripon
Gentherapie/-edierung
Protein
Translaon
RNA-Interferenz / Ansense
Small Molecules Pepde Monoklonale Ankörper Aptamere
Abb. 2.2 Das Zentrale Dogma der Molekularbiologie beschreibt die Übertragung der Information von der DNA über die RNA hin zum Funktionsträger Protein, die durch die Reihenfolge (Sequenz) der jeweiligen Monomeren (Nukleotide bei DNA und RNA; Aminosäuren bei Proteinen) determiniert ist. Die drei Biopolymere können in ihrer Funktion durch chemische Verbindungen bzw. durch biochemische Verfahren für chemisch-biologische Experimente beeinflusst werden
ausgeglichen werden. Hier zeichnet sich die philosophische Trennlinie der Chemischen Biologie als neue Disziplin zu den anderen Biowissenschaften ab. Lebende Systeme wie Organismen oder Zellen werden als Ganzes untersucht. Anstatt einzelne Gene zu mutieren, wird versucht, Gene und Genprodukte durch synthetisch hergestellte Verbindungen in In-vitro- oder In-vivo-Experimenten in ihrer Funktion reversibel zu manipulieren und die Veränderungen im Gesamtsystem zu untersuchen. Erst dadurch, dass man ein lebendes System mit seinen Eigenschaften als Ganzes und nicht als Summe seiner einzelnen Teile akzeptiert, ist es möglich, das Mehr als die Summe aller Teile des Lebens studieren zu können (siehe Tab. 2.1). Um Gene und Genprodukte in ihrer Funktion reversibel manipulieren zu können, bedient man sich synthetisch hergestellter Verbindungen, sogenannter Sonden (Engl.: Probe). Abb. 2.2 zeigt das Zentrale Molekularbiologische Dogma – in Abhängigkeit der Ebenen DNA, RNA und Proteine – mit welchen synthetischen Molekülen oder Verfahren die Funktionen der Makromoleküle moduliert werden kann. Das Zentrale Dogma
8
2 Chemische Biologie – eine holistische Wissenschaft
der Molekularbiologie beschreibt die Informationsweitergabe innerhalb der Biopolymere von der DNA über die RNA hin zu den Proteinen. Proteine können als klassische Wirkstoffziele in ihrer Funktion durch niedermolekulare Verbindungen (Engl.: Small Molecules), Peptide oder Antikörper beeinflusst werden. RNA-Moleküle binden direkt ebenso niedermolekulare Verbindungen (RNA-Binder) und alle Varianten von kurzen Nukleotidsequenzen (Oligonukleotiden). Daneben kann die Funktion der RNA über die Beeinflussung der RNA-Interferenz (RNAi) moduliert werden. Die DNA kann in ihrer Funktion als Informationsträger über DNA-Binder, bzw. weiter gefasst: über Knock-out oder die Genom-Editierung (Genom-Umschreibung) mit beispielsweise CRISPR-Cas, beeinflusst werden. Gene und Genprodukte mit chemischen Sonden zu manipulieren ist das eine. Das andere ist die phänotypische Veränderung beobachten zu können. Die Chemische Biologie ist daher untrennbar mit den verbesserten bioanalytischen Verfahren der letzten Jahre verknüpft. Es sind aber nicht nur die oben genannten heutigen bioanalytischen Verfahren, die sich unterscheiden. Die Chemische Biologie ist hochgradig automatisiert. Das Testen von chemischen Sonden erfolgt nicht einzeln von Hand. Mittlerweile existieren überall auf der Welt große Bibliotheken von Tausenden bis Millionen potenzieller chemischer Sonden, die im Hochdurchsatz (Engl.: High-Throughput) mit Hilfe von Robotern in kürzester Zeit in miniaturisierten biochemischen Experimenten, sogenannten Assays, getestet werden. Trotz der erst heute möglichen bioanalytischen Verfahren ist die Idee, organische Verbindungen für die Untersuchung von Zellen, Gewebeproben, Pflanzen, Insekten oder auch Tieren zu nutzen, fast so alt wie die Organische Chemie. Im Jahr 1856 entdeckte der erst 18-jährige britische Chemiker William Perkin (1838–1907) zufällig beim Versuch, das Malariamittel Chinin zu synthetisieren, den ersten Anilinfarbstoff. Diesen nannte er aufgrund seiner violetten Farbe ähnlich der Blüte der Wilden Malve und in Anlehnung der französischen Bezeichnung Mauve Mauveine (siehe Abb. 2.3). Die Entdeckung weiterer Anilinfarbstoffe folgte. Zunächst stoßen in großen Mengen industriell hergestellte Anilinfarbstoffe auf den Bedarf der Textilindustrie. Die Produktion natürlich vorkommender Pflanzenfarbstoffe wie die des Indigos zum Färben von Baumwollstoffen war langwierig, mühsam und letztlich sehr teuer. Bunte Kleidung war ein Luxusgut. Die Entdeckung der kostengünstigen Herstellung synthetischer Anilinfarbstoffe aus Kohlenteer führte zu der Entstehung der modernen chemischen Industrie. Bestes Beispiel ist das heute weltweit größte Chemieunternehmen, die Badische Anilin- & Soda-Fabrik, besser bekannt als BASF. Ähnlich verhält es sich mit der Actien-Gesellschaft für Anilin-Fabrication, also die heute durch ihre fotografischen Produkte bekannte Agfa. Schnell kam man auf die Idee, dass Anilinfarbstoffe, die man bei dem Versuch ein Malariamittel herzustellen fand, selbst pharmakologische Eigenschaften besitzen könnten. Das bekannteste Beispiel sind die Arbeiten von Paul Ehrlich (1854–1915). Ehrlich nutzte in seinen frühen Forschungsarbeiten Anilinfarbstoffe zum Färben von Zellen. Dies ermöglichte erstmals die Diagnose zahlreicher Blutkrankheiten. Er vermutete,
2.2 Chemische Biologie ist keine Wirkstoffentwicklung
9
Abb. 2.3 Strukturen des ersten von William Perkin synthetisch hergestellten Anilinfarbstoffs Mauveine (R = Mischung aus CH3 und H) und des von Paul Ehrlich entdeckten ersten Chemotherapeutikums Salvarsan zur Behandlung der Infektionskrankheit Syphilis
dass die unterschiedliche Färbung der Zellen auf chemische Reaktionen mit einzelnen Bestandteilen der Zellen zurückzuführen ist. Daraufhin postulierte er seine Hypothese der Zauberkugeln (Engl.: Magic Bullets). Inspiriert durch die Oper „Der Freischütz“ wählte er den Namen Zauberkugeln für chemische Substanzen, die ähnlich wie in der Oper immer zielgenau den Krankheitserreger treffen und gesundes Gewebe verschonen („Chemotherapia specifica“). 1909 gelang Ehrlich die Entdeckung einer Chemikalie, die selektiv Syphiliserreger abtötete. Die Verbindung bezeichnete man in Anlehnung der lateinischen Wörter „salvare“ – heilen und „sanus“ – gesund, heil sowie einem Rest des Wortes Arsen als Salvarsan: „Heilen mit Arsen“ (siehe Abb. 2.3). Vielfach wird es auch als Präparat 606 bezeichnet, da es im 606. Tierversuch gefunden wurde. Salvarsan stellte sich als Meilenstein der Arzneimittelforschung heraus. Zum ersten Mal in der Medizin war es möglich, ein gezielt antimikrobiell wirkendes Medikament gegen eine Infektionskrankheit ohne schwere Nebenwirkungen wie Haarausfall oder Zahnverlust wie bei der bis dahin verwendete Therapie mit Quecksilber einzusetzen. Ehrlich gilt damit als Begründer der modernen Chemotherapie.
2.2 Chemische Biologie ist keine Wirkstoffentwicklung Dennoch ist es wichtig zu betonen, dass die Chemische Biologie nicht gleichbedeutend mit und auch keine Teildisziplin der Wirkstoff- und Medikamentenentwicklung ist! Das Ziel der Chemischen Biologie ist nicht die Heilung oder Behandlung einer Krankheit, sondern die Untersuchung von lebenden Systemen mit chemischen Sonden. Diese Sonden entsprechen nicht den hohen Gesundheits- und Sicherheitsanforderungen, denen Wirkstoffe und vor allem Arzneimittel unterliegen. Viele Toxizitätsprobleme können ignoriert werden, da diese Verbindungen nicht für den menschlichen Gebrauch gedacht sind. Im Gegenteil werden in der Chemischen Biologie Sonden mit reaktiven
10
2 Chemische Biologie – eine holistische Wissenschaft
chemischen Funktionen wie Michael-Akzeptor, Epoxide, Chlormethylenketone etc. verwendet – die in der Wirkstoffentwicklung vermieden werden –, um stärkere biologische Effekte in den Experimenten zu erzielen. Allerdings birgt die Verwendung von Sonden mit reaktiven Gruppen die Gefahr von Nebenwirkungen, sogenannten Off-Target-Effekten, die die Folge von spezifischem Binden der Sonden an anderen Wirkstoffzielen sind. Trotz dieses grundlegenden Unterschieds ist die Chemische Biologie sehr eng mit der Wirkstoffentwicklung verbunden. Methodisch ist die Chemische Biologie von der Wirkstoffentwicklung kaum bis gar nicht zu unterscheiden: Chemische Substanzbibliotheken werden in Hochdurchsatzverfahren nach phänotypischen Veränderungen durchmustert und anschließend in biochemischen oder zellbiologischen Experimenten angewendet. Allerdings sind die in der Chemischen Biologie verwendeten chemischen Sonden in den Substanzbibliotheken meist keine für die Medikamentenentwicklung geeigneten Wirkstoffe. Dennoch dienen die chemischen Sonden als Konzeptverbindungen für die Wirkstoffentwicklung. Die Anwendung chemischer Sonden dient der Aufklärung der Komplexität lebender Systeme mit der Folge, dass man neue Wirkstoffziele und Wirkkonzepte entwickeln kann. Zusammenfassung Die Chemische Biologie hat ihre Wurzeln in den Biowissenschaften. Allerdings unterscheidet sie sich erheblich mit ihrem Ansatz lebende System ganzheitlich zu untersuchen. Sie ist eine holistische Wissenschaft. Im Gegensatz dazu verfolgen die klassischen Disziplinen der Naturwissenschaften einen reduktionistischen Ansatz: Biologie lässt sich auf Chemie reduzieren und die Chemie auf die Physik. Die Chemische Biologie ist nicht gleichbedeutend mit (und auch kein Teil) der Wirkstoffentwicklung oder der Pharmakologie. In der Chemischen Biologie werden nur die gleichen Methoden wie das Durchmustern von chemischen Substanzbibliotheken verwendet, um chemische Sonden für die Untersuchung und Manipulation von lebenden Systemen zu finden. Warum die Chemische Biologie dennoch essenziell für die heutige Wirkstoffentwicklung ist, erklärt Kap. 3.
Literatur Crick F (1970) Central dogma of molecular biology. Nature 227:561–563 Mayr E (1982) The growth of biological thought: Diversity, evolution, and inheritance. Harvard University Press, Boston Morrison KL, Weiss GA (2006) The origins of chemical biology. Nat Chem Biol 2:3–6 Schreiber SL (2005) Small molecules: The missing link in the central dogma. Nat Chem Biol 1:64–66 van Regenmortel MHV (2004) Reductionism and complexity in molecular biology. EMBO Rep 5:1016–1020
3
Wirkstoffentwicklung
Inhaltsverzeichnis 3.1 Die Medikamentenentwicklung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.1 Wirkstoffsuche. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.1.2 Leitstrukturentwicklung und präklinische Studien . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1.3 Klinische Studie Phase I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.1.4 Klinische Studie Phase II. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.1.5 Klinische Phase III. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.2 Gründe für das Scheitern einer Medikamentenentwicklung. . . . . . . . . . . . . . . . . . . . . . . . 16 3.3 Die Lücke zwischen Laborexperimenten und klinischer Wirkung . . . . . . . . . . . . . . . . . . . 17 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Die Entwicklung eines neuen Medikamentes ist langwierig, risikoreich und daher teuer. Nach Untersuchungen der Unternehmensberatungen PricewaterhouseCoopers (PwC) und Deloitte steigen seit Jahren die Ausgaben der 12 größten pharmazeutischen Unternehmen für die Medikamentenentwicklung. PwC berichtet in seinem Report „From Vision to Decision Pharma 2020“, dass die durchschnittlichen Kosten für ein neues Medikament mittlerweile mehr als 4 Mrd. USD betragen. Gleichzeitig stagniert die Anzahl an Neuzulassungen durch die US-amerikanischen Regulierungsbehörde, der Food and Drug Administration (FDA), wie Abb. 3.1 zeigt. Seit dem Jahr 2010 pendelt sich die Anzahl der Medikamentenneuzulassungen bei 30 pro Jahr ein. Basierend auf dem Trend stagnierender Zulassungszahlen bei steigenden Kosten errechnete Deloitte, dass die Kapitalrendite, also der Gewinn im Verhältnis zum eingesetzten Kapital, der Entwicklungsinvestitionen in der pharmazeutischen Industrie von 10,1 % im Jahr 2010 auf 3,2 % im Jahr 2017 gesunken ist. Eine Kapitalrendite von dauerhaft unter 3 % würde nach Abzug der Inflation (der Abwertung des Wertes einer Währung bzw. die Teuerungsrate) von durchschnittlich 2 % seit dem Jahr 2000 bedeuten, dass mit der Entwicklung neuer Medikamente kein Geld verdient werden kann. Die gesellschaftliche Folge dieser © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. F. Schmidt, Chemische Biologie, https://doi.org/10.1007/978-3-662-61116-6_3
11
15
15$
00
00$
19
20
30$
20
30
13
45$
20
45
05
60$
20
60
98
R&DAUSGABEN (Mrd.)
3 Wirkstoffentwicklung
NEUZULASSUNGEN
12
Abb. 3.1 Entwicklung der Ausgaben (in blau) in der Medikamentenentwicklung der 12 größten pharmazeutischen Unternehmen sowie die Anzahl der Medikamentenneuzulassungen (in grau) durch die US-amerikanische Regulierungsbehörde FDA. Die prognostizierte Entwicklung bis zum Jahr 2025 (jeweils gestrichelt) geht von weiter steigenden Ausgaben bei einer Stagnation der Neuzulassungen aus
wirtschaftlichen Entwicklung wäre katastrophal: Es würden keine neuen Therapien mehr entwickelt werden. Die genannten Zahlen sind dennoch kritisch zu betrachten: Patientenvereinigungen sowie Krankenkassen bezweifeln die genannten Zahlen. Anhand öffentlich zugänglicher Jahresabschlüsse börsennotierter Pharma-Unternehmen haben diese Organisationen die tatsächlichen Kosten für die Neuentwicklung eines Medikamentes mit 300 bis 700 Mio. EUR berechnet. Also deutlich günstiger als von der Industrie ausgewiesen. Pharmazeutische Unternehmen begründen die hohen Preise für neue Medikamente mit den steigenden Entwicklungskosten. Die pharmazeutische Industrie hat demnach ein Interesse, hohe Kosten in den Gesprächen zur Erstattung mit den Krankenkassen anzuführen. Bei aller Relativierung dieser Zahlen muss festgehalten werden, dass die Entwicklung neuer Medikamente stagniert. Vergleicht man die Wirkstoffentwicklung mit der Informationstechnologie, wird dies besonders deutlich: Gordon Moore postulierte 1965, dass die Anzahl der Transistoren auf einem Mikroprozessor und damit die Rechenleistung sich alle 2 Jahre verdoppelt (Moore’sches Gesetz). Obwohl in den letzten 50 bis 100 Jahren enorme technologische Sprünge unternommen wurden, können wir nicht besser und schneller Medikamente entwickeln. Mit der erstmaligen Sequenzierung eines menschlichen Genoms im Jahr 2001 kam der Gedanke auf, dass ähnliche Technologiesprünge in der Medikamentenentwicklung zu erwarten seien. Vor diesem Hintergrund
3.1 Die Medikamentenentwicklung
13
$100M $10M $1M $100K $10K $1K 2001 2002
2003
2004
2005
Moore’sches Gesetz
2006
2007
2008
2009 2010 2011
2012
2013
2014
2015
2016
2017
Kosten pro Genonmsequenzierung
Abb. 3.2 Kosten der Genomsequenzierung seit 2001 im Vergleich zum Moore’schen Gesetz. (Quelle: www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data)
behauptete der damalige Leiter des Human Genome Project, Francis Collins, dass das menschliche Genom den Gesundheitsdienstleistern neue Kräfte zur Behandlung, Vorbeugung und Heilung von Krankheiten gibt. Die Kosten der Sequenzierung eines menschlichen Genoms sind von fast 100 Mio. USD im Jahr 2001 auf 1000 USD im Jahr 2017 gesunken. Diese Entwicklung schlägt bei Weitem das Moore’sche Gesetz, welches „nur“ von einer Verdopplung der Effektivität alle zwei Jahre ausgeht (siehe Abb. 3.2). Obwohl durch die enorme Kostensenkung Millionen von menschlichen Genomen sequenziert werden konnten, ist der erhoffte Effekt auf die Wirkstoffentwicklung ausgeblieben. Woran liegt das?
3.1 Die Medikamentenentwicklung Der Verlauf der Entwicklung eines neuen Medikamentes kann in mehrere Abschnitte eingeteilt werden (Abb. 3.3): Die am Anfang stehende Wirkstoffsuche mit anschließender Leitstrukturentwicklung, die präklinischen Studien, die klinischen Studien mit ihren 3 Phasen sowie der Begutachtungsprozess durch die Behörden (meist die US-amerikanische FDA).
3.1.1 Wirkstoffsuche Im ersten Abschnitt der Wirkstoffentwicklung (Abb. 3.4) entwickelt man mit Hilfe bekannter Daten eine Hypothese. Das bedeutet, man untersucht ein Makromolekül, ein sogenanntes Wirkstoffziel, durch Manipulation seiner Funktion (bspw. durch genetische
F ZU DA LA SS
F B DA A EG C H UT TU N G
U
N
G
K ST LIN U IS D IE CH N E
P K RÄ ST LIN U IS D IE CH N E
3 Wirkstoffentwicklung W EN IR TW KS T IC OF K F LU N G
14
ANZAHL AN W I R K S T O F F K A N D I D AT E N
Z E I T
Hohes Ri s iko des Schei terns K e i n e W i r k u n g i m M e n s c h e n: - “Fal s che” Pat ienten - W i rk s tof f ziel n icht zent ral
Abb. 3.3 Der Entwicklungsverlauf eines neuen Medikamentes
Abb. 3.4 Schematische Darstellung der Wirkstofffindung, Leitstrukturentwicklung und präklinische Testung anhand des Schlüssel-Schloss-Prinzips. Nachdem man ein mögliches Wirkstoffziel = Schloss (meist ein Protein) identifiziert hat, wird ein Wirkstoff = Schlüssel gesucht, der daran bindet. Oftmals muss der gefunden Wirkstoff weiter optimiert werden, um schließlich (prä)klinisch getestet zu werden
3.1 Die Medikamentenentwicklung
15
Manipulation = Mutagenese), ob eine Modulation des Wirkstoffziels eine phänotypische Veränderung in Zell- oder Tierversuchen hervorruft. Nach einer Vielzahl dieser Experimente mit unterschiedlichen Wirkstoffzielen legt man sich fest und definiert eine Hypothese, dass man durch die Modulation eines bestimmten Wirkstoffzieles eine Krankheit behandeln, vielleicht sogar heilen kann. Im Englischen spricht man von der Drugability, der Medikamentenfähigkeit eines Wirkstoffziels. Danach beginnt man mit der Suche nach einem geeigneten Wirkstoff, der an das Wirkstoffziel bindet und in Zell- und Tierversuchen den Effekt reproduzieren kann. Dazu werden große Substanzbibliotheken mit Millionen von Verbindungen gegen das Wirkstoffziel durchmustert. Den Vorgang bezeichnet man als Hochdurchsatzscreening (Engl.: Highthroughput Screening). Meist ist das schon die erste Hürde, weil viele vielversprechende Wirkstoffziele mögliche Wirkstoffe nicht oder nur schlecht binden. Im Englischen spricht man von Ligandability, der Fähigkeit eines Makromoleküls, einen möglichen Wirkstoff (Ligand) binden zu können.
3.1.2 Leitstrukturentwicklung und präklinische Studien Hat man einen Liganden gefunden, werden eine Vielzahl Derivate (strukturähnliche Verbindungen) hergestellt, in der Hoffnung, Bindungseigenschaften wie Affinität und Selektivität optimieren zu können. Diesen Prozess bezeichnet man als Leitstrukturentwicklung. Er ist zentraler Teil der Medizinischen Chemie (veraltet: Pharmazeutische Chemie). Neben Affinität und Selektivität wird bereits das Augenmerk auf die Vermeidung toxischer Eigenschaften des Liganden gelegt. Hat man eine vielversprechende Leitstruktur, erfolgen präklinische Studien. Hier steht die toxikologische Prüfung in Tierversuchen im Zentrum. Meist verlaufen die Leitstrukturentwicklung und präklinische Studien parallel zueinander, um früh toxische Effekte der Leitstruktur zu erkennen.
3.1.3 Klinische Studie Phase I Ist der Wirkstoff in Tierversuchen toxikologisch als unbedenklich getestet worden, erfolgt die klinische Prüfung beim Menschen. In der klinischen Phase I werden die toxikologischen Versuche anstatt bei Tieren am Menschen wiederholt. Dazu werden unterschiedliche Dosen des Wirkstoffs bei meist gesunden Probanden getestet. Hier wird vor allem darauf geachtet, dass die Ergebnisse aus den Tierversuchen beim Menschen reproduziert werden können. Ist der Wirkstoff im Rahmen seiner Anwendung toxikologisch unbedenklich für den Menschen, schließt sich die klinische Phase II an.
16
3 Wirkstoffentwicklung
3.1.4 Klinische Studie Phase II In dieser geht es das erste Mal um therapeutische Wirksamkeit beim Menschen. Daher erfolgen die Studien an Patienten. Ziel einer klinischen Studie Phase II ist immer die optimale Dosisfindung.
3.1.5 Klinische Phase III Ist die optimale Dosis in der Phase II gefunden worden, folgt eine klinische Studie der Phase III. Hier muss der entscheidende Wirksamkeitsnachweis erbracht werden. Dazu sind Phase-III-Studien in der Regel randomisierte Doppelblindstudien. Das heißt, durch Zufall (Engl.: Random) erhält der Patient den Wirkstoff oder ein Placebo. Welches er bekommt, ist weder dem Patienten noch dem behandelnden Arzt bekannt (doppelblind).
3.2 Gründe für das Scheitern einer Medikamentenentwicklung Untersuchungen zu gescheiterten Medikamentenentwicklungen der Jahre 2012–2015 haben gezeigt, dass sich die Erfolgsraten in den unterschiedlichen Phasen der Entwicklung unterscheiden. Die höchsten Ausfallraten treten in der klinischen Phase II auf. Die Erfolgsrate liegt in dieser Phase bei lediglich 25 %.
Erfolgsrate
Präklinik
Phase I
Phase II
Phase III
Begutachtung
Gesamt
65 %
45 %
25 %
65 %
85 %
10 %
Was sind die Gründe für das Scheitern und warum ist die klinische Phase II der Zeitpunkt mit den höchsten Ausfallquoten? Die Gründe für das Scheitern einer Medikamentenentwicklung sind in Abb. 3.5 gezeigt. Demnach scheitern die meisten Medikamentenentwicklungen an mangelnder Wirksamkeit. Das erklärt, warum die klinische Phase II die geringste Erfolgsrate aufweist. In dieser wird erstmals die Wirksamkeit zur Dosisfindung des Kandidaten geprüft. Warum kann man die klinische Wirksamkeit nicht anhand von Laborexperimenten vorhersagen, um keine Überraschung in der klinischen Testung zu erfahren?
3.3 Die Lücke zwischen Laborexperimenten und klinischer Wirkung
17
Abb. 3.5 Gründe für das Scheitern eines Medikaments
3.3 Die Lücke zwischen Laborexperimenten und klinischer Wirkung Die Medikamentenentwicklung ist ein hypothesentestendes Verfahren. Eine Idee, wie eine Krankheit behandelt werden kann, wird mit Hilfe von Zell- und Tierexperimenten am Anfang einer Hypothese entwickelt. Diese wird durch eine Vielzahl von Experimenten bis hin zu finalen Versuchen beim Menschen getestet. Fällt dem Leser hier etwas auf? Der Prozess ist reduktionistisch. Was in einzelnen Versuchen in Zellen und Tieren funktioniert, sollte auch im Großen beim Menschen funktionieren. Allerdings ist die Medikamentenwirkung beim Menschen mehr als die Summe von Ergebnissen aus Zellund Tierversuchen. Die Datenlage aus diesen Experimenten ist zu schwach, um verlässlich die klinische Wirksamkeit eines Wirkstoffs vorhersagen zu können. Dies zeigt sich aus Untersuchungen zum Scheitern von klinischen Phase-II- und Phase-III-Studien. Insbesondere in der klinischen Phase II wird erstmals auf Wirkung getestet. Man bezeichnet diese Situation auch als Lücke zwischen Laborexperimenten und klinischer Wirksamkeit. Gründe sind, dass das gewählte Wirkstoffziel nicht zentral für den Krankheitsmechanismus ist sowie dass für die Studie Patienten ausgewählt wurden, die zwar die klinischen Symptome der adressierten Krankheit haben, aber nicht an dieser Krankheit leiden. Letzteres klingt trivial, ist aber ein großes Problem. Mehrere Studien zu Wirkstoffen der späten Form der Alzheimer Erkrankung verliefen negativ. Nach der Autopsie verstorbener Teilnehmer musste festgestellt werden, dass bis zu 35 % der Teilnehmer zwar klinisch dement waren, aber nicht an der Alzheimer Erkrankung litten. Dass wir
18
3 Wirkstoffentwicklung
trotz der Genomforschung klinische Wirksamkeit von Wirkstoffen nicht vorhersagen können, und vor allem bei wem, ist ein Grund, warum die Medikamentenentwicklung risikoreich ist. Aber es gibt noch einen weiteren Grund, der in dem Konzept begründet ist, wie wir Medikamente entwickeln. Zusammenfassung Die Medikamentenentwicklung ist entgegen der genutzten Methoden aus den reduktionistischen Biowissenschaften eine holistische Disziplin. Das ist insofern problematisch, als man anhand von Labor- und Zellexperimenten nicht die klinische Wirksamkeit beim Menschen vorhersagen kann. Letzteres führt zu den erschreckend niedrigen Erfolgsraten, wenn der Wirkstoff das erste Mal beim Menschen auf Wirksamkeit in der klinischen Phase IIB getestet wird. Die Kapitalrendite der pharmazeutischen Industrie sinkt seit Jahren. Das bedeutet, dass man in Zukunft mit der Entwicklung neuer Medikamente kein Geld mehr verdienen kann. Die gesellschaftliche Folge dieser wirtschaftlichen Entwicklung wäre katastrophal: Es würden keine neuen Therapien mehr entwickelt werden.
Literatur https://www.pwc.com/gx/en/pharma-life-sciences/pharma2020/assets/pwc-pharma-successstrategies.pdf https://www2.deloitte.com/content/dam/Deloitte/global/Documents/Life-Sciences-Health-Care/ deloitte-uk-measuring-return-on-pharma-innovation-report-2018.pdf https://www.mckinsey.com/~/media/mckinsey/industries/pharmaceuticals%20and%20medical%20 products/our%20insights/precision%20medicine%20opening%20the%20aperture/precisionmedicine-opening-the-aperture.ashx Harrison RK (2016) Phase II and phase III failures: 2013–2015. Nat Rev Drug Discov 15:817–818
4
Von der Genomforschung zur Chemischen Biologie
Inhaltsverzeichnis 4.1 Chemische Genomik: Identifizierung neuer Wirkstoffe und Wirkstoffziele. . . . . . . . . . . . 23 4.2 Chemische Proteomik: Charakterisierung des Wirkstoffziels. . . . . . . . . . . . . . . . . . . . . . . 25 4.3 Chemische Genetik: Validierung des Wirkstoffziels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.4 Chemische Biologie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Ein anderer Grund, warum die Entwicklung neuer Medikamente schwierig ist, untermauerte die Genomforschung. Das Genom codiert für ca. 23.000 Gene, also Stellen, die zur Herstellung einer biologisch aktiven Ribonukleinsäure (Englisch: Ribonucleic Acid RNA) führen (Transkription), die wiederum für 50.000 bis 100.000 Proteine codieren (Translation). Andererseits untersuchte man die bereits zugelassenen Medikamente. Wie Tab. 4.1 zeigt, sind derzeit 1591 Medikamente von der US-amerikanischen Regulierungsbehörde FDA zugelassen. Sofern dies möglich war, ordnete man jedes Medikament einem Wirkstoffziel zu. Von den 1591 zugelassenen Wirkstoffen binden 1292 an 695 humane Wirkstoffzielen. Die Medikamente zielen demnach nur auf 2–3 % des menschlichen Genoms (Abb. 4.1). Schaut man sich die Zahlen genauer an, fällt auf, dass 1348 der 1591 zugelassen Wirkstoffe niedermolekulare Liganden, chemische Verbindungen mit einer molekularen Masse von unter 1000 g/mol, sind, die an 749 der 893 identifizierten Wirkstoffziele binden. Ein durchschnittlicher Wirkstoff ist ein niedermolekularer Ligand, der an ein Protein bindet. Die Protein-Wirkstoffziele sind fast ausschließlich Enzyme, Kanäle, Rezeptoren und Transporter. Gemeinsam haben sie die Eigenschaft, einen niedermolekularen Liganden zu binden (Ligandability). Meist beruht dies auf der Tatsache, dass die genannten Proteinklassen einen natürlichen Liganden, bspw. ein Substrat, binden. Die Proteine weisen definierte Bindungstaschen auf, in denen natürliche Liganden sowie Wirkstoffe sehr gut binden können. Enzyme, Kanäle, © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. F. Schmidt, Chemische Biologie, https://doi.org/10.1007/978-3-662-61116-6_4
19
20
4 Von der Genomforschung zur Chemischen Biologie
Tab. 4.1 Liste der von der US-amerikanischen Regulierungsbehörde FDA als Medikamente zugelassenen Wirkstoffe und ihre Ziele Wirkstoffziele Gesamt Niedermolekulare Liganden
Biologika
Zugelassene Wirkstoffe Gesamt Niedermolekulare Liganden
Biologika
Humane Proteine
667
549
146
1194
999
195
Pathogene Proteine
189
184
7
220
215
5
Andere humane Makromoleküle
28
9
22
98
63
35
Andere pathogene Makromoleküle
9
7
4
79
71
8
Gesamt
893
749
179
1591
1348
243
Rezeptoren und Transporter sind Signalamplifikationspunkte. Chemisch betrachtet treten diese Proteine in den Signalwegen nicht in stöchiometrischen Mengen auf, sondern in katalytischen Konzentrationen. Sie katalysieren biochemische Signalschritte. Die Ausschaltung eines solchen Schrittes unterlässt die Signalverstärkung. Ein klinischer Effekt wie die Wirkung eines Medikamentes stellt sich ein. Man bezeichnet das Auslösen eines klinischen Effektes aus der Modulation eines Wirkstoffzieles Drugability. Aus diesen zwei Gründen ist die Wirkstoffentwicklung historisch auf niedermolekulare Liganden, die an Proteine wie Enzyme, Kanäle, Rezeptoren oder Transporter binden, fokussiert. Was macht man, wenn man ein Krankheitsgen findet, das nicht für eines dieser Proteine codiert? Wie in Abb. 4.2 illustriert, hat die Genomforschung dennoch viele neue krankheitsassoziierende Gene gefunden, deren Produkte mit den etablierten Methoden der Wirkstoffentwicklung in der pharmazeutischen Industrie nicht adressiert werden können („undruggable“). Das ist der Grund, warum die Chemische Biologie eine zentrale Rolle in der Wirkstoffentwicklung von heute spielt. Die Lücke zwischen der Genomforschung und der Wirkstoffentwicklung wird durch das Testen von chemischen Sonden zur Erforschung biologischer Systeme geschlossen. Das Ziel ist die systematische • Identifizierung, • Charakterisierung und • Validierung von Wirkstoffen und Wirkstoffzielen (Abb. 4.3).
4 Von der Genomforschung zur Chemischen Biologie
21
Abb. 4.1 Das Genom codiert für ca. 23.000 Gene. Von den 1591 zugelassenen Wirkstoffen binden 1292 an 695 humane Wirkstoffzielen. Die Medikamente zielen demnach nur auf 2–3 % des menschlichen Genoms. Die meisten Genprodukte sind entweder nicht krankheitsrelevant oder „undruggable“
22
4 Von der Genomforschung zur Chemischen Biologie
A
Ich habe das Krankheitsgen gefunden!
FORSCHER
Es gibt nur 400-500 Wirkstoffziele und deines gehört nicht dazu!
PHARMA
B
Abb. 4.2 Illustration der Chemischen Biologie in der Wirkstoffentwicklung. a Genomforscher haben viele, neue krankheitsursächliche Gene gefunden, deren Produkte keine Enzyme, Kanäle, Rezeptoren oder Transporter sind, die mit den etablierten Protokollen der pharmazeutischen Industrie adressiert werden können. b Die Chemische Biologie als Brückenbauer zwischen der Genomforschung und der Wirkstoffentwicklung. Chemischen Sonden zur Modulation gefundener Gene helfen mögliche Therapiekonzepte auszuprobieren und zu validieren. (Adaptiert aus Altmann KH et al. (2009) The State of the Art of Chemical Biology. ChemBioChem 10: 16–29)
23
ierung von W teris irks rak tof a h fe :C
n
offzielen irkst dW un
Chemische Pr ote om ik
ng von Wirksto ffen dieru Vali un : k i dW t ne ir e G
n iele ffz to ks
Che mi sch e
eines biologisch lation en S odu yst M em : e gi mi o l tW o i i eB
n ffe sto rk
Ch em isc h
4.1 Chemische Genomik: Identifizierung neuer Wirkstoffe und Wirkstoffziele
Chemische Genomik: Identifizierung von Wirkstoffen und Wirkstoffzielen
Abb. 4.3 Die Chemische Biologie und ihre Teildisziplinen Chemische Genomik, Chemische Proteomik und Chemische Genetik und ihre Aufgaben Identifizierung, Charakterisierung und Validierung von Wirkstoffen und Wirkstoffzielen
4.1 Chemische Genomik: Identifizierung neuer Wirkstoffe und Wirkstoffziele Die Chemische Genomik (oder Chemogenomik) leitet sich von der Genomik ab, der Erforschung des Aufbaus des Genoms (der Gesamtheit aller Träger der vererbbaren Informationen) und der Wechselwirkungen zwischen den Genen (den einzelnen vererbbaren Informationen). Wie im ersten Abschnitt von Kap. 3 ausgeführt, wurde durch die Sequenzierung des menschlichen Genoms eine Vielzahl neuer Gene entdeckt. Die Chemische Genomik hat sich zum Ziel gesetzt, die Genprodukte zu identifizieren, die mögliche Wirkstoffziele sind. Dazu werden ganze Genprodukt- bzw. Wirkstoffzielfamilien (bspw. Enzym- und Rezeptorklassen) systematisch gegen chemische Bibliotheken meist niedermolekularer Substanzen, sogenannten Sonden, getestet. Anders
24
4 Von der Genomforschung zur Chemischen Biologie
ausgedrückt: Ähnlich wie in der Genomik geht es in der Chemischen Genomik primär um die Untersuchung der Gesamtheit aller Genprodukte (Proteine) mit dem Fokus auf ihre Eigenschaften, ein Wirkstoffziel zu sein, und wie sie sich voneinander in ihren Bindungseigenschaften und Funktionen unterscheiden, und weniger um das einzelne Gen bzw. Genprodukt. Im Zentrum der Chemischen Genomik stehen chemische Sonden (Liganden), Proteine (Rezeptoren) und die bei der Wechselwirkung der beiden entstehende biologische Veränderung eines Merkmals, der sogenannte Phänotyp. Sobald der Phänotyp charakterisiert ist, kann man ein Protein mit einem molekularen Ereignis assoziieren. Verglichen mit der Genetik ist die Chemische Genomik in der Lage, die Funktion eines Proteins und nicht des Gens zu verändern. Die Interaktion sowie die Reversibilität der Interaktion können in Echtzeit beobachtet werden. Zum Beispiel kann die Modifikation eines Phänotyps nur nach Zugabe einer spezifischen Verbindung beobachtet werden und nach seinem Rückzug aus dem Medium unterbrochen werden. Es gibt zwei experimentelle Ansätze in der Chemischen Genomik: die Vorwärtsgerichtete (klassische) Chemische Genomik und die Rückwärtsgerichtete Chemische Genomik (Abb. 4.4). Vorwärtsgerichtete Chemische Genomik In der Vorwärtsgerichteten Chemischen Genomik, die auch als Klassische Chemische Genomik bekannt ist, wird die Veränderung des Phänotyps einer Zelle in Anwesenheit eines Wirkstoffs untersucht. Zum Beispiel könnte eine Phänotypveränderung das Anhalten des Tumorwachstums sein. Ursprünglich werden Wirkstoffe, auch chemische Sonden genannt, verwendet, von denen bekannt ist, an welche Proteinfamilien sie bevorzugt binden. Im letzten Schritt wird versucht, das Wirkstoffziel zu identifizieren. Man testet den gefundenen Wirkstoff gegen alle bekannten Mitglieder der bekannten Proteinfamilie. Reverse Chemogenomik Bei der Rückwärtsgerichteten Chemischen Genomik werden die Bibliotheken von chemischen Sonden gegen mehrere Mitglieder einer Proteinfamilie (bspw. Kinasen) parallel getestet. Findet man eine oder mehrere chemische Sonden, die die Proteine in ihrer Funktion modulieren können, testet man die Sonden ebenfalls gegen Zellen auf die Veränderung des Phänotyps. Auffällig ist, dass die Reverse Chemische Genomik mit dem wirkstoffzielbasierten Ansatz der pharmazeutischen Industrie annähernd identisch ist: Ein Protein wird gegen viele Wirkstoffkandidaten einzeln im Hochdurchsatz getestet. Der einzige Unterschied ist, dass in der Chemischen Genomik chemische Sonden verwendet werden, die den toxikologischen Ansprüchen eines Wirkstoffkandidaten nicht genügen müssen und daher beispielsweise chemisch reaktive Gruppen aufweisen können. Zudem wird in der Chemischen Genomik nicht ein Wirkstoffziel getestet, sondern mehrere (meist alle bekannten) Mitglieder einer Proteinfamilie, um die Bindungs- und Funktionsunterschiede der Proteine untersuchen zu können.
4.2 Chemische Proteomik: Charakterisierung des Wirkstoffziels
25
Abb. 4.4 Die Identifizierung neuer Wirkstoffe und Wirkstoffziele erfolgt angelehnt an die Genetik vorwärts und rückwärts: In der Vorwärtsgerichteten Chemischen Genomik werden Wirkstoffe an Zellen getestet, um eine biologische Veränderung (Phänotyp) auszulösen. Anschließend wird das Ziel des Wirkstoffs ermittelt. In der Rückwärtsgerichteten Chemischen Genomik werden verwandte Proteinfamilien gegen chemische Bibliotheken durchmustert. Findet man einen aktiven Wirkstoff, wird dieser an Zellen getestet. Meist gehen Experimente der Vorwärtsgerichteten Chemischen Genomik mit Experimenten der Rückwärtsgerichteten Chemischen Genomik einher, um das Wirkstoffziel eindeutig identifizieren zu können
Die experimentellen Ansätze der Vorwärtsgerichteten (klassischen) und Rückwärtsgerichteten Chemischen Genomik sollten immer parallel durchgeführt werden, um das Wirkstoffziel eindeutig identifizieren zu können.
4.2 Chemische Proteomik: Charakterisierung des Wirkstoffziels Oftmals ist die eindeutige Identifizierung des Wirkstoffziels durch die Chemische Genomik nicht möglich bzw. unerwünschte Bindungspartner, sogenannte off-target-effects, sollen ausgeschlossen werden. Hier setzt die Chemische Proteomik an.
26
4 Von der Genomforschung zur Chemischen Biologie
Die Proteomik untersucht das Proteom, den Satz an translatierten Proteinen zu einem bestimmten Zeitpunkt unter definierten Bedingungen und hat das Ziel, die Gesamtheit aller Proteine und ihrer gegenseitigen Wechselwirkungen zu kartieren. Die Proteomik nutzt klassische Methoden der Proteinbiochemie wie die Proteinextraktion und -aufreinigung. Als die zentrale Methode hat sich allerdings die Massenspektrometrie in der Proteomik etabliert. Im Gegensatz dazu ist das Ziel der Chemischen Proteomik die Identifizierung und Charakterisierung des Wirkstoff-Wirkstoffziel-Komplexes. Hierzu wird der Ligand chemisch über einen Linker mit einem Etikett (Englisch: tag) verknüpft. Die generierte Sonde wird mit dem Zelllysat inkubiert. Anschließend wird eine Affinitätsreinigung durchgeführt (Abb. 4.5). Beispielsweise kann das Etikett ein Polyhistidin-Tag (ein Peptid bestehend aus 6 Histidin-Aminosäuren), das über einen Chelat-Komplex an immobilisierte Nickel-Ionen bindet, während man die ungebundenen Proteine wegwaschen kann. Anschließend wäscht man auch das gebundene Protein durch eine Lösung von Imidazol (die funktionale Gruppe des Histidins) von der Festphase. Das aufgereinigte Zielprotein des Wirkstoffs wird im Anschluss durch Gelchromatografie
Chemische Proteomik
Zelllyse
Ligand Linker Tag
Sonde
Affinitätsreinigung
MS/MS Analyse
Charakterisierung des Wirkstoffziels
Gelchromatografie
isoliertes Wirkstoffziel
Abb. 4.5 Die eindeutige Identifizierung und Charakterisierung des Ligand-Protein-Komplexes ist das Ziel der Chemischen Proteomik. Hierzu wird der Ligand chemisch mit einem Etikett (Tag) versehen, der es erlaubt, über die Affinitätschromatografie das Zielprotein des Liganden zu isolieren. Im Anschluss wird das Zielprotein mit Hilfe der Gelchromatografie und der Massenspektrometrie untersucht
4.3 Chemische Genetik: Validierung des Wirkstoffziels
27
und Massenspektrometrie untersucht. Techniken der Massenspektrometrie erlauben es zudem, auf die Aminosäuresequenz des Proteins zu schließen und damit das Protein eindeutig zu charakterisieren.
4.3 Chemische Genetik: Validierung des Wirkstoffziels Die Chemische Genetik ist die älteste Teildisziplin der Chemischen Biologie und stand lange synonym für die Chemische Biologie. In diesem Buch ist sie daher in Abgrenzung zur Chemischen Biologie enger definiert als in anderen Publikationen. Die Chemische Genetik geht direkt auf die Mutagenese-Experimente der Genetik zurück. Wie bereits im Abschn. 2.1 kurz ausgeführt und in Abb. 4.6 beschrieben, kann die Chemische Genetik analog zum klassischen genetischen Screening betrachtet werden. Dabei werden zufällige Mutationen in den Organismus eingeführt, der Phänotyp dieser Mutanten beobachtet und schließlich die spezifische Genmutation (Genotyp) identifiziert, die diesen Phänotyp erzeugt hat. In der Chemischen Genetik wird der Phänotyp nicht durch die Einführung von Mutationen verändert, sondern durch die Exposition gegenüber chemischen Sonden. Vorteile der Chemischen Genetik gegenüber genetischen Knock-out-Experimenten
• Die Wirkung von Wirkstoffen zeigt sich schnell. • In den meisten Fällen ist die Wirkung reversibel (aufgrund von Stoffwechsel und Clearing), so dass eine zeitliche Kontrolle der Proteinfunktion ermöglicht wird. • Die Wirkung ist einstellbar, ermöglicht Grade von Phänotypen durch unterschiedliche Konzentration. • Der Effekt ist bedingt, weil der Wirkstoff an jedem Punkt der Entwicklung eingeführt werden kann. Ein Knock-out, der für die embryonale Entwicklung eines Organismus tödlich ist, kann für einen erwachsenen Organismus nicht untersucht werden. • Knock-out-Studien können die Rolle verschiedener Proteinformen, die von demselben Gen stammen, nicht aufklären, während ein kleines Molekül prinzipiell in der Lage sein sollte, zwischen diesen Funktionen zu unterscheiden. • Der Effekt kann von jedem untersucht werden, der Zugang zu der Verbindung hat. Nachteile Chemischer Genetik gegenüber genetischen Knock-out-Experimenten: • Es muss zuerst eine Verbindung identifiziert werden, die Wirkung zeigt. • Die Identifizierung des biologischen Ziels des Liganden kann sehr aufwendig sein.
28
4 Von der Genomforschung zur Chemischen Biologie
Abb. 4.6 Die Chemische Genetik dient der Validierung eines Proteins auf seine Eignung als Wirkstoffziel (Englisch: Target Validation). Die Chemische Genetik geht auf die MutageneseExperimente in der Genetik zurück. Statt der Einführung von Mutationen in das Genom werden chemische Sonden auf die Veränderung des Phänotyps untersucht. Analog zu der Chemischen Genomik existieren die zwei experimentellen Ansätze der Vorwärts- und Rückwärtsgerichteten Chemischen Genetik. Chemische Genomik und Chemische Genetik unterscheiden sich in ihrer experimentellen Durchführung nicht. Sie unterscheiden sich nur in ihren Zielen der Identifizierung und Validierung des Wirkstoffziels
4.4 Chemische Biologie
29
Ähnlich wie in der Chemischen Genomik erfolgen die Experimente vorwärts- und rückwärtsgerichtet. Das phänotypische Screening (vorwärts) von chemischen Bibliotheken wird verwendet, um einen Wirkstoff zu finden, der den Phänotyp verändern kann. Die Rückwärtsgerichtete Chemische Genetik spielt eine besondere Rolle darin, Wirkstoffziele in experimentellen Krankheitsmodellen zu validieren (Englisch: Target Validation): Hat die Manipulation dieses Proteins den gewünschten klinischen Effekt? Es ist daher ausdrücklich festzuhalten: Der experimentelle Aufbau in der Chemischen Genetik unterscheidet sich nicht von dem in der Chemischen Genomik. In der Chemischen Genetik steht die Validierung des Wirkstoffziels im Mittelpunkt. Um die gewünschte klinische Wirkung beim Menschen erzielen zu können, muss vorher gezeigt werden, dass dieser Effekt in Zellexperimenten nachweisbar ist. Wie in Abschn. 3.2 beschrieben, ist die mangelnde Vorhersage der klinischen Wirksamkeit eines Wirkstoffs der wichtigste Grund für das Scheitern einer Medikamentenentwicklung.
4.4 Chemische Biologie Neben den Teilgebieten der Chemischen Genomik (Wirkstoffidentifizierung), der Chemischen Proteomik (Wirkstoffzielcharakterisierung) und Chemischen Genetik (Wirkstoffzielvalidierung) spielen immer mehr Ansätze in der Medikamentenentwicklung eine Reihe, die es erlauben, bislang nicht adressierbare Wirkstoffziele dennoch mit Wirkstoffen manipulieren zu können. Diese Strategien werden mittlerweile in der pharmazeutischen Industrie unter dem Oberbegriff Chemische Biologie zusammengefasst. In der klassischen Wirkstoffentwicklung und Pharmakologie gibt es einen Wirkstoff, der an ein Wirkstoffziel bindet, welches den Phänotyp verändert bzw. einen klinischen Effekt zeigt (Abb. 4.7). Wie wir gelernt haben, sind nur ca. 3 % der menschlichen Gene als Wirkstoffziel im klinischen Gebrauch. Wie kann man ein Protein dennoch manipulieren, das zu den anderen 97 % gehört? Ansätze wie Antikörper-Wirkstoff-Konjugate (Englisch: Antibody Drug Conjugate – ADC), die Verbindung eines monoklonalen Antikörpers mit einem niedermolekularen Liganden zur gezielten Inhibition von Tumorzellen oder die Protolyse gegen Chimäre (Englisch: Proteolysis trageting Chimera – PROTAC) sind neue Verfahren, die es ermöglichen, Proteine außerhalb des bisherigen Wirkspektrums erreichen zu können. In Bezug auf die Wirkstoffentwicklung hat sich die Chemische Biologie als Oberbegriff dieser Verfahren und Ansätze etabliert. Zusammenfassung Durch die Genomforschung erhielt man Zugang zu vielen neuen, möglichen Wirkstoffzielen. Deren Überprüfung als Grundlage für neue Therapien ist die Aufgabe der Chemischen Biologie mit ihren Teildisziplinen. Während die Chemische Genomik systematisch Liganden für neue Wirkstoffziele identifiziert, die Chemische Proteomik
30
4 Von der Genomforschung zur Chemischen Biologie
Abb. 4.7 Das Problem der nicht adressierbaren Wirkstoffziele. Betrachtet man die im Genom codierten Proteine fällt auf, dass jeweils nur 10 % entweder eine tiefe, hydrophobe Tasche besitzen, in der ein niedermolekularer Ligand binden kann, oder das Wirkstoffziel extrazellular auftritt, so dass ein Biologikum an dieses binden kann. Man geht davon aus, dass 80 % aller möglichen Wirkstoffziele mit niedermolekularen Liganden oder Biologika nicht adressiert werden können. Dahingegend steht das Versprechen der Chemischen Biologie durch neue Wirkkonzepte bislang nicht adressierbare Proteine modulieren zu können. In der Pharmakologie gilt: Ein Wirkstoff manipuliert ein Wirkstoffziel, welches einen veränderten Phänotyp auslöst. Grundlage neuer Wirkkonzepte der Chemischen Biologie sind Wirkstoffkombinationen. Bislang nicht manipulierbare Proteine sollen durch das Netzwerk moduliert werden
die Bindung des Liganden an das Wirkstoffziel charakterisiert, die Chemische Genetik das gefundene Genprodukt als Wirkstoffziel validiert, fallen unter den Oberbegriff Chemische Biologie alle Ansätze, bisher durch niedermolekulare Liganden und Biologika nicht modulierbare Wirkstoffziele zu adressieren.
Literatur Altmann KH et al (2009) The state of the art of chemical biology. ChemBioChem 10:16–29 Bredel M, Jacoby E (2004) Chemogenomics: An emerging strategy for rapid target and drug discovery. Nat Rev Genet 5:262–275 Santos R et al (2017) A comprehensive map of molecular drug targets. Nat Rev Drug Discov 16:19–34
Teil II DNA
5
DNA – Bauplan der Proteine
Inhaltsverzeichnis 5.1 Funktion und Struktur der DNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 5.2 Oligonukleotidsynthese. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 5.3 DNA-Sequenzierung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.3.1 Polymerasekettenreaktion – PCR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.3.2 Sanger-Abbruchsequenzierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 5.3.3 Next-Generation-Sequenzierung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5.3.4 DNA-Microarray. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Desoxyribonukleinsäure (Englisch: Desoxyribonucleic Acid – DNA) ist ein Molekül, das aus zwei Ketten besteht, die sich umeinanderwickeln und eine Doppelhelix bilden. Es enthält die genetische Anweisung für Entwicklung, Funktion, Wachstum und Reproduktion aller bekannten Organismen und vieler Viren (Abb. 5.1). DNA und Ribonukleinsäure (RNA) sind Nukleinsäuren. Nukleinsäuren sind neben Proteinen, Lipiden und komplexen Kohlenhydraten (Polysacchariden) eine der vier Hauptarten von Makromolekülen, die für alle bekannten Lebensformen essenziell sind.
5.1 Funktion und Struktur der DNA Die beiden DNA-Stränge werden auch als Polynukleotide bezeichnet, da sie aus einfacheren Monomereinheiten bestehen, die als Nukleotide bezeichnet werden. Jedes Nukleotid besteht aus einer von vier stickstoffhaltigen Nukleobasen (Cytosin [C], Guanin [G], Adenin [A] oder Thymin [T]), einem Zucker namens Desoxyribose und einer Phosphatgruppe. Die Nukleotide sind durch kovalente Bindungen zwischen dem Zucker eines Nukleotids und dem Phosphatrest des nächsten Nukleotids in einer Kette
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. F. Schmidt, Chemische Biologie, https://doi.org/10.1007/978-3-662-61116-6_5
33
34
5 DNA – Bauplan der Proteine DNA
RNA
Transkripon
Gentherapie/-edi erung
Protein
Translaon
RNA-Interferenz / An sense
Small Molecules Pep de Monoklonale An körper Aptamere
Abb. 5.1 Das Zentrale Dogma der Molekularbiologie beschreibt die Übertragung der Information von der DNA über die RNA hin zum Funktionsträger Proteine, die durch die Reihenfolge (Sequenz) der jeweiligen Monomeren (Nukleotide bei DNA und RNA; Aminosäuren bei Proteinen) determiniert ist. Die drei Biopolymere können in ihrer Funktion durch chemische Verbindungen bzw. durch biochemische Verfahren für chemisch-biologische Experimente beeinflusst werden
miteinander verbunden, was zu einem alternierenden Zucker-Phosphat-Rückgrat führt. Die stickstoffhaltigen Basen der beiden getrennten Polynukleotidstränge werden gemäß den Basenpaarungsregeln (A mit T und C mit G) mit Wasserstoffbrückenbindungen zu doppelsträngiger DNA zusammengebunden. Die komplementären stickstoffhaltigen Basen werden in zwei Gruppen unterteilt, Pyrimidine und Purine. In der DNA sind die Pyrimidine Thymin und Cytosin; die Purine sind Adenin und Guanin (Abb. 5.2). Beide Stränge doppelsträngiger DNA speichern die gleiche biologische Information. Diese Informationen werden repliziert, sobald sich die beiden Stränge trennen. Ein großer Teil der DNA (mehr als 98 % für den Menschen) ist nicht codierend, was bedeutet, dass diese Abschnitte nicht als Muster für Proteinsequenzen dienen (Abb. 5.3, 5.4 und 5.5). Die beiden DNA-Stränge verlaufen in entgegengesetzte Richtungen und sind daher antiparallel. An jeden Zuckerrest ist eine von vier Arten von Nukleobasen (kurz Basen) gebunden. Es ist die Sequenz dieser vier Nukleobasen entlang des Rückgrats, die die genetische Information codiert. RNA-Stränge werden unter Verwendung von DNA-Strängen als Matrize in einem als Transkription bezeichneten Prozess erzeugt, bei dem DNA-Basen gegen ihre entsprechenden Basen ausgetauscht werden, außer im Fall von Thymin (T), das in der RNA durch Uracil (U) ersetzt wird. Unter dem genetischen Code spezifizieren diese RNA-Stränge die Sequenz von Aminosäuren innerhalb von Proteinen in einem Prozess, der als Translation bezeichnet wird. In eukaryotischen Zellen ist die DNA in langen Strukturen organisiert, die als Chromosomen bezeichnet werden (Abb. 5.3). Vor der typischen Zellteilung werden diese Chromosomen bei der DNA-Replikation dupliziert (Abb. 5.4), wodurch für jede
5.1 Funktion und Struktur der DNA
35
Abb. 5.2 Bausteine der DNA: Basen und Zuckerrückgrat
Tochterzelle ein vollständiger Chromosomensatz bereitgestellt wird. Eukaryotische Organismen (Tiere, Pflanzen, Pilze und Protisten) speichern den größten Teil ihrer DNA im Zellkern als Kern-DNA und einige in den Mitochondrien als MitochondrienDNA oder in Chloroplasten als Chloroplasten-DNA. Im Gegensatz dazu speichern Prokaryoten (Bakterien und Archaeen) ihre DNA nur im Zytoplasma in zirkulären Chromosomen. In eukaryotischen Chromosomen verdichten und organisieren Chromatinproteine wie Histone die DNA. Diese Verdichtungsstrukturen steuern die Wechselwirkungen zwischen DNA und anderen Proteinen und helfen dabei, zu steuern, welche Teile der DNA transkribiert werden.
36
5 DNA – Bauplan der Proteine
Abb. 5.3 Struktur eines Chromosoms und modellhafte Darstellung der darauf liegenden Gene
Protein
mRNA
DNA
Ribosom
(DNA-Synthese)
(RNA-Synthese)
(Proteinsynthese)
Abb. 5.4 Basierend auf dem Molekularbiologischen Dogma stellt sich der Informationstransfer von der Protein-codierenden DNA über davon abgeleitete RNA-Synthese (Transkription) zu der Proteinbiosynthese (Translation) dar
Regulatorisches Protein
RNA PolymeraseKomplex
Richtung der Transkripon
Bindungsstelle des RNA-PolymeraseKomplexes
Protein-kodierende Sequenz
GGGCCC Regulatorisches Element
Abb. 5.5 Generelle Struktur eines Gens: Beginnend mit einer regulatorischen Bindungsstelle für einen Transkriptionsfaktor gefolgt von einer Bindungsstelle für die RNA-Polymerase, die nach Bindung die Protein-codierende Sequenz abliest und in ein mRNA dabei synthetisiert
5.2 Oligonukleotidsynthese
37
5.2 Oligonukleotidsynthese Oligonukleotide werden in der Zelle durch Enzyme, den sogenannten Polymerasen, synthetisiert. Allerdings benötigen Polymerasen bestimmte Startsequenzen, die später im Oligonukleotid verbleiben. Um vor allem kürzere Oligonukleotide beliebiger Basenabfolge erhalten zu könne, hat sich die Phosphoramiditsynthese durchgesetzt. Dazu werden wie in Abb. 5.6 gezeigt, geschützte Phosphoramidite als Nukleotidanaloga zur Synthese von Oligonukleotiden genutzt. Die 5-Hydroxygruppe ist mit einer Dimethoxytrityl-(DMT)-Gruppe geschützt. Im Falle der Ribonukleinsäure (RNA) ist die 2-Hydroxygruppe mit einer tert-Butyldimethylsilyl- (TBDMS) bzw. mit einer
Abb. 5.6 Übersicht der Synthesebausteine in der Oligonukleotidsynthese
38
5 DNA – Bauplan der Proteine
Tri-iso-propylsilyloxymethylgruppe (TOM) orthogonal geschützt. Die 3-Hydroxygruppe wird mit einem 2-Cyanoethyl-N,N,N′,N″-tetraisopropylphosphorodiamidit umgesetzt und es entsteht das Phosphoramidit. Wie in Abb. 5.6 ebenfalls gezeigt, sind außer Thymin und Uracil die Basen geschützt: Cytosin ist acetylgeschützt, Adenin ist benzylgeschützt und Guanin ist isopropylgeschützt. Die Oligonukleotidsynthese erfolgt an der Festphase. Hierzu wird ein Nukleotidbaustein am 3′-Ende immobilisiert. Durch schrittweise Addition von Nukleotidresten an den 5′-Terminus der Nukleotidbausteine wächst die Kette, bis die gewünschte Sequenz zusammengesetzt ist. Jede Addition wird als Synthesezyklus bezeichnet (Abb. 5.7) und besteht aus vier chemischen Reaktionen:
Abb. 5.7 Synthesezyklus der Oligonukleotidsynthese
5.2 Oligonukleotidsynthese
Übersicht
Schritt 1: Entsperren (Detritylierung) Die DMT-Gruppe wird mit einer Lösung einer Säure wie 2 % Trichloressigsäure (TCA) oder 3 % Dichloressigsäure (DCA) in einem inerten Lösungsmittel wie Dichlormethan oder Toluol abgespalten. Das abgespaltene DMT-Kation wird weggewaschen; der Schritt führt dazu, dass der an einen festen Träger gebundene Oligonukleotidvorläufer eine freie 5′-terminale Hydroxygruppe trägt. Schritt 2: Kupplung Das Nukleosidphosphoramidit wird vor der Zugabe auf die Festphase in Acetonitril gelöst und mit einem sauren Azolkatalysator wie 1H-Tetrazol oder 5-Ethylthio1H-tetrazol aktiviert. Das Mischen erfolgt mittlerweile meist kurz vor der Zugabe zur Festphase. Das aktivierte Phosphoramidit wird im Überschuss (1,5 bis 20) gegenüber dem trägergebundenen Material zugeführt. Die 5′-Hydroxygruppe des gebunden den Nukleotidbausteins reagiert mit der aktivierten Phosphoramidit-Einheit unter Bildung einer Phosphit-Triester-Bindung. Die Kupplung von 2′-DesoxynukleosidPhosphoramiditen ist sehr schnell und nach etwa 20 s vollständig vollzogen. Die Reaktion ist sehr empfindlich gegenüber Wasser als alternatives Nucleophil. Man verwendet daher wasserfreies Acetonitril. Nach Beendigung der Kupplung werden ungebundene Reagenzien und Nebenprodukte durch Waschen entfernt. Schritt 3: Verschließen (Capping) Das Verschließen (Engl.: Capping) der nicht gekuppelten, an die feste Phase gebundenen 5′-Hydroxygruppe erfolgt durch Zugabe von Essigsäureanhydrid und dient dem Zeck, dass unreagierte 5′-OH-Gruppen von einer Kettenbildung im nächsten Synthesezyklus abgehalten werden. Schritt 4: Oxidation Die neu gebildete Phosphittriester-Bindung ist nicht stabil. Die Behandlung des trägergebundenen Materials mit Iod und Wasser in Gegenwart einer schwachen Base wie Pyridin oxidiert den Phosphittriester zu einem stabilen Phosphattriester. Diese Schritte können beliebig wiederholt werden, bis die gewünschte Sequenz vorliegt. Im letzten Schritt erfolgt die Abspaltung in Abhängigkeit des gewählten Linkers, an dem der erste Nukleotidbaustein geknüpft wurde. In den meisten Fällen werden heutzutage nicht-nukleosidische Linker verwendet, welche basisch unter der Verwendung von Ammoniak in Methanol gespalten werden.
39
40
5 DNA – Bauplan der Proteine
5.3 DNA-Sequenzierung Bei der DNA-Sequenzierung wird die Nukleinsäuresequenz bestimmt – die Reihenfolge der Nukleotide in der DNA. Es umfasst alle Methoden oder Technologien, mit denen die Reihenfolge der vier Basen bestimmt wird: Adenin, Guanin, Cytosin und Thymin. Das Aufkommen schneller DNA-Sequenzierungsmethoden hat die biologische und medizinische Forschung und Entdeckung erheblich beschleunigt.
5.3.1 Polymerasekettenreaktion – PCR Die Polymerasekettenreaktion (Englisch: Polymerase Chain Reaction – PCR) ist eine Methode zur In-vitro-Vervielfältigung (Amplifikation) der Desoxyribonukleinsäure (DNA). Grundlage der PCR ist ein Enzym, die thermostabile DNA-Polymerase, welche die DNA-Bausteine einbauen kann. Analog zum iterativen Synthesezyklus (Abb. 5.7) erfolgt die Vervielfältigung in beliebig wiederholbaren Zyklen, die alle das vorherige Produkt als Ausgang haben. Dies ermöglicht eine exponentielle Amplifikation. Die PCR ist die zentrale Methode der Molekularbiologie. Letztlich beruht die gesamte DNA-Sequenzierung direkt und indirekt auf dieser Technik. Für die Amplifikation eines DNA-Stranges benötigt man folgende Komponenten: • das DNA-Template mit der zu amplifizierenden Zielregion • eine hitzebeständige DNA-Polymerase, die während des Denaturierungsschrittes bei 95 °C intakt bleibt • zwei DNA-Primer, die zu den 3′-Enden jedes Sense- und Antisense-Stranges der Ziel-DNA komplementär sind, da die DNA-Polymerase nur an eine doppelsträngige Region binden und von dort neue DNA-Bausteine einbauen kann • Desoxy-Nukleotid-Triphosphate (dNTP: dATP, dCTP. dGTP, dTTP) – Bezeichnung der Nukleotide, die Triphosphatgruppen enthalten. Aus diesen baut die DNAPolymerase den neuen DNA-Strang auf. • Pufferlösung mit Magnesium-Ionen Mg2+ als Cofaktor der thermostabilen DNAPolymerase Ablauf Der PCR-Prozess umfasst in der Regel 20 bis 50 Zyklen. Diese erfolgen meist in einem sogenannten Thermocycler, kann aber auch in drei unterschiedlich temperierten Wasserbädern durchgeführt werden. Ein einzelner Zyklus besteht aus drei Teilen (Abb. 5.8):
5.3 DNA-Sequenzierung
41
Abb. 5.8 Darstellung der Polymerasekettenreaktion (PCR). a Die Komponenten für die PCR: DNA-Probe, Primer, dNTPs, Taq-Polymerase, Puffer mit Magnesium-Ionen und ein Reaktionsgefäß; b Ablauf der PCR: 1. Denaturierung des Doppelstranges bei 95 °C, 2. Annealing der Primer bei 55 °C, 3. Extension bei 72 °C
Übersicht
1. Denaturierung (Schmelzen oder Englisch: Melting) Die Denaturierung bzw. das Aufbrechen der Wasserstoffbrücken des doppelsträngigen DNA-Templates in zwei Einzelstränge ist der erste Schritt im Amplifikationszyklus. Die Reaktionskammer wird 20–30 s lang auf 94–98 °C erhitzt. 2. Primer-Hybridisierung (Englisch: Primer Annealing) Im nächsten Schritt wird die Reaktionstemperatur für 20–40 s auf 50–65 °C gesenkt, wodurch die Primer an jedes der einzelsträngigen DNA-Templates binden. Das Reaktionsgemisch enthält typischerweise zwei verschiedene Primer: einen für jedes der beiden einzelsträngigen Komplemente, die die Zielregion enthalten. Die Primer sind selbst einzelsträngige Sequenzen, aber viel kürzer als die Länge der Zielregion und ergänzen nur sehr kurze Sequenzen am 3′-Ende jedes Strangs. Es ist wichtig, eine geeignete Temperatur für
42
5 DNA – Bauplan der Proteine
die Hybridisierung zu bestimmen, da Effizienz und Spezifität stark von der Temperatur beeinflusst werden. Diese Temperatur muss niedrig genug sein, um eine Hybridisierung des Primers mit dem Strang zu ermöglichen, aber hoch genug, damit die Hybridisierung spezifisch ist, d. h., der Primer sollte nur an einen perfekt komplementären Teil des Strangs binden und nirgendwo anders. Wenn die Temperatur zu niedrig ist, kann der Primer nicht perfekt binden. Wenn die Temperatur zu hoch ist, bindet der Primer möglicherweise überhaupt nicht. Eine typische Hybridisierungstemperatur liegt bei etwa 3–5 °C unter der Schmelztemperatur (Tm) der verwendeten Primer. Stabile Wasserstoffbrücken zwischen komplementären Basen werden nur gebildet, wenn die Primer-Sequenz sehr genau mit der Template-Sequenz übereinstimmt. 3. Elongation (Amplifikation) Im letzten Schritt bindet die DNA-Polymerase an das Primer-Template-Hybrid und beginnt mit der Bildung des komplementären DNA-Strangs. Die Temperatur in diesem Schritt hängt von der verwendeten DNA-Polymerase ab: Die optimale Aktivitätstemperatur für die thermostabile DNA-Polymerase Taq-Polymerase (Thermus aquaticus) beträgt ungefähr 75–80 °C. Die DNA-Polymerase synthetisiert einen neuen DNA-Strang, indem sie freie dNTPs aus dem Reaktionsgemisch hinzufügt, der zum Template in 5′-zu-3′-Richtung komplementär ist, wobei die 5′-Phosphatgruppe der dNTPs kondensiert wird. Die genaue Zeit, die für die Verlängerung benötigt wird, hängt sowohl von der verwendeten DNA-Polymerase als auch von der Länge der zu amplifizierenden DNA-Zielregion ab. Als Faustregel gilt, dass die meisten DNA-Polymerasen bei ihrer optimalen Temperatur tausend Basen pro Minute polymerisieren. Unter optimalen Bedingungen (d. h., wenn es keine Einschränkungen aufgrund begrenzender Substrate oder Reagenzien gibt) wird bei jedem Verlängerungsschritt die Anzahl der DNA-Zielsequenzen verdoppelt. Mit jedem aufeinanderfolgenden Zyklus werden die ursprünglichen Templatestränge plus alle neu erzeugten Stränge zu zusätzlichen Templatesträngen für die nächste Verlängerungsrunde, was zu einer exponentiellen Amplifikation der spezifischen DNA-Zielregion führt.
Die Teilschritte der Denaturierung, der Hybridisierung und der Elongation bilden einen einzigen Zyklus. Es sind mehrere Zyklen erforderlich, um die DNA so weit wie gewünscht zu amplifizieren. Die Formel zur Berechnung der Anzahl der nach einer bestimmten Anzahl von Zyklen gebildeten DNA-Kopien lautet daher 2n, wobei n die Anzahl der Zyklen ist. Somit führt ein Reaktionssatz für 30 Zyklen zu 230 oder 1.073.741.824 Kopien der ursprünglichen doppelsträngigen Ziel-DNA.
5.3 DNA-Sequenzierung
43
5.3.2 Sanger-Abbruchsequenzierung Als Sequenzierung bezeichnet man die Bestimmung der Reihenfolge der vier Bausteine Adenin, Cytosin, Guanin und Thymin. Anhand der Reihenfolge kann auf die codierte Aminosäure und damit auf das Protein geschlossen werden. Die erste und lange Zeit einzige Methode zur DNA-Sequenzierung war die nach ihrem Erfinder Frederick Sanger benannte Sanger-Sequenzierung, die im Jahr 1977 entwickelt wurde. Die Sanger-Sequenzierung ist eine Abwandlung der PCR mit dem Unterschied, dass den dNTPs kettenterminierende Didesoxynukleotide (ddNTPs) zugegeben werden. Seit der Jahrtausendwende wurden wirtschaftlichere Methoden zur Sequenzierung ganzer Genome (Next-Generation Sequencing) entwickelt. Die Sanger-Sequenzierung wird aber bis heute wegen ihrer hohen Genauigkeit für die Sequenzierung kurzer DNA-Stränge von bis zu 500 Nukleotiden verwendet. Wie in Abb. 5.9 gezeigt, benötigt das klassische Kettenabbruchverfahren nach Sanger ähnlich wie die PCR • ein einzelsträngiges DNA-Template, dessen Sequenz man wissen will, • DNA-Primer, die an das Template binden, • DNA-Polymerase,
Abb. 5.9 Sanger-Sequenzierung mit der Abbruchmethode mit Hilfe von ddNTPs
44
5 DNA – Bauplan der Proteine
Abb. 5.9 (Fortsetzung)
• Desoxyribonukleotidetriphosphate (dNTPs), • Didesoxyribonukleotidtriphosphate (ddNTPs), die die durch die DNA-Polymerase katalysierte Kettenverlängerung beenden. Wie erwähnt, beruht die Sanger-Sequenzierung auf den Didesoxyribonukleotidtriphospha ten (ddNTPs). Diesen kettenterminierenden Nukleotiden fehlt eine 3 ′-OH-Gruppe, die für die Bildung einer Phosphodiesterbindung zwischen zwei Nukleotiden erforderlich ist, was dazu führt, dass die DNA-Polymerase die Verlängerung der DNA beendet, wenn ein modifiziertes ddNTP eingebaut wird. Die Konzentration der Didesoxynukleotide (ddNTPs) sollte ungefähr 100-fach höher sein als die des entsprechenden Desoxynukleotids (z. B. 0,5 mM ddTTP zu 0,005 mM dTTP), damit genügend Fragmente produziert werden
5.3 DNA-Sequenzierung
45
können, während die vollständige Sequenz noch transkribiert wird. Die ddNTPs sind meist entsprechend ihrer Base zu deren Nachweis radioaktiv- bzw. fluoreszenzmarkiert. In der anschließenden Gelelektrophorese werden die unterschiedlich langen PCR-Produkte aufgetrennt. Anhand des spezifischen Fluoreszenzsignals für eine Base, kann für jede Position auf die entsprechende Base geschlossen werden. Die Sanger-Sequenzierung markiert einen wichtigen Meilenstein in der Genomforschung. Allerdings können immer nur kurze DNA-Stücke mit dieser Methode sequenziert werden, da a) die Längen der verwendeten Gele der Elektrophorese limitiert sind und b) aus wirtschaftlicher Sicht durch den Kettenabbruch enorme Mengen an DNA benötigt werden. Die erste Sequenzierung eines menschlichen Genoms basierte im Grunde auf der Sanger-Sequenzierung. Die Kosten dafür lagen bei mehr als 1 Mrd. EUR. Und das war damals nur möglich, da große DNA-Stränge mit Hilfe von Restriktionsendonukleasen spezifisch in kleinere Stränge geschnitten werden konnten und bekannt war, wo die Restriktionsendonukleasen die DNA spezifisch schneiden. Zudem ermöglichte erst die stark gestiegene Rechenleistung der Computer ab Ende der 1 990er-Jahre diese Schnipsel aus der Vielzahl an Sanger-Sequenzierungsexperimenten wieder zusammenzusetzen.
5.3.3 Next-Generation-Sequenzierung Im Gegensatz zur klassischen Sanger-Sequenzierung hat sich eine Reihe wirtschaftlich effizienterer Methoden zur Ganzgenomsequenzierung (Englisch: Whole Genome Sequencing – WGS) durchgesetzt. Die Kosten für die Sequenzierung sind von über einer Milliarde EUR mit der Sanger-Sequenzierung auf wenige hundert EUR gesunken. Diese neuen Methoden fallen unter den Begriff des Next-Generation Sequencing (NGS), zu Deutsch Sequenzierung der nächsten Generation. Mittlerweile gibt es eine Vielzahl unterschiedlicher NGS-Methoden am Markt, über die man schnell den Überblick verlieren kann. Zum Verständnis wichtiger ist, was alle diese Methoden technisch gemeinsam haben: Sequenzierung durch Synthese. Wie im Abschn. 5.3.1 nutzen die neuen Methoden zur Genomsequenzierung Restriktionsendonukleasen, um die DNA spezifisch in kleine Teile zu schneiden. Mit den mittlerweile noch schnelleren Computern können die Sequenzierungsprodukte noch effizienter zu dem Gesamtgenom zusammengesetzt werden. Die entscheidende Innovation aller dieser Methoden war, dass die benötigte DNA-Menge durch das Vermeiden eines unwiderruflichen Abbruchs der Kettenverlängerung drastisch gesenkt wurde. In Abb. 5.10 sind die DNA-Bausteine der Sequenzierung nach der Firma Solexa gezeigt. Der Fluorophor ist spezifisch für die jeweilige Base und wie die 3′-OH-Gruppe mit einem Azid geschützt. Das heißt, nach Einbau der Base kann durch ein Fluoreszenzsignal die Base an dieser Stelle nachgewiesen werden. Im nächsten Schritt erfolgt der chemische Angriff auf die beiden Azide. Als Folge wird der Fluorophor abgespalten und die 3′-OH-Gruppe liegt entschützt vor. Im nächsten Schritt koppelt die DNA-Polymerase
46
5 DNA – Bauplan der Proteine
Abb. 5.10 Beispiel für eine Sequenzierung durch Synthese. a Der Baustein mit dem basenspezifischen Fluorophor und der geschützten 3′-OH-Gruppe; b mit der Abspaltung des Fluorophors wird gleichzeitig die 3′-OH-Gruppe freigesetzt, die am nächsten Synthesezyklus teilnehmen kann
basierend auf dem komplementären DNA-Template den nächsten Baustein ein. Die Base wird wieder anhand des Fluorophors nachgewiesen. Im Anschluss wird der Fluorophor wieder abgespalten, damit er im nächsten Schritt nicht stört. Außerdem wird die 3′-OH-Gruppe entschützt, um mit dem nächsten DNA-Baustein koppeln zu können. Im Gegensatz zum Sanger-Verfahren benötigt man nur einen DNA-Strang und nicht mehrere DNA-Stränge, die kontinuierlich nach jeder Base abbrechen. Diese Sequenzierung durch Synthese (Englisch: Sequencing by Synthesis) spart enorme DNA-Mengen.
5.3.4 DNA-Microarray Eine weitere, kostengünstige Methode zur (nicht vollständigen) DNA-Sequenzierung ist der DNA-Microarray. Ein DNA-Microarray (auch allgemein als DNA-Chip oder Biochip bekannt) ist eine Sammlung mikroskopischer DNA-Spots, die an einer festen Oberfläche haften. Ursprünglich wies man mit dieser Methode die Expression eines Gens über die Detektion der gebildeten mRNA nach. Hierzu werden einige Picomol (10−12 mol) der zu testenden DNA-Sequenz, die mit einer Fluoreszenzsonde versehen ist, auf einem Träger (meist Glas) immobilisiert. Im nächsten Schritt wird die zu untersuchende mRNA hinzugegeben. Bindet
5.3 DNA-Sequenzierung
47
eine der mRNAs an die immobilisierten Sonden wird das Fluoreszenzsignal gequencht, d. h. unterbunden. Da genau definiert ist, welche Sonde an welcher Stelle auf dem Chip aufgetragen wurde, kann darauf geschlossen werden, welche mRNA gebunden bzw. welches Gen exprimiert wurde. Mittlerweile können DNA-Microarray auch zur Sequenzierung verwendet werden (Abb. 5.11). Durch die großen Sequenzierungsprojekte wissen wir, dass die DNA aus
Abb. 5.11 Beispiel für die Genotypisierung mit Hilfe eines DNA-Microarrays
48
5 DNA – Bauplan der Proteine
ca. 3,2 Mrd. Basenpaaren besteht. In ca. 335 Mio. Positionen, sogenannten Einzelnukleo tidpolymorphismen (Englisch: Single Nucleotide Polymorphisms – SNPs) unterscheiden sich die einzelnen Genome. Davon treten ca. 15 Mio. in verschiedenen Populationen weltweit mit einer Häufigkeit von mehr als 1 % auf. Anstatt das ganze Genom kostenintensiv zu sequenzieren, testet man mit dem Chip nur die häufigsten Unterschiede (Einz elnukleotidpolymorphismen). Dazu werden allelspezifische Oligonukleotidsonden (ASO-Sonden) häufig auf der Grundlage der Sequenzierung einer repräsentativen Gruppe von Personen ausgewählt: Positionen, bei denen festgestellt wurde, dass sie in der Gruppe mit einer bestimmten Häufigkeit variieren, werden als Grundlage für Sonden verwendet. Dabei werden SNP-Chips im Allgemeinen durch die Anzahl der von ihnen getesteten SNP-Positionen beschrieben. Im Gegensatz zu einem Genexpressionstest müssen für jede SNP-Position zwei Sonden verwendet werden, um beide Allele nachzuweisen. Wenn nur eine Sonde verwendet würde, könnte Homozygotie nicht von der Heterozygotie des untersuchten Allels unterschieden werden. Zusammenfassung Das Genom besteht aus langen Ketten der Desoxynukleinsäurebausteinen Adenin, Thymin, Guanin und Cytosin, die auf Proteinen, den sogenannten Histonen, aufgewickelt die einzelnen Chromosomen bilden. Die Abfolge der D NA-Buchstaben codieren für Proteine. Kurze DNA- und RNA-Oligonukleotide werden können an der Festphase schnell synthetisiert werden. Von größerem Interesse war lange die Aufklärung der Sequenz (Sequenzierung). Notwendige Techniken sind die Polymerasekettenreaktion, die Sanger-Abbruchsequenzierung, die Next-Generation-Sequenzierung durch Synthese sowie DNA-Microarrays.
6
Genomische Variation
Inhaltsverzeichnis 6.1 Genomweite Assoziationsstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 6.2 Feinkartierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.3 Polygenic Risk Score. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 6.4 Drug Target Linkage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 6.5 Phänomen-weite Assoziationsstudie – PheWAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Alle Menschen haben nahezu das gleiche Genom mit einer fast identischen DNASequenz von mehr als 3,2 Mrd. Basenpaaren (also 6,4 Mrd. DNA-Buchstaben). Zwischen Individuen bestehen nur geringfügige Unterschiede, die jeden von uns einzigartig machen. Diese Unterschiede, genetische Varianten genannt, treten an bestimmten Stellen innerhalb der DNA auf. Die Reihenfolge der DNA-Bausteine ist ein Code. Dieser Code besteht aus den vier Bausteinen Adenin, Thymin, Cytosin und Guanin, abgekürzt mit den Buchstaben A, T, C und G. Eine genetische Variante tritt an einer Stelle innerhalb der DNA auf, an der sich dieser Code zwischen Menschen unterscheidet. Die einfachste Form von genetischer Variation ist ein Unterschied in der vorhandenen Nukleotidbase. Diese Arten von Varianten werden als Einzelnukleotidpolymorphis men (Single Nucleotide Polymorphism – SNP) bezeichnet. Von 3,2 Mrd. Basenpaaren unterscheiden sich die Menschen in ca. 335 Mio. Positionen. Davon treten nur 15 Mio. über mehrere Populationen weltweit häufiger als zu 1 % auf. Abb. 6.1 zeigt die zwei Kopien eines DNA-Moleküls aus derselben Region zweier unterschiedlicher Individuen. Beachten Sie, dass die Basen in den beiden Genomen sich unterscheiden: In Abb. 6.1a sieht man ein CG-Paar, während in Abb. 6.1b ein TG-Paar auftritt. Bei einem SNP ist aufgrund der komplementären Strukturen der DNA auch immer der andere Strang betroffen. Da das Genom in Form von doppelten Chromosomen diploid ist, treten SNPs als wildtyp, heterozygot oder homozygot auf. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2020 M. F. Schmidt, Chemische Biologie, https://doi.org/10.1007/978-3-662-61116-6_6
49
50
6 Genomische Variation
Abb. 6.1 Einzelne Unterschiede im Genom bezeichnet man als genetische Varianten. Treten diese häufiger als zu 1 % auf, werden sie als Einzelnukleotidpolymorphismen bezeichnet. Bei einer geringeren Häufigkeit spricht man von Mutation. a CG-Paar, b TG-Paar im Genom zweier Individuen
Es gibt ungefähr 15 Mio. solcher genetischen Varianten im Genom eines Individuums (Abb. 6.2). Diese Varianten können für diese Person einzigartig sein oder auch in anderen vorkommen. Einige Varianten erhöhen das Risiko, an Krankheiten zu leiden, während andere dieses Risiko verringern können. Andere dagegen haben gar keinen Einfluss auf das Krankheitsrisiko. Neben den Einzelnukleotidpolymorphismen gibt es noch die Deletion (Löschung), die Insertion (zusätzlicher Einbau) und die Translokation (Ortsveränderung/Versetzung) von DNA-Buchstaben, die die genetische Variation beeinflussen. Die Frage ist: Wie beeinflussen diese genetischen Varianten das Risiko für bestimmte Krankheiten? Heutzutage unterteilt man genetische Krankheiten in zwei Klassen ein: solche, die mit einem einzelnen Gen assoziiert sind (monogenisch: mono = einzeln; genisch: genetisch), und solche, die von mehreren Genen (polygenisch; poly = viele; genisch = genetisch) und Umweltfaktoren beeinflusst werden. Viele Krankheiten liegen in einem Spektrum zwischen diesen beiden Extremen. Viele Erbkrankheiten lassen sich auf Varianten in einem einzigen Gen zurückführen (Abb. 6.3). Beispielsweise Mukoviszidose (oder auch Cystische Fibrose genannt), eine fortschreitende genetische Erkrankung, die auf einer einzelnen Mutation in einem ChloridIonenkanal (Cystic Fibrosis Transmembrane Conductance Regulator – CFTR-Gen auf
6 Genomische Variation
51
Abb. 6.2 Genetische Varianten sind über das ganze Genom verteilt
Chromosom 7) beruht, führt zu Lungeninfektionen und schränkt die Atmungsfähigkeit stark ein, da durch den defekten Ionenkanal der Schleim nicht verflüssigt wird und viskos bleibt. Krankheiten, die auf dem Defekt eines Gens beruhen, werden auch Mendel’sche Krankheiten (Englisch Mendelian Diseases) genannt, da sie im Erbgang den Mendel’schen Regeln folgen. Komplexe, auch polygenische Krankheiten genannt entstehen durch viele genetische Varianten, gepaart mit Umwelteinflüssen (wie Ernährung, Schlaf, Stress und Rauchen). Ein Beispiel ist die Erkrankung der Herzkranzgefäße (Koronare Herzerkrankung). Bisher haben Forscher etwa 60 genetische Varianten gefunden, die bei Menschen mit koronarer Herzkrankheit häufiger vorkommen. Die meisten dieser Varianten sind über das Genom verteilt und gruppieren sich nicht auf einem bestimmten Chromosom (Abb. 6.4). Die Forscher identifizieren diese genetischen Varianten, die mit komplexen Krankheiten assoziiert sind, indem sie die Genome von Individuen mit und ohne diese Krankheiten vergleichen, sogenannte genomweite Assoziationsstudien (GWAS).
52
6 Genomische Variation
Abb. 6.3 Bei einer monogenischen Erkrankung ist nur ein Gen auf einem Chromosom betroffen
Abb. 6.4 Bei einer polygenischen Erkrankung handelt es sich oftmals um ein komplexes vZusammenspiel vieler Gene auf unterschiedlichen Chromosomen
6 Genomische Variation
53
Beim Vergleich von Genomen gesunder (Kontrollen) und erkrankter (Fälle) Teilnehmer hat sich zur Beschreibung der genetischen Varianten folgende Terminologie entwickelt: Referenzallel
Das Referenzallel ist das Nukleotid, welches im hier verwendeten Referenzgenom vorkommt. Es ist wichtig, hier immer das konkrete Referenzgenom zu nennen, auf das man sich bezieht. Beispiel: Genome Reference Consortium GRCh38 vom Dezember 2013. Variantenallel Das Variantenallel ist ein anderes Nukleotid, das an dieser Stelle im Genom vorkommt, im Vergleich zum Referenzallel. In der Regel wird nur ein Allel beobachtet, das von der Referenzsequenz abweicht. An einigen Stellen sind jedoch mehrere Unterschiede zu erkennen. Effektallel Das Effektallel ist das Allel, mit dem die Größe des beobachteten phänotypischen Effekts gemessen werden kann. Minor Allel Das Nebenallel (meist Englisch Minor Allel genannt) ist das Nukleotid, das an dieser Position in der untersuchten Population am seltensten vorkommt. Normalerweise, aber nicht immer, ist das Minor Allel dasselbe wie das Effektallel. Bei einem Vergleich unterschiedlicher Populationen, z. B. von europäischer und asiatischer Abstammung, kann sich das Minor-Allel unterscheiden. Das heißt, ein Allel, das in einer europäischen Population vorherrschend ist, kann in einer asiatischen Population ein Minor Allel sein. Des Weiteren zeigen Variantenallele folgende Eigenschaften. Allelhäufigkeit Jedes Allel kommt in einer Population mit einer bestimmten Häufigkeit, oder auch Frequenz genannt, vor. Die Allelfrequenz wird ausgedrückt als ein Bruchteil oder Prozentsatz der Chromosomen, die das Allel in der untersuchten Population tragen. Beispielsweise liegt ein Allel mit einer Häufigkeit von 0,2 auf 20 % der Chromosomen vor. Da Individuen entweder homozygot für das Allel sein können – sie
54
6 Genomische Variation
tragen zwei Kopien – oder heterozygot – sie tragen eine Kopie –, kann der Anteil der Personen, die ein Allel tragen, nicht mit der Allelhäufigkeit gleichgesetzt werden. Nebenallelfrequenz Die Nebenallelhäufigkeit (Englisch: Minor Allel Frequency – MAF) bezeichnet die Häufigkeit des untergeordneten Allels in einer bestimmten Population. MAF ist äquivalent zu der Effekt-Allelfrequenz, wenn die Neben- und die Effekt-Allele die gleichen sind. Varianten mit MAF von über 5 % gelten als häufig; Varianten mit MAF zwischen 0,05 % und 5 % werden als niederfrequent bezeichnet. Varianten mit einer MAF von