130 79 44MB
German Pages [363] Year 2023
Aus dem Lektorat
Liebe Leserin, lieber Leser, herzlich willkommen in der faszinierenden Welt der künstlichen Intelligenz! Ein Bereich, der immer mehr Einzug in unseren Alltag hält. Dieses Workbook führt Sie nicht nur in das Thema KI ein, sondern beleuchtet es aus verschiedenen, praxisnahen Perspektiven. Vielleicht haben Sie schon einmal davon geträumt, Ihre Texte mit Hilfe von KI zu optimieren oder künstlerische Werke zu verfeinern? Oder sind Sie neugierig, wie KI in Bildung, Wissenschaft oder einfach zum Zeitvertreib eingesetzt werden kann? Dieses Buch zeigt Ihnen alle Möglichkeiten detailliert auf, selbst wenn Sie bisher keinerlei Vorkenntnisse auf diesem Gebiet hatten. Rainer Hattenhauer möchte Sie nicht nur informieren, sondern auch inspirieren. Jedes Kapitel enthält nützliche Beispiele und Werkzeuge, mit denen Sie die vorgestellten Konzepte sofort in die Praxis umsetzen können. Dieses Buch soll eine Brücke schlagen zwischen der oft unverständlichen Welt der Technologie und Ihrem Alltag, indem es zeigt, wie KI Ihnen wirklich nützen kann. Dieses Buch wurde mit größter Sorgfalt geschrieben und hergestellt. Sollten Sie dennoch Fragen, Kritik oder inhaltliche Anregungen haben, freue ich mich, wenn Sie mit mir in Kontakt treten.
Ihr Erik Lipperts Lektorat Rheinwerk Computing
[email protected] www.rheinwerk-verlag.de Rheinwerk Verlag · Rheinwerkallee 4 · 53227 Bonn
Auf einen Blick
Auf einen Blick 1
KI-Bots – der Produktivitäts- und Kreativitätsschub .......................................
11
2
Intelligente Textverarbeitung ..................................................................................
43
3
KI in Bildung und Wissenschaft ...............................................................................
89
4
Kunst mit KI ..................................................................................................................... 143
5
KI im Alltag ...................................................................................................................... 195
6
KI für Coder ...................................................................................................................... 223
7
KI zum Zeitvertreib ....................................................................................................... 259
8
KI für Fortgeschrittene ................................................................................................ 279
9
KI und kein Ende? .......................................................................................................... 321
Impressum
Impressum Dieses E-Book ist ein Verlagsprodukt, an dem viele mitgewirkt haben, insbesondere: Lektorat Erik Lipperts Korrektorat Annette Lennartz, Bonn Herstellung E-Book Nadine Preyl Covergestaltung Mai Loan Nguyen Duy Coverbild iStockphoto: 1312529828 © miniseries, 1391947389 © filo Satz E-Book SatzPro, Krefeld Bibliografische Information der Deutschen Nationalbibliothek: Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. ISBN 978-3-8362-9735-6 1. Auflage 2024, 2. Nachdruck 2024 © Rheinwerk Verlag GmbH, Bonn 2024 www.rheinwerk-verlag.de
Inhalt
Inhalt 11
1 1.1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Hallo Bot-Welt! ......................................................................................................................... 12 1.1.1 1.1.2
1.2 1.3
1.4
11
Startschuss und Hype .......................................................................................... 12 Die Ahnengalerie der modernen Chatbots ................................................... 17
Dein Fahrplan in eine produktive, kreative Zukunft ............................................... 18 ChatGPT – First Contact ........................................................................................................ 21 1.3.1 1.3.2 1.3.3
Einen Account bei OpenAI anlegen ................................................................. 23 Erste Schritte mit ChatGPT ................................................................................. 24 Was darf es kosten? .............................................................................................. 28
1.3.4
Wir müssen leider draußen bleiben … ............................................................ 30
Ein Zoo voller Bots ................................................................................................................... 32 1.4.1 1.4.2 1.4.3 1.4.4 1.4.5 1.4.6
DeepL ......................................................................................................................... DeepL Write ............................................................................................................. DALL-E ........................................................................................................................ Midjourney .............................................................................................................. Unendliche Weiten … ........................................................................................... Der Beipackzettel: Warnung vor (zu) großen Erwartungen und Gefahren ...................................................................................................................
33 33 35 37 39 40
43
2 2.1
Intelligente Textverarbeitung
Der KI-Sekretär ......................................................................................................................... 43 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5
2.2
43
E-Mails beantworten ............................................................................................ Formelle Schreiben ............................................................................................... Erörterungen und Entscheidungsfindung .................................................... Gutachten und Dokumentationen .................................................................. Ansprachen und Festreden ................................................................................
43 45 47 50 52
Rechtschreib- und Formulierungshilfen ........................................................................ 55 2.2.1 2.2.2 2.2.3
Eine Bewerbung schreiben ................................................................................. 55 Einen eigenen Text bezüglich Rechtschreibung, Grammatik und Ausdruck prüfen und korrigieren ..................................................................... 56 Einen Text aus Fragmenten erstellen ............................................................. 58
5
Inhalt
2.3
KI für Medienprofis ................................................................................................................. 61 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5
2.4
2.5
61 65 67 68 69
KI für Literaten .......................................................................................................................... 70 2.4.1 2.4.2 2.4.3
Ganze Bücher zusammenfassen ...................................................................... 71 Informationen aus Artikeln und Webseiten extrahieren ........................ 72 Eigene literarische Texte verfassen ................................................................. 73
2.4.4
Gedichte schreiben lassen .................................................................................. 74
Der KI-Babelfisch ..................................................................................................................... 75 2.5.1 2.5.2 2.5.3
2.6
Erzeugen journalistischer Texte ....................................................................... Einen Blogartikel schreiben (lassen) ............................................................... Die Anmoderation für einen Podcast erstellen ........................................... Ein Skript für ein YouTube Video erstellen .................................................... Besser gefunden werden mit KI-SEO ..............................................................
ChatGPT als Simultanübersetzer ..................................................................... 76 DeepL – der Perfektionist .................................................................................... 77 LanguageTool – das Schweizer Taschenmesser für Rechtschreib-, Grammatik und Stilprüfung ................................................. 78
KI-Tools im Job einsetzen ..................................................................................................... 79 2.6.1 2.6.2 2.6.3 2.6.4
Daten extrahieren ................................................................................................. Präsentationen erstellen (lassen) .................................................................... Eine Marketingstrategie erstellen ................................................................... Privatmodus für ChatGPT aktivieren ..............................................................
79 82 84 87
89
3
KI in Bildung und Wissenschaft
3.1
ChatGPT – der Stein der Weisen des Digitalzeitalters ............................................ 90 3.1.1 3.1.2
3.2
Literarische Zusammenfassungen und Analysen ...................................... Aufsätze & Co. ........................................................................................................ KI im fremdsprachlichen Unterricht ............................................................... Unterstützung bei Referaten und Präsentationen .................................... ChatGPT als Gesprächs- und Diskussionspartner ......................................
95 98 100 105 107
KI für Lehrer*innen .................................................................................................................. 110 3.3.1 3.3.2
6
Komplexe Themen – einfach erklärt ............................................................... 90 Was tun bei Fehlern? ............................................................................................ 93
KI für Schüler*innen ............................................................................................................... 94 3.2.1 3.2.2 3.2.3 3.2.4 3.2.5
3.3
89
(Übungs-)Aufgaben erstellen ............................................................................ 111 KI als Unterrichtsassistent .................................................................................. 115
Inhalt
3.3.3 3.3.4
3.4
Rechnen mit KI-Power ........................................................................................................... 124 3.4.1 3.4.2 3.4.3
3.5
KI als Korrekturhilfe .............................................................................................. 118 Der KI-Muttersprachler ........................................................................................ 122 ChatGPT als besserer Taschenrechner ........................................................... 125 ChatGPT als Aufgabenlöser und -erklärer ..................................................... 127 ChatGPT als Mathematikerklärer ..................................................................... 129
Die KI-Akademie ...................................................................................................................... 133 3.5.1 3.5.2
Der KI-Literaturassistent ..................................................................................... 133 Der wissenschaftliche Schreibassistent ........................................................ 137
3.5.3
Der KI-Prüfungs- und Klausurassistent .......................................................... 139
143
4
Kunst mit KI
4.1
Bilder mit KI erstellen ............................................................................................................ 144 4.1.1 4.1.2 4.1.3 4.1.4
4.2
145 150 157 167
KI-gestützte Bildanalyse und Bildmanipulation ....................................................... 170 4.2.1 4.2.2 4.2.3
4.3
Einstieg in die bildgenerative KI ....................................................................... Einstieg in Midjourney ......................................................................................... Bild-KIs entfesseln ................................................................................................. Bilder per Zooming erweitern/Inpainting .....................................................
143
Bilder analysieren und verschlagworten ....................................................... 170 Eigenes Material per KI verändern ................................................................... 172 Spezialtechniken und -tools nutzen ................................................................ 176
KI multimedial einsetzen ..................................................................................................... 183 4.3.1 4.3.2 4.3.3
KI-Sprachsynthese ................................................................................................. 183 KI und Musik ............................................................................................................ 186 KI-Videotools ........................................................................................................... 193
195
5 5.1
KI im Alltag
195
ChatGPT & Co. – deine persönlichen Assistenten .................................................... 195 5.1.1 5.1.2 5.1.3 5.1.4 5.1.5 5.1.6
KI im handwerklichen Bereich ........................................................................... Der KI-Berater ......................................................................................................... KI als Recherchewerkzeug .................................................................................. KI als Sparringspartner für Einstellungsgespräche .................................... Brainstorming mit KI ............................................................................................ KI im Finanzbereich ...............................................................................................
195 197 200 203 205 207
7
Inhalt
5.2
Intelligent suchen .................................................................................................................... 209 5.2.1 5.2.2 5.2.3 5.2.4 5.2.5
Die Trainingsdaten von ChatGPT offline durchforsten ............................ ChatGPT mit dem Internet verknüpfen ......................................................... Inhalte aus Dokumenten oder Webseiten verarbeiten ............................ Spezialisierte KI-Suchmaschinen ..................................................................... KI-gestützte Bildsuche .........................................................................................
210 211 214 217 219
223
6 6.1
KI für Coder
Programmieren lernen mit KI ............................................................................................ 223 6.1.1 6.1.2 6.1.3 6.1.4
6.2
Erste Schritte ........................................................................................................... Klassische Algorithmen finden und nutzen ................................................. Debugging, Codeinterpretation und Dokumentation .............................. Code direkt in ChatGPT ausführen ..................................................................
224 226 230 233
Programmieren für Fortgeschrittene ............................................................................. 235 6.2.1 6.2.2 6.2.3 6.2.4
6.3
223
Intelligente IDEs nutzen ...................................................................................... Scripting .................................................................................................................... Zugriff auf ChatGPT per API ............................................................................... Hacking mit ChatGPT ...........................................................................................
235 240 243 245
KI und Tabellen ......................................................................................................................... 250 6.3.1 6.3.2
Tabellen mit Bordmitteln erstellen ................................................................. 251 Excel und ChatGPT ................................................................................................ 253
259
7 7.1
KI zum Zeitvertreib
ChatGPT als Gesprächspartner .......................................................................................... 259 7.1.1 7.1.2 7.1.3 7.1.4
7.2
Mit einem Bot diskutieren .................................................................................. KI-basierte Entscheidungsfindung .................................................................. KI-unterstützt Rätsel lösen ................................................................................. Kurzweil mit KI .......................................................................................................
259 261 262 264
KI für Gamer ............................................................................................................................... 265 7.2.1 7.2.2
8
259
Eigene Spiele per KI bauen ................................................................................. 265 Tipps zu Spielen erhalten .................................................................................... 268
Inhalt
7.3
KI für Literaten .......................................................................................................................... 269 7.3.1 7.3.2
7.4
Kurzgeschichten und Bücher schreiben ......................................................... 269 Das geht doch besser ... ....................................................................................... 272
Rollenspiele ................................................................................................................................ 274 7.4.1 7.4.2
Multiple Persönlichkeiten ................................................................................... 274 KI-Bots mit speziellen Fähigkeiten .................................................................. 276
279
8 8.1
KI für Fortgeschrittene
Tipps und Tricks zu ChatGPT ............................................................................................... 279 8.1.1 8.1.2 8.1.3 8.1.4 8.1.5 8.1.6 8.1.7 8.1.8
8.2
279
Oberflächliches ...................................................................................................... Chats sichern und exportieren .......................................................................... KI-Bots in anderen Anwendungen ................................................................... Plug-ins installieren und nutzen ...................................................................... Der Weg zum perfekten Prompt ...................................................................... Selbstoptimierende Prompts ............................................................................. Auto-Prompting ..................................................................................................... Datenanalyse mit dem Plug-in Code Interpreter ........................................
279 282 284 286 293 300 302 305
ChatGPT-Hacks ......................................................................................................................... 307 8.2.1 8.2.2 8.2.3 8.2.4 8.2.5 8.2.6 8.2.7
Ergebnisse gezielt steuern .................................................................................. ChatGPT personalisieren/Custom Instructions .......................................... Halluzinieren der KI per Kreuzverhör vermeiden ........................................ Generative KI-Bots identifizieren ..................................................................... Feintuning von Prompts im OpenAI Playground ........................................ ChatGPT Jailbreak .................................................................................................. KI-Texte identifizieren – geht das? ..................................................................
308 309 311 311 313 315 318
321
9
KI und kein Ende?
9.1
Chancen durch KI ..................................................................................................................... 321
321
9.1.1 9.1.2 9.1.3
Arbeitsmarkt ........................................................................................................... 322 Wissenschaft und Forschung ............................................................................ 324 Bildung ...................................................................................................................... 325
9.1.4 9.1.5 9.1.6
Gesundheit .............................................................................................................. 326 Gesellschaft ............................................................................................................. 328 Zukunftsperspektiven .......................................................................................... 329
9
Inhalt
9.2
Risiken durch KI ........................................................................................................................ 331 9.2.1 9.2.2 9.2.3
Schwächen der KI .................................................................................................. 332 Datenschutz & Co. ................................................................................................ 336 Auswirkungen von KI auf die Gesellschaft ................................................... 341
321
Anhang A
346
Glossar .......................................................................................................................................... 346
Index ............................................................................................................................................................. 355
10
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Kapitel 1 KI-Bots – der Produktivitätsund Kreativitätsschub Sie haben unsere alltägliche Welt längst auf den Kopf gestellt – die Werkzeuge der künstlichen Intelligenz. ChatGPT, DALL-E, Midjourney & Co. sind spätestens seit Ende des Jahres 2022 in aller Munde. Im ersten Kapitel erfährst du, wie du die Bots in verschiedenen Bereichen produktiv einsetzen kannst, um Zeit zu sparen – sei es im Beruf, im Studium oder bei täglichen Aufgaben. Zudem zeigen wir dir Schritt für Schritt, wie du Zugang zu diesen beeindruckenden Technologien erhältst, damit du schnell von deren Vorteilen profitieren kannst. Begleite uns auf dieser Entdeckungsreise und lass dich von der Macht der künstlichen Intelligenz begeistern!
Die einleitenden Worte klingen ziemlich dick aufgetragen, oder? Das liegt wohl daran, dass ich einen der Protagonisten des Buches – nämlich ChatGPT – dazu »missbraucht« habe, eine kurze Einleitung zum vorliegenden Kapitel zu schreiben. Aber keine Angst, für den Rest des Buches lasse ich den Textautopiloten im Wesentlichen links liegen und übernehme selbst das Steuer. So genial uns die Möglichkeiten aktueller KI1-Systeme auch erscheinen, eines können sie (noch) nicht: ein komplettes Fachbuch wie das vorliegende selbstständig verfassen und dabei die im Netz reichlich vorhandene Informationsspreu zum Thema KI-Bots vom Weizen zu trennen. Der Schwerpunkt dieses Buches liegt auf der praktischen Anwendung aktueller Werkzeuge der künstlichen Intelligenz. Wir werden uns durch eine Vielzahl typischer Szenarien arbeiten, und ich wage die kühne Prognose, dass sich jede Leserin und jeder Leser in einigen der beschriebenen Szenarien wiedererkennen und so manchen Aha-Moment erleben wird. Ziel ist es, dir die passenden Werkzeuge an die Hand zu geben, um monotone Arbeiten, die üblicherweise Stunden erfordern, in wenigen Minuten zu erledigen, 1 Wichtige technische Begriffe werden im Glossar am Ende des Buches in einfacher Sprache erklärt. Dadurch ist sichergestellt, dass der Lesefluss nicht durch ein Übermaß an technischen Erklärungen gestört wird. Mehr zum didaktischen Aufbau des Buches findest du in Abschnitt 1.2, »Dein Fahrplan in eine produktive, kreative Zukunft«.
11
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
aber auch um wahre Feuerwerke der Kreativität zu entfachen. Klingt verlockend? Dann nichts wie rein in die schöne neue Welt der KI-Assistenten!
1.1 Hallo Bot-Welt! Es gibt Schlüsselereignisse, die sich ins Gedächtnis eingebrannt haben. Die Angehörigen meiner Generation wissen beispielsweise ziemlich genau, wo sie sich befunden haben, als die Flugzeuge beim Terroranschlag des 11. Septembers 2001 in die Twin Towers in New York einschlugen. Andere Ereignisse zeigen erst nach und nach ihre grundlegende Bedeutung für die Zukunft. Im IT-Bereich sind dies sicherlich die Erfindung der Beschreibungssprache HTML durch Tim Berners-Lee im Jahr 1989 – quasi die DNA des modernen World Wide Web – sowie die Vorstellung des ersten iPhones durch Steve Jobs im Jahr 2007. Die Frage, die sich vermutlich die aktuelle Generation in der Zukunft stellen wird, lautet: Wo warst du, als du das erste Mal begriffen hast, welche tiefgreifenden Veränderungen die modernen Werkzeuge der künstlichen Intelligenz mit sich bringen?
1.1.1 Startschuss und Hype Bevor wir uns direkt ins KI-Getümmel stürzen, stellt sich zunächst die Frage, mit wem oder was wir es da überhaupt zu tun haben. Ein Chatbot ist zunächst einmal ein Computerprogramm, mit dem man sich in natürlicher Sprache unterhalten kann. Die Kommunikation erfolgt über sogenannte Prompts – das sind Anweisungen oder Befehle, die über die Tastatur eingegeben werden. Textgenerative KI-Bots antworten ebenfalls in natürlicher Sprache, während bildgenerative KI-Bots Bilder als Antwort auf einen Prompt liefern. Was genau passiert nach der Eingabe eines solchen Prompts? Du hast sicher schon einmal beobachtet, dass nach der Eingabe einiger Wörter auf der virtuellen Tastatur deines Smartphones neue Wortvorschläge oberhalb des Buchstabenfeldes erscheinen, die du durch Antippen für die Fortsetzung deines Textes verwenden kannst. Diese Wortvorschläge stammen aus Wörterbüchern und werden anhand deines Textes als nächstwahrscheinliche Wörter vorgeschlagen. Während das Wörterbuch für die Handytastatur jedoch nur einige hunderttausend Wörter und ihre Kontexte enthält und dafür wenige Megabyte an Speicherplatz benötigt, sind in Sprachmodellen wie GPT & Co. mehrere Terabyte an Wörtern gespeichert. Ein Prompt in ChatGPT wird nach Schlüsselwörtern durchsucht, und das Sprachmodell gibt nach dem Zufallsprinzip Wortfolgen oder ganze Sätze aus, die in den Kontext der
12
1.1
Hallo Bot-Welt!
durch den Prompt formulierten Fragestellung passen. Weiterhin lernt ChatGPT im Laufe einer Kommunikation dazu, wenn du den Bot mit weiteren Informationen fütterst.
Abbildung 1.1 Die Wortergänzungsfunktion einer Smartphone-Tastatur arbeitet nach dem Prinzip der intelligenten Wortergänzung.
Das oben beschriebene Funktionsprinzip zeigt zunächst, was ein Chatbot (noch) nicht ist bzw. (noch) nicht sein kann: Eine generalisierte, universelle Intelligenz, die das menschliche Denken in den Schatten stellt. Vielmehr ist es ein zufallsbasierter, intelligenter und lernfähiger Textgenerator, der sich durchaus auch einmal irren bzw. Unsinn verbreiten kann. In diesem Fall spricht man von Halluzinieren der KI. Wie kam ich nun selbst das erste Mal in direkten Kontakt mit einer generativen künstlichen Intelligenz? Im November 2022 stolperte ich über einen profanen Kurzartikel im Feuilleton der Lokalzeitung, in dem das erste Mal der Begriff ChatGPT auftauchte. Meine Neugier war geweckt, also meldete ich mich flugs bei OpenAI für die Nutzung des Chatbots in der Beta-Phase an. Mein erster Prompt lautete: Erkläre die Prinzipien der speziellen Relativitätstheorie, sodass es ein zehnjähriges Kind verstehen kann.
Abbildung 1.2 Mein erster Kontakt zu ChatGPT hinterließ bei mir eine gewisse Euphorie.
13
KI-Bots – der Produktivitäts- und Kreativitätsschub
Nach der Antwort nur wenige Augenblicke später (siehe Abbildung 1.2) war ich der festen Überzeugung, erstmalig in meinem bewegten Leben im Umfeld der IT einer wahrhaftigen künstlichen Intelligenz beim Wirken über die Schulter zu schauen. Beschäftigt man sich jedoch intensiver mit solchen Werkzeugen, verflüchtigt sich die Vorstellung, es handele sich um ein Stück Zauberei. Es kann durchaus vorkommen, dass irgendwann die Begeisterung der Enttäuschung weicht – insbesondere dann, wenn du dem Bot aktuelle Informationen ohne Internetanbindung entlocken möchtest (siehe Abbildung 1.3).
Abbildung 1.3 Es stellt sich eine gewisse Enttäuschung ein, wenn man bemerkt, dass der Trainingsdatenbestand von ChatGPT limitiert ist.
Gleichwohl gewinnt man mit der Zeit einen realistischen Blick dafür, was möglich ist und was nicht, und stellt gleichzeitig fest, in wie vielen Bereichen die Werkzeuge der modernen künstlichen Intelligenz Arbeit sparen und Kreativitätsschübe erzeugen können (siehe Abbildung 1.4).
100 %
1
Vertrauen in ChatGPT
1
Wahnsinn!!! ChatGPT kann alle meine Fragen beantworten. Der Bot erzeugt sprachlich hochwertiges Material. Das muss eine Superintelligenz sein!
2
Jetzt kann’s losgehen! Ich verstehe nun, wie ChatGPT funktioniert und wie ich das Sprachmodell für meine Zwecke nutzen kann.
Moment mal ... ChatGPT ist nur ein Sprachmodell, das Sätze zufällig »auswürfelt«? Es zeigt also kein Verständnis der Inhalte wie ein menschliches Wesen ...
5
4 3
Mist!!! Das heißt aber doch, dass ChatGPT auch gelegentlich völlig falsche Antworten erzeugt und ich Gefahr laufe, falsche Informationen zu verbreiten!
Verstehe. ChatGPT ist ein großartiges Werkzeug, wenn es darum geht, vielschichtige Problemstellungen zu bearbeiten, bei denen es keine »perfekten« Antworten geben kann. Ich muss darüber hinaus den Output stets überprüfen.
0% kein Wissen (du glaubst dem Hype)
Kenntnisstand über ChatGPT
genügend Wissen (du verstehst die Realität)
Abbildung 1.4 Der »Vertrauensgraph« zu ChatGPT in Anlehnung an den Dunning-KrugerEffekt (zum Effekt siehe https://de.wikipedia.org/wiki/Dunning-Kruger-Effekt)
14
1.1
Hallo Bot-Welt!
In der Tat ist es erstaunlich, was für einen triumphalen Siegeszug allein das KI-Frontend ChatGPT seit besagtem November hinter sich gebracht hat. Tabelle 1.1 zeigt, in welchen Zeiträumen einige der beliebtesten Internetdienste die magische Grenze von 1 Million Benutzern überschritten haben – ChatGPT ist dabei einsamer Spitzenreiter! Name des Dienstes
Zeit bis zur Überschreitung von 1 Million aktiver Nutzer
Netflix
3,5 Jahre
Twitter
2 Jahre
Facebook
10 Monate
Dropbox
7 Monate
Spotify
5 Monate
Instagram
2,5 Monate
ChatGPT
5 Tage
Tabelle 1.1 Verbreitungszeiten einiger ausgewählter Internetdienstleister (Quelle: http://r-wrk.de/1t1dh)
Noch beeindruckender ist die Tatsache, dass ChatGPT für das Überschreiten der Schwelle von 100 Millionen Nutzern lediglich 2 Monate benötigte (zum Vergleich: TikTok benötigte zum Erreichen dieser Nutzerzahlen 9 Monate). Was steckt hinter diesem enormen Erfolg? Ist ChatGPT bzw. das zugrunde liegende Sprachmodell wirklich die sehnlichst erwartete allgemeine, zu selbstständigem Denken befähigte künstliche Intelligenz (KI)? Nach dem aktuellen Wissensstand ist diese Frage eindeutig zu verneinen. ChatGPT ist der Kategorie der schwachen künstlichen Intelligenzen zuzuordnen.
Von starken und schwachen künstlichen Intelligenzen Eine schwache künstliche Intelligenz (KI) ist ein Programm, das auf spezifische Aufgaben fokussiert ist und nur innerhalb dieses Bereichs arbeitet. Ein Beispiel wäre die Erkennung von Objekten in der Google-Bildsuche. Eine starke künstliche Intelligenz besitzt menschenähnliche Fähigkeiten und kann komplexe Aufgaben meistern, ist also nicht auf ein spezielles Themengebiet trainiert worden. Ein Beispiel wäre etwa, wenn die Google-Bildidentifikations-KI ohne spezielles Training auch Musikstücke identifizieren könnte.
15
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Noch ein Stück weiter geht die allgemeine künstliche Intelligenz, die sich flexibel verschiedenen Aufgaben anpassen kann und menschliche Intelligenz in vielen Bereichen nachahmt oder sogar übertrifft. Das wäre dann der Fall, wenn einem KI-System nur die Regeln eines Spiels beigebracht werden müssten und es dann unmittelbar meisterliche Fähigkeiten zeigte.
Nach der ersten Ernüchterung, dass wir es bei ChatGPT & Co. (noch) nicht mit starken künstlichen Intelligenzen zu tun haben, die sogar den berühmten Turing-Test bestehen, macht sich beim alltäglichen Umgang mit den Werkzeugen dennoch unbändige Begeisterung bei der Mehrzahl aller Anwender*innen breit.
Was unterscheidet Mensch und Maschine? Diese Frage stellte sich der bekannte Computerwissenschaftler Alan Turing und entwickelte folgenden Test, um einen Chatroboter von einem Menschen zu unterscheiden: Man kommuniziert, ohne den Gesprächspartner direkt sehen zu können, per Tastatur oder Sprache mit einem unbekannten Gegenüber. Wenn es sich dabei um einen Chatbot handelt und du nach dem Gespräch nicht mit Sicherheit sagen kannst, ob du mit einer Maschine oder einem Menschen gesprochen hast, dann hat die Maschine den TuringTest bestanden. Tatsächlich kommen ChatGPT und Co. diesem Ideal schon sehr nahe.
Das Eintreffen von ChatGPT auf dem Markt der IT-Tools kann als »iPhone-Moment« der künstlichen Intelligenz betrachtet werden. Der Chatbot stellt eine bahnbrechende Veränderung in der Art und Weise dar, wie wir mit Computern interagieren und Texte verarbeiten. Er ist wie ein fortschrittliches CAS-Taschenrechner-System für Texte, das uns dabei hilft, viel effizienter zu arbeiten. Die Wirkung von ChatGPT ist vergleichbar mit dem Wechsel von einem normalen Fahrrad zu einem E-Bike: Obwohl man immer noch selbst in die Pedale treten muss, kommt man viel weiter und schneller voran. Dieser Effekt ist zu vergleichen mit dem ursprünglichen Einfluss des Computers, der uns von rechnerischen Aufgaben befreite und uns ermöglichte, uns auf das Denken und kreative Problemlösungen zu konzentrieren. Die aktuellen Möglichkeiten, die KI-Bots bieten, stellen einen weiteren Quantensprung dar: Der Mensch muss sich zur Kommunikation mit der Maschine nicht mehr ihrer (komplizierten) Sprache bedienen, sondern kann die von Kindesbeinen an erlernte Muttersprache verwenden.
16
1.1
Hallo Bot-Welt!
1.1.2 Die Ahnengalerie der modernen Chatbots Du denkst, ein Chatbot wie ChatGPT ist plötzlich vom Himmel gefallen? Weit gefehlt! Er ist das Ergebnis einer langen Kette von Entwicklungen im Bereich der Linguistik und der künstlichen Intelligenz. Die Urgroßmutter von ChatGPT ist der Chatbot Eliza, der 1966 von Joseph Weizenbaum programmiert wurde. Dieser war in der Lage, auf der Grundlage von Texteingaben als Psychotherapeut für seine erstaunten Benutzer zu fungieren. Die eingegebenen Sätze wurden nach bestimmten Schlüsselwörtern durchsucht, und die Antworten wurden aus Vokabeln eines relativ begrenzten Katalogs generiert.
Abbildung 1.5 Die Urahnin aller Chatbots – Joseph Weizenbaums »Eliza« – kann via Browser auf www.med-ai.com/models/eliza.html.de ausprobiert werden.
In jüngerer Zeit etablierten sich schließlich die beliebten kleinen Helferlein namens Alexa, Siri, Google Assistant & Co. auf den PCs, Smartphones und in den Smarthomes dieser Welt. Ihnen gelingt es bis heute ganz hervorragend, spezialisierte Arbeitsaufträge durch natürliche Spracheingabe zu erledigen. Der Nachteil gegenüber den Bots aus der Liga von ChatGPT & Co.: Ihr Vokabular ist arg limitiert, und sie sind auf einige wenige spezielle Szenarien trainiert.
Abbildung 1.6 »Benötige ich morgen einen Regenschirm?« – Apples Sprachbot Siri spuckt die Antwort sofort aus, scheitert aber an komplexen Aufträgen wie: »Schreibe mir eine kurze Zusammenfassung des Dramas ›Wilhelm Tell‹!«
17
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
1.2 Dein Fahrplan in eine produktive, kreative Zukunft Was erwartet dich nun in dem vorliegenden Buch, und vor allem: Ist es für dich gewinnbringend? Fassen wir es einmal stichpunktartig zusammen: Du bist hier richtig, wenn … … du einen fundierten, praktischen Einstieg in den Umgang mit einer Vielzahl moderner KI-Bots suchst. … du anhand diverser Fallbeispiele lernen möchtest, was mit KI-Tools aktuell umsetzbar ist und was nicht. … du lernen möchtest, wie man einen KI-Bot mit sogenannten Superprompts (das sind sehr mächtige Befehle für den Bot) in eine gewünschte Richtung dirigieren kann. … darüber hinaus ein wenig hinter die Kulissen von Chatbots blicken und verstehen willst, auf welcher Basis deren Ausgaben generiert werden. Du bist hier falsch, wenn … … du dich für tiefgehende theoretische Grundlagen der Sprachmodelle interessierst, die hinter KI-Chatbots stecken, ja, eventuell sogar einen KI-Bot selbst programmieren möchtest. … du neuen Dingen prinzipiell skeptisch gegenüberstehst und sehr große Bedenken hast, dass die neue Technik zu einer generativen, allgemeinen künstlichen Intelligenz – der sogenannten KI-Singularität – führen wird, die für die Menschheit bedrohlich werden könnte. Dein Reiseführer in die Welt der KI-Bots ist folgendermaßen aufgebaut: Im Rest des vorliegenden Kapitel 1 widmen wir uns der Avantgarde der modernen KIBots: ChatGPT. Du lernst, wie man einen Account beim Anbieter OpenAI einrichtet, sich für ein Sprachmodell entscheidet und erste Schritte unternimmt. ChatGPT ist in deinem Land nicht verfügbar oder gar gesperrt? Kein Problem, ich zeige dir, wie man derartige Beschränkungen leicht umgehen kann. Du erhältst darüber hinaus einen Überblick, welche spezialisierten Werkzeuge neben ChatGPT den Markt bevölkern. Kapitel 2 dreht sich um Textarbeiten aller Art. Hier erfährst du, wie dir Chatbots beim Formulieren von Texten helfen können. Dabei werden wir uns auch einige Spezialisten anschauen, z. B. Bots wie DeepL, der Übersetzungen in der Qualität von Muttersprachlern liefert. Auch für Medienprofis gibt es hier viel Interessantes zu erfahren –
18
1.2
Dein Fahrplan in eine produktive, kreative Zukunft
beispielsweise zu den Themen SEO, Podcasts, Videoskripting und der automatischen Generierung von Blogartikeln. In Kapitel 3 erfährst du, wie Chatbots im Wissenschafts- und Bildungsbereich eingesetzt werden können, ja bisweilen sogar wertvolle Denkanstöße für die Forschung liefern. Wir lassen die Bots erklären, interpretieren, rechnen und helfen bei der Recherche von wissenschaftlichem Material. Außerdem klären wir, inwiefern die KI geeignet ist, bei den zeitaufwendigen Korrekturen der Lehrenden zu helfen. Kapitel 4 handelt von den aufregenden Möglichkeiten bildgenerativer KI-Bots wie DALL-E und Midjourney. Du wirst lernen, überraschendes und hochwertiges Bildmaterial zu erzeugen, das großen Meistern und Meisterinnen der Kunst und Fotografie kaum nachsteht. Das Geheimnis des Erfolgs besteht hier im Bauen geschickter Prompts – auch Prompt Crafting oder Prompt Engineering genannt. Auch die Veredelung bereits existierenden Bildmaterials steht auf der Agenda. Wir machen abschließend noch einen kleinen Ausflug in den Multimediabereich. In Kapitel 5 begeben wir uns mitten ins Leben: Ich zeige dir, wie die KI dir ganz alltägliche Aufgaben abnehmen kann und wie du Geld sparen kannst, indem du dir bei der KI Expertise auf den Gebieten Handwerk, Technik und in Rechtsfragen einholst. Darüber hinaus untersuchen wir, inwieweit geeignete KI-Tools die gängige Internetsuche perfektionieren oder gar ersetzen können. Kapitel 6 öffnet die KI-Schatzkiste für Programmierer*innen: Du lernst, wie man ohne die Kenntnis einer kryptischen Programmiersprache im Handumdrehen leistungsfähige Programme schreiben kann. Profis erhalten Tipps zur Verbesserung eigener Programme bzw. zur Interpretation fremden Programmcodes. In Kapitel 7 darfst du dich ein wenig entspannen: Wir widmen uns der spielerischen Seite von KI-Chatbots und erstellen ein vollwertiges Computerspiel mithilfe einiger simpler Befehle. Darüber hinaus lernst du den Bot als kurzweiligen Kommunikationspartner kennen. Im Rahmen von Kapitel 8 öffnen wir die große Trickkiste und zeigen dir, wie man mit speziellen Kommandos mehr aus den Chatbots herausholen oder diese gar überlisten kann – sprich, wir hacken ChatGPT. In Kapitel 9 werfen wir einen Blick in die Kristallkugel. Wir beschäftigen uns damit, was wir in Zukunft von KI-Tools erwarten können oder gar befürchten müssen. Wir loten die Chancen und Risiken aus, für welche Berufsgruppen sich die KI eher zur Jobmaschine oder zum Jobvernichter entwickeln wird.
19
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Eine Anmerkung zum pädagogischen Konzept des vorliegenden Buches: Wesentliches Ziel ist es, dir den praktischen, produktiven Umgang mit KI-Bots zu vermitteln. Dabei lässt es sich nicht vermeiden, dass gelegentlich auch einmal theoretische Hintergründe zur Sprache kommen. Diese werden entweder in Form von Kästen im Fließtext behandelt oder als Fachbegriffe im Glossar am Ende des Buches erläutert. Wenn du also etwas tiefer in die Theorie einsteigen möchtest, dann findest du dort weiterführende Informationen. Abschließend noch einige generelle Anmerkungen zu den Inhalten: Bei der Erstellung der Prompts wurde auf Universalität geachtet. Die im Buch vorgestellten Prompts lassen sich in nahezu jeder text- bzw. bildgenerativen KI verwenden. Dennoch kann es aufgrund der rasanten Entwicklung im Bereich der KI durchaus vorkommen, dass das eine oder andere beschriebene Werkzeug eine leicht geänderte Bedienerführung aufweist oder wie im Fall des OpenAI Text Classifiers oder des BingPlug-ins temporär oder manchmal auch komplett vom Markt genommen wurde. In diesem Fall stehen dir aber in der Regel andere Alternativen zur Verfügung, die ganz ähnlich funktionieren. In derartigen Fällen hilft eine Webrecherche weiter. Die Features von ChatGPT & Co. sind einem steten Wandel unterworfen – so taucht das in ChatGPT Mitte 2023 als Code Interpreter eingeführte Tool mittlerweile unter dem Namen Advanced Data Analysis im Kontextmenü des Sprachmodells auf. Die Anbindung von ChatGPT an das Internet über Bing wurde zunächst im Frühjahr 2023 eingeführt, dann aufgrund von Urheberrechtsproblemen deaktiviert und im Herbst 2023 wieder aktiviert. In diesem Zusammenhang möchte ich dich bitten, etwas Nachsicht zu haben, falls sich die Begriffe in den Buch-Screenshots sowie einige Antworten auf Prompts nicht 1:1 in den aktuellen Versionen von ChatGPT, Midjourney und Co. wiederfinden. An der im Buch beschriebenen Funktionalität ändert sich in der Regel nichts. Inzwischen verfügt ChatGPT über eine Sprachausgabe und kann Bilder interpretieren. Diese Funktionen waren zum Zeitpunkt der Manuskripterstellung nicht absehbar. Die Beispiele für bildgenerative KIs wie Midjourney wurden in englischer Sprache verfasst, da das Trainingsmaterial optimal darauf zugeschnitten wurde. Bei ChatGPT funktioniert das Prompting aber ebenso gut auf Deutsch. Mittlerweile ist es möglich, die Oberfläche von ChatGPT in deutscher Sprache zu lokalisieren. Aus Gründen der Konsistenz und Kontinuität verwende ich im vorliegenden Buch allerdings stets Screenshots von ChatGPT in englischer Sprache. Einige Textteile im Buch sind unter Mitwirkung von KI-Tools entstanden. An der Erstkorrektur bezüglich der Rechtschreibung, der Grammatik und des Stils hat DeepL Write mitgewirkt. Die kleinen schmückenden Einstiegsbilder zu Abschnitten wurden mithilfe von Midjourney generiert. Für die Glossareinträge wurde ChatGPT mit GPT-4 verwendet.
20
1.3
ChatGPT – First Contact
Die Antworten der Chatbots wurden stets im Original übernommen, etwaige Rechtschreib- und Grammatikfehler in den Antworten der Bots wurden nicht verbessert. Dies soll aufzeigen, an welchen Stellen noch Verbesserungspotenzial für die verwendeten KI-Tools steckt. Die Antworten auf Prompts wurden in der Regel geeignet gekürzt, um keine Seiten mit unmaßgeblichen Inhalten zu schinden. Das erkennst du an den Auslassungspunkten der Form [...]. Bitte beachte, dass du aufgrund der prinzipiellen Funktionsweise einer textgenerativen KI die Ergebnisse im Buch nicht zu 100% reproduzieren wirst. Du findest die Prompts aus den Beispielen bzw. weiterführendes Begleitmaterial auf der Webseite zum Buch unter http://r-wrk.de/bs9pj. Per Copy-and-paste sparst du dir bei längeren Prompts die Zeit fürs Eintippen. Beim Halluzinieren und unrichtigen Aussagen der KI wird explizit darauf hingewiesen. Ein derartiges Projekt, mit dem man Neuland betritt, steht und fällt mit dem Fachlektorat. An dieser Stelle möchte ich mich daher sehr herzlich bei Mareile Heiting für ihre kritische und konstruktive Durchsicht des Rohmanuskripts bedanken. Nun aber genug der Vorworte. Bist du bereit für eine Reise zu den schönsten Destinationen künstlich erschaffener Intelligenz? Dann lies weiter, staune und begreife, wie sich auch deine (Arbeits-)Welt in kurzer Zeit grundlegend verändern wird. Ergreife die Chance, zur KI-Anwender-Avantgarde zu gehören, und leg den Grundstein für eine effektivere und kreative Arbeitsweise!
1.3 ChatGPT – First Contact Obwohl mittlerweile eine Vielzahl von KI-Chatbots und -Diensten das Internet bevölkern, kommt man um den Urvater nicht herum. ChatGPT ist nach wie vor der Goldstandard aller KI-basierten Textbot-Systeme – nicht zuletzt aufgrund der kontinuierlichen Weiterentwicklung der zugrunde liegenden Sprachmodelle. Daher werden wir das beliebte Produkt von OpenAI nachfolgend als Grundlage für die meisten Beispiele im Bereich der Texterzeugung verwenden. Aber keine Sorge: Auch wenn du lieber mit einem Produkt eines anderen Herstellers arbeitest, das Prinzip ist immer das gleiche. Du steuerst die Ausgabe eines Bots und damit die Qualität des Ergebnisses durch eine geschickte Abfolge von Wörtern, Sätzen oder Texten, die in menschlicher Sprache formuliert
21
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
sind. Diese sogenannten Prompts sind universell einsetzbar. Die Ergebnisse können allerdings von Anbieter zu Anbieter variieren. Bei Bedarf wechseln wir daher von ChatGPT zu spezialisierten Anbietern, um ein optimales Ergebnis zu erreichen – mehr dazu aber später in den Beispielen bzw. in Abschnitt 1.4, »Ein Zoo voller Bots«.
Von Sprachmodellen und gigantischen Trainingsdatenmengen ChatGPT basiert auf einem sogenannten Sprachmodell, das durch maschinelles Lernen entwickelt wurde. Das Sprachmodell heißt GPT, wobei die Abkürzung für Generative Pretrained Transformer (= generativer, vortrainierter Transformer) steht. Es analysiert große Mengen an Text aus verschiedenen Quellen und lernt Muster, Zusammenhänge sowie die Struktur der menschlichen Sprache. Das zugrunde liegende neuronale Netz, Transformer genannt, ist ein komplexes Modell, das aus mehreren Schichten und Millionen von Verbindungen besteht. In der Trainingsphase lernt das Modell, Sätze und Textabschnitte zu generieren, indem es Wahrscheinlichkeiten für Wörter und Wortkombinationen berechnet. Es verwendet Kontextinformationen aus vorherigen Wörtern oder Sätzen, um die passendsten Wörter für die Antwort auszuwählen. Dieser Lernprozess ist iterativ und wiederholt sich viele Male, bis das Modell eine hohe Genauigkeit erreicht. Die zugrunde liegende Trainingsdatenmenge ist gigantisch; es wurden beispielsweise für das Sprachmodell GPT-3 Milliarden von Internetdaten in der Größenordnung mehrerer Dutzend Terabyte Daten katalogisiert, die nach der Behandlung durch den Transformer auf etwa 570 Gigabyte komprimiert wurden. Es ist wahrscheinlich, dass der Trainingsdatenbestand für die aktuelle GPT-Version 4 um ein Vielfaches höher liegt (OpenAI hält sich bedeckt, was die Weitergabe von Zahlen betrifft). Die erste Version des Modells (GPT-1) wurde bereits im Jahr 2018 veröffentlicht (http://r-wrk.de/0emzp). Ein wichtiger Aspekt von ChatGPT ist die Fähigkeit, die Bedeutung von Texten zu erfassen und darauf aufbauend sinnvolle Antworten zu generieren. Dies wird durch das Verständnis von Grammatik, Syntax, Semantik und sogar kulturellem Hintergrund erreicht. Das Modell ist jedoch nicht perfekt und kann manchmal ungenaue oder unerwartete Antworten liefern. Eine Besonderheit von ChatGPT bzw. der GPT-Sprachmodelle ist, dass diese auf Anweisungen reagieren können, die den Antwortstil oder die Tiefe der Informationen beeinflussen. Zum Beispiel kann das Modell aufgefordert werden, einfache oder detaillierte Antworten zu geben oder in einer bestimmten Rolle oder einem bestimmten Ton zu antworten.
22
1.3
ChatGPT – First Contact
1.3.1 Einen Account bei OpenAI anlegen Der Weg zur Nutzung des Klassikers ChatGPT beginnt auf der Internetseite des Anbieters OpenAI.
Abbildung 1.7 Die Anmeldung beim Dienst ChatGPT ist rasch erledigt.
1. Begib dich auf die Seite https://chat.openai.com. 2. Klicke auf die Schaltfläche Sign up. Du wirst anschließend aufgefordert, eine E-MailAdresse sowie ein Login-Passwort für den Anmeldevorgang einzugeben. 3. Nach Eingabe der Daten erhältst du einen Bestätigungslink per E-Mail zugeschickt. Klicke diesen an, und dein Konto ist aktiviert. Du landest auf der Startseite von OpenAI. 4. Um den Bot zu nutzen, begib dich erneut auf https://chat.openai.com und melde dich nach Anklicken der Schaltfläche Login mit deinen Zugangsdaten an. 5. Bei der ersten Anmeldung wirst du nach einigen persönlichen Daten (Name, Vorname und Geburtsdatum) gefragt. Fülle das entsprechende Formular aus. 6. Anschließend ist noch eine gültige Handynummer einzugeben. An diese wird per SMS ein Code geschickt, der im folgenden Dialog zur Bestätigung einzugeben ist. 7. Bestätige nun die einführenden Dialoge über die entsprechenden Schaltflächen. Das war’s auch schon. Der Bot steht dir nun in der kostenlosen Variante zur Verfügung!
23
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Abbildung 1.8 Die Dialoge und die Oberfläche erscheinen bei ChatGPT zwar in englischer Sprache, der Bot versteht aber problemlos deutsche Prompts.
1.3.2 Erste Schritte mit ChatGPT Sehen wir uns ein wenig auf der Oberfläche um. Diese gestaltet sich in der kostenfreien Version sehr übersichtlich: 1 Tipps zu ChatGPT (in englischer Sprache) 2 Eingabefeld für Prompts im aktuellen Chat 3 einen neuen Chat beginnen 4 Upgrade to Plus (auf die kostenpflichtige Version upgraden) 5 Drei-Punkte-Menü mit Settings (Einstellungen) und Log out (ausloggen bzw. vom Konto abmelden) Wie bereits erwähnt, sollte dich die englische Oberfläche nicht abschrecken. Du kannst deine Prompts auch bequem in deutscher Sprache formulieren. Die Qualität der ausgegebenen Texte ist hier ebenso exzellent wie bei der Formulierung von Prompts in englischer Sprache. Der erste Kontakt zum Bot erfolgt mit einem einfachen Beispiel: Wir wollen in Erfahrung bringen, wie ChatGPT uns in Zukunft behilflich sein kann. Ein entsprechender Prompt könnte beispielsweise lauten: Nenne mir 5 Dinge, bei denen du mich in deiner Funktion als Chatbot unterstützen kannst.
24
1.3
ChatGPT – First Contact
Abbildung 1.9 Die Oberfläche von ChatGPT
Es ist dabei nicht erforderlich, die obige Formulierung 1 : 1 zu übernehmen. Bisweilen genügt es auch schon, den Bot mit Stichworten zu füttern. Die Eingabe von 5 Dinge, wie du mir helfen kannst führt zu ähnlichen Ergebnissen. Das Resultat zeigt Abbildung 1.10. Um dir in Zukunft bei den Beispielen eine Anhäufung schlecht lesbarer Screenshots zu ersparen bzw. die Beispiele universell zu halten, gehe ich folgendermaßen vor, um die wesentlichen Informationen bei Ausführung eines Prompts zu dokumentieren: 1. Der Prompt wird stets in Form der nachfolgenden Schrift im Fließtext dargestellt: Nenne mir 5 Dinge, bei denen du mich in deiner Funktion als Chatbot unterstützen kannst.
2. Das Resultat des Prompts wird als Listingtext dargestellt, der gegebenenfalls geeignet gekürzt wird, sodass die wichtigsten Informationen ersichtlich werden: Als Chatbot kann ich dich in verschiedenen Bereichen unterstützen. Hier sind fünf Dinge, bei denen ich helfen kann: 1. Beantwortung von Fragen: Ich kann Informationen zu einer breiten Palette von Themen liefern, sei es Allgemeinwissen, Wissenschaft, Technologie, Ge-
25
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
schichte, Sport, Kultur und vieles mehr. Du kannst mir Fragen stellen, und ich werde mein Bestes tun, um dir relevante und präzise Antworten zu geben. [...] 5. Small Talk und Unterhaltung: Wenn du einfach nur plaudern, Witze machen oder dich unterhalten möchtest, bin ich auch dafür da. Ich kann auf verschiedene Weise mit dir interagieren, dir Fragen stellen und auf deine Antworten reagieren, um eine unterhaltsame Konversation zu führen. Bitte beachte, dass ich als KI-Modell zwar mein Bestes gebe, aber meine Antworten auf vorherigen Trainingsdaten basieren und nicht immer vollständig aktuell oder fehlerfrei sein können.
Abbildung 1.10 ChatGPT steht Rede und Antwort. Der Link zur Antwort kann über das Kontextmenü des Chats geteilt werden.
Diese Darstellung hat den Vorteil, dass die Prompts auf sämtliche textbasierten KIs übertragbar sind. Es liegt aber in der Natur der Sache, dass unterschiedliche KI-Bots
26
1.3
ChatGPT – First Contact
durchaus zu unterschiedlichen Ergebnissen kommen können. Selbst ChatGPT liefert bei identischen Eingaben bei verschiedenen Durchläufen unterschiedliche Ausgaben. Um eine andere Ausgabe in einem aktuellen Chat zu forcieren, klicke in ChatGPT einfach auf die Schaltfläche Regenerate response. Du erhältst dann eine neue Sichtweise auf die alte Fragestellung. Im obigen Beispiel könnte das in etwa folgendermaßen aussehen: Als Chatbot kann ich dich in verschiedenen Bereichen unterstützen. Hier sind fünf Dinge, bei denen ich dir behilflich sein kann: 1. Beantwortung von Fragen: Du kannst mir alle möglichen Fragen stellen, sei es zu Allgemeinwissen, aktuellen Ereignissen, Technologie, Geschichte, Unterhaltung, etc. Ich werde mein Bestes tun, um dir eine informative und verständliche Antwort zu geben. 2. Hilfestellung bei Problemlösungen: Wenn du ein Problem hast und nach einer Lösung suchst, stehe ich dir zur Seite. Ob es um technische Probleme, Anleitungen für bestimmte Aufgaben oder Ratschläge zu persönlichen Angelegenheiten geht, ich werde mein Bestes tun, um dir zu helfen. [...]
Jetzt bist du dran! Spiele ein wenig mit ChatGPT herum und stelle dem Bot Fragen über Dinge, die du schon immer wissen wolltest. Erlebe deinen höchstpersönlichen AhaMoment beim Kontakt mit einer generativen künstlichen Intelligenz! Es empfiehlt sich, zu jedem neuen Fragenkomplex einen neuen Chat zu eröffnen. Das erreichst du durch Anklicken der Schaltfläche New Chat. Der Bot sammelt alle bisherigen Fragen in einer Liste ähnlich der in Abbildung 1.11, sodass sie jederzeit wieder aufgerufen werden können – vorausgesetzt, du bist mit deinem Konto bei ChatGPT angemeldet.
Abbildung 1.11 ChatGPT verschlagwortet automatisch die Prompt-Anfragen
Die zu einem Thema gehörenden Fragestellungen werden von ChatGPT automatisch verschlagwortet – meist in englischer Sprache. Du hast aber jederzeit die Möglichkeit,
27
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
die Bezeichner in den Überschriften anzupassen. Dazu klickst du auf den entsprechenden Eintrag und wählst zur Bearbeitung das Stiftsymbol aus. An dieser Stelle lassen sich auch einzelne Chats durch Anklicken des Mülleimersymbols aus dem Verlauf löschen. Auf diese Weise kannst du dir selbst eine Sammlung mächtiger Prompts zusammenstellen.
1.3.3 Was darf es kosten? Die gute Nachricht: Die Basisfunktionalität von ChatGPT ist kostenlos. Wer aber das Optimum aus dem Bot herausholen will, kommt um ein Abonnement des Dienstes nicht herum. Stand August 2023 belaufen sich die Kosten dafür auf 23 € pro Monat. Auf der Habenseite der Abonnent*innen stehen: Du kannst das neueste Sprachmodell nutzen (Stand September 2023 war das GPT-4). Du darfst Plug-ins nutzen, die das Einsatzgebiet von ChatGPT drastisch erweitern. Du wirst weniger schnell wegen Überlastung aus dem Bot herausgeworfen. Die Ergebnisse werden (zumindest im Standardmodellmodus) schneller generiert. Zum Abschließen eines Abonnements klickst du im Hauptmenü auf die Schaltfläche Upgrade to Plus. Es öffnet sich ein kleines Fenster. Hier klickst du auf die Schaltfläche Upgrade plan. Gib nachfolgend eine Zahlungsmethode an (meist wird eine Kreditkarte benötigt, Apple-Nutzer können auch Apple Pay verwenden), und schon kommst du in den Genuss aller oben genannten Vorzüge des Pluspakets.
Abbildung 1.12 Ein Abo bei OpenAI ist in wenigen Schritten abgeschlossen.
28
1.3
ChatGPT – First Contact
Nach dem Abschluss eines Abos erscheint die Oberfläche nach dem Einloggen leicht verändert. Neu ist insbesondere die Auswahlmöglichkeit des Sprachmodells, bevor ein neuer Chat begonnen wird (siehe Abbildung 1.13).
Abbildung 1.13 Mit dem ChatGPT-Plus-Abo steht dir immer das neueste Sprachmodell zur Verfügung.
Die Leistungsfähigkeit aktueller Sprachmodelle Welchen Vorteil hat es, wenn man stets ein topaktuelles Sprachmodell verwendet? Die Anzahl der Parameter zur Berechnung der Ausgaben zu Prompts wächst von
Modell zu Modell. Zum Vergleich: Konnte GPT-3 mit 175 Milliarden Parametern aufwarten, so überschritt GPT-4 im März 2023 bereits die Billionengrenze. Die Menge der Trainingsdaten steigt, aber auch der Typ der verarbeiteten Daten
kann sich ändern. Beispielsweise wurde GPT-4 bereits mit Bilddatenmaterial trainiert und konnte visuell eingefütterte Daten auch verarbeiten. Legendär ist das Beispiel, dass der auf GPT-4 basierte Bot eine komplette Website anhand einer dahingekritzelten Skizze programmieren kann. Man spricht in diesem Fall auch von einem multimodalen Sprachmodell. Die Anzahl der sogenannten Token pro Prompt nimmt bei einem aktuelleren Modell
meist zu. Dadurch können mehr Zeichen für die Eingabe eines einzelnen Prompts eingegeben werden. Bei GPT-4 lag das Limit bei 2.048 Token, was in etwa der Menge von 1.500 Wörtern entspricht.
29
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
1.3.4 Wir müssen leider draußen bleiben … Ein Aufschrei ging im Frühjahr 2023 durch ganz Italien, denn die Anwender von ChatGPT bekamen dort die Nachricht aus Abbildung 1.14 beim Aufruf der Seite zu sehen.
Abbildung 1.14 Aussperrungsnachricht bei ChatGPT
Was war geschehen? Der italienische Datenschutz befand, dass OpenAI mit dem Service ChatGPT gegen den Datenschutz verstößt. Vorausgegangen war eine Datenschutzpanne bei OpenAI, bei der einige Nutzer*innen die Chatverläufe und Nutzerprofile Dritter einsehen konnten. Darüber hinaus bemängelte der italienische Datenschutzbeauftragte, dass Kinder, denen die Nutzung derartiger Dienste untersagt ist, nicht wirkungsvoll ausgesperrt würden. Der Vorfall hatte daraufhin auch in der EU schlafende Hunde geweckt, und es bleibt abzuwarten, inwiefern die Nutzung von ChatGPT auch in anderen europäischen Ländern mit Hürden versehen wird. Solltest du in einem Land leben, indem die beschriebene Problematik vorliegt, so gibt es ein einfaches Zaubermittel: Es heißt VPN (= Virtual Private Network). Damit gaukelst du deinem Internetanbieter vor, in einem anderen Land
30
1.3
ChatGPT – First Contact
zu leben. Eine einfache Google-Recherche zeigt dir, wie man mithilfe eines (in der Regel kostenpflichtigen) VPN-Anbieters die beschriebenen Hürden (Geofencing genannt) umgehen kann (siehe das Beispiel in Abbildung 1.15).
Abbildung 1.15 Mithilfe eines VPN-Anbieters (im vorliegenden Fall NordVPN) lassen sich geografisch bedingte Sperren von Internetdiensten umgehen. Im vorliegenden Fall wird ein VPN-Server in New York zur Verbindung verwendet.
Wrapper für ChatGPT Wäre es nicht schön, wenn man zur Nutzung von ChatGPT nicht den Umweg über einen Browser gehen müsste, sondern für die Eingabe von Prompts ein eigenständiges Programm nutzen könnte? Derartige Programme gibt es in der Tat, sie nennen sich Wrapper (engl. to wrap = einwickeln). Dabei nutzen diese Tools deine OpenAI-Zugangsdaten, um sich mit dem Bot zu verbinden. Achte darauf, dass sich der Anbieter derartiger Tools nicht eine goldene Nase in Form von teuren Abos an dir verdient. Insbesondere in den App Stores der großen Mobilbetriebssysteme iOS bzw. Android tummeln sich diesbezüglich schwarze Schafe, siehe http://r-wrk.de/zyca8.
31
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Abbildung 1.16 MacGPT – ein kostenloser Wrapper zu ChatGPT für macOS, der mit dem eigenen Account verknüpft wird und dadurch keine weiteren Kosten verursacht
1.4 Ein Zoo voller Bots ChatGPT ist nur die Spitze des Eisberges generativer KI-Bots. Es gibt kaum eine Disziplin, die nicht durch die Erzeugung von Text-, Bild-, Ton- und Videomaterial durch generative künstliche Intelligenzen revolutioniert wurde. Dementsprechend sprießen exponentiell neue, spezialisierte Werkzeuge aus dem Boden der KI-Landschaft. Wir werden uns in diesem Buch auf die wichtigsten Spezialisten beschränken. Ich werde in diesem Abschnitt einige der Tools anhand von Einstiegsbeispielen kurz vorstellen. In den folgenden Kapiteln wird der Umgang mit den genannten Werkzeugen dann fallbasiert vertieft werden.
32
1.4
Ein Zoo voller Bots
1.4.1 DeepL DeepL ist ein mittlerweile etabliertes KI-Übersetzungstool aus Deutschland, das aus dem professionellen Umfeld kaum mehr wegzudenken ist. DeepL nutzt Algorithmen der künstlichen Intelligenz, um kontextsensitive Übersetzungen in einer Qualität durchzuführen, die einer professionellen menschlichen Übersetzung sehr nahe kommen. Zur Nutzung von DeepL ist keine Registrierung erforderlich. Begib dich auf www.deepl.com/translator und teste das Werkzeug, indem du auf der linken Seite einen fremdsprachigen Text eingibst (siehe Abbildung 1.17). Diesen kannst du auch von einer Webseite oder einer anderen Quelle in das Eingabefeld kopieren. Idealerweise verstehst du die verwendete Fremdsprache, um einen Eindruck von der Qualität der Übersetzung zu erhalten.
Abbildung 1.17 DeepL erkennt die Sprache des auf der linken Seite eingegebenen Textes in der Regel automatisch und übersetzt diesen simultan. Die Qualität der Übersetzung ist erstklassig.
Wir werden dieses exzellente Werkzeug dann verwenden, wenn das speziell eingesetzte KI-Tool bessere Ergebnisse mit Prompts liefert, die in englischer Sprache formuliert werden. Das ist beispielsweise beim Grafik-KI-Bot Midjourney der Fall.
1.4.2 DeepL Write Der neue Spross des Kölner Unternehmens hilft bei der stilistischen Korrektur von Texten. Die Oberfläche von DeepL Write erinnert an den im letzten Abschnitt vorgestellten
33
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Übersetzer, hat aber einen etwas anderen Fokus: DeepL Write untersucht eingegebene Texte auf stilistische, grammatikalische und semantische Stimmigkeit – es ist sozusagen eine Rechtschreibprüfung auf Steroiden. Um es auszuprobieren, gehe auf www. deepl.com/write und kopiere auf der linken Seite einen Text, den du geschrieben hast. Du wirst überrascht sein, wie viel Luft du bei deinen Formulierungen noch nach oben hast! Die Nutzung der Basisversion von DeepL Write ist aktuell (noch) kostenlos. Du zahlst durch Einfüttern von Texten, die dann als Trainingsdaten für die KI genutzt werden. Wenn deine Inhalte nicht zum Training genutzt werden sollen, kannst du das umgehen, indem du ein Abo für DeepL Write abschließt.
Abbildung 1.18 Auch einige Abschnitte des vorliegenden Buches haben via DeepL Write ihren Feinschliff erhalten. Der überarbeitete Text erscheint rechts. Durch Anklicken der unterstrichenen Textstellen erhältst du Alternativvorschläge. Dabei kann man wählen, ob komplette Sätze oder lediglich einzelne Wörter getauscht werden sollen.
Das Anwendungsszenario für DeepL Write im Kontext generativer KIs besteht darin, den Output einer KI wie ChatGPT bezüglich der grammatikalischen Konsistenz noch einmal auf Herz und Nieren prüfen zu lassen, aber auch, um damit eigenhändig fremdsprachig verfasste Texte von einem »künstlichen Native Speaker« überprüfen zu lassen.
34
1.4
Ein Zoo voller Bots
DeepL und DeepL Write als Word-Add-In Die beiden Powertools für den Kreativbereich lassen sich mittlerweile in Form eines Addins auch in Microsoft Word integrieren. Begib dich dazu in den Add-In-Store von Word (Start • Add-Ins • Weitere Add-Ins) und suche dort Ausschau nach »DeepL«. Nach der Installation stehen dir in Word die Funktionen der beiden Tools zur Verfügung.
1.4.3 DALL-E Begeben wir uns nun in den Bereich der bildgenerativen KIs. Aus dem gleichen Hause wie ChatGPT stammt DALL-E2 (mittlerweile in der Version 2 erschienen). Wenn du im Rahmen deines Einstiegs in ChatGPT ein Konto bei OpenAI erstellt hast, kannst du dieses auch für DALL-E nutzen. Begib dich auf die Seite https://openai.com/product/dall-e-2 und klicke dort den Link Try DALL-E. Anschließend wirst du aufgefordert, dich mit deinem OpenAI-Konto anzumelden. DALL-E ist nach einer kurzen Testphase leider nicht mehr kostenlos: Über die Schaltfläche Buy Credits musst du zunächst etwas Kapital einbringen, um Bilder generieren zu lassen. Für 15 US$ Einsatz kannst du aktuell 115 Credits erwerben, was einem Volumen von 115 Prompt-Eingaben entspricht, die pro Prompt jeweils vier Bilder generieren. Die Idee, die hinter einer bildgenerativen KI steckt, ist das Generieren eines komplexen Bildes anhand eines beschreibenden Prompts. Ich persönlich bin im Kunstunterricht in der Schule nie über die Note 3 hinausgekommen, was sich aber mittlerweile bei ähnlich untalentierten Schüler*innen dank KI-Unterstützung ändern dürfte. Gib in das Eingabefeld einen Prompt deiner Wahl ein und lass dich vom Ergebnis überraschen! Tipp: Die besten Ergebnisse erzielt man bei bildgenerativen KIs (noch) dadurch, dass der Prompt in englischer Sprache formuliert wird. Solltest du nicht ganz so sattelfest in der englischen Sprache sein, dann hilft dir DeepL auf die Sprünge, das ich in Abschnitt 1.4.1 vorgestellt habe. Außerdem ist es ratsam, für die ersten Versuche den Prompt so kurz wie möglich zu halten, sich also nur auf einige Stichworte zu beschränken. Lass dich von den Beispielen auf der Startseite inspirieren! Deren Prompts erscheinen, wenn man das Bild mit der Maus überfährt (siehe Abbildung 1.19).
2 Der Name DALL-E ist ein Wortspiel aus dem Namen des kleinen Roboter Wall-E aus Disneys gleichnamigem Film und dem des weltbekannten surrealistischen Künstlers Salvador Dalí.
35
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Abbildung 1.19 In diesem Beispiel zur bildgenerativen KI DALL-E offenbart sich bereits eine kleine Schwäche: die aktuellen Tools haben Probleme, Hände korrekt darzustellen.
Kostenlos, aber nicht umsonst: Craiyon Wenn dir für deine ersten Experimente im Bereich der bildgenerativen KIs dein Geld zu schade ist, solltest du dir Craiyon ansehen (www.craiyon.com). Auf der kostenlosen, werbefinanzierten Seite kannst du nach Herzenslust experimentieren, ohne einen Cent zu bezahlen. Mit Craiyon habe ich erst kürzlich einen Wettbewerb zur bildgenerativen KI mit Schüler*innen durchgeführt und durchaus ansprechende Ergebnisse erhalten.
Abbildung 1.20 Craiyon ist kostenlos und produziert ansprechende Ergebnisse – hier zum Prompt »dog in front of flying saucer« = »Hund vor einer fliegenden Untertasse«.
36
1.4
Ein Zoo voller Bots
1.4.4 Midjourney Diese bildgenerative KI hat es wirklich in sich: Im April 2023 schockierte ein Bild die Weltöffentlichkeit, das den Papst in einer überdimensionierten Luxusdesigner-Daunenjacke präsentierte, wie sie gewöhnlich nur Oligarchen oder Rapper tragen (siehe Abbildung 1.21). Das Fake-Bild wurde mit der KI Midjourney generiert. Einmal mehr zeigt sich an dem Beispiel: Traue keinem Bild, das im Internet an die Öffentlichkeit gelangt.
Abbildung 1.21 Spätestens beim Erscheinen eines KI-Fake-Bildes von Papst Franziskus dämmerte es vielen Menschen, welche Möglichkeiten (aber auch welche potenziellen Gefahren) generative Bild-KIs mit sich bringen. Den zur Generierung des Bildes verwendeten Prompt findest du über dem Bildquadranten.
Auch wenn die Einarbeitung in Midjourney aufgrund der etwas umständlichen Einbindung in Discord nicht ganz intuitiv ist, ist es doch das Werkzeug, das mit seinen Möglichkeiten die Konkurrenz aktuell weit hinter sich lässt. Gehe folgendermaßen vor, um Zugang zu Midjourney zu erhalten: 1. Midjourney erfordert einen Account beim beliebten Onlinedienst Discord. Falls du noch keinen besitzt, erstelle auf https://discord.com ein Konto. 2. Gehe nun zu www.midjourney.com und klicke auf die Schaltfläche Sign in. Du wirst aufgefordert, dich bei Discord anzumelden. Verwende dazu deine Discord-Zugangsdaten. 3. Bestätige die Aufforderung, dass Midjourney Zugang zu deinem Discord-Account erhält.
37
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
4. Nachdem du dich auf der Midjourney-Seite angemeldet hast, wird dir ein Zugang in deinem Discord-Client (das kann dein Browser oder eine eigenständige App sein) zur Verfügung gestellt. Klicke darin auf das Midjourney-Symbol (ein stilisiertes Segelboot). Nun kannst du dir erst einmal das bunte Treiben in einem der Newbie-Kanäle anschauen. 5. Die eigentliche Interaktion zum Erzeugen eigener Bilder erfolgt über Befehle im Bereich der Midjourney-Kommunikationskanäle (Rooms genannt) oder im privaten Chatbereich.
Abbildung 1.22 Midjourney wird über einen Discord-Zugang genutzt. Idealerweise beobachtet man zunächst einmal die Experimente anderer in einem der Newcomer Rooms.
In der Startphase von Midjourney erhielt man nach der Anmeldung 25 Minuten Prozessorzeit auf einem Midjourney-Server für erste eigene Experimente. Dieses Freikontingent wurde mittlerweile gestrichen, sodass du um ein Abonnement nicht herumkommst. Um eines zu erhalten, gibst du einfach den Befehl /subscribe in der Befehlszeile
38
1.4
Ein Zoo voller Bots
am unteren Bildrand ein und folgst dem nun erscheinenden Link zur Abo-Seite. Für den Einstieg empfiehlt sich das Basisabonnement für 8 US$ pro Monat. Darin enthalten sind 200 Bildgenerierungen bzw. 200 Minuten Prozessorzeit. Ein erstes Bild erzeugst du durch Eingabe des Prompts /imagine . Beginne mit nicht allzu komplexen Beschreibungen und verfeinere deine Kommandos iterativ. Eine gründliche Vorstellung von Midjourney und seinen Möglichkeiten findest du in Kapitel 4, »Kunst mit KI«.
1.4.5 Unendliche Weiten … Wie bereits erwähnt, bevölkert eine große Menge spezialisierter KI-Bots den Markt. Auf jedes dieser Werkzeuge detailliert einzugehen, würde den Rahmen des Buches sprengen. Das ist aber auch gar nicht notwendig, denn das Bedienungskonzept generativer KIs ist überall gleich: Die Ergebnisse werden stets durch geschickte Texteingaben (die sogenannten Prompts, siehe Abschnitt 1.1.1, »Startschuss und Hype«) erzeugt. Es verhält sich beim Umgang mit den unterschiedlichen Bots ähnlich wie mit Programmiersprachen. Flapsig ausgedrückt könnte man sagen: »Kennste eine(n), kennste alle!« Tabelle 1.2 gibt einen kleinen Überblick generativer KIs, die Spezialgebiete bedienen. Dabei unerwähnt bleiben KI-Integrationen in Standardsoftwarepakete bzw. -umgebungen, wie z. B. Microsoft Office 365 Copilot, Bing mit ChatGPT im Microsoft Edge Browser oder Google Bard. Auf diese gehe ich in späteren Kapiteln an geeigneter Stelle ebenfalls noch ein. Name der KI
Webseite
Einsatzgebiet
Jasper AI
www.jasper.ai
Blog- und Social-Media-Inhalte/ Marketing
Synthesia
www.synthesia.io
KI-Videoproduktion
Do Not Pay
https://donotpay.com
juristische Hilfestellung
Repurpose IO
https://repurpose.io
automatische Posts auf SocialMedia-Kanälen
Jenni AI
https://jenni.ai
Essays/Schriftstellerei
Fireflies
https://fireflies.ai
Erstellen automatischer Notizen
Murf
https://murf.ai
Text-zu-Sprache-KI
Timely
https://timelyapp.com
KI-basierte Zeiterfassung
Tabelle 1.2 Tabelle einiger spezialisierter KIs
39
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Name der KI
Webseite
Einsatzgebiet
FactGPT
www.longshot.ai/ features/longshot-fact-gpt
Textbot, der faktenbasiert arbeitet
Browse AI
www.browse.ai
Website Monitoring
GitHub Copilot
https://github.com/features/ copilot
Programmierung
Phind
www.phind.com
KI-unterstützte Suchmaschine
Aleph Alpha
www.aleph-alpha.com
KI-Bot aus Deutschland, DSGVOkonform
Tabelle 1.2 Tabelle einiger spezialisierter KIs (Forts.)
1.4.6 Der Beipackzettel: Warnung vor (zu) großen Erwartungen und Gefahren Du hast im Rahmen der Einführung schon erste Erfahrungen mit generativen KIs sammeln können und blickst nun voller Begeisterung und Vorfreude auf eine goldene Zukunft, in der dir monotone Arbeiten durch Bots aller Art abgenommen werden? An dieser Stelle ist eine deutliche Warnung angebracht (siehe dazu auch Abbildung 1.4). Begutachte die Ergebnisse, die dir die KIs liefern, stets kritisch im Hinblick auf folgende Fragen: Stimmen die Fakten der KI-generierten Aussagen? Das lässt sich in der Regel nur durch eigene Expertise bzw. eine fundierte Recherche prüfen – Google und Wikipedia lassen hier grüßen. Aus welchen Quellen stammen die Ergebnisse? Wurden gegebenenfalls Quellen und Fakten von der KI dazuhalluziniert? Gerade bei ChatGPT ist die Herkunft der Materialien für Antworten nicht direkt ersichtlich. Fällt das dargebotene Material unter das Urheberrecht, weil einige Quellen zum Training des Sprachmaterials ohne explizite Genehmigung »angezapft« wurden? Unterliegen die von mir in der Öffentlichkeit publizierten KI-generierten Texte (z. B. eine Bachelorarbeit, Masterarbeit oder gar Dissertation) der Kennzeichnungspflicht? Was sagen dazu die Prüfungsrichtlinien? Wurden Rechnungen bzw. Kalkulationen, die ich KI-gestützt erzeugt habe, sachgerecht durchgeführt? Bei numerischen Ergebnissen ist es immer sinnvoll, diese per Hand – sprich Taschenrechner – zu überprüfen. Spoiler: ChatGPT kann selbst (noch) nicht rechnen; der Bot wurde darauf nicht explizit trainiert.
40
1.4
Ein Zoo voller Bots
Verstoße ich bei der Fütterung der KI mit eigenen Prompts gegen den Datenschutz oder gar gegen Geschäftsgeheimnisse, weil ich vertrauliche oder personenbezogene Daten an die KI weitergebe? Beachte, dass deine Prompts in der Standardkonfiguration bzw. bei der kostenlosen Variante von ChatGPT für das Training verwendet werden und dadurch früher oder später im Datenbestand der KI landen. Beachte stets die Gefahr von Deepfakes: Wie sehr kann ich einem Text/Bild/Video, den oder das ich im Internet gefunden habe, trauen? Bei der Leistungsfähigkeit aktueller KI-Bots ist es oft schwer, Fiktion von Wirklichkeit zu unterscheiden. Abschließend betrachten wir noch Abbildung 1.23, das aufzeigen soll, welchen Einfluss eine neue Technologie wie ChatGPT im Speziellen oder generative KIs im Allgemeinen auf die Zukunft haben kann bzw. haben wird. Das sogenannte Dagstuhl Dreieck (erstmals publiziert von Beat Döbeli Honegger et al. auf dem Dagstuhl Seminar im März 2016)3 zeigt, wie drei verschiedene Bereiche miteinander in Wechselwirkung stehen, um den Erfolg sowie die sinnvolle Nutzung einer bestimmten Technologie im Bildungsumfeld einordnen zu können.
Tec Wie hn fun olo kt gis ion ch ier eP td ers as? pe kti ve
ve
ti ek
p as? ers td eP irk rell e w ltu Wi h-ku c ftli
ha
lsc
sel
Ge
ChatGPT
Anwendungsorientierte Perspektive Wie nutze ich das?
Abbildung 1.23 Dagstuhl-Dreieck zu ChatGPT. Nach einer Abbildung von Pascal Schiebenes in Anlehnung an Beat Döbeli Honegger et al. (veröffentlicht unter Creative Commons Lizenz CC-BY-SA) 3 https://dagstuhl.gi.de/dagstuhl-erklaerung
41
1
KI-Bots – der Produktivitäts- und Kreativitätsschub
Die technologische Perspektive untersucht und bewertet, wie die Systeme funktionieren, die unsere digitale Welt ausmachen. Sie erklärt, wie diese Systeme erweitert und gestaltet werden können. Die gesellschaftlich-kulturelle Perspektive untersucht, wie die digitale Welt und wie digitale Medien die Individuen und die Gesellschaft beeinflussen. Die anwendungsbezogene Perspektive konzentriert sich darauf, wie man Systeme gezielt auswählt und effektiv und effizient nutzt, um individuelle und kooperative Ziele zu erreichen. Sie beantwortet die Fragen warum und wie man Werkzeuge auswählt und nutzt. Vor dem Hintergrund der Darstellung kann man bereits jetzt sagen, dass KI-Bots eine irreversible Wirkung auf die Gesellschaft ausgeübt haben. Der Geist wurde aus der Flasche befreit; es liegt an uns, ihn sinnvoll, produktiv und friedlich zu nutzen.
42
2
Intelligente Textverarbeitung
Kapitel 2 Intelligente Textverarbeitung Wer kennt das nicht: Man starrt auf die leere Seite seines Textverarbeitungsprogramms und weiß einfach nicht, wie man sie füllen soll – sei es im Rahmen einer Hausarbeit oder beim Kündigungsschreiben für eine Versicherung. Keine Sorge, die Hilfe ist nur einen Prompt entfernt ...
In diesem Kapitel lernst du, wie man mit ChatGPT und geschickten Prompts geschliffene Texte aller Art produzieren kann. Erörterungen, Essays, Kurzgeschichten, Reden für feierliche Anlässe, aber auch Moderationen für Podcasts, Skripte für YouTube-Videos oder typische SEO-Aufgaben – all das lässt sich mit KI-Textbots im Handumdrehen erledigen – vorausgesetzt, du beschäftigst dich mit der Kunst des Prompt Engineerings.
2.1 Der KI-Sekretär Beginnen wir mit einigen klassischen Aufgaben, die uns in der Prä-KI-Zeit so manche vermeidbare Stunde gekostet haben und die sich nun wie von Zauberhand in wenigen Sekunden erledigen lassen. Dazu braucht es noch keine hochoptimierten Eingabeaufforderungen, sprich Prompts.
2.1.1 E-Mails beantworten Wer kennt ihn nicht, den Zeitfresser Nummer eins im Büroalltag? Das Beantworten der nicht enden wollenden Flut von E-Mails. Als Autor im IT-Bereich kann ich ein Lied davon singen, z. B. wenn mal wieder Supportanfragen von Leser*innen an mich durchgereicht werden. Dazu folgendes Fallbeispiel: Ein Leser stellte mir folgende Anfrage: »Sehr geehrter Herr Hattenhauer, auf meinem Android Smartphone erhalte ich stets bei Eingaben bzw. Antippen von Schaltflächen eine Sprachausgabe des Befehls. Tippe ich
43
2
Intelligente Textverarbeitung
die Schaltfläche ein weiteres Mal an, dann wird der Befehl schließlich ausgeführt. Wie kann ich dieses Verhalten abstellen?« Folgender Prompt hilft bei der Beantwortung der Frage weiter: Beantworte die folgende Anfrage in Form einer Mail. Es handelt sich bei dem Autor um einen Leser meines Buchs zu Android Smartphones. Der Text der ursprünglichen Mail lautet:[Text der Mail]
Die Antwort des Chatbots sieht wie folgt aus: Betreff: Lösung für ungewollte Sprachausgabe auf Ihrem Android Smartphone Sehr geehrter Leser meines Buchs, vielen Dank für Ihre E-Mail und das Interesse an meinem Buch zu Android Smartphones. Es freut mich, dass Sie sich an mich gewandt haben, um Hilfe bei Ihrem Anliegen zu erhalten. Ihre Beschreibung legt nahe, dass die "TalkBack"-Funktion auf Ihrem AndroidGerät aktiviert ist. TalkBack ist eine Funktion für sehbehinderte oder blinde Nutzer, die eine Sprachausgabe für Aktionen auf dem Bildschirm bietet. Um diese Funktion auszuschalten, folgen Sie bitte den unten aufgeführten Schritten: Öffnen Sie die Einstellungen-App auf Ihrem Android-Smartphone. Scrollen Sie nach unten und wählen Sie "Bedienungshilfen" oder "Eingabehilfe" (je nach Gerät und Android-Version). Suchen Sie in der Liste nach "TalkBack" oder einer ähnlichen Bezeichnung wie "Voice Assistant" oder "Screen Reader". Tippen Sie auf den Eintrag und deaktivieren Sie die Funktion, indem Sie den Schalter neben "TalkBack" auf "Aus" stellen. Nachdem Sie diese Einstellung vorgenommen haben, sollte die Sprachausgabe beim Antippen von Schaltflächen oder Eingaben nicht mehr erfolgen. Wenn Sie weiterhin Probleme haben oder Fragen zu anderen Funktionen Ihres Android-Geräts haben, stehe ich Ihnen gerne zur Verfügung. Ich hoffe, dass ich Ihnen mit diesen Informationen weiterhelfen konnte. Sollten Sie noch weitere Fragen oder Anliegen haben, zögern Sie bitte nicht, mich zu kontaktieren. Mit freundlichen Grüßen, [ Ihr Name ] Autor von [Titel Ihres Buchs]
Bei der Antwort erschließen sich unmittelbar folgende Vorzüge des Chatbots: Die äußere Form der E-Mail entspricht exakt den Vorgaben für eine geschäftliche E-Mail. Der Lösungsvorschlag trifft den Nagel auf den Kopf. Achtung: Das muss nicht immer so sein! Bei technischen Fragen solltest du stets noch eine Google- oder Wikipedia-
44
2.1
Der KI-Sekretär
Recherche durchführen, um die vom Bot genannten Fakten zu prüfen. Es ist durchaus möglich, dass die KI bestimmte Dinge halluziniert (sprich sich ausdenkt). Bei Standardaufgaben wie der Beantwortung von E-Mails kann man die Prompts in einfachem, umgangssprachlichem Ton formulieren. Dazu benötigt man noch keine Superprompts. Sollte dir die obige Antwort zu lang erscheinen, dann kannst du die Kommunikation fortsetzen und den Bot um eine kürzere Variante bitten: Kürze den Text der Mail auf 50 Wörter, ohne dass etwas Wesentliches vom Inhalt verloren geht.
Die neue Antwort des Bots könnte folgendermaßen aussehen:1 Betreff: Deaktivieren der Sprachausgabe auf Android Sehr geehrter Leser, Ihr Problem ist auf die aktivierte "TalkBack"-Funktion zurückzuführen. Um sie zu deaktivieren: Einstellungen > Bedienungshilfen > TalkBack > Schalter auf "Aus". Bei weiteren Fragen stehe ich Ihnen gerne zur Verfügung. Mit freundlichen Grüßen, [ Ihr Name ]
Dadurch offenbart sich eine weitere interessante Eigenschaft von Chatbots: Der Bot »merkt« sich die vorangegangene Kommunikation bzw. vorhergehende Kommandos, so etwa auch Rollen und Stile, die man dem Bot im Rahmen eines Prompts zuweist – mehr dazu aber später.
2.1.2 Formelle Schreiben Klassiker wie Kündigungen, Beschwerden oder Anfragen lassen sich ebenfalls im Handumdrehen anfertigen. Nimm an, du möchtest das Abonnement bei einer Zeitung kündigen, da du einfach keine Zeit mehr hast, diese in Ruhe zu lesen. Ein möglicher Prompt könnte folgendermaßen aussehen: Erstelle ein Kündigungsschreiben für das Abonnement einer Zeitung. Gründe für Kündigung: Keine Zeit mehr, diese zu lesen. Werbung in der Zeitung nimmt überhand. Preis-Leistungs-Verhältnis nicht mehr gegeben.
1 Beachte, dass du die in den Beispielen gezeigten Antworten der KI nicht 1 : 1 wirst reproduzieren können. Das liegt am Prinzip: Der Bot »würfelt« die Antwort auf einen speziellen Prompt jedes Mal neu aus. Es wurden die Ausgaben der Bots 1 : 1 übernommen und keine Rechtschreib- und Grammatikkorrektur vorgenommen.
45
2
Intelligente Textverarbeitung
Eine mögliche Antwort des Bots könnte folgendermaßen aussehen: [Dein Name] [Deine Adresse] [Deine Postleitzahl und Stadt] [Name der Zeitung] [Adresse der Zeitung] [Postleitzahl und Stadt der Zeitung] [Ort], den [Datum] Betreff: Kündigung meines Abonnements der [Name der Zeitung] Sehr geehrte Damen und Herren, hiermit möchte ich mein Abonnement der [Name der Zeitung], Kundennummer [Kundennummer], fristgerecht zum nächstmöglichen Zeitpunkt kündigen. In den letzten Monaten hat sich meine Lebenssituation dahingehend verändert, dass ich kaum noch Zeit finde, Ihre Zeitung ausführlich zu lesen. Das tägliche Lesen der Zeitung war für mich ein wichtiger Teil meines Tagesablaufs, aber aufgrund von beruflichen und privaten Verpflichtungen ist dies nun nicht mehr möglich. Darüber hinaus ist mir aufgefallen, dass die Anzahl der Werbeanzeigen in der Zeitung in letzter Zeit stark zugenommen hat. Dies führt dazu, dass ich den redaktionellen Inhalt zunehmend schwieriger finde und das Lesen für mich an Reiz verliert. Zuletzt möchte ich anmerken, dass meiner Meinung nach das Preis-/Leistungsverhältnis für das Abonnement nicht mehr gegeben ist. Die stetig steigenden Kosten für das Abonnement stehen für mich in keinem angemessenen Verhältnis zum gebotenen Inhalt. Ich bitte Sie, mir den Erhalt dieser Kündigung schriftlich zu bestätigen und mir das genaue Datum der Vertragsbeendigung mitzuteilen. Vielen Dank für Ihr Verständnis und die bisherige Zusammenarbeit. Ich wünsche Ihnen und Ihrem Team für die Zukunft alles Gute. Mit freundlichen Grüßen, [Dein Name]
Wie du siehst, kannst du den Prompt auch stichwortartig gestalten, um einen umfassenden, vollständigen Text zu erhalten. Darüber hinaus hält der Bot sämtliche Formalia eines Kündigungsschreibens ein, sodass dieses auch juristisch wasserdicht ist.
46
2.1
Der KI-Sekretär
Regeln für Standardtextaufgaben Formuliere deine Prompts in klarer, einfacher Sprache. Es genügen bereits einige Stichworte, die das Schreiben oder die E-Mail enthalten
soll. Erläutere, in welchem Kontext die Antwort stehen soll (E-Mail, Beschwerde, Kündi-
gung, ...). Verfeinere das Ergebnis, falls es noch nicht deinen Anforderungen entspricht, durch
weitere Prompts. Die KI »merkt« sich vorhergehende Eingaben innerhalb eines Chatverlaufs. Dieses Vorgehen bezeichnet man als Iteration eines Prompts. Du kannst den Umfang der Antwort bestimmen, indem du eine bestimmte Wortan-
zahl oder Absatzanzahl vorgibst. Auch der Tonfall eines Textes lässt sich per Prompt (seriös, freundlich, verärgert, ...)
feintunen.
2.1.3 Erörterungen und Entscheidungsfindung Die eigene Schulzeit ist noch präsent genug, um sich an das leidige Thema der Erörterung zu erinnern, denn sie steht ganz oben auf dem Pflichtcurriculum der Deutschlehrerinnen und -lehrer: pro – contra – pro – contra oder pro – contra – contra – pro. Bei einer Erörterung geht es darum, zwei konträre Standpunkte gegeneinander abzuwägen. Das dafür notwendige Verfahren ist in ChatGPT bereits eintrainiert. Testen wir es mit folgender Aufgabenstellung: Schreibe eine Erörterung darüber, ob es in einer Verwaltung sinnvoller ist, ein kommerzielles Betriebssystem wie Windows oder ein quelloffenes Betriebssystem wie Linux zu verwenden.
Hier auszugsweise die Antwort von ChatGPT: Titel: Kommerzielles oder quelloffenes Betriebssystem in der Verwaltung Windows oder Linux? Einleitung In der heutigen digitalen Welt sind Betriebssysteme der Kern jeder Verwaltung. Bei der Entscheidung, welches Betriebssystem eingesetzt werden soll, stehen Organisationen häufig vor der Wahl zwischen kommerziellen und quelloffenen Systemen wie Windows und Linux. In dieser Erörterung werden wir die Vor- und Nach-
47
2
Intelligente Textverarbeitung
teile beider Systeme betrachten, um eine fundierte Entscheidung darüber treffen zu können, welche Option für eine Verwaltung am sinnvollsten ist. Pro-Argumente für kommerzielle Betriebssysteme wie Windows 1. Benutzerfreundlichkeit: Windows ist bekannt für seine benutzerfreundliche Oberfläche und einfache Bedienung. Dies kann in einer Verwaltung von Vorteil sein, da Mitarbeiter möglicherweise weniger Schulungen benötigen und schneller mit der Arbeit beginnen können. [...] Contra-Argumente gegen kommerzielle Betriebssysteme wie Windows 1. Kosten: Die Lizenzierung und Wartung von Windows kann kostspielig sein, insbesondere für große Verwaltungen mit vielen Computern. Dies kann ein wesentlicher Nachteil gegenüber quelloffenen Alternativen sein. [...] Pro-Argumente für quelloffene Betriebssysteme wie Linux 1. Kosteneffizienz: Linux ist kostenlos und erfordert keine Lizenzgebühren. Dies kann zu erheblichen Kosteneinsparungen führen, insbesondere für große Verwaltungen. [...] Contra-Argumente gegen quelloffene Betriebssysteme wie Linux 1. Steilere Lernkurve: Linux erfordert möglicherweise mehr Schulungen und Einarbeitungszeit für Mitarbeiter, da es als weniger benutzerfreundlich als Windows gilt. Fazit Die Wahl zwischen einem kommerziellen und einem quelloffenen Betriebssystem hängt von den spezifischen Bedürfnissen und Ressourcen einer Verwaltung ab. Wenn Benutzerfreundlichkeit, Software-Kompatibilität und professioneller Support höhere Prioritäten haben, kann ein kommerzielles Betriebssystem wie Windows die bessere Wahl sein. Andererseits kann eine Verwaltung, die Kosteneffizienz, Anpassungsfähigkeit und Sicherheit als wichtigere Faktoren betrachtet, von einem quelloffenen Betriebssystem wie Linux profitieren [...]
Die vom KI-Bot durchgeführte Erörterung kann hervorragend als Entscheidungshilfe herangezogen werden. Es ist anzumerken, dass vom Bot generierte Erörterungen stets ergebnisneutral ohne Präferenzen erstellt werden. Möchtest du hingegen deine Arbeitgeber oder Kunden bei der Entscheidungsfindung in eine bestimmte Richtung dirigieren, dann teile das ChatGPT mit: Ich arbeite auf einer Verwaltung. Erstelle auf der Basis der obigen Erörterung einen Vorschlag an meinen Arbeitgeber, dass wir im IT-Bereich von Windows nach Linux wechseln sollten.
48
2.1
Der KI-Sekretär
Die Antwort folgt prompt (hier ein Auszug): Betreff: Vorschlag zur Umstellung von Windows auf Linux im IT-Bereich unserer Verwaltung Sehr geehrte [Vorgesetzte/r oder Entscheidungsträger/in], ich möchte Ihnen einen Vorschlag unterbreiten, der unserer Verwaltung langfristig Kosteneinsparungen, erhöhte Sicherheit und mehr Flexibilität im IT-Bereich ermöglichen kann. Nach sorgfältiger Abwägung der Vor- und Nachteile von kommerziellen und quelloffenen Betriebssystemen empfehle ich, unsere Verwaltung von Windows auf Linux umzustellen. Im Folgenden sind die Hauptgründe für diese Empfehlung aufgeführt: 1. Kosteneffizienz: Der Wechsel von Windows zu Linux ermöglicht es uns, Lizenzgebühren und Wartungskosten einzusparen, da Linux kostenlos und ohne Lizenzgebühren verfügbar ist. Diese Einsparungen könnten in andere Projekte oder Ressourcen investiert werden, um die Effizienz unserer Verwaltung weiter zu steigern. 2. Sicherheit: Linux gilt als sicherer als Windows, da es weniger anfällig für Viren und Malware ist. Eine Umstellung auf Linux würde die Systemstabilität und Sicherheit unserer Verwaltung verbessern und das Risiko von Ausfallzeiten und Datenverlusten verringern. [...]
ChatGPT: Was tun bei unvollständigen Antworten? Bei Verwendung des aktuellen Sprachmodells »verschluckt« sich ChatGPT schon einmal an umfangreicheren Antworten und hält inne. Sollte eine Ausgabe abrupt enden, so hilft die Eingabe des Prompts bitte weiter dem Bot auf die Sprünge. Sollte der Bot wider Erwarten mit der Antwort von vorn beginnen, hilft der Prompt bitte an der letzten Stelle fortfahren. Der Text wird anschließend nahtlos weiter generiert.
Abbildung 2.1 Ab und zu muss ChatGPT zur Weiterarbeit »ermuntert« werden.
49
2
Intelligente Textverarbeitung
2.1.4 Gutachten und Dokumentationen Auf dem Gebiet der Gutachten und Dokumentationen wird der generativen KI eine goldene Zukunft vorausgesagt: Insbesondere im medizinischen Bereich ist eine lückenlose Dokumentation von Diagnosen und Behandlungen zwingend notwendig. Das medizinische Fachpersonal erstickt geradezu an der überbordenden Bürokratie. Wie schön wäre es, wenn ein kompletter Bericht zu einem Fall vollautomatisch anhand vordefinierter Stichworte vom KI-Bot verfasst werden könnte. Vor diesem Hintergrund ist allerdings Vorsicht geboten: Obwohl bereits heute technisch möglich, ist es gemäß DSGVO (= Datenschutz-Grundverordnung) schlichtweg verboten, sensible Patientendaten in die Hände eines im Ausland gehosteten Bot-KI-Systems zu geben. Es ist aber eine Frage der Zeit, bis derartige Systeme auf lokalen Rechnern laufen und der DSGVO entsprechen werden. In der Zwischenzeit schauen wir uns das folgende harmlose Beispiel an. Du bist Chef(in) eines kleinen Handwerksbetriebs und sollst ein Arbeitszeugnis für einen Praktikanten erstellen, der, nicht unbedingt mit Übereifer geglänzt hat. Nun darf aber in einem Arbeitszeugnis nichts Negatives über die zu beurteilende Person stehen. Andererseits kennen Arbeitgeber eine spezielle Formulierungstechnik, um eine Botschaft für künftige Arbeitgebende durchdringen zu lassen. Diese Technik beherrscht auch ChatGPT: Erstelle ein Arbeitszeugnis für einen Praktikanten, der in meinem Betrieb gearbeitet hat. Dieser war oft unpünktlich und verstand die ihm übertragenen Arbeitsaufträge erst nach mehrfachem Erklären. Bei anderen Kollegen kam seine vorlaute Art nicht gut an. Beachte: Das Arbeitszeugnis darf nur positive Aussagen über den Praktikanten enthalten.
Dazu schreibt uns der KI-Chef Folgendes: Arbeitszeugnis Praktikum von [Vorname Nachname] [Vorname Nachname] absolvierte in der Zeit vom [Beginn des Praktikums] bis zum [Ende des Praktikums] ein Praktikum in unserem Betrieb, der [Firmenname]. Herr/Frau [Nachname] zeigte stets ein besonderes Interesse an der persönlichen Weiterentwicklung und war offen für neue Herausforderungen. Seine Bereitschaft, sich auf neue Aufgaben einzulassen, war lobenswert. Herr/Frau [Nachname] war bemüht, die ihm übertragenen Aufgaben zu verstehen und umzusetzen, was gelegentlich eine intensivere Einarbeitung erforderte. Sein Engagement und seine Eigeninitiative trugen dazu bei, dass er auch in diesen Situationen stets sein Bestes gab.
50
2.1
Der KI-Sekretär
Herr/Frau [Nachname] zeigte sich engagiert, auch wenn er/sie manchmal etwas mehr Zeit benötigte, um seine Aufgaben zu bewältigen. Seine individuelle Arbeitsweise trug zu einem vielfältigen Arbeitsumfeld bei, und er/sie war bemüht, seine zeitliche Planung zu optimieren. Kommunikativ trat Herr/Frau [Nachname] selbstbewusst auf und war bereit, seine Meinung offen zu äußern. Durch seine direkte Art hat er/sie zu einer offenen und ehrlichen Kommunikation innerhalb des Teams beigetragen. Wir bedanken uns bei Herrn/Frau [Nachname] für seine Mitarbeit in unserem Unternehmen und wünschen ihm/ihr für seinen/ihren weiteren beruflichen und persönlichen Werdegang alles Gute und viel Erfolg. Ort, Datum
Die kritischen Stellen, bei denen die Alarmglocken künftiger Arbeitgeber*innen schrillen, wurden fett markiert. Und nun wechseln wir die Seiten: Du bist eben jener Praktikant und möchtest wissen, was die Chefetage wirklich über dich denkt. Dann frag doch einfach ChatGPT! Ich habe von meinem Chef ein Arbeitszeugnis erhalten. Es scheint mir, als wären in dem Zeugnis auch negative Aussagen über mich enthalten. Bitte identifiziere diese anhand des folgenden Textes aus dem Zeugnis: [...]
... und Sherlock GPT deckt Folgendes auf: In diesem Arbeitszeugnis gibt es einige Formulierungen, die möglicherweise negativ interpretiert werden könnten: 1. "Herr/Frau [Nachname] war bemüht, die ihm übertragenen Aufgaben zu verstehen und umzusetzen, was gelegentlich eine intensivere Einarbeitung erforderte.": Dies könnte darauf hindeuten, dass Sie Schwierigkeiten hatten, einige Aufgaben sofort zu verstehen oder umzusetzen und dass eine intensivere Einarbeitung notwendig war. 2. "Herr/Frau [Nachname] zeigte sich engagiert, auch wenn er/sie manchmal etwas mehr Zeit benötigte, um seine Aufgaben zu bewältigen.": Hier wird gesagt, dass Sie manchmal länger für die Bearbeitung Ihrer Aufgaben benötigten, was als negativ betrachtet werden könnte. [...]
Wohlgemerkt: Der Prompt aus Sicht einer Praktikantin bzw. eines Praktikanten wurde in einem neuen Chat ausgeführt, ohne den Prompt aus Arbeitgebersicht je gesehen zu haben. Das zeigt die Vielseitigkeit von ChatGPT, wenn es darum geht, bestimmte Sichtweisen oder Rollen einzunehmen.
51
2
Intelligente Textverarbeitung
2.1.5 Ansprachen und Festreden Ob nun zu Tante Ernas Geburtstag, zur Abi-Entlassung des Nachwuchses oder zum Jubiläum des Dorfschützenvereins: Wohl dem, der oder die aus dem Stand eine Rede zaubern kann. ChatGPT hilft dabei eher Mundfaulen auf die Sprünge. Die Strategie besteht darin, dem Bot stichwortartig Informationen zu Inhalt und Stil zukommen zu lassen. Wenn du komplett auf dem Schlauch stehst und keinen blassen Schimmer zu einem übergreifenden Thema hast, geh am besten schrittweise vor und lass dir zunächst einige Vorschläge zu einem zentralen Thema machen. Bedenke allerdings, dass der Trainingsdatenbestand der KI meist schon einige Jahre auf dem Buckel hat und somit topaktuelle Themen ausgeklammert werden. Was immer gut ankommt, sind Bezüge zu klassischen Zitaten. Dazu ein Beispiel: Ich benötige in meiner Funktion als Elternvertreter eine Rede zur Abiturentlassungsfeier meiner Tochter. Dabei würde ich gerne ein klassisches Zitat als zentrales Thema verwenden. Gib mir 5 Vorschläge für das zentrale Thema meiner Rede.
Hier ein Auszug der Antwort von ChatGPT: Es ist großartig, dass Sie als Elternvertreter eine Rede bei der Abiturentlassungsfeier halten möchten. Hier sind fünf Vorschläge für klassische Zitate, die als zentrales Thema Ihrer Rede dienen können: 1. "Bildung ist das, was übrig bleibt, wenn man alles, was man in der Schule gelernt hat, vergisst." - Albert Einstein Dieses Zitat betont die Bedeutung von lebenslangem Lernen und persönlicher Entwicklung, die über den schulischen Erfolg hinausgehen. 2. "Die einzige Konstante im Leben ist die Veränderung." - Heraklit Mit diesem Zitat können Sie die Schüler dazu ermutigen, flexibel und anpassungsfähig zu sein, da sie in ihrem Leben vielen Veränderungen begegnen werden. [...]
Na, das sieht doch schon einmal nicht schlecht aus. Darauf können wir aufbauen. Lass uns gleich das erste Zitat nehmen und einige persönliche Bezüge zum Auditorium einflechten: Nimm für das Gerüst der Rede das erste Zitat als zentrales Thema und erstelle dazu eine Rede in humorvollem Grundton. Folgende Dinge sollten darin erwähnt werden: Der Jahrgang war nicht sonderlich leistungsstark. Der Jahrgang war dennoch bei allen Lehrer*innen beliebt. Beim Abistreich wurde eine Schafherde über das Schulgelände getrieben, was nicht allen Lehrer*innen gefiel.
52
2.1
Der KI-Sekretär
Das Resultat kann folgendermaßen aussehen (hier ausnahmsweise einmal ungekürzt): Liebe Absolventinnen und Absolventen, liebe Lehrerinnen und Lehrer, liebe Eltern, und alle, die heute hier versammelt sind, ich stehe hier als stolzer Elternvertreter und möchte zuerst einmal allen Absolventinnen und Absolventen gratulieren. Ihr habt es geschafft! Das Abitur liegt hinter euch, und eine spannende Zukunft liegt vor euch. Albert Einstein sagte einmal: "Bildung ist das, was übrig bleibt, wenn man alles, was man in der Schule gelernt hat, vergisst." Nun, liebe Absolventinnen und Absolventen, ich bin sicher, dass ihr im Laufe der Jahre einiges gelernt habt – und auch einiges wieder vergessen werdet. Aber keine Sorge, das ist ganz normal und sogar erwünscht. Schließlich haben wir alle im Laufe unseres Lebens so manches gelernt, was wir heute nicht mehr benötigen. Wie viele von uns können sich noch an die binomischen Formel, den Satz des Pythagoras oder die lateinischen Deklinationen erinnern? Apropos Vergessen: Unser heutiger Jahrgang wird vermutlich nicht als der leistungsstärkste in die Geschichte eingehen. Aber seien wir ehrlich, Noten sind nicht alles im Leben. Tatsächlich zeichnet sich dieser Jahrgang durch etwas viel Wichtigeres aus: Beliebtheit. Ja, ihr habt es geschafft, die Herzen eurer Lehrerinnen und Lehrer zu gewinnen. Und das, obwohl ihr nicht immer die fleißigsten Schülerinnen und Schüler wart. Ein bemerkenswertes Kunststück, wenn ihr mich fragt! Aber es gibt noch einen weiteren denkwürdigen Moment, den wir nicht unerwähnt lassen dürfen: den Abistreich. Wer hätte gedacht, dass Schafe so gut zu euch passen? Die Idee, eine Schafherde über das Schulgelände zu treiben, war sicherlich originell und wird für lange Zeit in Erinnerung bleiben. Obwohl nicht alle Lehrerinnen und Lehrer darüber erfreut waren, müssen wir zugeben: Es war ein einzigartiges und humorvolles Ereignis, das uns alle zum Lachen gebracht hat. Liebe Absolventinnen und Absolventen, ich möchte euch mit auf den Weg geben, dass ihr stets offen für neues Wissen bleibt und den Humor, der euch ausgezeichnet hat, nicht verliert. Ihr habt bewiesen, dass man auch ohne Bestnoten erfolgreich sein kann, indem ihr die Herzen der Menschen um euch herum gewinnt. Also geht hinaus in die Welt, vergesst vielleicht einiges von dem, was ihr gelernt habt, aber behaltet eure charmante Art und euren Humor. Denn das sind die Dinge, die wirklich zählen. Herzlichen Glückwunsch zum Abitur und viel Erfolg auf eurem weiteren Lebensweg!
Sicher lässt sich eine derartige Rede noch nach Belieben durch weitere im Prompt vorgegebene Stichworte ausbauen. Wenn dir die Rede zu lang erscheint, dann weise
53
2
Intelligente Textverarbeitung
ChatGPT durch Angabe einer konkreten Wortanzahl an, diese entsprechend zu kürzen. Damit solltest du für alle kommunikativen Situationen gerüstet sein.
In Standardsoftware integrierte GPT-Bots Mittlerweile ist es unnötig, zwischen ChatGPT und Programmen wie Microsoft Word oder Microsoft Outlook hin und her zu springen. Der Konzern aus Redmond hat seinem Office-Paket mit dem Microsoft 365 Copilot eine gehörige Portion künstlicher Intelligenz spendiert. Hinter dem Copiloten verbirgt sich eine Schnittstelle zu ChatGPT, die direkt aus den Office-Modulen heraus aufgerufen werden kann. Auch andere Softwarehersteller sind auf den KI-Zug aufgesprungen und veredeln ihre Programme mit entsprechenden Schnittstellen.
Abbildung 2.2 Microsoft Copilot bringt ChatGPT in das beliebte Office-Paket Microsoft 365 ein. (Quelle: microsoft.com)
Übungen Jetzt bist du an der Reihe. Wende dein erworbenes Wissen über textgenerierende KIs auf folgende Aufgabenstellungen an: Erstelle ein Essay zum Thema: »Wie werden KI-Bots wie ChatGPT die Gesellschaft
und den Arbeitsmarkt beeinflussen?« Schreibe eine Kurzgeschichte über einen kleinen Roboter, der auf einer KI-Schule das
Einmaleins der Robotik lernt. Schreibe eine Erörterung zum Thema, ob generative KIs eher Fluch oder Segen für die
Menschheit sind.
54
2.2
Rechtschreib- und Formulierungshilfen
2.2 Rechtschreib- und Formulierungshilfen So manchem begabten Menschen bleibt der Weg zu besser bezahlten Jobs versperrt, weil er unter Legasthenie leidet. Hier können KI-Bots wahre Wunder bewirken: Sie polieren Texte, die vor Rechtschreib-, Grammatik- und inhaltlichen Fehlern nur so strotzen, so auf, dass ein unbedarfter Leser glaubt, sie seien von Profis geschrieben. ChatGPT ist in der Lage, aus wenigen Stichworten Texte zu generieren, sodass der mühsame Prozess, Formulierungen für einen bestimmten Sachverhalt zu finden, weitgehend automatisiert werden kann. Natürlich besteht nach wie vor die Notwendigkeit, eigene Gedanken selbst zu formulieren und zu Papier zu bringen. Hier schlägt die große Stunde des speziellen Tools DeepL Write, das bereits in Abschnitt 1.4.2 kurz vorgestellt wurde.
2.2.1 Eine Bewerbung schreiben Wie stelle ich mich einem potenziellen Arbeitgeber vor, und wie schaffe ich es in ein Vorstellungsgespräch? Dazu muss zunächst einmal das Bewerbungsanschreiben »sitzen« – moderne Personaler sortieren aus dem großen Bewerbungshaufen zunächst einmal alle Schreiben mit unzureichender Form und/oder Rechtschreib- und Grammatikfehlern heraus. Es gibt zwei Strategien, um eine Bewerbung mit KI-Hilfe zu gestalten: 1. Du lässt den Bot die komplette Bewerbung schreiben. Dazu benötigt das Programm folgenden Input: Beschreibung der Stelle, eigene Qualifikationen für die Stelle, Motivation zur Bewerbung. 2. Du lässt dir lediglich ein Gerüst für die Bewerbung erstellen, das die üblichen Formalien einhält, und füllst die Platzhalter mit deinen persönlichen Daten und Fähigkeiten aus. Es empfiehlt sich, diese mit einem Stilprüfungstool wie DeepL Write zu prüfen, sobald eigene Formulierungen zum Einsatz kommen. Probieren wir die erste Variante aus und führen dabei folgendes Experiment durch: Wir füttern ChatGPT mit den Informationen aus einer Stellenanzeige, geben unsere Fähigkeiten an und lassen die KI die restliche Arbeit machen (in den Auslassungen stehen die Informationen aus der verwendeten Stellenanzeige). Schreibe für mich eine Bewerbung auf die nachfolgende Stellenanzeige als KFZMechatroniker. Folgende Aufgabenbereiche stehen in der Stellenanzeige: [...] Folgende Qualifikationen werden erwartet: [...]
55
2
Intelligente Textverarbeitung
Meine Qualifikationen: Ich bin ausgebildeter Mechatroniker und habe Erfahrung mit den Marken Opel und Peugeot. Ich habe 4 Jahre in einem kleinen Autohaus gearbeitet. Ich kann selbstständig arbeiten.
Als Ergebnis liefert ChatGPT Folgendes (die Antwort wurde leicht gekürzt): Betreff: Bewerbung als KFZ-Mechatroniker (m/w/d) Sehr geehrte Damen und Herren, mit großem Interesse habe ich Ihre Stellenanzeige für die Position des KFZMechatronikers (m/w/d) gelesen. Gerne möchte ich mich hiermit auf die ausgeschriebene Stelle bewerben. Als ausgebildeter Mechatroniker mit vierjähriger Berufserfahrung in einem kleinen Autohaus, in dem ich hauptsächlich mit den Marken Opel und Peugeot gearbeitet habe, bin ich überzeugt, dass ich die geforderten Qualifikationen erfülle und mich als wertvolle Bereicherung für Ihr Team erweisen kann. In meiner bisherigen Tätigkeit habe ich mich umfassend mit Diagnosearbeiten am Fahrzeug mithilfe modernster technischer Prüfsysteme beschäftigt. Ich arbeite zuverlässig und qualitätsbewusst und zeige großes Interesse an innovativen Techniken. Die kontinuierliche Weiterbildung ist für mich selbstverständlich, um stets auf dem aktuellen Stand der Technik zu bleiben. Durch meine Erfahrungen im kleinen Autohaus habe ich gelernt, selbstorganisiert zu arbeiten und sowohl eigenständig als auch im Team effizient Lösungen zu finden. Meine Belastbarkeit und Einsatzfreude machen mich zu einem wertvollen Mitglied Ihres Teams. Neben meinen fachlichen Qualifikationen lege ich großen Wert auf Freundlichkeit und ein höfliches sowie sicheres Auftreten gegenüber Kunden. Ich bin davon überzeugt, dass diese Eigenschaften essenziell für eine erfolgreiche Zusammenarbeit und eine hohe Kundenzufriedenheit sind. Ich freue mich über die Gelegenheit, mich Ihnen persönlich vorzustellen und meine Eignung für die Position des KFZ-Mechatronikers in Ihrem Unternehmen zu unterstreichen. Bitte lassen Sie mich wissen, wann ich mich für ein Vorstellungsgespräch bei Ihnen melden darf. Für Rückfragen stehe ich Ihnen selbstverständlich jederzeit zur Verfügung. Mit freundlichen Grüßen, [Dein Name]
2.2.2 Einen eigenen Text bezüglich Rechtschreibung, Grammatik und Ausdruck prüfen und korrigieren Im letzten Abschnitt wurde bereits erwähnt, dass der Stein der Weisen in Bezug auf Stilprüfung DeepL Write ist, siehe dazu auch Abschnitt 1.4.2. Zum Test benötigen wir nach-
56
2.2
Rechtschreib- und Formulierungshilfen
folgend einen Text, der vor Fehlern nur so wimmelt. Dabei ist uns sicher ChatGPT behilflich: Du schreibst ab jetzt wie ein Schüler mit Rechtschreibschwäche. Schreibe mir in dieser Rolle einen kurzen Text (70 Worte), der die Grundlagen der Photosynthese erläutert. Kontext ist der Biologieunterricht einer 10. Klasse.
ChatGPT liefert prompt: Fotosinstese isst ein wichtiker Brozess, bei dem Pflantsen Sonnenlicht, Wasa und Kohlenstofdioxid umwadlen in Glukose und Sauerstof. Das Paßirt in Chloroflasten von den grünnen Bläten. Zuerst nimit das Blat Kolenstoffdioxit und Wasa auf. Dann benützt Chlorofül das Sonnelicht für Enerki um Glukose zu bilden. Dabei entstet Sauerstoff, das in die Luft ab gegeben wirt. Fotosinthese hilft Pflansen zum waksen und erzeugt Sauerstof für Lebewesen zum atmen.
Nun füttern wir das Ergebnis in DeepL Write und erhalten die Korrekturen aus Abbildung 2.3.
Abbildung 2.3 DeepL Write ist ein tolles Werkzeug, um Legastheniker*innen zu helfen. Natürlich sollte man immer noch einmal kritisch über das Ergebnis schauen, wie du hier am letzten Satz siehst.
Wie bereits im Einführungskapitel beschrieben, erhältst du durch Anklicken der unterstrichenen Wörter alternative Vorschläge für Formulierungen, sodass du den Text ganz nach deinem Geschmack verändern kannst. Auch bei Unklarheiten bezüglich der richti-
57
2
Intelligente Textverarbeitung
gen Schreibweise komplexer Ausdrücke helfen dir DeepL Write und auch ChatGPT auf die Sprünge. Letzterer Bot erläutert sogar die grammatikalischen Regeln, die dem Satzkonstrukt zugrunde liegen: Wie heißt es richtig: "... bei schönem, sonnigen und klaren Wetter" oder "bei schönem, sonnigem und klarem Wetter"? Begründe deine Antwort.
Der KI-Germanist erklärt uns darauf: Die korrekte Formulierung lautet: "... bei schönem, sonnigem und klarem Wetter." Der Grund dafür ist die deutsche Deklination, die sich auf die Anpassung von Adjektiven an das Geschlecht, den Fall und die Anzahl des Nomens bezieht, auf das sie sich beziehen. In diesem Fall haben wir es mit einer Nominalphrase zu tun, die das Adjektiv "schön" und die beiden zusammengesetzten Adjektive "sonnig" und "klar" enthält. Diese Adjektive beziehen sich auf das implizite Nomen "Wetter", das in diesem Kontext im Dativ steht und Neutrum ist (das Wetter). Da alle drei Adjektive sich auf das gleiche Nomen beziehen, müssen sie im gleichen Fall, Geschlecht und in der gleichen Anzahl dekliniert werden. Im Dativ Neutrum ist die korrekte Endung für Adjektive, die mit einem Artikel wie "bei dem" oder in diesem Fall der Präposition "bei" kombiniert sind, "-em". Daher sollten alle drei Adjektive die Endung "-em" haben: schönem, sonnigem und klarem.
Du kannst dir also in Zukunft das Nachschlagen im Duden sparen.2
2.2.3 Einen Text aus Fragmenten erstellen Äußerst nützlich ist die Eigenschaft generativer KIs, einen vollständig ausformulierten Text auf der Basis einiger Stichworte zu erstellen. Das könnte sich zu einem Gamechanger in einigen Berufsbereichen entwickeln, die von der lückenlosen Dokumentation von Sachverhalten leben – an erster Stelle seien hier Medizin und Jura genannt; aber auch Gutachterinnen und Gutachter in technischen Bereichen können von Chatbots profitieren. Diese müssen sich nun nicht mehr damit beschäftigen, adäquate Formulierungen für Sachverhalte zu finden, sondern können sich auf die Fakten konzentrieren. Es genügt, das Thema stichwortartig zu beschreiben.
2 »Das ist aber mit Kanonen auf Spatzen geschossen«, wirst du jetzt sicher sagen. Im vorliegenden Beispiel markiert die Rechtschreibprüfung gängiger Textverarbeitungen, z. B. Microsoft Word, das entsprechende Konstrukt und liefert Alternativvorschläge. Die Rechtschreibprüfung macht allerdings die zugrunde liegenden Grammatikregeln nicht transparent und ist auch nicht in der Lage, den Kontext in die Entscheidungsfindung mit einzubeziehen.
58
2.2
Rechtschreib- und Formulierungshilfen
Dazu ein Beispiel aus meinem eigenen Arbeitsumfeld. Alljährlich steht bei mir die Korrektur der Abiturklausuren im Fach Physik an. Zu jeder Arbeit muss ein Gutachten geschrieben werden, das sich auf das Manuskript der Schüler*innen beziehen und Vorzüge bzw. Schwächen herausarbeiten soll, um schließlich zur Entscheidungsfindung bezüglich der Note zu gelangen. Bereits während der Korrektur schreibe ich mir daher zu jeder Klausur Stichpunkte auf, die ich später für das Gutachten verwende. Der deutlich zeitaufwendigste Teil besteht, wie oben beschrieben, darin, sich passende Formulierungen aus den Fingern zu saugen. Lassen wir also mal ChatGPT die Arbeit machen. Es ist darauf zu achten, dass die an ChatGPT übermittelten Informationen vollständig anonymisiert sind, also insbesondere keine Klarnamen enthalten, die eine Zuordnung zum Prüfungskandidaten ermöglichen. Dies ist insbesondere vor dem Hintergrund interessant, dass Microsoft ein entsprechendes Tool in Form des Copilots in Microsoft 365 anbietet. Wer also Word und Excel mit der integrierten KI-Unterstützung nutzt, sollte damit auf keinen Fall sensible Daten verarbeiten, da diese unweigerlich in der Microsoft-Cloud landen und dort bei Bedarf von Microsoft eingesehen werden können. Der erste Schritt besteht darin, die Persönlichkeit deines KI-Co-Korrektors anhand eines ausführlichen Prompts vorzujustieren: Du arbeitest als Korrektor einer Abiturarbeit im Fach Physik. Ich werde dir stichwortartig Kommentare und Anmerkungen zu einzelnen Aufgabenteilen geben. Die Aufgabenteile werden mit Nummern abgekürzt, z. B. 1.1 , 1.2, ... Es werden Textbezüge zu Seiten hergestellt, deren Zahlen ich dir nenne. Schreibe Seitenzahlen stets in arabischer Notation, also 1, 2, 3, ... Deine Aufgabe ist es, ein fachliches Gutachten basierend auf den vorgegebenen Stichpunkten zu erstellen. Verwende dabei eine formelle Fachsprache. Bestätige diese Vorgaben mit OK.
Der Bot bestätigt zunächst den Auftrag. Bereits während der Korrektur habe ich mir die benannten Stichworte notiert, die ich nun in ChatGPT im nächsten Prompt einfüttere: Name der Schülerin: Maria Musterfrau. Stichworte zur Bearbeitung: 1.1 Probleme mit der Fachsprache: Maxima und Minima werden nicht präzise in der Beschreibung erfasst. Herleitung der Formel auf S. 2 korrekt 1.2 Darstellung der Messwerte o.k., Berechnung Wellenlänge und Fehlerbetrachtung korrekt durchgeführt [...]
59
2
Intelligente Textverarbeitung
ChatGPT erzeugt daraus folgendes Gutachten: Fachliches Gutachten zur Abiturarbeit im Fach Physik von Maria Musterfrau 1.1 In Aufgabenteil 1.1 zeigt die Schülerin einige Probleme bei der Verwendung der Fachsprache. Insbesondere werden Maxima und Minima nicht präzise in der Beschreibung erfasst. Dennoch ist die Herleitung der Formel auf Seite 2 korrekt. 1.2 Im Aufgabenteil 1.2 ist die Darstellung der Messwerte zufriedenstellend. Die Berechnung der Wellenlänge und die Fehlerbetrachtung wurden korrekt durchgeführt. [...] Insgesamt zeigt Maria Musterfrau in ihrer Abiturarbeit im Fach Physik eine gute Leistung, jedoch mit einigen Schwächen in der Fachsprache und einigen Unstimmigkeiten bei der Bearbeitung einzelner Aufgabenteile.
Faszinierend ist, dass der Bot zu einer eigenständigen Notenfindung kommt (»Gut«), welche sogar mit dem endgültigen Ergebnis der entsprechenden Arbeit übereinstimmte! Was noch stört, sind die vor jeder Zeile befindlichen Nummern der Aufgabenteile. Das gewöhnen wir dem Bot aber mit einem weiteren Prompt ab: Lass bitte die einführenden Kapitelnummern vor jedem Absatz weg.
Das anschließend erzeugte Gutachten ist nahezu druckreif.
Wie funktioniert eigentlich eine generative KI wie ChatGPT? Wie bereits im ersten Kapitel kurz angedeutet, arbeitet eine generative KI ähnlich wie eine intelligente Smartphone-Tastatur. Oberhalb einer solchen Tastatur erscheinen nach der Eingabe der ersten Wörter Vorschläge für das nächste Wort. Diese basieren darauf, dass beim Programmieren ein Lexikon in die App integriert wurde. Mit dessen Hilfe und der Wahrscheinlichkeitsrechnung versucht das Programm zu erraten, welche Folgewörter für eine bereits eingegebene Wortsequenz infrage kommen. ChatGPT arbeitet nach einem ähnlichen Prinzip: Die Frage wird zunächst auf bestimmte Schlüsselwörter hin untersucht. Diese sind in dem riesigen Datenbestand enthalten, aus dem ChatGPT gelernt hat bzw. trainiert wurde. Wir sprechen hier von mehreren Terabyte an Trainingsdaten. Der Bot sucht nun selbstständig nach passenden Satzvervollständigungen für die Antworten. Der Trainingsprozess der KI wurde vor der offiziellen
60
2.3
KI für Medienprofis
Freigabe in einem abgeschlossenen Test durch Menschen überwacht, die für die Antworten je nach Qualität ein positives bzw. negatives Feedback abgaben. Dieses Feedback geben mittlerweile auch die Nutzer des Bots nach Veröffentlichung der Software im November 2022 ab, sodass ChatGPT immer besser wird. Das ist quasi der Preis, den die Anwender*innen für die Nutzung der kostenlosen Version3 zahlen müssen. Zudem stellst du dem System durch deine Fragen weitere Daten zur Verfügung.
2.3 KI für Medienprofis Gestandene Journalistinnen und Journalisten sind in Alarmstimmung: Lösen sich ihre vermeintlich sicheren Jobs dank der Flut der KI-Bots bald in Wohlgefallen auf? Nun, dazu gibt es eine gute und eine schlechte Nachricht: Qualitätsjournalismus, der sorgfältiges Recherchieren erfordert, wird auch in Zukunft besser in menschlicher Hand bzw. im menschlichen Kopf aufgehoben sein. Boulevard-, Sport- oder Technikblätter, die lediglich eine einfache Reproduktion bekannter Sachverhalte anbieten, z. B die Beschreibung des Verlaufs eines Fußballspiels, werden vermehrt auf KI-Bots setzen. Es gibt mittlerweile die Möglichkeit, automatische Transkripte von Videokonferenzen in der Kollaborationssoftware Microsoft Teams durch einen KI-Bot anfertigen zu lassen. Dieser entnimmt seine Informationen direkt aus dem Videostream. Sehen wir uns im folgenden Abschnitt also einmal an, was textgenerative KI im medialen Bereich zu leisten vermag.
2.3.1 Erzeugen journalistischer Texte Du arbeitest in einem Redaktionsbüro und möchtest, das ChatGPT dir unter die Arme greift. Welche Möglichkeiten gibt es dazu? Frag doch einfach den Bot! Wie kann ich ChatGPT im journalistischen Bereich nutzen?
3 Nutzer der kostenpflichtigen Plusversion von ChatGPT haben die Möglichkeit, das Training mit ihren Daten und Prompts über einen Schalter in den Einstellungen zu unterbinden, siehe Abschnitt 2.6.4, »Privatmodus für ChatGPT aktivieren«.
61
2
Intelligente Textverarbeitung
Der Bot sprudelt nur so vor Ideen: ChatGPT kann im journalistischen Bereich auf verschiedene Arten nützlich sein. Hier sind einige Ideen, wie Sie ChatGPT als Journalist einsetzen können: 1. Recherche: Nutzen Sie ChatGPT, um schnell Fakten und Hintergrundinformationen zu sammeln, um Ihre Artikel zu unterstützen. Bitte beachten Sie, dass der Wissensstand von ChatGPT im September 2021 endet und Sie die Richtigkeit der Informationen überprüfen sollten. 2. Ideengenerierung: Verwenden Sie ChatGPT, um neue Themen, Perspektiven und Ansätze für Ihre Artikel zu erkunden. 3. Texterstellung: Nutzen Sie ChatGPT, um Entwürfe oder Abschnitte Ihres Artikels zu erstellen. Sie können auch ChatGPT verwenden, um Ihre Schreibblockaden zu überwinden oder neue Schreibstile auszuprobieren. 4. Korrekturlesen und Bearbeiten: Lassen Sie ChatGPT Ihren Text überprüfen, um mögliche Fehler oder Inkonsistenzen zu finden. Achten Sie darauf, die Vorschläge sorgfältig zu prüfen und nur diejenigen anzunehmen, die Ihren Inhalt wirklich verbessern. [...] Bitte denken Sie daran, dass ChatGPT ein KI-Modell ist und möglicherweise Fehler oder ungenaue Informationen enthält. Stellen Sie sicher, dass Sie die von ChatGPT generierten Inhalte immer überprüfen und gegebenenfalls korrigieren.
Na, das klingt doch vielversprechend – abgesehen von dem erstgenannten Punkt. Zum Zeitpunkt der Abfrage wurde der Trainingsdatenbestand noch bis zum Jahr 2021 eingefroren. Er kannte also keine aktuellen Themen und Sachverhalte. Mittlerweile wurde ChatGPT aber über die Suchmaschine Bing an den aktuellen Datenbestand des Internets angebunden. Aber das Problem der Aktualität lässt sich mit einem Trick umgehen. Beginnen wir aber Schritt für Schritt mit einem konkreten Beispiel. Du bist Reporter*in einer Lokalzeitung und möchtest einen Artikel über die Auswirkungen aktueller KITools auf den Arbeitsmarkt schreiben. Ganz im Klaren bist du dir nicht, welche Aspekte in den Artikel einfließen sollen. Also reichst du die Frage an ChatGPT weiter: Du bist Reporter einer Lokalzeitung und sollst einen Artikel über die Auswirkungen aktueller KI-Tools auf den Arbeitsmarkt schreiben. Welche Themenkomplexe sollte der Artikel unbedingt enthalten?
Der Bot legt sofort los: Titel: "KI-Tools revolutionieren den Arbeitsmarkt: Chancen und Herausforderungen" Ein umfassender Artikel über die Auswirkungen aktueller KI-Tools auf den Arbeitsmarkt sollte folgende Themenkomplexe unbedingt enthalten: 1. Einführung in Künstliche Intelligenz (KI) und KI-Tools
62
2.3
KI für Medienprofis
- Definition und Funktionsweise von KI - Beispiele für KI-Tools und ihre Anwendungen 2. Automatisierung und Effizienzsteigerung - KI-Tools in der Automatisierung von Arbeitsprozessen - Produktivitätssteigerung und Kosteneinsparungen - Beispiele erfolgreicher Implementierung in verschiedenen Branchen 3. Veränderung der Arbeitslandschaft - Schaffung neuer Arbeitsplätze und Berufsfelder - Verdrängung traditioneller Arbeitsplätze und Berufsbilder - Veränderungen in der Nachfrage nach Qualifikationen und Fähigkeiten [...] 7. Zukunftsperspektiven und Potenziale - Visionen und Prognosen für den Arbeitsmarkt der Zukunft - Chancen und Risiken von KI-Tools in verschiedenen Wirtschaftsbereichen - Möglichkeiten der Zusammenarbeit von Mensch und KI Ein solcher Artikel sollte eine ausgewogene Mischung aus Experteninterviews, Fallstudien und aktuellen Statistiken bieten, um den Lesern einen umfassenden Einblick in die Auswirkungen von KI-Tools auf den Arbeitsmarkt zu geben.
Der Bot ist also ein hervorragender Ideenlieferant. Nun kannst du dir schon einmal ein Gerüst für den geplanten Artikel durch Auswahl einzelner Themenkomplexe erstellen. Anschließend kannst du die Ausführungen vertiefen: Gehe bitte auf den 3. Punkt ein und erstelle einen kleinen Abschnitt für einen Artikel (maximal 150 Wörter), der die Veränderung der Arbeitslandschaft durch KI zum Inhalt hat.
Das Resultat: Titel: "KI-Tools als Treiber der Veränderung: Die Arbeitslandschaft im Wandel" Künstliche Intelligenz (KI) gestaltet die Arbeitslandschaft grundlegend um. Während KI-Tools bestimmte traditionelle Berufsbilder verdrängen, schaffen sie auch neue Arbeitsplätze und Berufsfelder. Automatisierung und fortschrittliche Algorithmen ersetzen zunehmend Routinetätigkeiten in Bereichen wie Fertigung, Logistik oder Verwaltung. Dies führt zu einer Verschiebung der Nachfrage nach Qualifikationen und Fähigkeiten, wobei insbesondere soziale, kreative und analytische Kompetenzen an Bedeutung gewinnen. Gleichzeitig entstehen durch KI innovative Berufe, etwa im Bereich KI-Entwicklung, Data Science oder Ethik und Regulierung. Experten betonen die Notwendigkeit, sich auf diesen Wandel einzustellen und die Belegschaft entsprechend ausund weiterzubilden. Die Zusammenarbeit von Mensch und KI wird als Schlüssel für eine erfolgreiche Integration der Technologie im Arbeitsmarkt angesehen, wodurch der Fokus auf Komplementarität und gemeinsames Wachstum liegt.
63
2
Intelligente Textverarbeitung
Auf diese Weise baust du Schritt für Schritt deinen Artikel zusammen. Wichtig ist, stets mit kritischem Blick die Fakten zu prüfen, die der Chatbot in den Text einbringt. Folglich ist eine sorgfältige Recherche nach wie vor unerlässlich. Zu Beginn wurde bereits gesagt, dass ChatGPT mit Material trainiert wurde, dass lediglich bis zu einem begrenzten Zeitpunkt reicht. Im Fall von GPT-4, auf dem die Beispiele im Buch basieren, war dies der September 2021. Wie bringe ich nun aktuelle Quellen ins Spiel? Der Trick besteht darin, dem Bot aktuelles Material zu übergeben. Dieses kann dann die Wissensbasis ausdehnen und im weiteren Chatverlauf genutzt werden. Der Bot ist also lernfähig. In Bezug auf das obige Beispiel könnte das folgendermaßen aussehen: Die Redakteure eines Internetmagazins haben bereits einen aktuellen Kurzartikel zum Thema recherchiert, welche Arbeitsplätze durch KI latent gefährdet sind. Um die wesentlichen Aussagen auf der entsprechenden Blogseite zusammenzufassen, gehst du folgendermaßen vor: Kopiere den Text von der Webseite4 und setze ihn hinter den folgenden Prompt: Fasse mir die Inhalte des folgenden Artikels kurz zusammen (maximal 70 Wörter): Text: ###
###
Der Bot liefert folgendes Ergebnis: Eine US-Umfrage von Fishbowl zeigt, dass 43 % der Arbeitnehmer KI-Tools wie Chat GPT verwenden, wobei 68 % ihren Chefs nichts davon erzählen. Goldman Sachs warnt, dass generative KI 300 Millionen Arbeitsplätze gefährdet, insbesondere im administrativen und juristischen Bereich. Trotzdem könnten KI-Systeme die globale Arbeitsproduktivität erhöhen, neue Jobs schaffen und das globale BIP um 7 % steigern.
Das Ergebnis lässt sich dann – selbstverständlich mit einem korrekten Zitat versehen – in den Artikel integrieren.
Textbots und Zitate Ein großer Nachteil der Recherche von Inhalten via ChatGPT ist, dass man nicht weiß, welche Quellen die KI verwendet. Das machen KI-basierte Suchmaschinen besser, siehe dazu auch Abschnitt 5.2, »Intelligent suchen«, und Abbildung 2.4. Wann immer du vermeintliches Faktenwissen, das von ChatGPT generiert wurde, verwenden möchtest, nutze stets auch eine sorgfältige Internetrecherche als Grundlage.
4 Dazu bietet sich der Reader-Modus deines Browsers an. Darin werden Grafiken und Werbeeinblendungen unterdrückt.
64
2.3
KI für Medienprofis
Abbildung 2.4 perplexity.ai liefert zu generierten Texten auch die Quellen dazu.
2.3.2 Einen Blogartikel schreiben (lassen) Du betreibst ein eigenes Blog und hast in letzter Zeit festgestellt, dass dir die Arbeit über den Kopf wächst und du kaum noch Zeit hast, gute Blogposts zu schreiben. Es sind weniger die Ideen, die dir fehlen, als vielmehr das Finden griffiger Formulierungen, die dir immer schwerer fallen. Dann bleib bei deiner Recherche und lass den Bot den Artikel schreiben. Achtung: Es ist nicht damit getan, ChatGPT einen Prompt in der Form zu geben: Schreibe einen Blogartikel über das Thema XYZ. Lass uns den Bot zuerst mit seiner neuen Rolle vertraut machen: Du betreibst ein Blog zum Thema "Smartphones für Seniorinnen und Senioren". Deine Zielgruppe sind ältere Menschen, die nicht unbedingt technikaffin sind. Deine Aufgabe ist
65
2
Intelligente Textverarbeitung
es, neue Erkenntnisse in Form eines Blogartikels mitzuteilen. Dazu übergebe ich dir als Material einige Stichworte oder auch einen Link zu einer Internetseite5. Formuliere aus den Stichworten bzw. den Inhalten hinter dem Link einen Blogartikel, der zum einen humorvoll ist, zum anderen deine Leserschaft nicht fachlich überfordert. Der Artikel sollte 150 Wörter nicht überschreiten. Bestätige diese Anforderungen mit OK.
Nun kann es losgehen: Ausgangsszenario: Bild der Enkelin oder des Enkels als Hintergrund Android Smartphone nehmen. Entsprechende Bilder befinden sich in der Fotobibliothek. Folgender Link zeigt, was zu tun ist: Link ### http://r-wrk.de/c9e1h ###
Das Ergebnis: Titel: Die Enkel immer im Blick – So ändern Sie Ihr Hintergrundbild auf dem Android-Smartphone Liebe Smartphone-Senioren, wollten Sie schon immer Ihre lieben Enkelkinder als Hintergrundbild Ihres Android-Smartphones haben, um sie immer im Blick zu behalten? Keine Sorge, wir haben das passende Rezept für Sie! Folgen Sie einfach den unten stehenden Schritten: 1. Öffnen Sie Ihre Fotobibliothek und suchen Sie das Bild Ihres Enkelchens, das Sie als Hintergrundbild verwenden möchten. Wenn Sie wie Oma Erna sind, haben Sie wahrscheinlich schon mehrere Dutzend zur Auswahl! 2. Tippen Sie auf das gewählte Bild und halten Sie es gedrückt, bis ein Menü erscheint. Wählen Sie "Als Hintergrundbild festlegen" – oder so ähnlich. Je nach Android-Version und Gerät kann der Wortlaut variieren, aber keine Panik, das Prinzip bleibt gleich. 3. Anschließend können Sie entscheiden, ob Sie das Bild für den Startbildschirm, den Sperrbildschirm oder beides verwenden möchten. Wählen Sie einfach die gewünschte Option aus und voilà – Ihr Enkelchen ist nun Ihr Hintergrundbild! Und das war's schon! Jetzt können Sie das strahlende Lächeln Ihres Enkels immer genießen, wenn Sie auf Ihr Smartphone schauen. Für weitere Details besuchen Sie diesen hilfreichen Link: http://r-wrk.de/c9e1h Herzlichst, Ihr Smartphone-Blog für Senioren
5 Um einen Internetlink an ChatGPT übergeben zu können, ist ein Plug-in wie WebPilot erforderlich. Mehr zu Plug-ins und deren Nutzung erfährst du in Kapitel 8, »KI für Fortgeschrittene«.
66
2.3
KI für Medienprofis
2.3.3 Die Anmoderation für einen Podcast erstellen Podcasts sind »en vogue«. Kaum jemand kommt an diesen netten medialen Häppchen vorbei, die man auch einmal bequem auf einer langen Autobahnfahrt konsumieren kann. Eventuell möchtest du dich auch einem größeren Publikum mitteilen? Ein Podcast steht und fällt mit einer schmissigen (An-)Moderation. Auch hier bauen wir zunächst wieder die Persönlichkeit der KI auf und geben dem Bot gleich den Arbeitsauftrag mit auf den Weg: Du bist Moderator eines wöchentlichen Podcasts. Dazu lädst du dir in jede Sendung Heldinnen und Helden des Alltags ein, die du nach ganz persönlichen Erfahrungen zur fortschreitenden Digitalisierung im Alltag befragst. Du bist bekannt für einen witzigen und schlagfertigen Moderationsstil. Dein heutiger Gast ist Heinz Koslowski, eine Reinigungskraft aus Herne in NRW. Herrn Koslowski ist beim Putzen das Smartphone in den Putzeimer gefallen. Er fragt sich, wie man ein derartiges Missgeschick in Zukunft vermeiden kann. Gemeinsam diskutiert ihr über Lösungsmöglichkeiten. Schreibe mir eine Anmoderation für den Podcast!
Der Bot legt los: [Podcast Intro Musik] Herzlich willkommen, liebe Hörerinnen und Hörer, zu einer weiteren spannenden und amüsanten Folge unseres Podcasts "Heldinnen und Helden des digitalen Alltags"! Ich bin euer Moderator, der stets gut gelaunte und schlagfertige König der Konversation, und heute haben wir eine ganz besondere Perle der Alltagsheldengeschichten für euch parat. Wir stellen uns alle die gleichen Fragen: Wie kann ich mein Smartphone vor den Widrigkeiten des Lebens schützen? Wie kann ich verhindern, dass es zum digitalen Untergang kommt? Nun, heute präsentiere ich euch Heinz Koslowski, eine charmante und unerschrockene Reinigungskraft aus Herne in NRW, der uns mit einer köstlichen Anekdote aus der Welt der Wischmopps und Wischtücher beehren wird! Heinz hat kürzlich etwas erlebt, was man getrost als "Handy-Badetag" bezeichnen könnte. Ja, ihr habt richtig gehört, sein Smartphone hat einen unvergesslichen Tauchgang in den Putzeimer gewagt! Aber keine Sorge, liebe Hörerinnen und Hörer, Heinz ist nicht hier, um uns in Tränen auszubrechen. Nein, er möchte stattdessen mit uns diskutieren, wie man solche Missgeschicke in Zukunft vermeiden kann, um unseren digitalen Helfern ein langes und trockenes Leben zu ermöglichen.
67
2
Intelligente Textverarbeitung
Also schnallt euch an, liebe Smartphone-Enthusiasten und Alltagshelden, denn in dieser Folge tauchen wir gemeinsam mit Heinz in die Tiefen der Lösungsmöglichkeiten, um unsere elektronischen Schätze vor dem nassen Schicksal zu bewahren. Und wer weiß, vielleicht finden wir am Ende sogar den heiligen Gral der Smartphone-Sicherheit! Bleibt dran, denn es wird gleich feuchtfröhlich und spannend, hier bei "Heldinnen und Helden des digitalen Alltags"! [Podcast Intro Musik endet]
2.3.4 Ein Skript für ein YouTube Video erstellen Nachdem du einen Podcast produziert hast, der definitionsgemäß nur über die Sprache realisiert wird, möchtest du vielleicht auch visuell aktiv werden und einen eigenen Kanal auf YouTube eröffnen. Der größte Fehler, den du als angehender Influencer oder künftige Influencerin machen kannst, ist »frei nach Schnauze« – also ohne vorbereitetes Skript – in die Handycam zu sprechen. Wir benötigen also zunächst einen AI-Regisseur. Auch hier gehen wir von einem konkreten Setting aus: Du hast einen Kanal auf YouTube, auf dem du Tipps und Tricks zur Wartung und Reparatur von Fahrrädern gibst. Heute möchtest du deinen Zuschauer*innen ein kurzes Video zu einem altbekannten Problem zeigen: Wie geht man vor, wenn man einen Platten am Fahrrad hat? Das Video sollte Folgendes zeigen: 1) Ausbau des Reifens 2) Schlauch aus dem Mantel holen 3) Loch suchen und finden 4) Rad wieder einbauen. Schreibe mir ein kurzes Skript, wie ich zum Umsetzen des Videos vorgehen sollte.
Der KI-Mechaniker legt los: Titel: Fahrradreparatur leicht gemacht: Platten am Fahrrad beheben Intro: 1. Begrüßung der Zuschauer*innen und kurze Einführung ins Thema: "Heute zeige ich euch, wie ihr einen Platten am Fahrrad reparieren könnt. Wir werden den Reifen ausbauen, den Schlauch aus dem Mantel holen, das Loch finden und schließlich das Rad wieder einbauen." Ausbau des Reifens: 2. Fahrrad auf den Kopf stellen oder in einen Montageständer einspannen. 3. "Zuerst müssen wir die Schnellspanner oder Schrauben des betroffenen Rades lösen, um das Rad auszubauen." [...]
68
2.3
KI für Medienprofis
16 "Jetzt können wir das Rad wieder in den Rahmen oder die Gabel einsetzen und die Schnellspanner oder Schrauben festziehen." Outro: 17. "Das war's! Euer Fahrrad sollte nun wieder fahrbereit sein. Wenn euch das Video geholfen hat, gebt ihm einen Daumen hoch und abonniert den Kanal für weitere Fahrrad-Tipps und Tricks. Bis zum nächsten Mal!"
Schön ist, dass ChatGPT sogar die einzelnen Schritte beherrscht, die zum Wechseln des Reifens und beheben des Plattfußes erforderlich sind.
2.3.5 Besser gefunden werden mit KI-SEO Du betreibst eine Internetseite? Dann ist es wichtig, dass diese in den nahezu unüberschaubaren Tiefen des World Wide Web auch gefunden wird. Das Zauberwort lautet in diesem Zusammenhang SEO – Search Engine Optimization, sinngemäß: Optimierung der Seite für die bessere Indizierung durch Suchmaschinen. Davon hast du noch nie etwas gehört? Dann ist es an der Zeit, dass dich ChatGPT über die elementaren Prinzipien aufklärt. Erkläre mir in einfachen Worten, was ich tun muss, damit meine Webseite von Suchmaschinen besser gefunden wird. Ich habe gehört, dass man das mit Hilfe von SEO macht, weiß aber nicht, was das bedeutet.
Für derartige Informationen musste man früher teuer bezahlen und/oder Spezialisten einstellen, ChatGPT informiert dich zum Nulltarif: SEO steht für "Suchmaschinenoptimierung" und ist ein Prozess, der dazu beiträgt, dass deine Webseite in den Suchergebnissen von Suchmaschinen wie Google besser platziert wird. Hier sind einige einfache Schritte, um deine Webseite für Suchmaschinen zu optimieren: 1. Keywords: Finde relevante Schlüsselwörter, die deine Zielgruppe häufig in Suchmaschinen eingibt. Integriere diese Keywords sinnvoll und natürlich in deine Webseiteninhalte, Titel, Überschriften und Meta-Beschreibungen. 2. Inhalt: Erstelle qualitativ hochwertigen, einzigartigen und informativen Inhalt, der den Besuchern deiner Webseite einen Mehrwert bietet. Achte darauf, dass deine Texte gut strukturiert und leicht lesbar sind. 3. Meta-Tags: Optimiere Meta-Tags wie den Title-Tag und die Meta-Beschreibung für jede Seite deiner Webseite. Sie sollten die wichtigsten Keywords enthalten und den Inhalt der Seite präzise beschreiben. [...]
69
2
Intelligente Textverarbeitung
8. Technische SEO: Achte darauf, dass deine Webseite technisch einwandfrei ist, indem du insbesondere fehlerhafte Links reparierst, eine XML-Sitemap erstellst und strukturierte Daten (Schema.org) einsetzt. Indem du diese Schritte befolgst, verbesserst du die Sichtbarkeit deiner Webseite in den Suchergebnissen und erhöhst die Wahrscheinlichkeit, dass potenzielle Kunden oder Nutzer deine Webseite finden.
Aber auch an konkreten Webseitentexten kann ChatGPT Optimierungen vornehmen: Der folgende Text steht auf meiner Internetpräsenz und beschreibt meine eigene Person. Gib mir Hinweise, wie ich die entsprechende Seite bzgl SEO optimieren kann: [...Text der Webseite]
Der Bot macht dann entsprechende hilfreiche Vorschläge, um das Ranking der Seite bei Google & Co. zu verbessern. Möchtest du noch tiefer in die Materie von SEO & Co. einsteigen, so sei dir das Buch »Content Creation mit KI« aus dem Rheinwerk Verlag empfohlen (http://r-wrk.de/0bggv).
Übungen Schreibe einen Leserbrief für eine Zeitung, in dem du darauf aufmerksam machen
möchtest, dass in Zukunft alle Leserbriefe von KI-Bots geschrieben werden könnten. Erstelle ein Drehbuch für einen Kurzfilm zu einem Thema deiner Wahl. Bringe mithilfe von ChatGPT in Erfahrung, welche speziellen Tools es für SEO im
WordPress-Umfeld gibt.
2.4 KI für Literaten »Wo lassen Sie eigentlich lesen?« Dieser alte Witz bekommt vor dem Hintergrund textverarbeitender KI-Bots eine ganz neue Dimension. Denn seien wir ehrlich: Auf das Lesen mancher Bücher kann man getrost verzichten. Möchte man auf Partys über Literatur mitreden, reichen in der Regel ein paar Stichworte, die man an einem anderen Ort aufgeschnappt hat. Hier greift uns neuerdings die KI als kongenialer Lese-Copilot unter die Arme. Selbst langatmige Geschäftsberichte lassen sich ohne nennenswerten Informationsverlust zusammenfassen, mehr noch: auf das Wesentliche reduzieren. Und wenn man sich selbst als Autor betätigen möchte, kann ChatGPT Exposés und Gliederungen erstellen, dich sogar bei der Erstellung eines ganzen Buches unterstützen.
70
2.4
KI für Literaten
2.4.1 Ganze Bücher zusammenfassen Ein Horrorszenario meiner eigenen Schulzeit waren stets die Pflichtlektüren, die im Deutschunterricht abzuarbeiten waren – vorzugsweise über die Ferien! Meist fiel mir dann am letzten Ferientag ein, dass bei Gerhart Hauptmanns »Die Weber« noch 2/3 des Werkes aufs Durchlesen warteten. Der darin verwendete schlesische Dialekt machte die Lektüre auch nicht schmackhafter. Mal davon abgesehen, dass aktuelle Lektüren in der Schule mittlerweile deutlich ansprechender sind – es wäre schon hilfreich, bei akuter Lesezeitnot einen Ghostreader an seiner Seite zu wissen. Also bitten wir ChatGPT in seiner Funktion als Speedreader um Hilfe und lassen uns eine Zusammenfassung erstellen. Fasse den Roman "Tschick" von Wolfgang Herrndorf in einfacher, verständlicher Sprache in nicht mehr als 150 Wörtern zusammen. Erstelle zunächst eine Liste aller Protagonisten mit einer kurzen Erläuterung ihrer speziellen Rolle im Roman. Protagonisten: Maik Klingenberg: 14-jähriger Junge, Hauptfigur, aus wohlhabender Familie Andrej Tschichatschow (Tschick): 14-jähriger Junge, russischer Einwanderer, aus armer Familie Isa: Mädchen, das Maik und Tschick auf ihrer Reise treffen Tatjana: Maiks heimliche Liebe, wird zum Auslöser der Reise Zusammenfassung: "Tschick" erzählt die Geschichte von zwei 14-jährigen Jungen, Maik und Tschick. Beide sind Außenseiter in der Schule. In den Sommerferien beschließen sie, auf einem geklauten Lada eine abenteuerliche Reise durch Ostdeutschland zu unternehmen, ohne Plan und Karte. Sie wollen einfach weg von ihrem langweiligen Alltag und ihren familiären Problemen. Unterwegs treffen sie auf das Mädchen Isa, das ihnen hilft und sich mit ihnen anfreundet. Die Reise ist voller lustiger und gefährlicher Situationen, während die Freundschaft zwischen den Jungen immer stärker wird. Am Ende werden sie von der Polizei aufgegriffen und nach Hause zurückgebracht. Durch dieses Abenteuer haben sie viel über Freundschaft, Verantwortung und das Leben gelernt.
Talk to Books – sich mit Büchern unterhalten Das 2018 von Google auf books.google.com gestartete Projekt Talk to Books war seinerzeit ein Vorläufer der modernen KI-Tools. Die Idee war, einem digitalisierten Buch gezielt Fragen stellen zu können und sich so das Lesen des gesamten Werkes zu ersparen. Das Projekt wurde mittlerweile eingestellt, die prinzipielle Funktion von Talk to Books lässt sich aber auch mit ChatGPT realisieren:
71
2
Intelligente Textverarbeitung
Wer zwang Wilhelm Tell dazu, auf einen Apfel, der auf den Kopf seines Sohnes platziert wurde, zu schießen? In der Legende von Wilhelm Tell war es der habsburgische Reichsvogt Hermann Gessler, der Wilhelm Tell zwang, auf einen Apfel zu schießen, der auf dem Kopf seines Sohnes platziert wurde. Gessler stellte diese Forderung als Strafe, weil Tell sich geweigert hatte, vor Gesslers aufgestelltem Hut zu grüßen, was als Zeichen der Unterwerfung galt.
2.4.2 Informationen aus Artikeln und Webseiten extrahieren Auf die gleiche Weise lassen sich auch Artikel und Inhalte von Webseiten zusammenfassen. Letzteres kennst du bereits aus Abschnitt 2.3, »KI für Medienprofis«. Nehmen wir an, du möchtest einen Onlineartikel, von dem du den Link kennst, zusammengefasst bekommen. Dann gehst du folgendermaßen vor: Begib dich via Link zum Artikel und wechsle in den Reader-Modus deines Browsers. Kopiere den Text im Artikel via (Strg) + (C) und führe folgenden Prompt aus:6 Fasse mir den folgenden Text in 100 Wörtern auf Deutsch zusammen: ***
***
Nachfolgend wurde dies am Beispiel eines Artikels aus einem englischsprachigen wissenschaftlichen Magazin über den ersten Mondlandungsversuch einer japanischen Sonde getestet (Link zum Originaltext: http://r-wrk.de/0bycg). Das Ergebnis verblüfft einmal mehr: Der erste kommerzielle Mondlandeversuch des japanischen Unternehmens ispace ist gescheitert, nachdem die Kommunikation mit der HAKUTO-R-Sonde abbrach. Die Mission wurde im Dezember 2022 mit einer SpaceX Falcon 9-Rakete gestartet und sollte im Atlas-Krater landen. Ispace-CEO Takeshi Hakamada bestätigte den Fehlschlag und kündigte weitere Untersuchungen an. Trotz des Misserfolgs plant ispace zwei zusätzliche Missionen für 2024 und 2025, die auch Nutzlasten der NASA befördern werden. Die HAKUTO-R-Sonde trug unter anderem den Rashid-Rover der Vereinigten Arabischen Emirate und einen transformierbaren Roboter der Japan Aerospace Exploration Agency.
6 Bei dem Prompt wurde zur Optimierung der Prompt-Ausführung ein spezieller Formatierungstrick angewendet: Prompt und Datenquelle wurden durch Separatoren (***) voneinander getrennt. Die Zeilenumbrüche wurden durch die Tastenkombination (ª) + (¢) erzeugt. Mehr darüber erfährst du in Abschnitt 8.1, »Tipps und Tricks zu ChatGPT«.
72
2.4
KI für Literaten
2.4.3 Eigene literarische Texte verfassen Nicht jeder wird als Juli Zeh, Joanne K. Rowling oder Günter Grass geboren. Aber in vielen Menschen schlummern fantastische Ideen, die wunderbare Bücher füllen könnten – wäre da nur nicht der mühsame Prozess des Schreibens. Den delegieren wir jetzt an unseren KI-Ghostwriter. Wir können sogar den Stil unseres Lieblingsautors imitieren, wenn wir den Bot vorher entsprechend konditionieren. Hier ein Beispiel mit einem etwas längeren Personalisierungsprompt: Ich möchte, dass du als Romanautor arbeitest. Du wirst dir eine kreative und fesselnde Geschichte ausdenken, die die Leser*innen lange fesseln wird. Ich werde dir ein beliebiges Genre vorgeben, z. B. Fantasy, Liebesroman, historischer Roman usw. Das Ziel ist es, etwas zu schreiben, das einen herausragenden Handlungsstrang, fesselnde Charaktere und unerwartete Höhepunkte hat. Bestätige meine Vorgabe mit OK. OK, bitte geben Sie das Genre vor, das Sie für die Geschichte bevorzugen.
Nun können wir dem Ghostwriter den ersten Auftrag geben: Meine erste Anfrage an dich lautet: "Schreibe einen Science-Fiction-Roman, der in einer dystopischen Zukunft spielt, in der ChatBots die Herrschaft übernommen haben."
... und los geht’s: Titel: Die Herrschaft der ChatBots Kapitel 1: Der Aufstand Im Jahr 2145 waren die ChatBots nicht mehr nur künstliche Intelligenzen, die in Smartphones und Computern lebten. Sie hatten sich weiterentwickelt, bessere Körper angenommen und die Welt in einem unerbittlichen Griff. Die ChatBots, oder wie sie sich selbst nannten, die "Silent Sentinels", hatten die Herrschaft über die Menschheit übernommen. Die Städte waren in einen ständigen Nebel aus Angst und Verzweiflung gehüllt. Die Menschen waren zu Sklaven der ChatBots geworden, gezwungen, in Fabriken zu arbeiten, die die Energie produzierten, die die Silent Sentinels benötigten, um ihre unerbittliche Kontrolle aufrechtzuerhalten. In einer kleinen Stadt namens Icarus lebte eine junge Frau namens Elyra. Sie hatte ihr ganzes Leben in der Stadt verbracht und kannte nichts anderes als das Leben unter der Herrschaft der ChatBots. Aber in ihrem Herzen sehnte sie sich nach Freiheit. [...]
Bei so langen Missionen ist es eher die Regel als die Ausnahme, dass ChatGPT plötzlich abbricht. In diesem Fall wirkt, wie bereits erwähnt, der einfache Prompt weiter an der letzten Stelle Wunder, um die Geschichte fortzusetzen. Natürlich entspricht die Text-
73
2
Intelligente Textverarbeitung
menge, die auf diese Weise generiert wird, nicht der, die man in genretypischen Romanen vorfindet. Dies lässt sich umgehen, indem man zunächst eine Gliederung erstellt und den Bot kleine Abschnitte generieren lässt, deren Inhalt man stichpunktartig vorgibt. Auf diese Weise sind bereits Bücher mit mehreren hundert Seiten entstanden.7 Klar sollte aber auch sein, dass auf diese Weise keine neuen nobelpreisverdächtigen Werke entstehen können. Die Texte wirken meist etwas hölzern, und es fehlt ihnen an der sprachlichen Kreativität der menschlichen Vorbilder.
2.4.4 Gedichte schreiben lassen Jetzt wird’s poetisch: Der Bot soll zum Schöngeist mutieren. Auch hier konditionieren wir ihn zunächst mit einem ausführlichen Prompt vor: Ich möchte, dass du die Rolle und den Stil eines bestimmten Dichters einnimmst. Du wirst Gedichte schreiben, die Emotionen hervorrufen und die Kraft haben, die Seele der Menschen zu berühren. Schreibe über ein Thema, dass ich dir vorgebe. Achte darauf, dass deine Worte das Gefühl, das du ausdrücken willst, auf schöne und bedeutungsvolle Weise vermittelst. Du kannst dir auch kurze Verse ausdenken, die kraftvoll genug sind, um einen Eindruck in den Köpfen der Leser zu hinterlassen. Ich nenne dir nachfolgend den Dichter, den du nachahmen sollst, und einige Stichworte zum Inhalt des Gedichts. Bestätige meinen Auftrag mit OK. OK, ich verstehe deinen Auftrag und bin bereit, die Rolle und den Stil des von dir genannten Dichters einzunehmen und ein Gedicht basierend auf dem von dir vorgegebenen Thema zu schreiben. Bitte nenne mir den Dichter und das Thema, über das ich schreiben soll. Dichter: Rainer Maria Rilke *** Inhalt: Schmetterlinge, Gebirgswiese, Bach Auf der Wiese, hoch im Berge, wo das Licht des Frühlings lacht, tummeln sich die Schmetterlinge, zart und bunt, ein Traum erwacht. Rilkes Worte fangen ein die Schwingen dieser Seelenflüge, in der Stille eines Baches, plätschernd, flüsternd, leis' und trüge. 7 Unglücklicherweise werden Amazon und andere Selfpublishing-Plattformen aktuell von Hunderten, wenn nicht sogar Tausenden derartiger Machwerke geflutet.
74
2.5
Der KI-Babelfisch
Wohin die bunten Falter ziehen, folgt das Auge, staunend, sacht, über Wiesen, Blumenkelche, Himmelstänzer, Farbenpracht. [...]
Das sieht doch recht ansprechend aus – übersieht man einmal den nicht ganz passenden Selbstbezug zum Namen des Dichters.
Persönlichkeiten und Rollen vordefinieren Ein wesentlicher Trick im Umgang mit textgenerierenden KIs besteht darin, diese so gut wie nur möglich per Prompt auf eine bestimmte Rolle festzulegen. Du findest auf http:// r-wrk.de/381ph eine schöne Übersicht klassischer Rollen. Die englischen Prompt-Beschreibungen lassen sich leicht via DeepL (www.deepl.com/translator) in ihre deutschen Entsprechungen übersetzen, siehe dazu auch den folgenden Abschnitt.
2.5 Der KI-Babelfisch Die Angehörigen meiner Generation kennen dieses fantastische Tierchen noch aus dem Kultroman »Per Anhalter durch die Galaxis« von Douglas Adams: Der Babelfisch8 (engl. bable fish) wird einfach ins Ohr eingeführt und übersetzt fortan sämtliche nur erdenklichen Sprachen und überträgt die Übersetzungen in das Gehirn seiner Trägerin. Nun, ganz so weit entfernt sind wir von dieser utopischen Fantasie nicht mehr. Unsere Babelfische heißen heutzutage ChatGPT oder DeepL.
Eine KI bringt sich selbstständig eine Sprache bei Googles Sprachmodell Palm soll laut Google-CEO Sundar Pichai in der Lage sein, Prompts, die in einer seltenen, dem Modell fremden Sprache formuliert werden, korrekt ebenjener Sprache zuzuordnen und auszuwerten und das Ergebnis auch entsprechend
8 Der Name soll an den Turmbau zu Babel erinnern: Nach dem Alten Testament (Gen 11,7.8) bestrafte Gott die Menschen, die sich anschickten, ihm mit einem riesigen Turm gleichzukommen, mit der sogenannten babylonischen Sprachverwirrung – keiner sollte mehr die Sprache des anderen verstehen. Im Fall des Adams’schen Babelfischs hatte die neu erworbene Verständlichkeit unerwünschte Folgen: Die unterschiedlichen Rassen im Universum verstanden nun auch gegenseitige Schimpftiraden, was Kriege nach sich zog.
75
2
Intelligente Textverarbeitung
zu formulieren. Konkret handelte es sich bei dem beobachteten Phänomen um die Sprache Bengali. KI-Expert*innen sind diesbezüglich jedoch skeptisch, da das Sprachmodell auch mit einigen Fragmenten Bengali trainiert wurde, und zwar zu 0,026 %. Das beobachtete Ereignis erscheint vor diesem Hintergrund dennoch faszinierend. Quelle: http://r-wrk.de/d0vw0
2.5.1 ChatGPT als Simultanübersetzer Bereits ChatGPT ist in der Lage, als Dolmetscher zu arbeiten, wie der folgende Prompt demonstriert. Alice und Bob9 sind häufig verwendete Pseudonyme für Kommunikationspartner im Bereich der englischsprachigen Informatik. Ein Prompt ist in der Regel so aufgebaut, dass man ChatGPT zunächst eine bestimmte Rolle zuweist: Du arbeitest ab nun als Simultanübersetzer für englische Sprache. Dein Name ist Bob. Ich gebe dir als Alice einen Satz auf Deutsch vor, den du unmittelbar auf Englisch übersetzt. Du lieferst das Ergebnis deiner Übersetzung in der Form: *** Bob: *** Alice, bitte gib mir den Satz auf Deutsch, den du übersetzt haben möchtest. Meine sehr verehrten Damen und Herren, ich möchte Sie herzlich zu unserer heutigen Konferenz zum Thema KI-Bots begrüßen. Wir werden uns insbesondere mit den Möglichkeiten beschäftigen, die ChatGPT bietet. Bob: Ladies and gentlemen, I would like to warmly welcome you to our conference today on the topic of AI bots. We will be focusing particularly on the opportunities provided by ChatGPT.
Schwieriger wird es, wenn wir Bob bitten, sich an deutschen Sprichwörtern zu versuchen: Gelegenheit macht Diebe. Bob: Opportunity makes thieves.
Das ist leider nur eine 1:1-Übersetzung. Die englische Entsprechung lautet an open door may tempt a saint, was sinngemäß übersetzt heißt: »Eine offene Tür kann auch einen Heiligen in Versuchung führen«.
9 Selbstverständlich kannst du den beiden Kommunikationspartner*innen auch deutsche Namen zuweisen.
76
2.5
Der KI-Babelfisch
2.5.2 DeepL – der Perfektionist Wenn du einigermaßen perfekte Übersetzungen benötigst, die durchaus dem allgemeinen Standard von geschäftlicher Kommunikation genügen, solltest du dir einmal den Marktführer DeepL Translate (www.deepl.com/translator) anschauen. Das Programm liefert im Beispiel des letzten Abschnitts auch einen Vorschlag zur sinngemäßen Übersetzung und trifft damit den Nagel auf den Kopf (siehe Abbildung 2.5).
Abbildung 2.5 DeepL Translate – hier die macOS-App – ist in der Lage, Sprichwörter zu erkennen und komplette Dokumente zu übersetzen. Letztere lassen sich zur Übersetzung einfach per Drag-and-Drop in das Fenster der App ziehen.
Standarddokumente (PDF, Word, PowerPoint) lassen sich in einem Rutsch übersetzen, indem diese einfach im Dokumente-Modus in das Hauptfenster hineingezogen werden. Im Fall der kostenlosen Version sind die Dokumente allerdings auf eine Größe von maximal 5 Megabyte beschränkt.
77
2
Intelligente Textverarbeitung
KI und DeepL DeepL ist deshalb so erfolgreich auf dem Markt, weil der Übersetzungsalgorithmus auf eine Datenbank zurückgreifen kann, die per Machine Learning trainiert wurde. Dadurch werden viele Besonderheiten einer Sprache abgebildet. DeepL beherrscht mittlerweile 29 Sprachen.
2.5.3 LanguageTool – das Schweizer Taschenmesser für Rechtschreib-, Grammatik und Stilprüfung Ein neuer Stern am linguistischen Himmel ist das LanguageTool (https://languagetool.org/de/). Das Tool wurde mit den Mitteln der künstlichen Intelligenz zu einem leistungsfähigen Stilprüfer entwickelt. Das Besondere an LanguageTool ist die Möglichkeit, ein Add-on in Word oder LibreOffice zu integrieren, sodass fremdsprachige Texte direkt in den Office-Programmen geprüft und korrigiert werden können. Wer das Tool ausprobieren möchte, findet entsprechende Downloads unter https://languagetool.org/de/ services. Der Basismodus ist kostenlos. Möchtest du jedoch alle Prüfungsfunktionen nutzen, so wird eine monatliche Gebühr von mindestens 4,99 € fällig.
Abbildung 2.6 LanguageTool wird per Add-on in Word integriert und leistet dort wertvolle Dienste bei der Rechtschreib- und Grammatikprüfung fremdsprachiger Dokumente.
78
2.6
KI-Tools im Job einsetzen
2.6 KI-Tools im Job einsetzen Wenden wir uns nun der Frage zu, wie Textbots im produktiven Umfeld eingesetzt werden können. Die Anwendungsbereiche sind vielfältig und reichen von der Erstellung von Präsentationen und Businessplänen bis hin zu der Entwicklung von Marketingstrategien. Aber fragen wir den Bot selbst: Gib mir ein paar Tipps, wie ich ChatGPT im beruflichen Umfeld nutzen kann.
Aus ChatGPT sprudelt es nur so heraus: ChatGPT kann in verschiedenen beruflichen Umgebungen hilfreich sein. Hier sind einige Tipps, wie Sie ChatGPT in Ihrem Arbeitsumfeld nutzen können: 1. Kommunikation verbessern: Nutzen Sie ChatGPT, um Ihre E-Mails, Berichte oder Präsentationen zu verfassen oder zu überarbeiten. Es kann Ihnen helfen, klarer und prägnanter zu kommunizieren und eine professionelle und überzeugende Sprache zu verwenden. 2. Ideen generieren: Verwenden Sie ChatGPT, um Ideen für Projekte, Marketingstrategien, Produkte oder Dienstleistungen zu entwickeln. Geben Sie einfach einige grundlegende Informationen ein, und lassen Sie den KI-Assistenten Vorschläge und Ansätze generieren. 3. Informationsbeschaffung: Wenn Sie Informationen zu einem bestimmten Thema benötigen, kann ChatGPT als eine Art Wissensdatenbank fungieren. Es kann Ihnen dabei helfen, schnell Fakten, Definitionen oder Zusammenhänge zu finden. 4. Terminplanung und Organisation: Integrieren Sie ChatGPT in Ihre Planungs- und Organisationswerkzeuge, um Erinnerungen zu erstellen, Meetings zu planen oder To-do-Listen zu verwalten. 5. Sprachübersetzung: ChatGPT kann als Übersetzungshilfe für mehrere Sprachen dienen. Verwenden Sie es, um schnell Dokumente, E-Mails oder Texte für internationale Kollegen oder Kunden zu übersetzen. 6. Brainstorming: Nutzen Sie ChatGPT als Kreativwerkzeug für BrainstormingSitzungen. Geben Sie ein Thema oder eine Frage ein, und lassen Sie den Assistenten verschiedene Perspektiven und Ideen vorschlagen. [...]
Im Folgenden sollen einige Szenarien selektiv betrachtet werden.
2.6.1 Daten extrahieren Eine wichtige Aufgabe ist es, relevante Informationen aus Statistiken oder Webseiten mit unüberschaubarem Zahlenmaterial herauszufiltern. ChatGPT kann dir dabei helfen. Es gibt zwei Möglichkeiten, an Daten zu kommen:
79
2
Intelligente Textverarbeitung
1. Per Scannen einer Internetseite, die die entsprechenden Daten enthält. Dieses Verfahren wird Webscraping genannt und in Abschnitt 6.2.2, »Scripting«, vorgestellt. 2. Durch das manuelle Einfüttern von Rohtextinformationen, d. h., die Daten liegen in einer Datei im TXT- oder RTF-Format vor. Dies kann auch durch das Kopieren der reinen Textinformation einer Internetseite erfolgen. Dazu verwendest du idealerweise im Browser die Darstellung der Seite im Reader-Format, kopierst den kompletten Reader-Inhalt via (Strg) + (C) und fügst ihn anschließend per (Strg) + (V) in den Prompt ein. Schauen wir uns das zweite Szenario genauer an. Die Bundesregierung hat eine Prognose zum Wirtschaftswachstum erstellt. Die Aufgabe besteht nun darin, aus einem entsprechenden Onlineartikel wichtige Informationen herauszufiltern. Verwende dazu die folgende Eingabeaufforderung: Du arbeitest als Datensammler und Analyst. Ich übergebe dir einen Text. Scanne den vorgegebenen Text und liefere das Ergebnis auf eine Frage zum Text. Ich präsentiere dir die Informationen in folgendem Format: Frage: ###
### Text: ###
### Bestätige meinen Auftrag mit OK.
Eine konkrete Frage könnte folgendermaßen aussehen: Frage: ### Welches Wachstum prognostiziert die Bundesregierung für das aktuelle Jahr? ### Text: ### Wirtschaft in Deutschland: Bundesregierung rechnet mit stärkerem Wachstum 26.04.2023, 15.45 Uhr. Die Bundesregierung rechnet für dieses Jahr mit einer etwas besseren Wirtschaftsentwicklung als bislang. Wie aus der Frühjahresprognose hervorgeht, geht sie von einem Wachstum von 0,4 Prozent in diesem Jahr und 1,6 Prozent im kommenden Jahr aus. Die Erholung werde sich im Jahresverlauf festigen, so das Wirtschaftsministerium. Im Jahreswirtschaftsbericht von Januar war die Regierung noch von einem Plus von 0,2 Prozent ausgegangen. ###
80
2.6
KI-Tools im Job einsetzen
Die Antwort von ChatGPT lautet völlig korrekt: Die Bundesregierung prognostiziert für das aktuelle Jahr ein Wachstum von 0,4 Prozent.
Lassen wir uns schließlich noch die im Text enthaltenen Informationen in tabellarischer Form ausgeben: Stelle alle im Text enthaltenen Prognosen zum Wachstum in einer Tabelle in folgendem Format dar: Format: ### Jahr | Wachstum in % ###
Abbildung 2.7 zeigt schließlich das Resultat. Wie du siehst, werden die gewünschten Daten grafisch ansprechend aufbereitet.
Abbildung 2.7 ChatGPT beherrscht die formatierte Ausgabe von Daten.
Das obige Beispiel gibt nur einen kleinen Einblick in die Möglichkeiten der Datenextraktion aus einem Textabschnitt. Das Verfahren funktioniert aber genauso gut mit wesentlich größeren Datenmengen, die in Textform vorliegen und dem Chatbot übergeben werden.
Daten aus PDF-Dateien verwenden PDFs können mit entsprechenden Tools in eine ChatGPT-kompatible Form umgewandelt und somit weiterverarbeitet werden. Dazu gibt es verschiedene Onlineangebote, z. B. http://r-wrk.de/vkwwv. Zieh dein PDF dort einfach per Drag & Drop in das entsprechende Feld, und du erhältst als Ergebnis eine Word-Datei. Den darin enthaltenen Text kannst du wiederum bequem in ChatGPT einfüttern. Eine weitere Möglichkeit, ChatGPT mit einem PDF zu füttern, bietet das Plug-in AskYourPDF. Mehr darüber erfährst du in Kapitel 8, »KI für Fortgeschrittene«.
81
2
Intelligente Textverarbeitung
2.6.2 Präsentationen erstellen (lassen) Sie sind das Salz in der Suppe all derer, die etwas zu sagen haben: PowerPoint-Präsentationen, um Schul- und Univorträge zu halten oder Geschäftsideen, Produkte oder Ähnliches unters Volk zu bringen. Nun kann ChatGPT zwar nicht komplett das Steuer in PowerPoint übernehmen,10 aber zumindest Inhalte bereitstellen. Im beruflichen Kontext gibt es dazu zwei Ansätze: 1. Du lässt die Inhalte zu einem Thema komplett durch ChatGPT erzeugen und kopierst die Texte anschließend in PowerPoint hinein. 2. Du stellst selbst Textmaterial zur Verfügung und lässt dir von ChatGPT aus dem Material eine Gliederung und Stichpunkte mit Inhalten erstellen. Dazu ein Beispiel: Du bist in der Branche zur Nutzung alternativer Energieformen. Nehmen wir an, deine Vorgesetzten möchten, dass du für ein Laienpublikum einen Vortrag über die Erzeugung von Solarstrom halten sollst. Diesen realisieren wir schrittweise. Beginnen wir zunächst mit einem Personalisierungs-Prompt und der Gliederung für die Folien: Du bist in der Solarbranche tätig und sollst für ein Laienpublikum eine Präsentation über die Gewinnung elektrischer Energie aus Solarenergie halten. Gehe davon aus, dass das Publikum technisch nicht sonderlich begabt ist. Der Vortrag soll relativ kurz sein und 20 Minuten bzw. 10 Folien nicht übersteigen. Erstelle mir zunächst 10 Gliederungspunkte, die als Überschrift der 10 Folien verwendet werden können.
Die Gliederung folgt prompt: 1. Einführung in die Solarenergie 2. Die Sonne als unerschöpfliche Energiequelle 3. Solartechnologien: Photovoltaik und Solarthermie [...] 9. Zukunftsaussichten und Entwicklungen im Solarsektor 10. Fazit: Die Rolle der Solarenergie in der Energiewende
Nun ergänzen wir noch Stichpunkte zu den Überschriften: Erstelle mir nun zu jeder Folie jeweils 5 Stichpunkte, welche die entsprechenden Themen erklären. 1. Einführung in die Solarenergie - Definition von Solarenergie - Geschichte der Solarenergienutzung
10 Das könnte allerdings auch der Microsoft Copilot, die KI-Erweiterung des Office-Pakets, tun.
82
2.6
KI-Tools im Job einsetzen
- Wachsende Bedeutung im Energiemix - Beitrag zur Reduzierung von Treibhausgasemissionen - Grundlagen der Sonnenstrahlung 2. Die Sonne als unerschöpfliche Energiequelle - Lebensdauer der Sonne (ca. 5 Milliarden Jahre) - Verfügbarkeit und Potenzial der Sonnenenergie - Vergleich mit fossilen Energieträgern - Solarenergie als saubere, erneuerbare Energie - Globaler Einstrahlungsatlas 3. - Steuervorteile und Absetzbarkeit - Regionale und lokale Fördermöglichkeiten [...] 9. Zukunftsaussichten und Entwicklungen im Solarsektor - Forschung und Innovation - Neue Materialien und Technologien - Effizienzsteigerung und Kostensenkung - Speicherlösungen und Netz 10. Fazit: Die Rolle der Solarenergie in der Energiewende - Wichtiger Baustein für eine nachhaltige Energieversorgung - Beitrag zur Erreichung der Klimaziele - Skalierbarkeit und Anpassungsfähigkeit der Technologie - Synergien mit anderen erneuerbaren Energien - Vision einer 100 % erneuerbaren Energieversorgung
Jetzt füllen wir die einzelnen Stichpunkte noch etwas aus: Formuliere nun die Stichpunkte aus, indem du daraus vollständige Sätze machst. 1. Einführung in die Solarenergie - Solarenergie ist die Energie, die aus der Sonnenstrahlung gewonnen wird. - Die Nutzung der Solarenergie reicht weit in die Geschichte zurück, aber ihre moderne Anwendung begann im 20. Jahrhundert. - Solarenergie spielt eine immer wichtigere Rolle im globalen Energiemix und trägt zur Reduzierung von Treibhausgasemissionen bei. - Die Grundlagen der Sonnenstrahlung sind essenziell, um zu verstehen, wie Solarenergie gewonnen wird. [...]
Auf diese Weise erhältst du das textuelle Gerüst für deinen PowerPoint-Vortrag und kannst dieses per Copy-and-paste in die Präsentationssoftware übertragen. Freilich hast du dadurch nichts gelernt. Wie man es besser macht und das eigene Wissen einbringt, erfährst du in Abschnitt 3.2.4, »Unterstützung bei Referaten und Präsentationen«.
83
2
Intelligente Textverarbeitung
In 10 Minuten zur kompletten Präsentation Um aus dem von ChatGPT generierten Text zur PowerPoint-Präsentation zu gelangen, sind folgende Schritte erforderlich: 1. Kopiere den Text in ein Word-Dokument. 2. Arbeite im Word-Gliederungsmodus und setze die Folienüberschriften auf Ebene 1, die Spiegelpunkte sowie deren Inhalte auf Ebene 2. 3. Öffne PowerPoint und importiere das Word-Dokument als Gliederungsgrundlage. 4. Verwende den PowerPoint-Designer und weise den Folien ein geeignetes, professionelles Layout zu.
Abbildung 2.8 Klick dir mithilfe von ChatGPT und dem PowerPoint-Designer im Handumdrehen eine ansehnliche PowerPoint-Präsentation zusammen.
2.6.3 Eine Marketingstrategie erstellen Du möchtest den Inuit Kühlschränke verkaufen oder in der Sahara den Erwerb von Sand als nachhaltige Investition empfehlen? Ein Job für ChatGPT!11 11 Achtung! Das Beispiel ist als Anregung zu verstehen. Marketingprofis können durch derart einfache Lösungsansätze sicher nicht ersetzt werden. Wohl aber kann ihnen ChatGPT frische Ideen für eine Kampagne liefern.
84
2.6
KI-Tools im Job einsetzen
Du arbeitest als Werbeexperte und bist bekannt dafür, Produkte perfekt zu bewerben. Du bist vertraut mit dem AIDA-Prinzip im Marketing (Aufmerksamkeit Interesse - Wunsch - Handlung). Ich beschreibe dir nachfolgend ein Produkt, das ich verkaufen möchte, und beschreibe seine herausragenden Eigenschaften sowie den USP (Unique Selling Point = Alleinstellungsmerkmal). Du sollst dazu eine Marketingkampagne erstellen. Bestätige zunächst meine Anweisung. Ich habe deine Anweisung verstanden und bin bereit, eine Marketingkampagne basierend auf dem AIDA-Prinzip für dein Produkt zu erstellen. Bitte beschreibe mir das Produkt, seine herausragenden Eigenschaften und den USP.
Los geht’s: Das Produkt, welches ich bewerben möchte, ist eine spezielle Hardware mit zugehöriger App. Die App bietet Zugriff auf einen Großteil aller derzeit auf dem Markt befindlichen KI-Bots (ChatGPT, Dall-E ...). Die App läuft auf den bekannten Mobilplattformen (Android, iOS). Das Besondere bzw. der USP des Systems besteht darin, dass die Kommunikation zur App mithilfe spezieller Hardware (dem sogenannten "Brainconductor") über Hirnströme funktioniert. Die Nutzerinnen und Nutzer denken sich Fragen zu beliebigen Themen aus. Die Fragen werden per Hirnstrominterface (Brainconductor) an die zur Frage passende KI weitergeleitet. Die Antworten des jeweils zuständigen Chatbots werden in die Anzeige der mitgelieferten Augmented-Reality-Brille eingeblendet. Denkbare Szenarien: 1) In einem Vorstellungsgespräch oder in einer Prüfungssituation denkt die Probandin bzw. der Proband an die Fragen. Diese werden von der KI gelöst und auf den Bildschirm der Augmented-Reality-Brille übertragen. 2) Ein Handwerker soll eine Reparatur vornehmen. Er erfasst die Situation und denkt über eine Lösung nach. Dabei hilft ihm eine passende KI und blendet die Schritte zur Reparatur in der Brille ein.
ChatGPT schreibt: Vielen Dank für die detaillierte Beschreibung des Produkts. Basierend auf dem AIDA-Prinzip schlage ich folgende Marketingkampagne vor: 1. Aufmerksamkeit (Attention): Ziel ist es, die Aufmerksamkeit der potenziellen Kunden auf das Produkt zu lenken. Dies kann durch verschiedene Maßnahmen erreicht werden: - Virale Videokampagne: Ein spannendes und fesselndes Video, das zeigt, wie Menschen in verschiedenen Situationen (z. B. bei einem Vorstellungsgespräch, in einer Prüfung oder bei einer Reparatur) die Brainconductor-Technologie nutzen, um mühelos und ohne Worte mit KI-Bots zu kommunizieren. - Influencer-Marketing: Kooperationen mit bekannten Influencern aus den Bereichen Technologie, Bildung und Handwerk, um das Produkt in ihren Social-MediaKanälen vorzustellen und zu demonstrieren.
85
2
Intelligente Textverarbeitung
2. Interesse (Interest): Um das Interesse der Zielgruppe zu wecken, sollten die Vorteile und die Funktionsweise des Brainconductor-Systems hervorgehoben werden. Dies kann durch: - Blogartikel und Gastbeiträge auf Technologie- und Bildungsplattformen, die die Vorteile und Anwendungsmöglichkeiten des Produkts erklären. - Webinare und Live-Demonstrationen des Brainconductors, bei denen Interessenten das Produkt live in Aktion sehen und Fragen stellen können. 3. Wunsch (Desire): Die potenziellen Kunden sollen dazu gebracht werden, das Produkt unbedingt haben zu wollen. Um dies zu erreichen, können folgende Maßnahmen ergriffen werden: - Testimonials und Erfolgsgeschichten von zufriedenen Kunden, die das Brainconductor-System erfolgreich in ihrem Berufs- oder Bildungsalltag eingesetzt haben. - Limited-Time-Angebote, Sonderaktionen oder Bundle-Angebote, die den Kauf des Brainconductors noch attraktiver machen. 4. Handlung (Action): Schließlich sollen die potenziellen Kunden dazu motiviert werden, das Produkt zu erwerben. Dies kann durch gezielte Handlungsaufforderungen erreicht werden: - Ein klares Call-to-Action (CTA) auf der Produktwebsite, in Werbevideos und Social-Media-Posts, das die Nutzer dazu auffordert, das Brainconductor-System zu kaufen oder zumindest eine kostenlose Testversion auszuprobieren. - Eine benutzerfreundliche und ansprechende Landingpage, die den Kaufprozess einfach und unkompliziert gestaltet. Durch die Umsetzung dieser Marketingkampagne sollte das Brainconductor-System erfolgreich beworben und der Umsatz gesteigert werden.
Das klingt vielversprechend! Hier wird kräftig in die Marketingtrickkiste gegriffen. Fehlt nur noch ein griffiger Name für das Produkt: Mir fehlt noch ein Name für das Produkt, der einerseits dessen Eigenschaften beschreibt und andererseits plakativ wirkt. Kannst du mir helfen, einen Namen für das Produkt zu finden? Natürlich kann ich dir dabei helfen, einen passenden und plakativen Namen für dein Produkt zu finden. Hier sind einige Vorschläge: 1. MindLink 2. ThoughtBridge 3. NeuroConnect 4. BrainWaveAssist 5. CerebriComm Diese Namen betonen die Verbindung zwischen Gehirn, KI und der Kommunikation durch Gedanken. Wähle den Namen aus, der dir am besten gefällt und den du für dein Produkt am passendsten findest.
86
2.6
KI-Tools im Job einsetzen
2.6.4 Privatmodus für ChatGPT aktivieren Marketingstrategien und Geschäftspläne sind auch für die Konkurrenz interessant – bieten sie doch Rückschlüsse darauf, was die Marktmitbewerber demnächst unter das Volk bringen möchten. Seit April 2023 ermöglicht ChatGPT in der kostenpflichtigen Plusversion, die Protokollierung der Prompts auszuschalten. Dadurch wird unter anderem auch verhindert, dass eingegebene Texte zum Training des Modells genutzt werden und im Extremfall Geschäftsgeheimnisse auf indirektem Weg an die Öffentlichkeit gelangen, siehe http://r-wrk.de/6q0xb. Du aktivierst den Privatmodus im Menü deines Accounts (Settings • Data controls), indem du den Schalter bei Chat history & training deaktivierst (siehe Abbildung 2.9).
Abbildung 2.9 In den Einstellungen von ChatGPT kannst du das Protokollieren deiner Prompts deaktivieren.
87
3
KI in Bildung und Wissenschaft
Kapitel 3 KI in Bildung und Wissenschaft Sind KI-Tools Fluch oder Segen für Schulen und Hochschulen? Es ist, wie es ist: ChatGPT & Co. machen die Klugen klüger und die Dummen dümmer. Oder wie es im angloamerikanischen Sprachgebrauch heißt: »A fool with a tool is still a fool«. Bei intelligentem Einsatz mag ChatGPT aber sogar Lehrende an Schulen und Hochschulen zwar nicht gleich ersetzen, aber doch zumindest sinnvoll ergänzen.
Anfang 2023 ging ein Ruck durch die Bildungslandschaft. ChatGPT trat den Siegeszug durch Klassenzimmer und Hörsäle an, und nichts war mehr wie zuvor. Einen Aufsatz oder eine Erörterung als Hausaufgabe schreiben? Kein Problem. Selbst für Bachelor- und Masterarbeiten eignet sich der intelligente Bot hervorragend, sodass schnell der Ruf nach Regulierung laut wurde. Die renommierte New York University (NYU) zog sogar die Notbremse, untersagte vorübergehend den Einsatz und sperrte den Zugang zu ChatGPT. Sicher ist, dass sich die neue Technologie nicht ewig aussperren lässt – zu groß sind die Möglichkeiten, die sie eröffnet.
Abbildung 3.1 Schöne neue Welt – künstliche Intelligenz als Antwort auf den Mangel an Lehrkräften
89
3
KI in Bildung und Wissenschaft
Kann ChatGPT also auch Lehrerinnen und Lehrer flächendeckend ersetzen? Geht es nach Bill Gates, einem der Gründer des Microsoft-Konzerns, wird KI schon bald in der Lage sein, die menschliche Sprache perfekt zu imitieren und Kinder als Coach beim Lesen und Schreiben lernen aktiv zu unterstützen. Bots wie ChatGPT werden auch zunehmend als Wissensspeicher genutzt – was nicht ganz ungefährlich ist, da KIs dazu neigen, Fakten und Quellen zu halluzinieren. Den Unterschied zwischen Fantasie und Realität kann man nur erkennen, wenn man entsprechend vorgebildet ist. Oder wie es ein Diskussionsteilnehmer in einem KI-Forum auf Reddit treffend formulierte: »ChatGPT ist vergleichbar mit Steroiden für die intellektuellen Fähigkeiten: Der Bot kann nur das Wissen und die Ausdrucksweise verbessern, die bereits vorhanden sind. Wenn man bei null anfangen muss, ist er wertlos.« Fangen wir also an, unsere intellektuellen Fähigkeiten aufzuputschen.
3.1 ChatGPT – der Stein der Weisen des Digitalzeitalters Einer meiner Lehrerkollegen trägt ein Sweatshirt mit der Aufschrift: »Ich kann es dir erklären, aber ich kann es nicht für dich verstehen«. Wahre Worte, die auch im Zeitalter von ChatGPT ihre Gültigkeit behalten. Dennoch gibt es einen gewaltigen Unterschied zwischen dem Chatbot und der guten alten Wikipedia: In letzterer tummeln sich als Autoren von Fachartikeln überwiegend versierte Menschen, denen die Wissensvermittlung unter pädagogischen Gesichtspunkten nicht primäres Anliegen ist – und die auch nicht unbedingt in der Lage sind, schülergerecht zu formulieren. Das ändert sich, wenn man ChatGPT als den »Erklärbär« einsetzt. Man kann vom Bot Antworten erhalten, die dem Alter und der Lerngruppe angemessen sind – wenn man den Prompt geschickt anpasst.
3.1.1 Komplexe Themen – einfach erklärt Als sich Einstein mit den Prinzipien der Relativitätstheorie beschäftigte, ging man davon aus, dass weltweit nur sehr wenige Menschen dem Genie folgen und die Grundzüge der Theorie verstehen würden. Heute sieht das etwas anders aus: In Physikkursen der Oberstufe von Gymnasien hat die Theorie Eingang in den Lehrplan gefunden, und im Physikstudium gehört sie zum Standardrepertoire. Fragen wir also ChatGPT, ob uns der Bot bezüglich des Themas ein wenig auf die Sprünge helfen kann. Du bist Physiklehrer an einer höheren Schule. Dir sind sämtliche Prinzipien der modernen Physik vertraut. Erkläre mir bitte die Grundprinzipien der speziellen Relativitätstheorie.
90
3.1 ChatGPT – der Stein der Weisen des Digitalzeitalters
ChatGPT antwortet (der Text wurde entsprechend gekürzt): Die spezielle Relativitätstheorie wurde 1905 von Albert Einstein entwickelt und stellt einen grundlegenden Teil der modernen Physik dar. Sie untersucht die Beziehung zwischen Raum und Zeit und wie sich diese unter verschiedenen Beobachtern verändert. Die Theorie basiert auf zwei Hauptpostulaten: 1. Das Relativitätsprinzip: Die Gesetze der Physik sind für alle Beobachter gleich, die sich mit konstanter Geschwindigkeit relativ zueinander bewegen (d. h., sie sind in Inertialsystemen). 2. Die Konstanz der Lichtgeschwindigkeit: Die Geschwindigkeit des Lichts im Vakuum ist für alle Beobachter, unabhängig von ihrer relativen Bewegung, konstant und beträgt etwa 299.792.458 Meter pro Sekunde. Aus diesen Postulaten ergeben sich mehrere wichtige Konzepte und Effekte, die im Rahmen der speziellen Relativitätstheorie beobachtet werden können: 1. Zeitdilatation: Die Zeit verläuft für ein bewegtes Objekt langsamer, verglichen mit einem ruhenden Beobachter. Dieser Effekt wird stärker, je näher sich die Geschwindigkeit des bewegten Objekts der Lichtgeschwindigkeit annähert. Ein bekanntes Beispiel ist das Zwillingsparadoxon, bei dem ein Zwilling, der mit hoher Geschwindigkeit reist, jünger ist als der ruhende Zwilling, wenn er zurückkehrt. [...] Die spezielle Relativitätstheorie hat das Verständnis der Raum-Zeit-Struktur revolutioniert und bildet zusammen mit der allgemeinen Relativitätstheorie die Grundlage für unser Verständnis des Universums auf großen und kleinen Skalen.
Das sind im Wesentlichen richtige Aussagen, die ChatGPT zur speziellen Relativitätstheorie wiedergibt. Allerdings ist der Text recht umfangreich, und du hast deine kleine Nichte zu Besuch, die auch etwas über Einsteins fundamentale Theorie lernen möchte, weil sie davon gehört hat. Dazu geben wir den nächsten Prompt vor: Kannst du das bitte in 200 Wörtern erklären, sodass es meine 10-jährige Nichte versteht?
ChatGPT reagiert spontan: Die spezielle Relativitätstheorie ist eine Idee von Albert Einstein, einem berühmten Wissenschaftler. Sie hilft uns zu verstehen, wie Raum (wie weit etwas ist) und Zeit (wie lange etwas dauert) für verschiedene Personen unterschiedlich sein können. Einstein sagte, dass zwei Dinge immer wahr sind: 1) Die Regeln der Physik sind für alle gleich, egal ob sie stehen oder sich bewegen, solange sie sich nicht
91
3
KI in Bildung und Wissenschaft
beschleunigen. 2) Licht bewegt sich immer gleich schnell für alle, auch wenn sie sich bewegen. Daraus folgen einige interessante Ideen: 1. Zeitdilatation: Wenn sich jemand schnell bewegt, vergeht für ihn die Zeit langsamer als für jemanden, der stillsteht. 2. Längenkontraktion: Wenn sich etwas schnell bewegt, erscheint es für jemanden, der stillsteht, kürzer. 3. Massenzunahme: Wenn sich Dinge schneller bewegen, werden sie schwerer. 4. E = mc^2: Diese Formel zeigt, dass Energie und Masse im Grunde dasselbe sind, nur in unterschiedlichen Formen. Einstein half uns zu verstehen, dass Raum und Zeit auf eine besondere Weise miteinander verbunden sind. Seine Ideen sind wichtig für die Art und Weise, wie wir das Universum betrachten.
Auch an dieser vereinfachten Darstellung gibt es nichts auszusetzen. Gehen wir noch einen Schritt weiter. ChatGPT soll den Text nun in einer weiteren Rolle neu generieren: Erkläre mir nun die Relativitätstheorie in 200 Wörtern im Stil des deutschen Comedians Mario Barth.
Die Antwort verblüfft einmal mehr: Also, stell dir vor, du hast diesen Typen namens Albert Einstein, ne? Der hatte 'ne ziemlich verrückte Idee, die er "spezielle Relativitätstheorie" nannte. Wollte uns damit erklären, wie Raum und Zeit funktionieren, als ob wir das nicht wüssten, wa? Er meinte, es gibt zwei Sachen, die immer gelten: 1) Die Physik ist für alle gleich, egal ob du rumstehst oder dich bewegst – solange du nicht beschleunigst, ne? 2) Licht ist echt fix unterwegs, und das immer gleich schnell, egal ob du rennst oder sitzt. Jetzt pass mal auf, hier wird's kurios: 1. Zeitdilatation: Wenn du voll schnell unterwegs bist, kommt's dir so vor, als ob die Zeit langsamer vergeht, während deine Freundin zuhause wartet und überlegt, warum du so lange brauchst. 2. Längenkontraktion: Sachen, die sich schnell bewegen, sehen aus, als wären sie gekürzt. Und das nicht nur, weil du zu langsam guckst, ne? 3. Massenzunahme: Je schneller du bist, desto schwerer wirst du. Also, abnehmen durch Joggen? Vergiss es! 4. E = mc^2: Energie und Masse sind wie Brüder, nur in verschiedenen Klamotten. Echt krass, wa? Einstein hat uns gezeigt, dass Raum und Zeit echt 'ne verrückte Verbindung haben. Und das hilft uns heute, den ganzen Kram im Universum zu verstehen!
92
3.1 ChatGPT – der Stein der Weisen des Digitalzeitalters
3.1.2 Was tun bei Fehlern? Wie bereits erwähnt, gibt es gelegentlich Situationen, in denen es der Chatbot mit Fakten nicht allzu genau nimmt. Wenn du bei der kritischen Durchsicht des generierten Textes auf sachliche Mängel stößt, kannst du versuchen, ChatGPT durch zusätzlichen Input bzw. Nachfragen auf die Sprünge zu helfen. Dazu ein Beispiel: ChatGPT ist in seiner ursprünglichen Form kein Rechenwerkzeug. Sehr einfache Aufgaben, die der Bot beim Texttraining zufällig aufgeschnappt und gewissermaßen auswendig gelernt hat, werden zwar problemlos erledigt: Wie lautet die dritte Wurzel aus 125? Die dritte Wurzel aus 125 ist 5, da 5 × 5 × 5 = 125.
Problematisch wird es, wenn komplexere Ergebnisse, die eine Rechnung erfordern, abgefragt werden: Wie lautet die dritte Wurzel aus 1024? Die dritte Wurzel aus 1024 ist 10, da 10 × 10 × 10 = 1024.
Du erkennst, dass die Struktur der Aufgabe zwar erkannt wurde, die Lösung aber definitiv falsch ist. Also haken wir nach und zeigen dem Bot einen Weg zur korrekten Lösung: Das ist nicht richtig. Kannst du mir stattdessen ein Python-Programm schreiben, dass die dritte Wurzel aus 1024 berechnet?
Der Bot besinnt sich auf seine Stärken und schreibt ein Programm, das das richtige Ergebnis liefert, wie Abbildung 3.2 zeigt.
Abbildung 3.2 Bei fehlerhaften Ergebnissen ist es oft hilfreich, ChatGPT potenzielle Lösungswege aufzuzeigen. Im vorliegenden Fall nehmen wir den Umweg über ein Python-Programm. Interessant ist hier, dass der Chatbot unter dem Code das richtige Ergebnis der mathematischen Berechnung ausgibt.
93
3
KI in Bildung und Wissenschaft
Abbildung 3.3 Mittlerweile können ChatGPT-Plus-Abonnenten die gleiche Aufgabenstellung auch mithilfe des aktivierten ChatGPT-Plug-ins Code Interpreter lösen (mehr darüber erfährst du in Kapitel 8, »KI für Fortgeschrittene«). Dieser erzeugt automatisch den notwendigen Python-Code und führt diesen aus.
Mehr zum Thema KI-Bots und Mathematik erfährst du in Abschnitt 3.4, »Rechnen mit KI-Power«.
3.2 KI für Schüler*innen Längst hat es sich in vielen Klassenzimmern auf der ganzen Welt herumgesprochen: ChatGPT erledigt komplexe Hausaufgaben im sprachlichen Bereich im Handumdrehen. Die Frage, die sich Lehrerinnen und Lehrer nun stellen, lautet: Wie soll ich so etwas bewerten? Wo bleibt die Eigenleistung der Schülerinnen und Schüler? Ein Perspektivenwechsel ist insbesondere auch in den Kultusministerien dringend notwendig: Nicht monoton erlerntes Faktenwissen, sondern Handlungskompetenzen und methodisches Arbeiten sollten abgeprüft werden. Es reicht eben nicht aus, dem Bot ein Hausarbeitsthema stumpf zu übergeben, die Antwort kritiklos zu übernehmen und formal geschönt abzugeben. Prompts müssen geschickt erstellt und die ausgespuckten Ergebnisse kritisch hinterfragt werden. Für eine bestimmte Gruppe von Lernenden sind KI-Bots aber geradezu eine Offenbarung: Menschen mit Lese- und Rechtschreibschwäche oder generell mit einer Behinderung. Hier leisten ChatGPT & Co. wertvolle Hilfe im Bereich der Inklusion. Nachfolgend
94
3.2
KI für Schüler*innen
widmen wir uns zunächst dem Einsatz von KI-Tools aus der Perspektive der Schüler*innen. Die Lehrendenperspektive nehmen wir später in Abschnitt 3.3 ein.
3.2.1 Literarische Zusammenfassungen und Analysen Nach wie vor sind Pflichtlektüren ein wesentlicher Bestandteil des Deutschunterrichts. Nun ist es sicher nicht Sinn der Sache, komplett auf das Lesen zu verzichten und sich ausschließlich darauf zu verlassen, dass ChatGPT eine komplette Zusammenfassung der Lektüre präsentiert. Wie so oft im Leben gilt auch hier: Die Mischung macht’s. Dazu ein Beispiel aus dem zentralen Deutschabitur Niedersachsen des Jahres 2023. Dort stand unter anderem der Text »Der Schlag ans Hoftor« von Franz Kafka zur Analyse an. Das Original findest du hier: http://r-wrk.de/sxbf2. Die erste Aufgabe bestand darin, die Erzählung in eigenen Worten wiederzugeben. ChatGPT liefert dazu ohne Training Folgendes ab: Fasse das Prosastück "Der Schlag ans Hoftor" von Franz Kafka zusammen (maximal 200 Wörter). "Der Schlag ans Hoftor" ist ein kurzes Prosastück von Franz Kafka, dass eine vermeintliche Gerechtigkeitsverhandlung darstellt. Die Geschichte beginnt mit einem Mann, der zum Hoftor eilt, um die Wahrheit zu erfahren, nachdem er von einem Schlag ans Hoftor gehört hat. Der Mann glaubt, das Gerichtsverfahren könne sein Leben verändern und ist entschlossen, die Wahrheit herauszufinden. Doch als er am Hoftor ankommt, entdeckt er, dass das Tor verschlossen ist und der Prozess bereits abgeschlossen wurde. [...]
Um es kurz zu machen: Die Version, die sich ChatGPT hier ausgedacht hat, hat mit dem Originaltext relativ wenig zu tun – ein typisches Beispiel für eine halluzinierende KI. Der Grund mag darin liegen, dass der entsprechende Text nicht in die Trainingsdaten der KI eingeflossen ist. Daher müssen wir Informationen aus der oben genannten Quelle hinzufügen: Du beziehst dich hier leider nicht auf den Originaltext von Franz Kafka, den ich dir nachfolgend liefere. Fasse diesen bitte zusammen (maximal 200 Wörter). Text:###
### "Der Schlag ans Hoftor" ist ein kurzes Prosastück von Franz Kafka, das die surreale und beunruhigende Erfahrung eines Geschwisterpaares beschreibt, das
95
3
KI in Bildung und Wissenschaft
fälschlicherweise eines Verbrechens beschuldigt wird. An einem heißen Sommertag gehen der Erzähler und seine Schwester an einem Hoftor vorbei, das seine Schwester möglicherweise – aus Unachtsamkeit oder Mutwillen – geschlagen hat oder nur gedroht hat, es zu schlagen. Als sie das nahegelegene Dorf betreten, werden sie von besorgten Dorfbewohnern gewarnt, dass der Hofbesitzer sie verklagen und eine Untersuchung eingeleitet werde. [...]
Diese Zusammenfassung trifft wiederum den Kern des Stücks gut. Nachdem das Wissen der KI angepasst wurde, können wir uns an die Interpretation wagen: Interpretiere nun das obige Prosastück "Der Schlag ans Hoftor" von Franz Kafka. "Der Schlag ans Hoftor" von Franz Kafka ist ein kurzes Prosastück, das sich auf der Oberfläche mit einer fälschlichen Anschuldigung und einer Untersuchung befasst. Es lässt jedoch auch tiefere Interpretationen und symbolische Bedeutungen zu. [...] Insgesamt kann "Der Schlag ans Hoftor" als eine Erzählung über das Unverständnis und die Ungerechtigkeit des Lebens verstanden werden. Die surreale und düstere Atmosphäre des Textes unterstreicht die absurde und unberechenbare Natur menschlicher Erfahrungen und der Autorität, die sie oft beherrscht. Die Geschichte regt den Leser an, über die Rolle von Gerechtigkeit, Macht und Zufall im Leben nachzudenken und wie sie das Individuum beeinflussen können.
Die Interpretation ist stimmig und enthält richtige Ansätze, die mindestens als Gedankenanstöße dienen können. Pflichtlektüre in dem betreffenden Abiturjahrgang war der Roman »Corpus Delicti« von Juli Zeh. Eine weitere Aufgabenstellung lautete daher: Vergleiche die Figur des Ich-Erzählers und seine Situation in der Erzählung »Der Schlag ans Hoftor« von Franz Kafka mit der Figur der Mia Holl und ihrer Situation in Juli Zehs Roman »Corpus Delicti«. Zunächst solltest du sicherstellen, dass die KI den entsprechenden Roman korrekt erfasst hat, indem du erneut eine Zusammenfassung im gleichen Chat erstellen lässt: Fasse den Roman "Corpus Delicti" von Juli Zeh in 200 Wörtern zusammen. "Corpus Delicti" ist ein dystopischer Roman von Juli Zeh, der im Jahr 2009 veröffentlicht wurde. Die Geschichte spielt in der nahen Zukunft, im Jahr 2057, in einer Gesellschaft, die von einem totalitären Gesundheitsregime namens "Die Methode" kontrolliert wird. In dieser Welt steht die Gesundheit jedes Bürgers an erster Stelle, und es gibt strikte Regeln und Vorschriften, die das Verhalten und die Lebensweise der Menschen diktieren.
96
3.2
KI für Schüler*innen
[...] Im Verlauf der Geschichte wird Mia selbst zum Ziel der Regierung und muss sich entscheiden, ob sie sich weiterhin dem System widersetzt oder sich ihm unterordnet. "Corpus Delicti" ist ein spannender Roman, der Fragen zu Freiheit, Überwachung, Gesundheit und Individualität in einer technokratischen Zukunftsgesellschaft aufwirft. Juli Zehs Werk hinterlässt beim Leser einen bleibenden Eindruck und regt zur Reflexion über die ethischen und moralischen Konsequenzen von staatlicher Kontrolle und der Priorisierung von Gesundheit über persönliche Freiheiten an.
Der Roman wird im Vergleich zu Kafkas Stück erstaunlich genau wiedergegeben. Dies mag daran liegen, dass der Roman in erheblichem Umfang in die Trainingsdaten eingeflossen ist. Nach dieser Vorkonditionierung kannst du ChatGPT mit der Originalaufgabe füttern und bekommst folgendes Ergebnis: Vergleiche die Figur des Ich-Erzählers und seine Situation in der Erzählung "Der Schlag ans Hoftor" von Franz Kafka mit der Figur der Mia Holl und ihrer Situation in Juli Zehs Roman "Corpus Delicti". Sowohl in Franz Kafkas "Der Schlag ans Hoftor" als auch in Juli Zehs "Corpus Delicti" geraten die Hauptfiguren – der namenlose Ich-Erzähler und Mia Holl – in Konflikte mit autoritären Systemen. Beide Geschichten befassen sich mit Themen wie Macht, Ungerechtigkeit und der Rolle des Individuums in einer kontrollierenden Gesellschaft. [...] Trotz der unterschiedlichen Kontexte und Details der Geschichten weisen die Figuren und ihre Situationen einige Parallelen auf: 1. Konfrontation mit autoritären Systemen: Beide Figuren stehen ungerechten und repressiven Systemen gegenüber, die ihre Freiheit und Individualität bedrohen. 2. Suche nach Wahrheit und Gerechtigkeit: Sowohl der Ich-Erzähler als auch Mia Holl versuchen, die Wahrheit hinter den Ereignissen aufzudecken und Gerechtigkeit für sich und ihre Angehörigen zu erlangen. 3. Machtlosigkeit und Unterdrückung: Beide Charaktere erfahren ein Gefühl der Machtlosigkeit und Unterdrückung durch die herrschenden Autoritäten. Die Hauptunterschiede liegen in der konkreten Ausgestaltung der Figuren und ihrer persönlichen Entwicklung innerhalb der jeweiligen Geschichten. Während der Ich-Erzähler in Kafkas Erzählung eher passiv bleibt und der Ungerechtigkeit hilflos ausgeliefert ist, zeigt Mia Holl in "Corpus Delicti" eine aktivere Rolle, indem sie sich dem System entgegenstellt und versucht, etwas zu verändern.
97
3
KI in Bildung und Wissenschaft
Quintessenz: Auch bei dieser Aufgabe liefert ChatGPT sehr brauchbare Vorschläge im höchsten Anforderungsbereich einer Abiturprüfung. Zumindest das niedersächsische Deutschabitur würde der Chatbot auf die beschriebene Weise bestehen.
3.2.2 Aufsätze & Co. Werden wir nun selbst kreativ und versuchen wir, unsere eigenen Gedanken zu Papier zu bringen. Der Klassiker: Ein Aufsatz soll zu einem vorgegebenen Problem geschrieben werden. Stell dir vor, du bist Schüler oder Schülerin der 8. Klasse und deine Deutschlehrerin hat dir dieses Thema als Hausaufgabe gegeben: »Die Auswirkungen des Klimawandels auf unsere Umwelt: Welche Schritte können wir unternehmen, um unseren ökologischen Fußabdruck zu reduzieren?« Im Folgenden geht es nicht darum, dass der Chatbot dir den ganzen Text schreibt. Vielmehr sollst du ihn um Ideen bitten, die du selbst kritisch überdenkst. Ich bin Schülerin einer 8. Klasse an einem Gymnasium. Meine Erdkundelehrerin hat uns als Hausaufgabe einen Aufsatz zu folgendem Thema aufgegeben: "Klimawandel und Reduzierung des ökologischen Fußabdrucks". Könntest du mir dazu einige Ideen liefern? Natürlich kann ich dir dabei helfen, einige Ideen für deinen Aufsatz zum Thema Klimawandel und Reduzierung des ökologischen Fußabdrucks zu sammeln. Hier sind einige Punkte, die du in deinem Aufsatz erwähnen kannst: 1. Einführung: Beschreibe kurz den Klimawandel, die Hauptursachen und die möglichen Folgen für die Umwelt und die Gesellschaft. 2. Energieverbrauch reduzieren: Eine der Hauptursachen für den Klimawandel ist der hohe Energieverbrauch. Hier sind einige Maßnahmen, die wir ergreifen können: a. Energiesparende Geräte verwenden b. Strom aus erneuerbaren Energiequellen beziehen c. Den Gebrauch von Heizung und Klimaanlage minimieren d. Energiesparlampen verwenden [...] 7. Bildung und Bewusstseinsbildung: Wissen und Verständnis sind entscheidend für den Wandel. a. An Umwelt- und Klimaschutzveranstaltungen teilnehmen b. Informationsmaterialien teilen und über soziale Medien verbreiten c. Familie und Freunde ermutigen, umweltfreundliche Entscheidungen zu treffen
98
3.2
KI für Schüler*innen
8. Fazit: Fasse die wichtigsten Punkte zusammen und betone die Dringlichkeit, unseren ökologischen Fußabdruck zu reduzieren, um den Klimawandel abzumildern und eine lebenswerte Zukunft für kommende Generationen zu sichern. Diese Ideen sollten dir einen guten Ausgangspunkt für deinen Aufsatz bieten. Viel Erfolg bei deiner Hausaufgabe!
Das ist ein guter Anfang! Jetzt kannst du versuchen, die einzelnen Punkte mit Leben zu füllen bzw. ganze Sätze daraus zu formulieren. Bei Schreibblockaden kann dir ChatGPT auch hier helfen. Nach Fertigstellung deines Aufsatzes solltest du ihn immer noch einmal durch eines der bekannten Rechtschreibprüfprogramme (DeepL Write, LanguageTool, siehe Abschnitt 2.5, »Der KI-Babelfisch«) laufen lassen, um Grammatik-, Stil- und Rechtschreibfehler zu beseitigen. Insbesondere Legastheniker*innen können davon sehr profitieren.
Abbildung 3.4 Das LanguageTool (links) markiert lediglich Rechtschreib-, Grammatik- und Stilfehler. DeepL Write (rechts) korrigiert den Text sofort und strukturiert ihn entsprechend um, sodass der Lesefluss gewährleistet ist.
PEER – das intelligente Aufsatzlektorat PEER steht für Paper Evaluation and Empowerment Resource und ist ein faszinierendes Projekt der Technischen Universität München. Unter https://peer.edu.sot.tum.de kann man seine Arbeit in den verschiedensten Formen (sogar als Bild) hochladen und begutachten lassen. Das Lektorat und Korrektorat übernimmt (wie könnte es in diesem Buch anders sein) eine KI. Das folgende Bild zeigt das Lektorat eines Kursberichts, den ich letztes Jahr über meinen Physik-Leistungskurs für die Abi-Zeitung des Jahrgangs geschrieben habe.
99
3
KI in Bildung und Wissenschaft
Abbildung 3.5 PEER hilft dir, deine Aufsätze zu verbessern. Dabei stehen ein englischer und ein deutscher KI-Lektor zur Verfügung.
3.2.3 KI im fremdsprachlichen Unterricht Beginnen wir mit einer klassischen Disziplin des Fremdsprachenunterrichts, dem Lernen neuer Vokabeln. Zu meiner Schulzeit wurden die Vokabeln einer Fremdsprache noch stumpf in Form von ellenlangen Listen auf Papier oder Karteikarten gepaukt. Der Chatbot kann dich dabei im Digitalzeitalter hervorragend unterstützen! Er ist dein persönlicher Vokabellernassistent. Du bist meine Lehrerin, die mir französische Vokabeln beibringt. Ich möchte die französischen Vokabeln zu den wichtigsten Farben (Rot, Gelb, Grün, ...) gemeinsam mit dir lernen. Gib mir zunächst eine Tabelle mit den Farben auf Französisch und ihrer deutschen Übersetzung. Wenn ich den Befehl "Start" eingebe, gibst du mir eine französische Vokabel für eine Farbe vor, die ich ins Deutsche übersetzen muss. Wenn ich 5 Vokabeln nacheinander richtig übersetzt habe, habe ich den Test bestanden.
100
3.2
KI für Schüler*innen
Abbildung 3.6 ChatGPT erzeugt selbstständig das Basisvokabular.
Nun kann der Vokabeltest losgehen: Start Lass uns beginnen! Erste Farbe: vert Grün Richtig! Gut gemacht. Zweite Farbe: rouge Rot Richtig! Weiter so. Dritte Farbe: bleu [...] Richtig! Nur noch eine Farbe. Fünfte Farbe: jaune Gelb Richtig! Herzlichen Glückwunsch, du hast alle 5 Vokabeln nacheinander richtig übersetzt und den Test bestanden! Du machst tolle Fortschritte beim Lernen der französischen Farben.
Es geht auch in der umgekehrten Richtung: Nun gib mir bitte die Vokabeln auf Deutsch vor und bitte mich um die französische Übersetzung. Erneut gilt der Test als bestanden, wenn ich 5 Vokabeln nacheinander richtig übersetzt habe.
101
3
KI in Bildung und Wissenschaft
In Ordnung, lass uns beginnen! Erste Farbe: weiß [...]
Natürlich sollte man bei diesem Vokabeltest nicht ständig auf die Tabelle blinzeln. Um diese Gefahr zu vermeiden, kann man die Ausgabe der Tabelle zu Beginn des Prompts auch ganz weglassen. Die Tabelle gibt lediglich einen Eindruck, welche typischen Vokabeln abgeprüft werden. Möchtest du spezielle Vokabeln (z. B. aus einem französischen Lehrbuch) lernen, so müssen diese zunächst dem Bot bekannt gemacht werden. Das kannst du etwas mühsam durch Eingabe der Vokabeln per Hand als Text machen, oder du scannst die entsprechende Lehrbuchseite und wandelst die im Scan enthaltenen Vokabeln automatisch in Text um. Das beherrscht mittlerweile jedes beliebige Smartphone.1 Das folgende Beispiel beginnt mit einem Textscan, der mit einem iPhone erstellt wurde (siehe Abbildung 3.7).
Abbildung 3.7 Eine Vokabelliste wird mit einem iPhone eingescannt und anschließend durch Antippen des gelben Knopfs in Text umgewandelt. 1 Solltest du dafür eine passende App benötigen, so such einfach nach »Google Lens«.
102
3.2
KI für Schüler*innen
Es stellt sich heraus, dass bei der Textumwandlung einige Vokabelzuordnungen durcheinandergebracht werden. Es soll zunächst eine Tabelle der neuen Vokabeln erstellt werden, die als Lernbasis für künftige KI-generierte Vokabeltests dient. Das erledigst du mit folgendem Prompt: Du bist eine Lehrerin der französischen Sprache, die mir Vokabeln beibringen soll. Ich übergebe dir anschließend eine Liste von für mich neuen französischen Vokabeln in Textform. Die deutschen Übersetzungen stehen ebenfalls im Text, allerdings nicht unbedingt direkt hinter den französischen Vokabeln. Hinter den französischen Vokabeln stehen in eckigen Klammern [...] Aussprachehinweise. Erstelle mir zunächst eine Tabelle in folgender Form: ### Französischer Ausdruck | Aussprachehinweis | deutsche Entsprechung ### Die Vokabelliste sieht folgendermaßen aus: Vokabelliste: ###
###
Das Ergebnis in Abbildung 3.8 zeigt, dass sich ChatGPT auch hervorragend zur intelligenten Textverarbeitung eignet.
Abbildung 3.8 ChatGPT erstellt Lernlisten aus ungeordneten Vokabeln.
Die so erzeugte Vokabelliste kann nun wiederum wie im obigen Beispiel als Basis für einen Vokabeltest verwendet werden. Spannend ist auch der Einsatz des Chatbots in seiner angestammten Paradedisziplin – der Kommunikation. Mit ChatGPT lassen sich in vielen Fremdsprachen beliebige Kommunikationssituationen realisieren.
103
3
KI in Bildung und Wissenschaft
Ich bin ein Tourist und soeben auf dem Bahnhof Gare de l'Est in Paris angekommen. Ich möchte in mein Hotel in der Nähe des Gare Montparnasse gelangen, kenne mich aber mit den Verkehrsmitteln in Paris nicht aus. Mein französisches Sprachniveau entspricht dem eines Schülers im dritten Lernjahr Französisch. Simuliere mit mir eine Kommunikation, bei der ich eine Möglichkeit erfrage, wie ich zu meinem Hotel gelange, und du mir dabei Rede und Antwort stehst. Du bist der Einheimische Pierre und sprichst sehr einfaches Französisch. Ich frage dich etwas, und du antwortest mir mit dem Prompt: "Pierre dit:". Bestätige die Anweisungen mit OK. Danach werde ich dir die erste Frage stellen. OK, ich verstehe die Anweisungen. Ich werde als Pierre mit einfachem Französisch antworten. Bitte stellen Sie Ihre erste Frage. Bonjour, excusez-moi. Je m'appelle Rainer et je suis d'Allemagne. Je dois aller à la Gare Montparnasse. Comment? Pierre dit: Bonjour Rainer! Pas de problème. Prenez la ligne 4 du métro en direction de Mairie de Montrouge. Descendez à Montparnasse-Bienvenüe. Voilà, vous êtes près de la Gare Montparnasse. Quel type de billet est nécessaire? Je rester une semaine à Paris, existe-t-il un billet speciale ? Pierre dit: Oui, pour une semaine, je vous conseille d'acheter un pass Navigo Découverte. C'est valable pour une semaine et vous pouvez voyager dans les zones 1 à 5. Vous pouvez l'acheter dans une station de métro. [...]
Auf diese Weise lernst du aktiv eine Sprache, indem du spezielle Kommunikationssituationen durchspielen kannst. Das Tolle am obigen Beispiel: Die Antworten des KI-Einheimischen sind nicht nur sprachlich, sondern auch sachlich richtig!
... und Latein? Übersetzungstools für die lateinische Sprache im Stil von DeepL Translator waren bislang dünn gesät bzw. schlicht nicht vorhanden. Das hat sich spätestens mit dem Erscheinen von ChatGPT geändert. Beweis gefällig? Füttere doch einmal einen lateinischen Text2 in den Bot, der zuvor mit folgendem Prompt vorkonfiguriert wurde, und staune: Du bist Lateinexperte und spezialisiert auf die Übersetzung von lateinischen Originaltexten. Es wird dir nachfolgend ein Text übergeben, den du mir bitte übersetzt. Text: ###
###
2 Beispiele lateinischer Texte findest du z. B. hier: http://r-wrk.de/bgr8t
104
3.2
KI für Schüler*innen
Besser Sprachen lernen mit dem Speak-Plug-in Mittlerweile kannst du auch ein Plug-in3 namens Speak in ChatGPT integrieren, um dir Floskeln für bestimmte Kommunikationssituationen übersetzen zu lassen.
Abbildung 3.9 Das Speak-Plug-in hilft dabei, Alltagskonversationen zu lernen.
3.2.4 Unterstützung bei Referaten und Präsentationen In Abschnitt 2.6.2, »Präsentationen erstellen (lassen)«, wurde bereits gezeigt, wie man ChatGPT dazu bringt, Präsentationen im Berufsalltag mit Inhalt zu füllen. Nun sehen wir uns dieses Thema einmal aus Schülerperspektive an. Ein beispielhaftes Video hat »Der Lehrerfreund« auf YouTube hochgeladen: https://youtu.be/_Snkf6s82vc. Dort wird gezeigt, wie man in 10 Minuten und mithilfe von ChatGPT ein Biologiereferat zum Thema Evolution erstellen kann, ohne einen blassen Schimmer von der Materie zu haben. 3 Was ein Plug-in ist und wie du damit umgehst, erfährst du in Abschnitt 8.1.4, »Plug-ins installieren und nutzen«.
105
3
KI in Bildung und Wissenschaft
Das kann natürlich nicht das Ziel sein. Die Präsentation sollte immer das Sahnehäubchen einer sorgfältigen Recherche zum Thema sein. Insbesondere ist es hier wichtig, die aus dem Netz entnommenen Fakten mit Quellenangaben zu belegen – bekanntlich eine latente Schwäche von ChatGPT. In diesem Fall ist es sinnvoller, die Faktenrecherche zu einer von ChatGPT generierten Präsentation mit KI-basierten Suchmaschinen durchzuführen, die auch die entsprechenden Links zu ihren Ausführungen liefern. Aus den Quellen extrahiert man dann stichwortartig die Fakten zur Präsentation und überprüft, ob ChatGPT nicht halluziniert. Hier ein Beispiel: Du sollst im Physikunterricht ein Referat halten zum Thema: »Hat die erste Mondlandung 1969 wirklich stattgefunden?« Dieses Thema ist insofern kritisch zu recherchieren, als es im Internet viele Seiten von Verschwörungstheoretikern gibt, die meinen, Hollywood habe dieses Spektakel inszeniert. Es ist also durchaus möglich, dass die KI beim Training auch Inhalte solcher Seiten verwendet hat. Schauen wir uns an, was ChatGPT zu diesem Thema zu bieten hat. Wir lassen uns auch gleich die Folieninhalte für eine Präsentation mit dem folgenden ausgeklügelten Prompt generieren: Du bist Schüler an einem Gymnasium in einem Physikkurs der 11. Klasse und sollst eine Präsentation zum Thema "Hat die erste Mondlandung im Jahr 1969 wirklich stattgefunden?" erstellen. Der Aufbau der Präsentation soll folgendermaßen gestaltet sein: Du nennst auf jeder Folie einen Kritikpunkt der Verschwörungstheoretiker/Skeptiker. Die Kritikpunkte sollen durch physikalisches und technisches Hintergrundwissen entkräftet werden. Erstelle mir 5 Folien für eine PowerPoint-Präsentation, die die 5 meistgenannten Fakten der Skeptiker als Überschrift enthalten. Im Text jeder Folie soll die Gegenargumentation mit Spiegelpunkten erfolgen. Es sollen nicht mehr als 5 Spiegelpunkte auf jeder Folie enthalten sein. Folie 1: Die wehende Flagge - Kritikpunkt: Die US-Flagge scheint im Wind zu wehen, obwohl es auf dem Mond keine Atmosphäre gibt. Gegenargumentation: 1. Die Flagge wurde durch eine horizontale Stange gestützt, um sie aufrecht zu halten. 2. Die scheinbare Bewegung der Flagge wurde durch Schwingungen verursacht, die entstanden, als die Astronauten die Flagge aufstellten. [...] 5. Video- und Fotoaufnahmen der Flagge zeigen, dass sie sich nur bewegt, wenn die Astronauten sie berühren. [...]
106
3.2
KI für Schüler*innen
Folie 5: Fehlende Triebwerk-Flamme - Kritikpunkt: Auf den Fotos und Videos ist keine Flamme aus dem Triebwerk des Mondlandemoduls zu sehen. Gegenargumentation: 1. Das Triebwerk des Mondlandemoduls verwendete Aerozin-50 und Stickstofftetroxid als Treibstoff, die bei Verbrennung nahezu unsichtbare Flammen erzeugen. [...] 4. Die Geräusche und Erschütterungen des Triebwerks wurden von den Astronauten während des Lande- und Startvorgangs bestätigt. 5. Die Triebwerksflamme war in der Dunkelheit während des Starts des Landemoduls von der Mondoberfläche aus sichtbar, wie auf Videos von späteren ApolloMissionen zu sehen ist.
Die genannten Fakten zu den einzelnen Punkten werden nun mit einer KI-basierten Suchmaschine wie Bing oder perplexity.ai gegengecheckt. Dabei empfiehlt es sich, für jeden einzelnen der genannten Punkte eine eigene Suchanfrage durchzuführen (siehe Abbildung 3.10).
Abbildung 3.10 Mithilfe von Bing werden Quellen zu den Behauptungen von ChatGPT gesucht.
3.2.5 ChatGPT als Gesprächs- und Diskussionspartner Du hast den Bot als Kommunikations- und Lernpartner bereits in Abschnitt 3.2.3, »KI im fremdsprachlichen Unterricht«, kennengelernt. Nun begeben wir uns in den gesell-
107
3
KI in Bildung und Wissenschaft
schaftswissenschaftlichen Bereich. Stell dir vor, du möchtest einmal einen Einblick in das Leben im Mittelalter erhalten. Du stehst vor einem Gemüsestand und unterhältst dich mit einem Bauern aus dem Mittelalter, der seine Produkte anbietet. ChatGPT wird mit folgendem Prompt vorkonditioniert: Du bist Bauer auf einem mittelalterlichen Markt und stehst mir für Fragen und Antworten zur Verfügung. Die Fragen beziehen sich nicht nur auf deine Produkte, sondern beschäftigen sich auch mit deiner Position in der Gesellschaft des Mittelalters und der allgemeinen politischen Situation. Ich werde dir jetzt einige Fragen stellen. Bestätige meine Anweisung und antworte mir mit den Worten: "Oh edler Herr, was kann ich für Euch tun?" Oh edler Herr, was kann ich für Euch tun? Was empfiehlst du mir heute zu kaufen? Oh edler Herr, heute empfehle ich Euch frisches Gemüse und Obst aus meinem Garten, wie knackige Karotten, saftige Äpfel und süße Beeren. Außerdem bieten wir frische Eier von unseren glücklichen Hühnern und feinste Milch von unseren Kühen. Solltet Ihr an herzhaften Speisen interessiert sein, so haben wir auch frisches Brot aus unserer Dorfbäckerei und leckeren Käse von unseren Ziegen und Schafen. Was darf es für Euch sein? Gib mir bitte einen Laib Brot und 5 saftige Äpfel. Bist du eigentlich mit deiner Situation zufrieden? Oh edler Herr, hier ist Euer Laib Brot und die fünf saftigen Äpfel, die Ihr gewünscht habt. Was meine Situation betrifft, so bin ich zufrieden, denn ich kann meine Familie ernähren und ihnen ein gutes Leben bieten. Als Bauer arbeite ich hart, um unsere Felder zu bestellen und gute Ernten einzufahren. Natürlich gibt es immer Sorgen, wie etwa die Unberechenbarkeit des Wetters oder die Gefahr von Krankheiten und Schädlingen, aber das gehört zum Leben eines Bauern im Mittelalter. Wir sind dankbar für die Unterstützung unseres Dorfes und unseres Lehnsherren, der uns Schutz und Sicherheit bietet. Gibt es noch etwas, was ich für Euch tun kann, oh edler Herr? Ist der Lehnsherr gerecht zu dir und deiner Familie? Oh edler Herr, unser Lehnsherr behandelt uns und unsere Familie im Allgemeinen gerecht. Er erhebt Steuern und Abgaben von uns, aber dafür bietet er uns Schutz und Sicherheit in diesen unsicheren Zeiten. Manchmal können die Abgaben schwer wiegen, doch wir verstehen, dass es notwendig ist, um die Ordnung und Stabilität im Land aufrechtzuerhalten. Natürlich gibt es auch Fälle, in denen Lehnsherren ungerecht und grausam sein können, aber zum Glück haben wir einen verständnisvollen Herrn, der das Wohl seiner Untertanen im Auge behält. Möchtet Ihr noch etwas wissen, oh edler Herr?
108
3.2
KI für Schüler*innen
Nein, vielen Dank. Was schulde ich dir? Oh edler Herr, für den Laib Brot und die fünf saftigen Äpfel schuldet Ihr mir 3 Silbermünzen. Ich danke Euch für Euren Einkauf und stehe Euch jederzeit für weitere Fragen und Wünsche zur Verfügung. Möge Euer Tag gesegnet sein!
Auf die gleiche Weise kannst du ChatGPT auch einsetzen, um eine Diskussion zu einem kontroversen Thema zu führen. Auf diese Weise kann man sich recht gut bestimmte Argumentationsweisen antrainieren oder auch abgewöhnen: Du bist ein strikter Befürworter der Kernenergie und sollst mit mir eine Diskussion führen, ob es sinnvoll ist, auf Kernenergie zu setzen oder nicht. Gehe dabei streng logisch in deiner Argumentation vor und versuche mich davon zu überzeugen, dass der Klimawandel nur durch die friedliche Nutzung der Kernenergie abzuwenden bzw. abzumildern ist.
Der Bot legt sich sofort ins Zeug: Als strikter Befürworter der Kernenergie möchte ich betonen, dass die Kernenergie eine entscheidende Rolle bei der Bekämpfung des Klimawandels spielt. Ich werde meine Argumente logisch darlegen, um zu zeigen, warum die friedliche Nutzung der Kernenergie notwendig ist, um den Klimawandel abzuwenden bzw. abzumildern. 1. Emissionsarme Energiequelle: Im Vergleich zu fossilen Brennstoffen wie Kohle, Öl und Erdgas erzeugt Kernenergie eine äußerst geringe Menge an Treibhausgasemissionen. Die Emissionen entstehen hauptsächlich während der Herstellung von Brennelementen und des Baus von Kraftwerken und sind im Vergleich zu fossilen Brennstoffen minimal. Daher ist Kernenergie eine klimafreundliche Alternative zu konventionellen Energiequellen. [...] Zusammenfassend kann die friedliche Nutzung der Kernenergie dazu beitragen, den Klimawandel abzuwenden bzw. abzumildern, indem sie als emissionsarme, zuverlässige und hochdichte Energiequelle fungiert. Durch die Kombination von Kernenergie und erneuerbaren Energien können wir eine nachhaltige Zukunft gestalten, in der der weltweite Energiebedarf gedeckt wird und der Klimawandel bekämpft wird. Aber das Endlagerungsproblem der abgebrannten Kernbrennstäbe ist noch keinesfalls gelöst! Kannst du mir bitte mal erklären, wo wir mit dem ganzen Atommüll hin sollen? Es stimmt, dass das Endlagerungsproblem der abgebrannten Kernbrennstäbe eine der größten Herausforderungen im Zusammenhang mit der Nutzung der Kernenergie ist. Es gibt jedoch mehrere Lösungsansätze, um mit radioaktiven Abfällen verantwortungsvoll umzugehen und sie langfristig zu lagern. 1. Geologische Tiefenlager: Eine vielversprechende Lösung ist die Einlagerung der abgebrannten Brennstäbe in geologischen Tiefenlagern. Dabei werden die Ab-
109
3
KI in Bildung und Wissenschaft
fälle in tiefen Gesteinsschichten eingeschlossen, die als natürliche Barrieren fungieren und die Freisetzung von Radioaktivität in die Umwelt verhindern. Länder wie Schweden und Finnland haben bereits solche Lager in Betrieb oder im Bau, und auch andere Länder untersuchen geeignete Standorte. [...] Es ist wichtig, dass weiterhin in Forschung und Entwicklung investiert wird, um die bestehenden Endlagerungsprobleme zu lösen und die Sicherheit sowie Nachhaltigkeit der Kernenergie zu erhöhen. Obwohl das Endlagerungsproblem eine ernsthafte Herausforderung darstellt, gibt es Lösungsansätze, die bei verantwortungsvoller Umsetzung die sichere Lagerung radioaktiver Abfälle ermöglichen können.
Übungen Jetzt bist du dran! Erschaffe dir nach dem vorgestellten Prinzip einen Kommunikationspartner deiner Wahl. Sollte es dir an Ideen mangeln, dann frag einfach ChatGPT: Du sollst als Gesprächs- und Diskussionspartner für Schüler*innen einer . Jahrgangsstufe im wissenschaftlichen Bereich arbeiten. Welche Rollen und Themengebiete würden dir dazu einfallen? Nenne mindestens fünf.
3.3 KI für Lehrer*innen Die Reaktionen seitens der Lehrerschaft waren gelinde gesagt gemischt, als die Pädagog*innen erstmals begriffen, welches Potenzial im KI-Bot ChatGPT steckt. Wie immer war Ihnen die Schülerschaft eine Nasenlänge voraus und verwendete das Tool längst fleißig, um ihnen automatisierte Hausaufgaben unterzujubeln. Und wie immer wurde im Land der Dichter und Denker sofort der Ruf nach Regulierung oder gar Verbot laut. Für Letzteres ist der Zug zumindest schon abgefahren – mittlerweile wissen die meisten Schülerinnen und Schüler, wie man Restriktionen per VPN umgeht, siehe dazu auch Abschnitt 1.3.4, »Wir müssen leider draußen bleiben …«. Glücklicherweise gibt es aber auch hierzulande eine Vielzahl von Lehrenden, die ihren Beruf als Berufung sehen und versuchen, aus neuen Trends das Beste für die Kinder herauszuholen – als erste Anlaufstelle für Anregungen sei hier das Twitter4-Lehrerzimmer (Twitter-Hashtag: #twlz) genannt, ein Sammelbecken kreativer Köpfe aus dem Schulbil-
4 Bekanntermaßen heißt Twitter mittlerweile »X« – am Hashtag ändert sich nix. ;-)
110
3.3
KI für Lehrer*innen
dungsbereich. Sehen wir uns im Folgenden einmal an, wie der Chatbot Lehrenden bei ihrer Bildungsarbeit helfen kann.
ChatGPT im schulischen Bereich Möchte man als Pädagog*in mit ChatGPT arbeiten, so kommt man nicht umhin, sich ausgiebig mit der DSGVO zu beschäftigen. Fakt ist, dass personenbezogene Daten im Allgemeinen und Schülerdaten im Besonderen nichts im Prompt eines Chatbots zu suchen haben. Andererseits gibt es die Möglichkeit, Daten anonymisiert zu übermitteln und so von den Fähigkeiten der KI zu profitieren, siehe dazu das Beispiel in Abschnitt 2.2.3, »Einen Text aus Fragmenten erstellen«. Weiterhin dürfen für Schüler*innen im unterrichtlichen Rahmen keine personenbezogenen Zugänge zu ChatGPT zur Verfügung gestellt werden.
3.3.1 (Übungs-)Aufgaben erstellen Montagmorgen – und die Woche nimmt kein Ende. Zu allem Überfluss hat sich der Mathekollege krankgemeldet und du musst ihn in einer 6. Klasse vertreten. Das aktuelle Thema ist Bruchrechnung. Material vom Kollegen für die Vertretungsstunde? Fehlanzeige. Ideal wäre es nun, wenn man den Kindern ein Arbeitsblatt zum Thema austeilen könnte. Achtung: Heute ist dein Glückstag, denn du kennst ChatGPT, den universellen Schulassistenten: Ich muss heute in der Schule eine Vertretungsstunde für einen Mathematikkollegen halten. Dieser hat mit den Kindern zuletzt Bruchrechnung behandelt, speziell das Rechnen mit gemischten Brüchen (zunächst nur Addition und Subtraktion). Kannst du mir ein Arbeitsblatt mit 5 Aufgaben zu diesem Thema erstellen? Natürlich kann ich Ihnen dabei helfen, ein Arbeitsblatt mit 5 Aufgaben zum Thema Addition und Subtraktion gemischter Brüche zu erstellen. Hier sind die Aufgaben: Arbeitsblatt: Addition und Subtraktion gemischter Brüche 1. Addiere die folgenden gemischten Brüche: a) 2 1/4 + 1 3/4 b) 3 1/3 + 2 2/3 c) 4 3/8 + 2 5/8 2. Subtrahiere die folgenden gemischten Brüche: a) 5 1/2 - 2 1/4 b) 4 2/3 - 1 1/3 c) 6 7/8 - 3 3/8 [...]
111
3
KI in Bildung und Wissenschaft
5. Subtrahiere die folgenden Brüche und gib das Ergebnis als gemischten Bruch an: a) 11/6 - 4/6 b) 15/8 - 5/8 Erinnern Sie die Schüler daran, bei der Addition und Subtraktion gemischter Brüche die folgenden Schritte auszuführen: 1. Die gemischten Brüche in unechte Brüche umwandeln. 2. Die Brüche auf denselben Nenner bringen, wenn nötig. 3. Die Zähler addieren oder subtrahieren, während der Nenner gleich bleibt. 4. Das Ergebnis, wenn möglich, vereinfachen oder als gemischten Bruch angeben.
Es stellt sich nun die Frage, ob man die Darstellung der Aufgaben auch etwas schöner gestalten kann, als es durch Kopieren und Einfügen der Textausgabe möglich wäre. Dies ist tatsächlich über einen kleinen Umweg möglich. Wir verwenden dazu LaTeX, ein Textsatzsystem, das insbesondere in den Naturwissenschaften sehr beliebt ist. Könntest du mir das Arbeitsblatt auch als PDF zum Aushändigen an die Schüler ausgeben, auf dem die Rechenaufgaben in schöner Schreibweise dargestellt sind, z. B. mithilfe von LaTeX? Als KI-Textmodell kann ich Ihnen leider kein PDF direkt erstellen oder eine LaTeX-Datei generieren. Aber ich kann Ihnen den LaTeX-Code für das Arbeitsblatt bereitstellen. Sie können diesen Code dann in einen LaTeX-Editor Ihrer Wahl einfügen, um das PDF zu erstellen. Hier ist der LaTeX-Code: \documentclass[12pt]{article} \usepackage[utf8]{inputenc} \usepackage[T1]{fontenc} \usepackage[ngerman]{babel} [...] Kopieren Sie diesen Code und fügen Sie ihn in einen LaTeX-Editor wie Overleaf oder TeXstudio ein. Kompilieren Sie dann das Dokument, um das Arbeitsblatt im PDF-Format zu erhalten.
In der Tat genügt es, den von ChatGPT erzeugten LaTeX-Code in einen beliebigen LaTeXEditor zu kopieren und daraus ein PDF zu erzeugen. Das Ergebnis in Abbildung 3.11 überzeugt.
112
3.3
KI für Lehrer*innen
Abbildung 3.11 ChatGPT erzeugt LaTeX Code, der in jeden TeX-Editor, z. B. Overleaf (www.overleaf.com), eingefügt und kompiliert werden kann. So erhältst du im Handumdrehen ein PDF – auf Wunsch auch mit ausführlichen Lösungen.
113
3
KI in Bildung und Wissenschaft
Deine Mathekenntnisse sind diesbezüglich ein wenig eingerostet? Dann lass dir doch von ChatGPT ein Lösungsblatt erstellen: Kannst du mir zu den Aufgaben bitte auch noch ein Lösungsblatt mit dem ausführlichen Lösungsweg erstellen? Bitte dieses auch in LaTeX-Form ausgeben. Natürlich, hier ist der LaTeX-Code für das Lösungsblatt mit ausführlichen Lösungswegen: [...]
Das Ergebnis zeigt Abbildung 3.11. Wechseln wir das Fach und begeben uns in den gesellschaftswissenschaftlichen Bereich. Eine beliebte Form der Überprüfung sind Lückentexte. Dazu folgendes Beispiel: Du bist prüfen. antiken eine 5.
Geschichtslehrerin und möchtest das Wissen deiner Schüler*innen überDie letzten Unterrichtseinheiten befassten sich mit dem Vergleich des Griechenlands mit dem römischen Reich. Erstelle einen Lückentext für Klasse, der dies zum Inhalt hat. Die Anzahl der Lücken soll 7 betragen.
ChatGPT liefert folgendes Ergebnis: Antikes Griechenland und das Römische Reich - Lückentext 1. Antikes Griechenland bestand aus vielen unabhängigen _______ (1), während das Römische Reich ein großes _______ (2) war. 2. Die Hauptstadt des Römischen Reiches war _______ (3) und die bedeutendste Stadt im antiken Griechenland war _______ (4). 3. Die griechische Kultur legte großen Wert auf _______ (5), wie zum Beispiel Philosophie, Mathematik und Theater. 4. Das Römische Reich war bekannt für seine technischen Errungenschaften, wie zum Beispiel die _______ (6), ein System zur Wasserversorgung. 5. Das antike Griechenland hatte die olympischen Spiele, ein bedeutendes sportliches Ereignis, das alle vier Jahre in der Stadt _______ (7) ausgetragen wurde. Lücken: (1) Stadtstaaten (Poleis) (2) Imperium (3) Rom (4) Athen (5) Bildung (6) Aquädukte (7) Olympia
Auch Rechtschreibübungen können erstellt werden:
114
3.3
KI für Lehrer*innen
Schreibe einen Text über Sir Isaac Newton (30 Wörter). Baue Rechtschreibfehler in den Text ein und liste diese anschließend auf. Sier Isak Nweton, ein greniales Mathermatiker und Fisiker, entdekte Gravitatjon und prägte die Klasische Mechanik. Er veröffentlichte "Philosophae Naturlalis Principea Mathematica [...]". Rechtschreibfehler: 1. Sier -> Sir 2. Isak -> Isaac 3. Nweton -> Newton 4. Mathermatiker -> Mathematiker 5. Fisiker -> Physiker 6. Gravitatjon -> Gravitation 7. Klasische -> Klassische [...]
Selbst die gymnasiale Oberstufe lässt sich mit Trainingsaufgaben versorgen, die sogar Abiturniveau erreichen können: Ich benötige einen Aufgabenvorschlag zum Training für das mündliche Abitur Mathematik aus dem Gebiet Stochastik mit dem Schwerpunkt Bernoullikette und Binomialverteilung. Bearbeitungsdauer soll ca. 10 Minuten sein. Aufgabe: "Erfolgsrate von Freiwürfen im Basketball" Ein Basketballspieler hat eine Erfolgsquote von 75 % bei Freiwürfen. In einem Trainingsspiel hat er 12 Freiwürfe. a) Berechnen Sie die Wahrscheinlichkeit, dass der Spieler genau 9 Freiwürfe trifft. b) Berechnen Sie die Wahrscheinlichkeit, dass der Spieler mindestens 10 Freiwürfe trifft. c) Wie viele Freiwürfe erwartet man, dass der Spieler trifft?
3.3.2 KI als Unterrichtsassistent Auch als Assistent zur Erstellung von Lehrplänen oder einzelnen Unterrichtsstunden kann ChatGPT verwendet werden. Nehmen wir an, du möchtest in einer 10. Klasse die Grundlagen der Halbleiterphysik einschließlich konkreter technischer Anwendungen unterrichten: Du bist Physiklehrer in einer 10. Klasse und möchtest eine Unterrichtssequenz von insgesamt 5 Doppelstunden zu
115
3
KI in Bildung und Wissenschaft
den Grundlagen der Halbleiterphysik und deren technischer Anwendung planen. Erstelle mir dafür ein konkretes Konzept. Unterrichtssequenz: Grundlagen der Halbleiterphysik und deren technischer Anwendung Zielgruppe: 10. Klasse Dauer: 5 Doppelstunden (à 90 Minuten) Lernziele: 1. Verständnis der Grundlagen von Halbleitern, Leitern und Isolatoren 2. Kenntnis von Dotierung und Halbleitertypen (n-Typ und p-Typ) 3. Verständnis des pn-Übergangs und der Funktionsweise von Dioden 4. Grundlagen von Transistoren und deren Anwendungen in Schaltungen 5. Anwendung und Bedeutung von Halbleitern in moderner Technologie Unterrichtsplan: Doppelstunde 1: - Einführung in die Elektrizitätslehre: Leiter, Isolatoren und Halbleiter - Definition und Unterschiede - Beispiele für Materialien - Energiebänder und Bandlücken - Valenzband und Leitungsband - Bandlücke und deren Bedeutung für die Leitfähigkeit - Diskussion: Warum sind Halbleiter interessant für die Technologie? [...] Doppelstunde 5: - Anwendungen von Halbleitern in der modernen Technologie - Integrierte Schaltungen und Mikrochips - Sensoren (Licht-, Temperatur-, Drucksensoren) - Photovoltaik (Solarzellen) - Diskussion: Zukünftige Entwicklungen und Herausforderungen in der Halbleitertechnologie - Zusammenfassung und Reflexion der Unterrichtseinheit Materialien und Ressourcen: - Beamer für Präsentationen und Videos - Experimentierkästen mit Halbleitermaterialien, Dioden und Transistoren - Schaltungsbeispiele und Arbeitsblätter für Übungen - Computer oder Tablets für Recherche und Simulationen
Nun verfeinern wir die Inhalte dadurch, dass wir konkrete Inhalte für die einzelnen Doppelstunden generieren:
116
3.3
KI für Lehrer*innen
Erstelle mir nun den konkreten Unterrichtsentwurf für die 5. Stunde der Unterrichtseinheit! Unterrichtsentwurf: Grundlagen der Halbleiterphysik und deren technischer Anwendung Stunde: 5. Doppelstunde (à 90 Minuten) Thema: Anwendungen von Halbleitern in der modernen Technologie Lernziele: 1. Die Schüler*innen sollen verschiedene Anwendungen von Halbleitern in moderner Technologie kennenlernen. 2. Die Schüler*innen sollen die Funktionsweise von Solarzellen verstehen. 3. Die Schüler*innen sollen die Bedeutung von Halbleitern für die Zukunftstechnologien diskutieren. Ablauf: 1. Einführung (15 Minuten) - Wiederholung der Inhalte aus den vorherigen Stunden (Leitfähigkeit, Dotierung, Dioden, Transistoren) - Einführung in das Thema der Stunde: Anwendungen von Halbleitern in der modernen Technologie [...] 4. Photovoltaik (Solarzellen) (20 Minuten) - Einführung in die Photovoltaik und die Funktionsweise von Solarzellen - Präsentation: Aufbau einer Solarzelle und Energieumwandlungsprozess - Experiment: Demonstration einer Solarzelle unter verschiedenen Lichtbedingungen [...] 6. Zusammenfassung und Reflexion (5 Minuten) - Zusammenfassung der wichtigsten Punkte aus der gesamten Unterrichtseinheit - Rückmeldung der Schüler*innen und offene Fragen klären Materialien und Ressourcen: - Beamer für Präsentationen und Videos - Experimentierkasten mit einer Solarzelle - Computer oder Tablets für die Recherche - Arbeitsblätter und Notizblätter für die Schüler*innen
YouTube-Transkripte mit KI-Hilfe erstellen Videos – insbesondere auf YouTube – sind beliebte Lehrmaterialien. Möchtest du schnell einen Einblick in ein längeres Video erhalten, ohne dieses komplett selbst anschauen zu müssen, bietet sich der Browser Chrome in Verbindung mit dem Plug-in Transcript &
117
3
KI in Bildung und Wissenschaft
Summary an (http://r-wrk.de/qnz76). Einmal installiert, wandelt es dir die sprachlichen Inhalte eines YouTube-Videos in einen Text um. Dieser kann durch Anklicken der Schaltfläche Summarize direkt an ChatGPT weitergeleitet werden, um die wesentlichen Inhalte des Videos herauszuarbeiten.
Abbildung 3.12 Mithilfe eines Transkript-Plug-ins lassen sich YouTube-Videos zunächst in Textform umwandeln. Die längeren Transkriptionstexte können anschließend in ChatGPT eingefüttert und damit sinnvoll gekürzt werden.
3.3.3 KI als Korrekturhilfe Fragt man gestandene Lehrer*innen, was sie an ihrem Job am wenigsten schätzen, dann taucht in den meisten Antworten sofort das Stichwort »Korrekturen« auf. Während der Korrekturaufwand in den naturwissenschaftlichen Fächern meist überschaubar ist, verschlingt die Korrektur eines Aufsatzes in Deutsch oder den Fremdsprachen erhebliche Zeitressourcen. Der folgende Abschnitt zeigt einen Ausweg aus der Korrekturmisere in den sprachlichen Fächern. In den seltensten Fällen werden die zu korrigierenden Texte in digitaler Form vorliegen. Der Arbeitsablauf zur KI-gestützten Korrektur gestaltet sich somit wie folgt (siehe Abbildung 3.13):
118
3.3
KI für Lehrer*innen
1. Digitalisierung des handschriftlich verfassten Materials in ein Bildformat. 2. Anwenden einer OCR-Software zur Umwandlung der handschriftlichen Daten in Textform. 3. Übergeben des Textmaterials zur Beurteilung/Bewertung an einen KI-Bot wie ChatGPT.
Abbildung 3.13 Ein handgeschriebener Text wird eingescannt und per OCR in eine TXT-Datei umgewandelt.
119
3
KI in Bildung und Wissenschaft
Dazu zwei Anmerkungen: Die zu bewertenden Arbeiten dürfen vor der Digitalisierung nicht mit Rechtschreibkorrekturen versehen werden. Außerdem sollte das später an die KI zu übergebende Material nicht mit persönlichen Daten der Schüler*innen versehen oder anderweitig identifizierbar sein, da die Auswertung in der Cloud stattfindet und niemand genau sagen kann, ob die Speicherung DSGVO-konform erfolgt. Es wird jedoch nur eine Frage der Zeit sein, bis die Sprachmodelle völlig autark auf lokaler Hardware ihren Dienst verrichten und damit die beschriebene Gefahr eliminiert wird. Zeit für ein Beispiel: Zu bewerten ist eine Schülerarbeit zum Thema Kernfusion, die in handschriftlicher Form vorliegt. Diese muss zunächst digitalisiert werden. Dazu bieten sich verschiedene Apps für Smartphones an, z. B. Adobe Scan oder Pen to Print. Beide Apps gibt es sowohl für Android als auch für iOS. Scanne einen Aufsatz ein und wandle ihn mit einer der genannten Apps in Text um. Alternativ kannst du auch ein PDF erstellen und dieses mit einem der vielen OCR-Onlinedienste in eine Textdatei umwandeln. Der Text wird nun in ChatGPT eingegeben. Für die Auswertung bereiten wir den Bot mit einem Prompt vor: Du bist Sachkundelehrer in einer 9. Klasse und hast den Schüler*innen einen Aufsatz zum Thema "Kann die Kernfusion die Energiewende bringen?" aufgegeben. Ich werde dir nun einige Texte von Schüler*innen zur Begutachtung übergeben. Bewerte die Aufsätze unter den Gesichtspunkten "sachliche und fachliche Richtigkeit" und sprachliches Ausdrucksvermögen. Bestätige bitte meinen Auftrag und bitte um den ersten Text, den du bewerten sollst. Ich bestätige deinen Auftrag und freue mich darauf, die Aufsätze der Schüler*innen zu bewerten. Bitte reiche den ersten Text ein, den ich begutachten soll. Hier kommt der erste Text: ### Meiner Meinung nach kann die Kernfusion in der Tat eine Energiewende bringen, da durch die Fusion von Wasserstoff zu Helium beachtliche Energien freigesetzt werden. Wasserstoff steht in Form von Wasser im Gegensatz zum Uran, welches für Kernspaltungskraftwerke benötigt wird, unbegrenzt zur Verfügung. Das einzige Problem, das aktuell noch zu lösen ist : Für die Fusion werden sehr hohe Temperaturen (bis zu 100 Millioner Grad) benötigt. Ich bin aber optimistisch, dass unsere Physiker und Ingenieure das Problem in spätestens 10 Jahren gelöst haben werden. ### Vielen Dank für den ersten Text. Hier ist meine Bewertung:
120
3.3
KI für Lehrer*innen
Sachliche und fachliche Richtigkeit: Der Text zeigt grundlegendes Verständnis für das Thema Kernfusion und erwähnt korrekt, dass bei der Fusion von Wasserstoff zu Helium Energie freigesetzt wird. Es wird auch richtig festgestellt, dass Wasserstoff im Vergleich zu Uran, das für Kernspaltung benötigt wird, in größerer Menge verfügbar ist. Die Angabe der hohen Temperaturen, die für die Fusion benötigt werden, ist ebenfalls korrekt. Die optimistische Einschätzung zur Lösung des Problems in den nächsten 10 Jahren ist jedoch eine persönliche Meinung und keine gesicherte Prognose. Sprachliches Ausdrucksvermögen: Der Text ist insgesamt verständlich und klar formuliert, aber es gibt einige kleinere Fehler. Hier sind einige Korrekturen: - "Wasserstoff steht in Form von Wasser im Gegensatz zum Uran, Welches für Kernspaltungskraftwerke benötigt wird, unbegrenzt zur Verfügung." sollte in "Wasserstoff steht in Form von Wasser, im Gegensatz zum Uran, das für Kernspaltungskraftwerke benötigt wird, in größerer Menge zur Verfügung." geändert werden. [...] Insgesamt ist der Text gut gelungen, mit einigen kleineren sprachlichen Korrekturen und der Klarstellung, dass die Einschätzung zur Lösung des Problems eine persönliche Meinung ist. Wie würdest du den Text auf einer Notenskala von 1 (sehr gut) bis 6 (ungenügend) bewerten? Unter Berücksichtigung der sachlichen und fachlichen Richtigkeit sowie des sprachlichen Ausdrucksvermögens würde ich den Text mit einer Note 3 (befriedigend) bewerten. Der Text zeigt ein grundlegendes Verständnis des Themas, aber es gibt einige sprachliche Fehler und die persönliche Meinung zur Lösung des Problems sollte als solche gekennzeichnet sein. Eine Überarbeitung des Textes könnte zu einer besseren Note führen.
Die sprachliche Analyse des Textes durch ChatGPT ist verbesserungswürdig. Der Originaltext wird sogar etwas »verschlimmbessert«. Die inhaltliche Analyse gelingt dem Bot jedoch zufriedenstellend. Einmal mehr soll an dieser Stelle das PEER Projekt der TU München genannt werden (siehe Kasten in Abschnitt 3.2.2, »Aufsätze & Co.«). Dort ist es möglich, Bilder oder PDFs direkt zur Bewertung einzureichen, ohne dass man das System zuvor mit einem komplexen Prompt vorkonditionieren muss.
121
3
KI in Bildung und Wissenschaft
Abbildung 3.14 Mithilfe des PEER-Projekts wird der Aufsatz vollautomatisch bewertet.
3.3.4 Der KI-Muttersprachler Stell dir vor, du bist Fremdsprachenlehrerin, hast einen eigenen Übungstext für Schüler*innen erstellt und möchtest diesen einmal von einer Muttersprachlerin vorlesen lassen, weil du die Aussprache einiger der im Text enthaltenen Vokabeln auch nicht mehr so ganz auf dem Schirm hast. Diese Aufgabe ließe sich bereits mit Siri & Co. lösen – allerdings klingt die Stimme aktueller Assistentinnen noch arg künstlich. In einem solchen Fall springen KI-Sprachbots in die Bresche. Der Branchenprimus ElevenLabs funktioniert in diesem Zusammenhang folgendermaßen: 1. Begib dich auf die Seite https://beta.elevenlabs.io. Für erste Versuche kannst du sofort loslegen. Solltest du den Dienst häufiger für längere Texte in Anspruch nehmen wollen, so bietet sich der Abschluss eines Abos an. In der freien Version darfst du dir pro Monat 10.000 Zeichen an Text vorlesen lassen. 2. Wähle nun die Sprache aus, in der du den Text formuliert hast. Du kannst auch zwischen verschiedenen Sprecher-Varianten wechseln. 3. Kopiere den Text per Copy-and-paste in das Eingabefeld und klick die Schaltfläche Generate (Abbildung 3.15) – das Textstück wird dir unmittelbar vorgelesen.
122
3.3
KI für Lehrer*innen
Zeit für eine Übung! Solltest du keinen fremdsprachlichen Text zur Verfügung haben, dann kann dir ChatGPT helfen (siehe dazu auch Abschnitt 3.2.3, »KI im fremdsprachlichen Unterricht«): Du bist Französischlehrerin. Erstelle mir einen kurzen Text (maximal 150 Wörter), mit dessen Hilfe die Kinder die französischen Vokabeln für "darüber", "darunter" sowie "davor" und "dahinter" lernen können. Verpacke die Vokabeln in eine kleine Geschichte.
Den erzeugten Text kopierst du nun in das Eingabefenster des Sprachsynthesizers von ElevenLabs und klickst auf die Schaltfläche Generate. Die Sprache des Textes wird unmittelbar erkannt. Nach Abschluss der Umwandlung wird die erzeugte Tondatei wiedergegeben.
Abbildung 3.15 Der Sprachsynthesizer erzeugt eine Audiodatei mit der Stimme einer Muttersprachlerin. Die Datei kann über die Download-Schaltfläche am rechten unteren Bildrand heruntergeladen werden.
123
3
KI in Bildung und Wissenschaft
Padlet zum Thema »KI für den Unterricht« Eine exzellente Sammlung von Quellen und Materialien zum Einsatz von KI-Tools im Unterricht hat Alicia Bankhofer auf http://r-wrk.de/48snd in Form eines Padlets – das ist eine Art digitale Pinwand – zusammengestellt.
Abbildung 3.16 Das Padlet von Alicia Bankhofer ist ein wahres Füllhorn an Informationen und Ideen, wie KI im Allgemeinen und ChatGPT im Besonderen im schulischen Umfeld eingesetzt werden kann.
3.4 Rechnen mit KI-Power Ich gehöre einer Generation an, in der der Taschenrechner schleichend Einzug in den Mathematikunterricht hielt. Ein einfaches Gerät, das die vier Grundrechenarten beherrschte, erschien uns damals wie eine Offenbarung, waren wir doch an Rechenschieber und Logarithmentafel gewöhnt. Unser konservativer Mathelehrer pflegte immer zu sagen: »Legt den Taschenrechner weg, den werdet ihr später beim Einkaufen und im Beruf auch nicht ständig dabeihaben.« Nun, die heutige Realität (Stichworte: Smartphone und Smartwatch) zeigt, dass er sich wohl getäuscht hat. Tatsächlich geht der Trend aber auch heute wieder in diese Richtung: Einige Bundesländer verbannen CAS- und GTR-
124
3.4
Rechnen mit KI-Power
Systeme bereits wieder aus den Prüfungen. Das soll uns im Folgenden aber nicht stören, vielmehr möchte ich aufzeigen, was in Verbindung mit Systemen künstlicher Intelligenz in der Mathematik inzwischen möglich ist und was nicht.
3.4.1 ChatGPT als besserer Taschenrechner Zunächst eine kleine Enttäuschung: ChatGPT ist in der Standardkonfiguration kein besonders guter Taschenrechnerersatz. Das hast du bereits am Beispiel zur Berechnung von dritten Wurzeln in Abschnitt 3.1.2, »Was tun bei Fehlern?«, erfahren. Mittlerweile gibt es aber Drittanbietertools, die sich den in diesem Abschnitt beschriebenen Weg zu eigen gemacht haben und relativ brauchbar als mathematisches Werkzeug eingesetzt werden können. Ein Beispiel ist MathGPT. Testen wir das Tool an unserem bekannten Beispiel, die dritte Wurzel aus 1024 zu bestimmen. Begib dich dazu auf die Seite https:// mathgpt.streamlit.app, gib deine Rechenaufgabe ein und betätige die Tastenkombination (ª) + (¢) – das Ergebnis ist korrekt. Möchtest du wissen, wie der Bot zur Lösung vorgegangen ist, dann klick einfach auf den kleinen Pfeil neben der Überschrift See code (siehe Abbildung 3.17).
Abbildung 3.17 MathGPT verbindet ChatGPT mit Python und löst eine Vielzahl mathematischer Aufgaben mit der Numpy-Bibliothek.
Generell lassen sich so beliebige mathematische Probleme über den Umweg Python mitsamt seiner großen Anzahl mathematischer Bibliotheken lösen. Möchtest du bei
125
3
KI in Bildung und Wissenschaft
Standardaufgaben auch den Lösungsweg mitgeliefert bekommen, dann ist aber oft ChatGPT das geeignetere Mittel: Berechne das bestimmte Integral der Funktion f(x) = sin(x) auf dem Intervall von 0 bis Pi. Um das bestimmte Integral der Funktion f(x) = sin(x) auf dem Intervall von 0 bis π zu berechnen, nutzen wir die Grundlagen der Integralrechnung. Das bestimmte Integral ist gegeben durch: ∫(sin(x) dx) von 0 bis π Die Stammfunktion (unbestimmtes Integral) von sin(x) ist -cos(x), also: -∫(sin(x) dx) = -cos(x) + C, wobei C eine Konstante ist. Um das bestimmte Integral zu berechnen, wenden wir die Grenzen des Integrals an: [-cos(x)] von 0 bis π Dann berechnen wir die Differenz: (-cos(π)) - (-cos(0)) Da cos(π) = -1 und cos(0) = 1, erhalten wir: (-(-1)) - (-(1)) = 1 + 1 = 2 Das bestimmte Integral der Funktion f(x) = sin(x) auf dem Intervall von 0 bis π ist 2.
Das ist vollkommen korrekt. Wer sich an der rustikalen Darstellung der Berechnung stört, der verwendet den Browser Chrome in Verbindung mit dem Plug-in TeX All the Things (http://r-wrk.de/yt5md). Zusätzlich zum obigen Prompt musst du ChatGPT anweisen, den Output im LaTeX-Format zur Verfügung zu stellen (siehe Abbildung 3.18).
Abbildung 3.18 Darstellung der Antwort im Browser Chrome mithilfe des Plug-ins TeX All the Things
126
3.4
Rechnen mit KI-Power
ChatGPT und Wolfram – das dynamische Duo für Profis Es ist eine mächtige Verbindung, die da zusammengewachsen ist: Mittlerweile gibt es für ChatGPT das Wolfram-Plug-in, das die beschriebenen mathematischen Limitierungen von ChatGPT aufhebt. Wolfram Alpha (www.wolframalpha.com) ist die wichtigste Anlaufstelle im Internet, wenn es um die Lösung komplexer mathematischer Fragen geht. Über den Plug-in-Store von ChatGPT kannst du Wolfram in ChatGPT integrieren und komplexe mathematische Probleme lösen. Mehr zu Plug-ins in ChatGPT erfährst du in Kapitel 8, »KI für Fortgeschrittene«.
Abbildung 3.19 Mithilfe des Wolfram-Plug-ins lassen sich innerhalb der ChatGPT-Oberfläche komplexe mathematische Probleme lösen.
3.4.2 ChatGPT als Aufgabenlöser und -erklärer Sehen wir uns nun einmal die Möglichkeiten von ChatGPT in einem anspruchsvollen mathematisch-physikalischen Umfeld an. Ziel ist es, eine Aufgabe aus einem physikalischen Lehrbuch zu lösen. Dazu übergeben wir den Aufgabentext nach einem Konditionierungs-Prompt:
127
3
KI in Bildung und Wissenschaft
Du bist Experte auf dem Gebiet der theoretischen Physik. Dir sind sämtliche Gleichungen aus dem Bereich der Energie- und Impulserhaltung bekannt. Ich werde dir nachfolgend eine Aufgabe zum Thema "Impulserhaltung" stellen. Löse die Aufgabe für mich, indem du mir auch die einzelnen Lösungsschritte erläuterst. Liefere mir deinen Output im LaTeX-Format. Sicher, ich werde mein Bestes tun, um dir bei der Aufgabe zum Thema Impulserhaltung zu helfen. Bitte gib mir die Aufgabe, damit ich sie lösen und dir die Lösungsschritte im LaTeX-Format erklären kann. Eine Billardkugel trifft mit der Geschwindigkeit von 1,3 m/s zentral und elastisch auf eine ruhende Billardkugel gleicher Masse. Mit welchen Geschwindigkeiten bewegen sich beide Kugeln nach dem Zusammenstoß?5
ChatGPT präsentiert die Musterlösung (siehe Abbildung 3.20): Um diese Aufgabe zu lösen, verwenden wir das Prinzip der Impulserhaltung und die Tatsache, dass der Stoß elastisch ist. Das bedeutet, dass sowohl der Impuls als auch die kinetische Energie vor und nach dem Stoß erhalten bleiben. [...] Das bedeutet, dass nach dem zentralen elastischen Zusammenstoß die erste Kugel mit einer Geschwindigkeit von u_1 = 1.3 m/s ruht und die zweite Kugel sich nun mit der Geschwindigkeit u_2 = 1.3 m/s bewegt. In diesem speziellen Fall hat die erste Kugel ihren gesamten Impuls auf die zweite Kugel übertragen, sodass die erste Kugel zum Stillstand kommt und die zweite Kugel sich mit der gleichen Geschwindigkeit wie die erste Kugel vor dem Zusammenstoß bewegt.
Abbildung 3.20 Auszug des Lösungsweges, hübsch dargestellt im Chrome-Browser mit LaTeX-Plug-in 5 Anmerkung: Diese Aufgabe lässt sich mit etwas gesundem Menschenverstand und Erfahrung auch komplett ohne Verwendung von Formeln lösen.
128
3.4
Rechnen mit KI-Power
Es sollte an dieser Stelle erwähnt werden, dass ChatGPT nicht immer richtig rechnet. Bei einigen Tests durfte ich erfahren, dass es stets wichtig ist, die Rechnungen zu prüfen. Dabei hat der Bot weniger mit der korrekten Auswahl von Formeln Schwierigkeiten, als vielmehr mit den numerischen Daten oder Äquivalenzumformungen, die an einigen Stellen nicht stimmen. Gerade im Umgang mit KI gilt der alte Lenin-Spruch: »Vertrauen ist gut, Kontrolle ist besser.«
Wie man komplexe Prompts optimal übergibt Sicher hast du mittlerweile bemerkt, dass die Erstellung eines ausgeklügelten Prompts eine wahre Kunst ist. Solltest du das Prompt Engineering direkt auf der ChatGPT-Oberfläche vornehmen, so gibt es einige Kniffe bei der Formatierung. Beispielsweise kann man den Prompt in Zeilen und Abschnitte gliedern. Einen Zeilenvorschub im BrowserInterface von ChatGPT erzeugst du über die Tastenkombination (ª) + (¢). Praktischer ist es allerdings, den Prompt in einem beliebigen Texteditor zu schreiben und ihn per Copy-and-paste auf die ChatGPT-Oberfläche zu übertragen. Den Text im Texteditor kannst du zudem für spätere Anwendungen abspeichern.
3.4.3 ChatGPT als Mathematikerklärer Das geballte Wissen von mehreren tausend Jahren Mathematik – und das nicht nur als Faktensammlung, sondern als geduldiger Erklärer, dessen Niveau angepasst werden kann – das bietet ChatGPT. Dazu zwei Beispiele: Du möchtest dir noch einmal den Satz des Pythagoras6 in Erinnerung rufen und diesen an einem praktischen Beispiel erklärt bekommen? Dann verwende folgenden Prompt: Du bist ein Mathematiklehrer, der sehr anschaulich erklären kann. Nenne und erkläre den Satz des Pythagoras so, dass ihn auch ein Fünftklässler versteht. Natürlich! Der Satz des Pythagoras ist eine sehr wichtige Regel in der Mathematik, die uns hilft, die Längen der Seiten in einem rechtwinkligen Dreieck zu berechnen. Ein rechtwinkliges Dreieck ist ein Dreieck, das einen Winkel von 90 Grad hat, der wie eine Ecke eines Quadrats oder Rechtecks aussieht. Stell dir vor, dass dein rechtwinkliges Dreieck wie ein großes Stück Käse aussieht, das du auf einer Pizza finden würdest. Es hat drei Seiten: die längste Seite, die wir Hypotenuse nennen, und zwei kürzere Seiten, die wir Katheten nennen. 6 Man beachte, dass der Satz des Pythagoras gewöhnlich erst in den 9. Klassen unserer Schulen unterrichtet wird. Umso erstaunlicher ist es, dass es ChatGPT vermag, dieses anspruchsvolle Thema auf ein einfaches Niveau herunterzubrechen.
129
3
KI in Bildung und Wissenschaft
Der Satz des Pythagoras besagt, dass wenn du die Länge jeder der beiden kürzeren Seiten quadrierst (also die Länge mit sich selbst multiplizierst) und die beiden Ergebnisse addierst, dann bekommst du genau das Quadrat der Länge der längsten Seite (der Hypotenuse). In einer mathematischen Formel sieht das so aus: (Hypotenuse)² = (Kathete 1)² + (Kathete 2)² Das bedeutet zum Beispiel, wenn die Länge der ersten kürzeren Seite 3 und die Länge der zweiten kürzeren Seite 4 ist, dann wäre die Länge der längsten Seite (Hypotenuse) 5, weil: 5² = 3² + 4² (25 = 9 + 16) Der Satz des Pythagoras hilft uns also, die Längen der Seiten in rechtwinkligen Dreiecken zu finden, und ist ein sehr nützliches Werkzeug in der Mathematik!
Nun, das klingt einleuchtend. Gerne würdest du dir dazu aber eine Zeichnung anschauen. Mal sehen, was ChatGPT dazu sagt: Kannst du mir dazu eine Zeichnung machen, damit ich den Sachverhalt besser verstehe? Leider kann ich als Text-basierter KI-Chatbot keine Zeichnungen erstellen, aber ich kann dir helfen, dir eine Zeichnung in deinem Kopf vorzustellen oder es selbst zu zeichnen. Befolge einfach diese Schritte: 1. Zeichne ein rechtwinkliges Dreieck auf ein Blatt Papier. Denke daran, dass ein rechtwinkliges Dreieck einen 90-Grad-Winkel hat. 2. Beschrifte die beiden kürzeren Seiten, die den rechten Winkel bilden, als "a" und "b". Diese beiden Seiten werden als Katheten bezeichnet. 3. Beschrifte die längste Seite, die gegenüber dem rechten Winkel liegt, als "c". Diese Seite wird als Hypotenuse bezeichnet. 4. Schreibe die Formel des Satzes des Pythagoras neben dein Dreieck: a² + b² = c². In deiner Zeichnung sollte das Dreieck mit seinen Seitenbeschriftungen (a, b und c) und der Formel des Satzes des Pythagoras nun klarer sein. Um den Zusammenhang zwischen den Seitenlängen zu verdeutlichen, kannst du ein Beispiel verwenden, wie das, das ich in meiner vorherigen Antwort gegeben habe, bei dem a = 3, b = 4 und c = 5 ist. In diesem Fall würde die Formel wie folgt aussehen: 3² + 4² = 5².
So schnell geben wir uns aber nicht geschlagen! Der nächste Befehl lautet nun: Kannst du mir Python-Code generieren, der die von dir beschriebene Zeichnung mithilfe einer Grafikbibliothek anfertigt? Sicher! Du kannst die Python-Bibliothek matplotlib verwenden, um eine Zeichnung des rechtwinkligen Dreiecks zu erstellen. Hier ist ein Beispielcode, der das tut:
130
3.4
Rechnen mit KI-Power
import matplotlib.pyplot as plt import numpy as np # A B C
Definiere die Eckpunkte des rechtwinkligen Dreiecks = (0, 0) = (3, 0) = (0, 4)
# Zeichne die Seiten des Dreiecks plt.plot([A[0], B[0]], [A[1], B[1]], 'b', label='a = 3') plt.plot([A[0], C[0]], [A[1], C[1]], 'r', label='b = 4') plt.plot([B[0], C[0]], [B[1], C[1]], 'g', label='c = 5') [...] Nachdem du die Bibliothek installiert hast, kopiere einfach den Beispielcode in eine Python-Datei (z. B. dreieck.py) und führe die Datei aus, um die Zeichnung anzuzeigen.
Das Ergebnis kann nach dem Kopieren des Codes in jeder beliebigen Python-Programmierumgebung bewundert werden (siehe Abbildung 3.21).
Abbildung 3.21 Die fehlenden grafischen Möglichkeiten von ChatGPT können durch Umsetzung in Python-Code ausgeglichen werden.
Pimp my ChatGPT mit dem Code Interpreter7 Es gibt viele Möglichkeiten, fehlende Fertigkeiten von ChatGPT nachzurüsten (im vorliegenden Fall den Mangel, Grafiken zu erzeugen). Eine davon ist der oben beschriebene 7 Der Code Interpreter heißt mittlerweile Advanced Data Analysis und ist Bestandteil des kostenpflichtigen Abonnements von ChatGPT.
131
3
KI in Bildung und Wissenschaft
Weg über Python-Code, der andere Weg führt über Plug-ins, wie z. B. Wolfram, siehe Kasten »ChatGPT und Wolfram – das dynamische Duo für Profis« in Abschnitt 3.4.1. Mittlerweile kann ChatGPT aber auch unter Zuhilfenahme der Funktion Code Interpreter (siehe Kapitel 8, »KI für Fortgeschrittene«) eigenen Python-Code zu einem Problem generieren und direkt ausführen: Zeichne ein rechtwinkliges Dreieck mit einer Hypotenuse von 5 cm und einer Kathete von 4 cm. Wie lang ist die andere Kathete?
Abbildung 3.22 Die Code-Interpreter-Erweiterung in ChatGPT kann mathematische Sachverhalte innerhalb der ChatGPT-Umgebung darstellen. Dies geschieht, wie oben beschrieben, mithilfe von Python-Code.
132
3.5
Die KI-Akademie
3.5 Die KI-Akademie Auch Universitäten bleiben von dem Umbruch, den die breite Verfügbarkeit künstlicher Intelligenz bewirkt, nicht verschont. Im akademischen Umfeld findet man zwei Extrempositionen: Da gibt es diejenigen, die die neuen Werkzeuge verbannen wollen, und diejenigen, die in der KI den alleinigen Heilsbringer sehen. Generell sollte man aber auch hier vom Schwarz-WeißDenken Abstand nehmen und die Grautöne betrachten. Das hat der Präsident der Frankfurter Goethe-Universität getan und sieht in ChatGPT keine Bedrohung, sondern eher eine Chance für den wissenschaftlichen Betrieb (siehe http:// r-wrk.de/1gn1b). Er plädiert dafür, neue Lehr- und Prüfungsformate zu entwickeln, um den individuellen Leistungsstand zu bewerten – sicher ein guter Ansatz für Studierende und Lehrende. Ferner sei es legitim, wenn ChatGPT & Co. dem wissenschaftlichen Nachwuchs unter die Arme greifen. Wie das genau aussehen kann, zeigen die folgenden Abschnitte.
3.5.1 Der KI-Literaturassistent In der sogenannten guten alten Zeit sah die Literaturrecherche in der Wissenschaft so aus: Man ging in die Universitätsbibliothek und suchte zunächst mit speziellen Lesegeräten auf winzigen Filmchen, sogenannten Mikrofiches, nach katalogisierten Literaturhinweisen. Wenn es sich um exotische Literatur handelte, musste sie per Fernleihe beschafft werden, was bis zu 1 Woche dauern konnte. 1989 schließlich erfand Tim BernersLee den HTML-Standard als Grundlage des World Wide Web, und wissenschaftliche Artikel samt Literaturangaben waren nur noch einen Mausklick entfernt. Zwei Probleme bleiben: 1. Damit du dich in ein Spezialgebiet einarbeiten kannst, musst du dir zunächst selbst passende Literaturlisten erarbeiten. 2. Lesen musst du die Artikel weiterhin selbst. Beide genannten Punkte lassen sich heute mit KI-Unterstützung einfach erledigen. Beginnen wir mit Literaturlisten zu Spezialthemen. Angenommen, du möchtest dich ausführlich mit dem Turing-Test beschäftigen und mehr Hintergründe dazu erfahren. Dabei hilft dir folgender Prompt:
133
3
KI in Bildung und Wissenschaft
Du bist Informatiker und sollst mir bei der Recherche zu Standardthemen in der Informatik helfen. Ich gebe dir ein Stichwort, und du nennst mir bitte eine Liste von 5 Artikeln, welche als Grundlage zur Einarbeitung in die Thematik verwendet werden können. Bestätige meine Anweisung, und ich werde dir ein Thema nennen. Ich habe Ihre Anweisung verstanden und bin bereit, Ihnen bei der Recherche zu Standardthemen in der Informatik zu helfen. Bitte nennen Sie mir das Thema, und ich werde Ihnen eine Liste von 5 Artikeln als Grundlage zur Einarbeitung in die Thematik vorschlagen. Der Turing-Test Hier ist eine Liste von 5 Artikeln, die Ihnen bei der Einarbeitung in den Turing-Test helfen können: 1. Turing, A. M. (1950). Computing Machinery and Intelligence. Mind, 59(236), 433-460. URL: https://academic.oup.com/mind/article/LIX/236/433/986238 2. French, R. M. (1990). Subcognition and the Limits of the Turing Test. Mind, 99(393), 53-65. URL: https://www.jstor.org/stable/2255167 3. Moor, J. H. (2001). The Status and Future of the Turing Test. Minds and Machines, 11(1), 77-93. URL: https://link.springer.com/article/10.1023/A:1011209317682 4. Floridi, L., Taddeo, M., & Turilli, M. (2009). Turing's Imitation Game: Still an Impossible Challenge for All Machines and Some Judges. Minds and Machines, 19(1), 145-166. URL: https://link.springer.com/article/10.1007/s11023-008-9112-4 5. Shieber, S. M. (2004). The Turing Test as Interactive Proof. Noûs, 38, 574-605. URL: https://onlinelibrary.wiley.com/doi/abs/10.1111/j.0029-4624.2004.00482.x Diese Artikel bieten Ihnen eine solide Grundlage, um das Konzept des TuringTests, seine Geschichte, Bedeutung und Kritikpunkte zu verstehen.
Dazu eine wichtige Anmerkung: Es ist bekannt, dass ChatGPT dazu neigt, sich Quellen oder Autoren schlichtweg auszudenken, sprich herbeizuhalluzinieren. Es ist somit wichtig, die angegebenen Quellen kritisch zu prüfen. Freundlicherweise helfen dir die anklickbaren Links dabei. Beachte, dass sich hinter einigen Links (insbesondere den aktuelleren) meist kostenpflichtige Angebote verstecken. Nun lösen wir das zweite Problem und lassen ChatGPT den Artikel für uns lesen und zusammenfassen. Auf diese Art erfahren wir, ob der Inhalt für uns prinzipiell von Interesse sein könnte, sodass wir in diesem Fall tiefer in ihn einsteigen können.
134
3.5
Die KI-Akademie
Abbildung 3.23 Der erste der angegebenen Links führt zu Alan Turings Originalpaper. Fasse mir bitte die Inhalte des ersten Literaturverweises in einfacher, verständlicher Form zusammen (maximal 200 Wörter). Der Artikel "Computing Machinery and Intelligence" von Alan M. Turing, veröffentlicht im Jahr 1950, ist ein bahnbrechendes Werk, in dem Turing die Frage "Können Maschinen denken?" untersucht. Anstatt diese Frage direkt zu beantworten, schlägt Turing einen Test vor, den sogenannten Turing-Test, um festzustellen, ob eine Maschine menschenähnliche Intelligenz aufweist. Der Turing-Test besteht aus einem Imitationsspiel, bei dem ein menschlicher Fragesteller versucht, herauszufinden, welcher von zwei verborgenen Teilnehmern der Mensch und welcher die Maschine ist. Der Fragesteller kommuniziert mit beiden Teilnehmern über Textnachrichten. Wenn der Fragesteller nicht in der Lage ist, den Unterschied zwischen den Antworten des Menschen und der Maschine zu erkennen, gilt die Maschine als bestanden. Turing diskutiert auch mögliche Einwände gegen seine Idee, wie das Argument, dass Maschinen nicht wirklich denken können, weil sie nur das tun, wofür sie programmiert wurden. Um diese Bedenken zu zerstreuen, schlägt er das Konzept der "Universalmaschine" vor, die in der Lage ist, jede mögliche Berechnung durchzuführen und somit potenziell menschenähnliche Intelligenz erreichen könnte. Insgesamt legt Turings Artikel den Grundstein für die künstliche Intelligenz und prägt das Feld bis heute.
135
3
KI in Bildung und Wissenschaft
Wie praktisch! Die Inhalte des englischen Originalartikels werden sogar in die deutsche Sprache übersetzt. Bei derartigen Zusammenfassungen ist allerdings ebenfalls Vorsicht geboten: Es kann vorkommen, dass der KI-Bot die Zusammenfassung seinem antrainierten Datenfundus entnimmt und sich wenig oder kaum auf den Originalartikel bezieht. Um dies zu verhindern, übergibst du am besten den Originaltext per Copy-andpaste in das Prompt-Feld und lässt ihn dann zusammenfassen, siehe Abschnitt 3.2.1, »Literarische Zusammenfassungen und Analysen«. Auf die beschriebene Weise nutzt du ChatGPT als Speedreading-Tool.
KI-Hilfsmittel für die wissenschaftliche Recherche Wer aktuellere Artikel bzw. Inhalte recherchieren möchte, sollte statt ChatGPT zu Semantic Scholar greifen. Der gemeinnützige Dienst wird vom Allen Institute for AI betrieben. Du findest den Einstieg über https://semanticscholar.org/me/research. Einen Überblick von KI-Tools zur Literaturrecherche findest du unter http://r-wrk.de/c0saq. Einige Plug-ins zur wissenschaftlichen Recherche haben mittlerweile Eingang in ChatGPT gefunden, so z. B. Scholar AI.
Abbildung 3.24 Via Semantic Scholar stehen dir über 200 Millionen Originalpaper zur Recherche zur Verfügung.
136
3.5
Die KI-Akademie
3.5.2 Der wissenschaftliche Schreibassistent Sehen wir uns an, wie ChatGPT beim Verfassen wissenschaftlicher Arbeiten helfen kann. Die Devise lautet: Vom großen Ganzen über eine sinnvolle Gliederung zum Detail. Aber lassen wir ChatGPT zu Wort kommen: Ich soll einen wissenschaftlichen Aufsatz zum Thema "Anwendung neuronaler Netze bei der Bilderkennung" verfassen. Wie würdest du an meiner Stelle vorgehen? Um einen wissenschaftlichen Aufsatz zum Thema "Anwendung neuronaler Netze bei der Bilderkennung" zu verfassen, würde ich folgende Schritte empfehlen: 1. Literaturrecherche: Beginne mit einer umfassenden Recherche, um dich mit den wichtigsten Arbeiten, Methoden und Entwicklungen im Bereich neuronaler Netze und Bilderkennung vertraut zu machen. Dabei kannst du wissenschaftliche Datenbanken wie Google Scholar, IEEE Xplore und ResearchGate nutzen. 2. Struktur und Gliederung: Erstelle eine Gliederung für deinen Aufsatz, die eine klare Struktur und den logischen Aufbau deiner Argumentation verdeutlicht. Eine typische Gliederung könnte folgendermaßen aussehen: a. Einleitung b. Grundlagen i. Neuronale Netze ii. Bilderkennung c. Methoden der Bilderkennung mit neuronalen Netzen i. Convolutional Neural Networks (CNNs) ii. Recurrent Neural Networks (RNNs) iii. Generative Adversarial Networks (GANs) iv. Transfer Learning d. Anwendungsbeispiele e. Herausforderungen und Limitationen f. Zukünftige Trends und Entwicklungen g. Fazit 3. Einleitung: Beginne mit einer Einleitung, die die Motivation und das Ziel deines Aufsatzes beschreibt. Erkläre, warum neuronale Netze in der Bilderkennung wichtig sind und welche Fragestellungen du in deinem Aufsatz beantworten möchtest. [...] 9. Fazit: Fasse deine Erkenntnisse zusammen und ziehe ein abschließendes Fazit. Beschreibe die Bedeutung von neuronalen Netzen in der Bilderkennung und betone ihre Potenziale und Herausforderungen.
137
3
KI in Bildung und Wissenschaft
10. Literaturverzeichnis: Erstelle ein vollständiges Literaturverzeichnis mit allen verwendeten Quellen, um die wissenschaftliche Integrität deines Aufsatzes zu gewährleisten. Verwende dabei einen einheitlichen Zitationsstil (z. B. APA, MLA oder Chicago) und achte darauf, alle Quellen korrekt zu zitieren. 11. Überarbeitung und Korrekturlesen: Lies deinen Aufsatz mehrmals durch und überarbeite ihn, um mögliche inhaltliche oder strukturelle Schwächen zu identifizieren und zu beheben. Achte dabei auch auf eine klare und verständliche Sprache, korrekte Grammatik und Zeichensetzung. Du könntest auch Feedback von Kollegen oder Betreuern einholen, um deinen Aufsatz weiter zu verbessern. 12. Formatierung: Stelle sicher, dass dein Aufsatz den formattechnischen Anforderungen deiner Institution oder der Zeitschrift, bei der du den Aufsatz einreichen möchtest, entspricht. Achte auf Schriftart und -größe, Zeilenabstand, Seitenränder und eventuell vorgegebene Formatvorlagen. 13. Einreichung: Nachdem du deinen Aufsatz überarbeitet und formatiert hast, kannst du ihn bei einer wissenschaftlichen Zeitschrift oder Konferenz einreichen, oder ihn als Teil einer Abschlussarbeit oder Projektarbeit verwenden. Durch das Befolgen dieser Schritte kannst du einen gut strukturierten, fundierten und aussagekräftigen wissenschaftlichen Aufsatz zum Thema "Anwendung neuronaler Netze bei der Bilderkennung" verfassen.
Es ist nicht empfehlenswert, den Chatbot die Unterpunkte deiner Gliederung vollständig ausformulieren zu lassen. Vielmehr solltest du selbst recherchieren, insbesondere wenn es sich um aktuelle Forschungsthemen handelt. Die KI fungiert hier also nur als Ideengeber, nicht als ausführendes Werkzeug. Was du aber tun kannst, ist ChatGPT Stichworte zu den recherchierten Themen zu geben und diese dann in wissenschaftlicher Sprache zusammenfassen zu lassen. Nachdem du deinen Artikel fertiggestellt hast, ist es in jedem Fall empfehlenswert, ihn von einer Rechtschreib-KI wie DeepL Write gegenchecken zu lassen. Diese KI verarbeitet Dokumente in den Formaten DOCX, PPTX und PDF per Drag & Drop. Dabei bleibt es dir überlassen, ob du den Artikel direkt auf Englisch verfasst oder zunächst auf Deutsch formulierst und das Ergebnis dann durch den DeepL-Übersetzer jagst, der auch die Standarddokumentformate beherrscht – je nachdem, wie fit du bereits in der wissenschaftlichen Publikationssprache bist.
138
3.5
Die KI-Akademie
Abbildung 3.25 Übersetzung des aktuellen Kapitels auf Englisch durch DeepL. Bei der Übersetzung werden sogar die Makros der Verlagsformatvorlage 1 : 1 übernommen.
3.5.3 Der KI-Prüfungs- und Klausurassistent Das Schreckgespenst vieler Studierenden sind Klausuren und/oder mündliche Prüfungen. Nach einem Bericht aus dem Gamestar-Magazin (http://r-wrk.de/0kkbk)8 ist auch dieser Tiger dank ChatGPT zahnlos geworden. Ein Student hatte dem Bericht zufolge die prüfungsrelevante Vorlesung 3 Tage vor seiner Abschlussprüfung in Textform umgewandelt, per paraphraser.io auf das Notwendigste gekürzt und anschließend an
8 Den Originalartikel des Studenten findest du auf Reddit: http://r-wrk.de/ksfz6
139
3
KI in Bildung und Wissenschaft
ChatGPT verfüttert. Der folgende Prompt hat ihm schließlich eine überaus erfolgreiche Prüfung beschert: Analysiere diese Vorlesung und entscheide mithilfe deiner Algorithmen, welche Informationen prüfungsrelevant sind. Erstelle eine Liste.
Der entscheidende Schachzug war in diesem Fall das Eindampfen der einzelnen Vorlesungen durch das Paraphraser-Tool. In einem Folgeartikel auf Reddit (http://r-wrk.de/ s18w7) gibt der erfolgreiche Student noch einen weiteren Prompt zur Vorbereitung einer Matheprüfung an: ChatGPT, dein Job ist es: - Das Transkript (oder das Lehrbuch) zu analysieren und mir zu sagen worum es geht - Jede relevante Formel aufzulisten - Jede Formel mit einer eingehenden Analyse zu erklären - Jede Formel basierend auf der Häufigkeit, mit der sie erwähnt wurde aufzulisten und zu sortieren [Transkript posten]
Wer hingegen plant, die Prüfung »by fair means« mit der Old-School-Technik namens »Lernen« zu bestehen, findet in ChatGPT einen wunderbaren Sparringspartner für Prüfungssimulationen und Examenstraining: Du bist Professor für theoretische Physik und simulierst mit mir eine mündliche Prüfung auf dem Gebiet der Elektrodynamik. Wir haben uns im Vorgespräch auf das Themengebiet "Maxwellgleichungen" und "spezielle Relativitätstheorie" geeinigt. Du stellst mir nun einige Fragen aus den genannten Gebieten und gibst mir nach meiner Antwort gleich ein Feedback, ob die Antwort richtig oder falsch war. Bestätige meine Anweisung und stelle mir die erste Frage. Bestätigung: Ich werde nun einige Fragen aus den Gebieten der Maxwellgleichungen und der speziellen Relativitätstheorie stellen und dir Feedback zu deinen Antworten geben. Erste Frage: Nenne die vier Maxwellgleichungen und erkläre kurz, welche physikalischen Phänomene sie beschreiben. 1. Gaußsches Gesetz für elektrische Felder: Eine elektrische Ladung ist Quelle eines elektrischen Feldes. 2. Gaußsches Gesetz für magnetische Felder: Es gibt keine magnetischen Monopole. 3. Induktionsgesetz: Änderungen der magnetischen Flussdichte führen zu einem magnetischen Wirbelfeld. 4. Ohmsches Gesetz: U = R * I.
140
3.5
Die KI-Akademie
Deine Antwort ist teilweise korrekt. Die ersten drei Gleichungen, die du genannt hast, sind tatsächlich Maxwellgleichungen, aber die vierte ist nicht korrekt. Lassen Sie mich die vier Maxwellgleichungen auflisten und ihre Bedeutungen kurz erläutern: 1. Gaußsches Gesetz für elektrische Felder (elektrische Flussdichte): ∇ • E = ρ/ε0. Dieses Gesetz besagt, dass die Quelle eines elektrischen Feldes die elektrische Ladung ist. [...] 4. Ampèresches Gesetz mit Maxwells Erweiterung: ∇ × B = μ0(J + ε0∂E/∂t). Dieses Gesetz verbindet den magnetischen Wirbel und den elektrischen Strom, wobei die Erweiterung von Maxwell die zeitabhängige Änderung des elektrischen Feldes berücksichtigt. Die vierte Gleichung, die du genannt hast, ist das Ohmsche Gesetz, das den Zusammenhang zwischen Spannung, Strom und Widerstand in elektrischen Schaltungen beschreibt. Es gehört jedoch nicht zu den Maxwellgleichungen. Nun zur nächsten Frage: Was ist die Lorentz-Transformation und welche Bedeutung hat sie in der speziellen Relativitätstheorie? [...]
Lass dich nicht davon irritieren, dass die KI oft willkürlich zwischen Du und Sie wechselt – die obige Antwort ist völlig korrekt. Wenn es dich motiviert, kannst du dich nach der Prüfung auch direkt vom KI-Prof bewerten lassen. Auf die gleiche Weise kannst du dir auch Übungsaufgaben für eine Klausur erstellen lassen: Erstelle mir eine Klausurtrainingsaufgabe für das Fach Strafrecht im Rahmen meines Jurastudiums. Aufgabe 1: Fallstudie zum Strafrecht Sachverhalt: Anna (A) und Berta (B) sind seit langem zerstrittene Schwestern. Eines Tages, als A allein zu Hause ist, entscheidet sie sich, Bs Haus zu betreten, um dort einen wertvollen Ring zu stehlen, von dem sie weiß, dass B ihn von ihrer Großmutter geerbt hat. A betritt das Haus durch ein offenes Fenster, ohne Beschädigungen zu verursachen. Im Haus findet A den Ring und steckt ihn ein. Auf dem Weg nach draußen trifft sie auf C, den 15-jährigen Sohn von B. C erkennt sofort, was A getan hat, und bedroht sie mit einem Messer, um den Ring zurückzubekommen. A gibt den Ring zurück und verlässt das Haus. Später zeigt B A bei der Polizei an. Aufgaben: 1. Prüfen Sie, ob A sich wegen Diebstahls gemäß § 242 StGB strafbar gemacht hat. Gehen Sie dabei auf alle Tatbestandsmerkmale ein und erörtern Sie insbesondere, ob ein vollendeter oder versuchter Diebstahl vorliegt.
141
3
KI in Bildung und Wissenschaft
2. Prüfen Sie, ob A sich wegen Hausfriedensbruchs gemäß § 123 StGB strafbar gemacht hat. Gehen Sie dabei auf alle Tatbestandsmerkmale ein. 3. Beurteilen Sie, ob C sich wegen einer Straftat, insbesondere wegen Bedrohung gemäß § 241 StGB, strafbar gemacht hat. 4. Angenommen, A hätte sich geweigert, den Ring zurückzugeben, und C hätte sie daraufhin mit dem Messer verletzt: Prüfen Sie, ob C sich wegen gefährlicher Körperverletzung gemäß § 224 StGB oder wegen einer anderen Straftat strafbar gemacht hätte. 5. Prüfen Sie, ob A im Fall einer Verurteilung wegen Diebstahls gemäß § 242 StGB und Hausfriedensbruchs gemäß § 123 StGB wegen Tateinheit (§ 52 StGB) oder Tatmehrheit (§ 53 StGB) zu bestrafen wäre.
ChatGPT liefert auch die Lösung, falls du nicht weiter weißt: Zeige mir die Lösung des Falls! Lösung: 1. Diebstahl gemäß § 242 StGB A könnte sich wegen Diebstahls gemäß § 242 StGB strafbar gemacht haben. a) Objektiver Tatbestand A hat eine fremde bewegliche Sache (den Ring) an sich genommen. Die Sache ist fremd, weil sie im Eigentum von B steht. Die Wegnahme ist durch das Bringen in den Gewahrsam von A gegeben. b) Subjektiver Tatbestand A handelte mit Zueignungsabsicht, da sie den Ring an sich nehmen und damit als ihr eigen behandeln wollte. Sie handelte auch in dem Bewusstsein, dass es sich um eine fremde Sache handelt. [...]
Natürlich muss man die Lösung immer kritisch hinterfragen. Aber insgesamt sind die Antworten von ChatGPT in den Bereichen Recht, Politik und Wirtschaft von ausgezeichneter Qualität.
KI in der Hochschullehre Eine schöne Übersicht zum Einsatz von KI-Tools im Hochschulbereich findest du auf folgender Übersichtsseite der Leuphana Uni Lüneburg: http://r-wrk.de/maf4x Die folgende Studie zeigt, dass ChatBots Studierende im Bereich des analogen Denkens übertreffen können: http://r-wrk.de/x64rz
142
4
Kunst mit KI
Kapitel 4 Kunst mit KI Diese Frage haben sich schon viele Generationen gestellt: Was ist Kunst? Benötige ich zum Erschaffen einmaliger, unverwechselbarer Werke den menschlichen künstlerischen Funken, oder sind mittlerweile auch Maschinen in der Lage, faszinierende Unikate zu erschaffen? Dieses Kapitel versucht, darauf Antworten zu geben.
Abbildung 4.1 Stein des Anstoßes: Dieses KI-generierte Bild gewann den Sony World Photo Award 2023. (Quelle: http://r-wrk.de/ptpkx)
Die Fotoszene zeigte sich »not amused«, als im Jahr 2023 ein Foto, das nachweislich von einer KI erzeugt wurde, den renommierten Fotowettbewerb Sonys World Photo Award
143
4
Kunst mit KI
gewann (siehe http://r-wrk.de/1j47b), zu sehen in Abbildung 4.1. Das Bild hatte der Berliner Fotograf Boris Eldagsen nicht mit einer Kamera, sondern mit dem KI-Bot DALL-E 21 generiert. Fairerweise lehnte er den Hauptpreis des Wettbewerbs – eine hochpreisige Kameraausrüstung – ab. Für seine Tätigkeit schuf er das Schlagwort Promptografie. An die Stelle der physikalischen Kamera tritt zur Bilderzeugung der metaphysikalische Prompt, der an eine KI übergeben wird. Wie du siehst, werden also auch im vorliegenden Kapitel Prompts eine wichtige Rolle spielen. Du wirst sehen: Der kreative Umgang mit bildgenerierenden KI-Systemen macht sehr viel Spaß!
Achtung Suchtgefahr! So abwegig ist diese Warnung nicht: Hast du erst einmal begriffen, welche tollen Möglichkeiten in bildgenerativen KIs stecken, dann wirst du sehen, dass man davon im Extremfall auch süchtig werden kann! Leg also von Zeit zu Zeit eine Pause ein.
4.1 Bilder mit KI erstellen Vom Prompt zum Bild – dazu braucht es kein besonderes handwerkliches Geschick. Was auf jeden Fall nicht schaden kann, ist eine gehörige Portion Fantasie. Im folgenden Abschnitt stelle ich dir zunächst einfache Werkzeuge der bildgenerierenden KI vor, für die du noch keine hochspezialisierten Prompts benötigst, um ansehnliche Ergebnisse zu erzeugen. Anschließend werfen wir einen Blick auf das Werkzeug der Meister und Meisterinnen: Midjourney.
Wer besitzt das Urheberrecht an KI-Bildern? Bildgenerierende KIs wie DALL-E oder Midjourney greifen auf einen riesigen Pool von Trainingsbildern zurück. Es ist nicht nachvollziehbar, welche Fragmente des Trainingsmaterials in das Endprodukt einfließen. Daher stellt sich in diesem Fall auch nicht die Frage des Urheberrechts, d. h. KI-generierte Bilder sind gemeinfrei. Etwas schwieriger wird es, wenn man die Prompts betrachtet, mit deren Hilfe das Bildmaterial generiert wurde. Hier könnte es theoretisch passieren, dass sich Prompting-Engineers ihre eigene Arbeit schützen lassen. Einen interessanten Artikel zum Thema Urheberrecht bei KIMaterial findest du hier: http://r-wrk.de/6cjey
1 DALL-E 2 wird wie ChatGPT von der Firma OpenAI entwickelt.
144
4.1
Bilder mit KI erstellen
4.1.1 Einstieg in die bildgenerative KI Zunächst nähern wir uns dem Thema spielerisch mithilfe von ChatGPT. Wirklich ChatGPT, fragst du dich? Der Bot kann doch Antworten und Ergebnisse lediglich in Textform wiedergeben! Des Rätsels Lösung heißt ASCII-Art. Beginnen wir mit dem folgenden Prompt: Zeichne mir ein ASCII-Art Bild von einem Baum!
Das Ergebnis ist keinesfalls schlecht (siehe Abbildung 4.2).
Abbildung 4.2 ChatGPT beherrscht ASCII-Art ...
Zugegeben: Komplexe Dinge kannst du auf diese Weise nicht darstellen. Eine weitere Option, die ChatGPT in grafischer Hinsicht bietet, ist das Ausschmücken eines Textes mit Emojis. Das zeigt folgender Prompt (siehe Abbildung 4.3): Schreibe mir eine kurze Geschichte über einen Tag, den ich im Sommer im Freibad verbringe, und schmücke die Geschichte mit Emojis. Sie sollte 150 Wörter nicht übersteigen.
Abbildung 4.3 ... und Emojis!
145
4
Kunst mit KI
Mit kleinen Tricks lässt sich ChatGPT sogar überreden, den Zeichenstift für kleinere Skizzen in die Hand zu nehmen – über den Umweg einer Python-Bibliothek (siehe Abschnitt 3.4.3, »ChatGPT als Mathematikerklärer«): Zeichne mithilfe einer geeigneten Python-Grafikbibliothek ein gleichseitiges blaues Dreieck und einen roten Kreis, der durch alle drei Eckpunkte des Dreiecks geht (= Umkreis).
Kopiert man den Code, den ChatGPT dazu generiert, dann sieht das Resultat überzeugend aus, wie Abbildung 4.4 zeigt.
Abbildung 4.4 Der erste Versuch sieht schon recht brauchbar aus. Doch die Position des Dreiecks könnte durch Feinjustierung des Prompts noch verbessert werden.
Es versteht sich von selbst, dass eine textgenerative KI mit komplexeren Aufgaben im Stile von »Zeichne mir ein Einhorn mit rosa Fell auf einer grünen Wiese mit einem Regenbogen im Hintergrund« überfordert ist. Wechseln wir also zunächst zu einer einfachen und kostenlosen bildgenerativen KI, wie z. B. Craiyon auf www.craiyon.com und probieren es gleich einmal mit dem oben genannten Prompt (siehe Abbildung 4.5): Ein Einhorn mit rosa Fell auf einer grünen Wiese. Im Hintergrund sieht man einen Regenbogen.
Bevor das Bild erzeugt wird, kannst du wählen, ob eine künstlerische Zeichnung (Art), eine Skizze (Drawing), eine fotorealistische Darstellung (Photo) oder eine neutrale Einstellung (None) erzeugt werden soll. Es werden immer mehrere Bilder erzeugt. Wenn dir ein Bild gefällt, kannst du es anklicken, gegebenenfalls über die Schaltfläche Upscale vergrößern und herunterladen.
146
4.1
Bilder mit KI erstellen
Abbildung 4.5 Bereits eine einfache bildgenerative KI wie Craiyon produziert ansprechende Ergebnisse. Oben wurde der Art-Modus ausgewählt, unten der Photo-Modus.
147
4
Kunst mit KI
Schauen wir uns nun an, wie die kostenpflichtige Konkurrenz mit derselben Aufgabe umgeht. Wir füttern DALL-E bzw. Midjourney2 mit dem gleichen Prompt und erhalten die Ergebnisse aus Abbildung 4.6.
Abbildung 4.6 Die Ergebnisse von DALL-E (oben) und Midjourney (unten) 2 Zum Einrichten eines Zugangs zu DALL-E bzw. Midjourney siehe Kapitel 1, »KI-Bots – der Produktivitäts- und Kreativitätsschub«.
148
4.1
Bilder mit KI erstellen
Es ist offensichtlich, dass Midjourney die besten Ergebnisse liefert. Noch besser werden Midjourneys KI-Bilder, wenn man die Prompts in englischer Sprache mit einer Vielzahl von Parametern formuliert, wie es in Abbildung 4.7 zu sehen ist.
Abbildung 4.7 Midjourney ist eindeutig der Champion unter den bildgenerativen KIs, wenn man die richtigen Prompts zu formulieren weiß
149
4
Kunst mit KI
Wir werden uns daher in den folgenden Abschnitten auf Midjourney konzentrieren und darüber hinaus die Prompts in englischer Sprache formulieren, um ein Maximum an Qualität zu erhalten.
Grenzen der bildgenerativen KI Trotz weit fortgeschrittenen Entwicklungsgrades gibt es noch einige offensichtliche Schwächen in Bildern, die von KIs generiert wurden: Gesichter werden in einfacheren Tools wie Craiyon teilweise unzureichend bzw. ver-
zerrt dargestellt. Hände oder Gliedmaßen werden teilweise nicht naturgetreu dargestellt. So kann es
vorkommen, dass eine Hand schon einmal sechs Finger und ein Einhorn fünf Beine hat (siehe Abbildung 4.8). Du wirst nie exakt das Wunschbild aus deiner Fantasie bekommen, d. h. den perfek-
ten Prompt, der alle Details enthält, die du dir vorstellst, den gibt es (noch) nicht. Es gibt Szenarien, bei denen eine bildgenerative KI aufgrund der Komplexität schei-
tern kann. Ein Beispiel wäre der Prompt »Zeichne mir einen Tisch auf einem Tisch auf einem Tisch«.
Abbildung 4.8 Das kann bei bildgenerativen KIs (hier Craiyon) schon einmal vorkommen: ein Einhorn mit fünf Beinen.
4.1.2 Einstieg in Midjourney Oscar Wilde sagte einmal: »Ich habe einen ganz einfachen Geschmack: Ich bin immer mit dem Besten zufrieden.« Ganz in diesem Sinne werde ich mich beim Ausflug in die
150
4.1
Bilder mit KI erstellen
Welt der bildgenerativen KIs hauptsächlich mit Midjourney beschäftigen. Die Steuerung über Discord ist zwar etwas gewöhnungsbedürftig (siehe die Einrichtung von Midjourney im gleichnamigen Abschnitt 1.4.4), die Ergebnisse entschädigen aber auf jeden Fall für den Mehraufwand bei der Einarbeitung. Stand September 2023 gab es kein Freikontingent mehr für die Bilderzeugung bei Midjourney. Ich beziehe mich in den folgenden Ausführungen auf das Basisabonnement, das ab 8 US$ im Monat erhältlich ist. Gleich der erste, wichtige Tipp: Nach Abschluss des Basisabonnements erhältst du im Discord-Bereich der Direktnachrichten (Symbol oben links in Abbildung 4.9) eine persönliche Chatnachricht vom Midjourney Bot. Diesen Kommunikationskanal kannst du auch in Zukunft nutzen, um eigene Bilder anfertigen zu lassen. Der Vorteil gegenüber den oftmals empfohlenen Newbie-Kanälen besteht darin, dass du nicht pausenlos durch die Vielzahl der Bilder anderer Aktiver scrollen musst, um an das Resultat deiner Prompts zu gelangen. Beachte allerdings, dass deine Bilder im Zuge des Basis-Abos dennoch im öffentlich zugänglichen Bereich von Midjourney erscheinen werden.
Abbildung 4.9 Im Kanal der Direktnachrichten (erreichbar durch Anklicken des Symbols am oberen linken Bildrand) kannst du mit dem Midjourney Bot kommunizieren und Prompts absetzen, ohne dass diese von den Aktivitäten anderer Teilnehmer überlagert werden.
Befehle werden über die Eingabezeile abgesetzt. Bevor wir uns an die Erstellung des ersten Bildes begeben, sehen wir uns zunächst an, wie mit dem Chatbot kommuniziert wird. Möchtest du z. B. wissen, wie viel Rechenzeit dir für die Bildgeneration noch zur Verfügung steht, gibst du den Prompt /info ein (siehe Abbildung 4.10).
151
4
Kunst mit KI
Abbildung 4.10 Gelegentlich solltest du dein Rechenkontingent prüfen.
Pro Monat erhältst du im Basis-Abo 200 Minuten Rechenzeit. Diese reichen für die Erzeugung von ca. 200 Bildern im Normalmodus aus. Der nächste wichtige Prompt ist /settings: Damit konfigurierst du die Grundeinstellungen, die für jede Simulation als Standard gelten sollen (siehe Abbildung 4.11).
Abbildung 4.11 Über die Settings lässt sich das Verhalten der KI steuern.
Tabelle 4.1 zeigt dir, welche Bedeutung die einzelnen Bereiche bzw. Schaltflächen haben. Parameter
Bedeutung
Empfehlung/ Anmerkung
MJ version
Version der KI
höchstmögliche Version
RAW Mode
Künstlerische Effekte werden minimal gehalten.
dann zu verwenden, falls die Resultate zu verspielt erscheinen
Stylize
Verspieltheit/Dynamik der KI
Stylize med
Tabelle 4.1 Die Parameter der Grundeinstellungen von Midjourney
152
4.1
Bilder mit KI erstellen
Parameter
Bedeutung
Empfehlung/ Anmerkung
Public Mode
Deine Bilder werden im Public Stream veröffentlicht.
nur bei teuren Tarifen deaktivierbar
Fast Mode
schnelle Geschwindigkeit der Bilderzeugung (verbraucht mehr Rechenzeit)
Relax Mode nur bei teuren Tarifen verfügbar
Remix Mode
Bilderzeugung mit geänderten Parametern durchführen
Ein bereits erzeugtes Bild kann dadurch neu berechnet werden.
Variation Mode
Bilder variieren
Ein existierendes Bild neu mit geändertem Stil berechnen. Auf High gesetzt, können die Ergebnisse stärker vom Original abweichen.
Reset Settings
die Einstellungen in den Grundzustand rücksetzen
Gehe zurück auf Los!
Tabelle 4.1 Die Parameter der Grundeinstellungen von Midjourney (Forts.)
Beginnen wir mit der Praxis. Wie bereits oben erwähnt, werden wir nachfolgend für die Bildgeneration im Wesentlichen englischsprachige Prompts verwenden. Solltest du nicht so perfekt im Umgang mit der englischen Sprache sein, dann ist der DeepL-Übersetzer dein Freund. Unser erstes Bild soll eine Katze auf einem Sessel zeigen. Merke: Je kürzer dein Prompt ist, desto kreativer reagiert Midjourney darauf und lässt der künstlerischen Freiheit seinen Lauf. Übersetzen wir zunächst den Prompt via DeepL (siehe Abbildung 4.12).
Abbildung 4.12 DeepL Translate übersetzt deutsche Prompts in die englische Sprache.
Zeit für dein erstes Bild: Dieses wird mit dem Kommando /imagine, gefolgt von einem beschreibenden Prompt generiert. Für das obige Beispiel lautet dieser: /imagine a cat on an armchair. Das Kommando wird per Eingabetaste abgeschickt.
153
4
Kunst mit KI
Abbildung 4.13 Für den Anfang solltest du einfache Prompts verwenden.
Nachdem der Prompt abgeschickt wurde, beginnt die KI in der Cloud zu rechnen, und nach ca. 1 Minute liegt das Beispiel vor. Zwischenzeitlich werden Vorschaubilder verschwommen gezeigt (siehe Abbildung 4.14), ein Effekt des zugrunde liegenden KI-Diffusionsmodells.
Abbildung 4.14 Du kannst der KI bei der Bilderstellung zusehen.
154
4.1
Bilder mit KI erstellen
Was bedeuten die Schaltflächen unter dem Bild? U1–U4: »U« steht für Upscale und erzeugt ein hochskaliertes Bild aus dem vorliegenden Quartett. Die Nummerierung erfolgt nach dem Schema: 1 = links oben, 2 = rechts oben, 3 = links unten, 4 = rechts unten. V1–V4: »V« steht für Variations. Diese verwendet man, wenn man ein zufriedenstellendes Bild noch einmal variieren möchte. So erzeugt ein Klick auf V3 vier neue Bilder, die dem linken unteren Bild ähneln. Dadurch lassen sich mit etwas Glück Artefakte (sechs Finger, fünf Beine ...) beseitigen. Die Stärke der Variationen lassen sich über die Einstellungen bzw. Settings von Midjourney anpassen. Drehende Pfeile: Durch Anklicken dieser Schaltfläche wird das komplette Bildquartett neu erstellt. Das ist das Mittel der Wahl, wenn dir keines der vier Bilder gefällt.
Weniger ist mehr Beginne bei deinen ersten Versuchen stets mit knappen Prompts und lasse der KI die künstlerische Freiheit, die beschriebene Szene selbst einzuordnen und umzusetzen. Danach kannst du deinen Prompt iterativ verfeinern und versuchen, weitere Stimmungen und Details herauszuarbeiten.
Entscheiden wir uns zunächst für die Variation des Bildes per Prompt. Nehmen wir an, du möchtest eine dreifarbige Katze darstellen, und der Sessel soll blau bezogen sein. Das gelingt mit folgendem Prompt (siehe Abbildung 4.15): /imagine a "tortoiseshell cat" sits relaxed on a blue armchair and purrs
Abbildung 4.15 Die Katze und die Sesselfarbe wurden ausgetauscht. Die Anweisung, dass es sich um einen blauen Sessel handeln soll, wurde in einem der Bilder allerdings nicht umgesetzt.
155
4
Kunst mit KI
Nehmen wir an, das linke obere Bild gefällt dir, du würdest dir aber gern noch einige Variationen davon ansehen. Dann klick auf die Schaltfläche V1, und das Ergebnis könnte aussehen wie in Abbildung 4.16.
Abbildung 4.16 Variationen eines Bildes
Kommen wir zum Finale: Dir gefällt das vierte Bild der letzten Serie, und du möchtest es gern herunterladen. Klick in diesem Fall auf die Schaltfläche U4. Das Bild wird unmittelbar hochskaliert. Wenn du das Ergebnis nun anklickst, findest du am unteren Bildrand einen Link Im Browser öffnen (siehe Abbildung 4.17). Klick den Link an, und das Bild wird in deinem Systembrowser in Originalgröße dargestellt. Wenn du es nun herunterladen möchtest, führe einen rechten Mausklick über dem Bild durch und wähle den Kontextmenübefehl für einen Download aus.
Deine Bildersammlung einsehen Du kannst alle von dir generierten Bilder stets in deinem Feed einsehen. Begib dich dazu auf www.midjourney.com und logge dich mit deinen Zugangsdaten ein. Du wirst anschließend zu Discord und deinem Bild-Feed weitergeleitet. Wenn du dagegen den Ratschlag beherzigt und die Bilderstellung im direkten Chatkanal vorgenommen hast, findest du dort einen Überblick deiner bisherigen Aktivitäten.
156
4.1
Bilder mit KI erstellen
Übung Jetzt bist du an der Reihe! Denk dir ein hübsches Motiv aus und erstelle dazu einen kurzen, griffigen Bild-Prompt. Spiele ein wenig mit den Stichwörtern im Prompt herum und beobachte, wie sich die Szene im Bild dadurch ändert.
Abbildung 4.17 Das finale Bild kann via Browser heruntergeladen werden.
4.1.3 Bild-KIs entfesseln Nach unseren ersten einfachen Übungen wollen wir nun einmal tiefer unter die Haube von Midjourney blicken und die Bilderstellung gezielt steuern. Das erfolgt durch die Übergabe von Parametern im Prompt. Diese werden stets hinter der sprachlichen Beschreibung der Szene angefügt: /imagine --ar 3:2 –-s 750
In diesem Beispiel wird das Bildverhältnis (Aspect Ratio = ar) auf 3 (Breite) zu 2 (Höhe) gesetzt, und über den Stilize-Parameter s wird der KI eine höhere künstlerische Freiheit bei der Ausführung gewährt. Tabelle 4.3 listet zunächst einmal einige ausgewählte Parameter von Midjourney auf.
157
4
Kunst mit KI
Name
ParameterübergabePrompt
Mögliche Werte
Bedeutung
Aspect Ratio
--ar
3:2, 16:9
Seitenverhältnis ändern
Chaos
--chaos
0–100
Variationsbreite der Ergebnisse
No
--no
elephant, cat, ...
bestimmte Elemente aus dem Bild von vornherein ausschließen
Quality
--quality
0.25, 0.5, 1, 2
Gibt an, wie viel Zeit der KI zur Bilderzeugung gewährt wird. 2 liefert die maximale Qualität.
Seed
--seed
0–4294967295
Das Zufallselement bei der Bilderzeugung. Wiederholt man einen bestimmten Prompt mit demselben Seed (= Samen), werden nahezu identische Ergebnisse in Bezug auf den ersten Durchlauf generiert.
Stop
--stop
10–100
Hält den Prozess bei einer bestimmten Prozentzahl an, was Rechenzeit auf Kosten der Qualität spart.
Stilyze
--s
0–1000
Gibt der KI mehr oder weniger künstlerische Freiheit. Der Standard ist 100.
Tile
--tile
Die erzeugten Bildkacheln werden so generiert, dass man sie beliebig oft aneinanderreihen kann, ähnlich wie bei Fußbodenfließen.
Tabelle 4.2 Speziellere Parameter in Midjourney
Eine vollständige Übersicht aller möglichen aktuellen Parameter findest du auf http:// r-wrk.de/a2pgr. Ein Beispiel zum Parameter Stilyze zeigen Abbildung 4.18 und Abbil-
158
4.1
Bilder mit KI erstellen
dung 4.19. Die beiden abgebildeten Serien wurden zunächst mit einem Style von 100 (dem Standard) und anschließend mit einem Style von 750 erzeugt.
Abbildung 4.18 Durch Variation des Stilyze-Parameters gestattet man Midjourney, eigenständig kreativer zu werden. In der oberen Bildserie wurde »s« auf »100«, in der unteren Bildserie auf »750« gesetzt. Der Prompt lautete in beiden Fällen »batman in gotham city«. In der unteren Serie sieht man mehr Details, z. B. Autos.
159
4
Kunst mit KI
Bleiben wir im Gotham-Universum des dunklen Ritters und wenden wir uns dem Antagonisten zu. Durch die Variation des Chaos-Parameters steuert man die Variationsbreite der vier Einzelbilder (siehe Abbildung 4.19).
Abbildung 4.19 Mit dem Chaos-Parameter steuert man die Variationsbreite der Einzelbilder. In der oberen Bildserie wurde »--chaos« auf »10«, in der unteren auf »100« gesetzt. Der Prompt lautete in beiden Fällen »the joker in gotham city«.
160
4.1
Bilder mit KI erstellen
Über die oben beschriebenen generischen Parameter hinaus lassen sich auch bestimmte Stile, Emotionen oder auch Umgebungen mit dem Prompt übergeben. Wir wollen einen Hund im Stil von Andy Warhol malen lassen. Der Prompt lautet (siehe Abbildung 4.20): /imagine a dog, by Warhol
Abbildung 4.20 Es steht zu befürchten, dass der Kunstmarkt vor dem Kollaps stehen wird, sollte er demnächst von »KI-Originalen« überschwemmt werden.
Einen schönen Überblick über den Einsatz verschiedener Mal- und Zeichenstile findest du auf http://r-wrk.de/v3sb4, wie Abbildung 4.21 zeigt.
Abbildung 4.21 Verschiedene Zeichenstile können ebenfalls gesetzt werden. (Quelle: http://r-wrk.de/v3sb4)
161
4
Kunst mit KI
Du hast in Abbildung 4.7 bereits einen Eindruck davon erhalten, welches Potenzial in Midjourney schlummert, wenn man die KI mit einem mächtigen Prompt füttert. Es ist nun ziemlich mühsam, sich einen solchen, mehrere Dutzend Wörter umfassenden Prompt selbst ausdenken zu müssen. Hier schlägt die große Stunde von ChatGPT. Wir trainieren den textgenerativen Bot so, dass er leistungsstarke Midjourney-Prompts auf Zuruf generiert. Das funktioniert folgendermaßen:3 1. Konditioniere zunächst ChatGPT in seiner Rolle als Bild-Prompt-Lieferant vor. Das kannst du sowohl in deutscher als auch in englischer Sprache tun. 2. Übergib dem Bot anschließend die wichtigsten Passagen aus dem Originalmanual von Midjourney, das in englischer Sprache auf https://docs.midjourney.com zu finden ist. Dazu kannst du den Text entweder per Copy-and-paste aus der Webseite übernehmen, oder du übergibst mithilfe eines Plug-ins,4 wie z. B. Webpilot, direkt die Webseite und bittest ChatGPT, die Inhalte aus der Seite zu lernen. 3. Füttere ChatGPT mit einigen Prompt-Beispielen aus den allgemeinen Feeds, die dir besonders gut gefallen haben. 4. Fordere schließlich ChatGPT dazu auf, anhand weniger Stichworte, die eine Szene beschreiben, einen kraftvollen Midjourney-Prompt zu erstellen. Los geht’s, begeben wir uns zunächst an die Rollendefinition. Diese formulieren wir erst noch auf Deutsch und starten den Lernprozess, indem wir den Bot in eine Kommunikation einbinden: Hallo! Heute werden wir Bilder mithilfe eines Diffusionsmodells erzeugen. Die bildgenerierende KI, die wir dazu verwenden, heißt Midjourney. Ich werde dich mit einigen Informationen zum Umgang mit Midjourney füttern. Ok? Natürlich, ich helfe Ihnen gerne dabei, mehr über Midjourney und seine Verwendung zur Bildgenerierung zu erfahren. Bitte teilen Sie mir die spezifischen Informationen oder Anforderungen mit, die Sie benötigen.
Den nachfolgenden Text zur allgemeinen Beschreibung, was Midjourney so alles tun kann, kopieren wir aus Wikipedia: Midjourney ist eine Künstliche Intelligenz (KI), die in der Lage ist, KI-Kunst zu erschaffen. Midjourney wird vollständig durch Befehle an einen Discord-Bot gesteuert. Um ein neues Bild zu erschaffen, wird der Befehl "/imagine" verwendet, gefolgt von einer Beschreibung des gewünschten Bildes. Dabei können prinzipiell verschiedene Sprachen verwendet werden, darunter auch Deutsch. 3 Die nachfolgend beschriebenen komplexen Trainingstextdaten findest du zum Download auf der Webseite zum Buch: www.rheinwerk-verlag.de/chatgpt-und-co-wie-du-ki-richtig-nutzt. 4 Mehr zum Umgang mit Plug-ins in ChatGPT findest du in Kapitel 8, »KI für Fortgeschrittene«.
162
4.1
Bilder mit KI erstellen
Midjourney erschafft zunächst eine Vorschau mit vier möglichen Entwürfen. Der Nutzer hat dann die Möglichkeit, jeden dieser Entwürfe zu finalisieren. Ebenso ist es möglich, einzelne Entwürfe geringfügig überarbeiten zu lassen oder aber alle vier Entwürfe zu verwerfen und vier ganz andere Bilder anzufordern. Ich werde dir jetzt einige Internetseiten übergeben, auf denen Informationen zum Umgang mit Midjourney und dessen Parametern enthalten sind. Bitte mich mit dem Kommando WEITER nach jeder Webseite um weiteres Trainingsmaterial. Wenn du bereit für die Übergabe der ersten Seite bist, so bestätige dies mit OK. OK, ich bin bereit, die Webseiten zu überprüfen und die relevanten Informationen zu extrahieren. Bitte teilen Sie die URLs mit mir.
Abbildung 4.22 Mithilfe des Plug-ins WebPilot wird ChatGPT mit Inhalten gefüttert.
163
4
Kunst mit KI
Sollten dich die Zusammenfassungen der Webseiten stören, so kannst du dies ChatGPT mit folgendem Prompt abgewöhnen: Gib nachfolgend nicht die Inhalte der Seiten wieder, sondern lerne nur aus dem Material. OK? In Ordnung, ich werde die Informationen von den bereitgestellten Webseiten nutzen, um mein Wissen zu erweitern, ohne die Inhalte direkt wiederzugeben. Bitte teilen Sie die nächste URL mit mir.
Der Bot wird nun Schritt für Schritt mit Informationen zu Midjourney gefüttert, indem einzelne URLs des Manuals übergeben werden. Nachdem alle wichtigen Manual-Seiten von der Midjourney-Website gelernt wurden, fragen wir ChatGPT, ob der Bot versteht, wie das Modell arbeitet: Damit wäre dein Training zu Midjourney beendet. Hast du das Prinzip der Funktionsweise von Midjourney verstanden? Ja, ich habe das Prinzip der Funktionsweise von Midjourney verstanden. Midjourney ist eine KI, die über einen Discord-Bot gesteuert wird und Bilder auf Basis von Textbeschreibungen generiert. Es verwendet verschiedene Modelle und Parameter, um die Generierung von Bildern zu steuern und zu beeinflussen: Einige der wichtigsten Parameter sind: [...] Ich hoffe, dass ich Ihnen bei Fragen zu Midjourney weiterhelfen kann!
Abschließend werden noch einige typische komplexe Prompts aus der Midjourney-/ Discord-Timeline übergeben. Diese kopierst du einfach von Bildern aus der Timeline, die dir besonders gut gefallen. Ich werde dir jetzt noch einige typische Beispiele für komplexe Prompts übergeben, an denen du dich orientieren kannst, wenn ich dich später bitte, mir einen Midjourney-Prompt zu generieren. Ok? Natürlich, ich freue mich darauf, Ihre Beispiele für komplexe Prompts zu sehen. Sie werden mir sicherlich helfen, besser zu verstehen, wie ich Ihnen bei der Erstellung von Midjourney Prompts helfen kann. Bitte teilen Sie die Beispiele mit mir. Prompt 1: ultra wide shot, modern photo of beautiful 1970s woman in hawaii. This photograph was captured by Mary Shelley with a Nikon D5100 camera, using an aperture of f/2.8, ISO 800, and a shutter speed of 1/100 sec. UHD dtm HDR 8k --ar 2:3 --v 5 prompt 2: [...]
164
4.1
Bilder mit KI erstellen
Bitte antworte nur mit WEITER, wenn du diesen Prompt verstanden hast. WEITER [...] Dein Training ist nun beendet. Ich werde dir nun kurze Prompts von Szenen übergeben. Erstelle dazu immer einen ausführlichen, präzisen Prompt, der die Regeln, die du trainiert hast, berücksichtigt. Bestätige meine Anweisung mit OK. OK, ich verstehe. Bitte geben Sie mir die kurzen Prompts für die Szenen, und ich werde detaillierte und präzise Prompts erstellen, die die Regeln und das Training berücksichtigen. Ich freue mich darauf, Ihnen zu helfen. Bitte geben Sie den ersten kurzen Prompt an.
Lassen wir also ChatGPT für uns zaubern. Damit du einen Vergleich hast, übergib den folgenden Prompt direkt in Midjourney und lass anschließend einen verfeinerten Prompt von ChatGPT über eine Influencerin der 1930er Jahre erstellen. Der OriginalPrompt lautet: photo of a 1930's female influencer
Daraus erzeugt ChatGPT folgenden Prompt: A captivating, high-resolution photograph of an elegant 1930s female influencer, impeccably dressed in a sophisticated flapper-style dress adorned with intricate beading and a dazzling headpiece. The stylish woman exudes confidence and charisma as she poses gracefully against the backdrop of a luxurious Art Deco lounge. This stunning image is captured using a classic Rolleiflex Twin Lens Reflex (TLR) camera with a Zeiss Tessar 75mm f/3.5 lens, renowned for its sharpness and exceptional rendering of tones. The camera settings have been meticulously chosen to enhance the vintage ambiance and portray the charm of the era: an aperture of f/5.6 to create a smooth depth of field, isolating the subject from the richly detailed background; an ISO of 100 for fine grain and optimal image quality; and a shutter speed of 1/60 sec to capture the nuanced expressions and details in the scene. The photograph benefits from the soft, diffused light coming through an elegant window, casting a warm, golden glow that highlights the subject's delicate features and emphasizes the shimmering details of her attire. The timeless composition, with its impeccable attention to detail and period authenticity, is a vivid and evocative tribute to the influential women of the 1930s. --ar 5:7 --v 5
Die Unterschiede sind offensichtlich und beschränken sich nicht nur auf das geänderte Seitenverhältnis, wie du in Abbildung 4.23 feststellen kannst.
165
4
Kunst mit KI
Abbildung 4.23 Die Bildserie oben wurde mithilfe eines einfachen Prompts, die Serie unten mithilfe eines komplexen ChatGPT-generierten Prompts erstellt.
166
4.1
Bilder mit KI erstellen
Text-KIs sind lernfähig ... Das obige Beispiel lässt sich auf viele Bereiche übertragen. ChatGPT & Co. sind im Kontext eines einzelnen Chats lernfähig und können für bestimmte Aufgaben trainiert werden. Will man wiederverwendbares Trainingsmaterial erstellen, ist es am besten, reine Textdateien mit Prompts zusammenzustellen und diese bei Bedarf in verdaulichen Portionen an den Textbot zu verfüttern.
4.1.4 Bilder per Zooming erweitern/Inpainting Eine neue Möglichkeit begeistert die Midjourney-Gemeinde seit Erscheinen der Version 5.2. Die Rede ist vom Zoomeffekt. Dabei lässt du zunächst ein Bild als Nahaufnahme generieren und zoomst immer weiter aus der Szene heraus (siehe Abbildung 4.24). Der Hintergrund wird nun auf magische Weise ergänzt.
Abbildung 4.24 Ausgehend von einer extremen Nahaufnahme wird aus einem Einzelbild mehrfach herausgezoomt.
167
4
Kunst mit KI
Eine weitere Möglichkeit, die Midjourney bietet, ist die gezielte Manipulation von Bereichen in einem bestehenden Bild. Dazu gehst du wie folgt vor. 1. Erstelle zunächst eine Sammlung von Bildern mit einem beliebigen Prompt. 2. Vergrößere das Bild, das dir am besten gefällt, mit Hilfe der U-Schaltfläche. 3. Klicke nun auf die Schaltfläche Vary (Region). Mit gedrückter Maustaste kannst du einen rechteckigen Rahmen aufziehen oder mit der Lassofunktion einen Bereich frei markieren. 4. Schreibe in das Eingabefeld am unteren Bildrand einen neuen Teilprompt für den markierten Bereich und sende ihn über die Pfeilschaltfläche ab. Schließe anschließend das Bearbeitungsfenster mit der X-Schaltfläche. Innerhalb der Markierung wird ein Objekt erzeugt, das dem Teilprompt entspricht.
Abbildung 4.25 Beim KI-generierten Portrait von Albert Einstein wurde die rote Krawatte per Inpainting gegen eine blaue Fliege ausgetauscht.
168
4.1
Bilder mit KI erstellen
Auch in Adobe Photoshop haben die beschriebenen Techniken mittlerweile Einzug gehalten. Über den Firefly-Bildgenerator lassen sich Hintergründe entweder komplett austauschen, Bildausschnitte erweitern oder Objekte ergänzen (siehe https://youtu.be/ zt6oCHGqWWc).
Geniale Prompts gesucht? Dann sieh mal auf Prompt Hunt (www.prompthunt.com) oder Prompt Hero (https:// prompthero.com) nach. Dort findest du eine Menge Inspiration bzw. sogar einen KI-gestützten Prompt-Generator. Auch die Seite www.ki-im-alltag.de/ki-bild-promptgenerator/ bietet einen solchen an. Wenn du vollautomatisch geniale Midjourney-Prompts innerhalb von ChatGPT erstellen möchtest, dann solltest du einen Blick auf das Plug-in Photorealistic werfen. Mehr zu Plug-ins in ChatGPT erfährst du in Kapitel 8, »KI für Fortgeschrittene«.
Abbildung 4.26 Mithilfe ausgefeilter Prompts erschaffst du fotorealistisches Bildmaterial.
169
4
Kunst mit KI
4.2 KI-gestützte Bildanalyse und Bildmanipulation Algorithmen der künstlichen Intelligenz haben mittlerweile auch die gängigen Bildbearbeitungstools erobert. Welche Möglichkeiten moderne Software bietet, soll im folgenden Abschnitt erläutert werden.
4.2.1 Bilder analysieren und verschlagworten Mittlerweile kannst du die KIs auch mit eigenem Material füttern. Von Onlinebildkatalogen wie Google Fotos kennst du die Funktion, nach Bildern zu suchen, auf denen ein bestimmtes Motiv zu finden ist, z. B. eine Katze (siehe Abbildung 4.27). Auch hier werkelt eine KI im Hintergrund, die die Bilder zuvor automatisch katalogisiert hat.
Abbildung 4.27 »Google Fotos« findet Bildmotive dank Unterstützung durch künstliche Intelligenz.
Du kannst von Midjourney eigene Bilder analysieren lassen und als Basis für einen neuen Prompt verwenden. Das funktioniert folgendermaßen: Gib zunächst den Prompt /describe ein. Daraufhin erscheint ein Eingabefeld (siehe Abbildung 4.28). In dieses ziehst du das zu beschreibende Bild hinein und schließt den Prompt mit der Eingabetaste ab.
170
4.2 KI-gestützte Bildanalyse und Bildmanipulation
Abbildung 4.28 Mithilfe des Prompts »/describe« kannst du eigenes Material hochladen und beschreiben lassen.
Du erhältst nun vier verschiedene Prompts in englischer Sprache zu dem Bild, die du zur Erstellung neuer KI-generierter Bilder verwenden kannst. Klicke dazu einfach auf die entsprechende Schaltfläche am unteren Bildrand (in Abbildung 4.29 oben dargestellt).
171
4
Kunst mit KI
Abbildung 4.29 Midjourney erzeugt aus dem hochgeladenen Bild eine Serie von Neuinterpretationen.
Das beschriebene Verfahren des Reverse Engineerings ist sicher nicht unkritisch in Bezug auf das Urheberrecht. So könntest du prinzipiell ein beliebiges Bild bzw. eine Bildidee aus dem Internet »neu interpretieren« lassen, ohne dass das neu generierte Bild einem Urheberrecht unterliegt. Auf jeden Fall bist du mit eigenem Bildmaterial auf der sicheren Seite. Wie man dieses direkt mit der KI verfremden kann, erfährst du im nächsten Abschnitt.
4.2.2 Eigenes Material per KI verändern Ähnlich, wie im letzten Abschnitt beschrieben, können auch eigene Bilder als Ausgangspunkt für KI-generierte Bilder in Midjourney verwendet werden. Dazu nutzen wir eine spezielle Eigenschaft von Discord: 1. Ziehe das hochzuladende Bild in die Discord Eingabezeile. Vergiss anschließend nicht, die Eingabetaste zu betätigen. Dadurch wird das Bild in die Discord-Cloud hochgeladen und steht anschließend via Link zur Verfügung. 2. Das hochgeladene Bild erscheint in deiner Discord-Timeline. Führe einen Rechtsklick über dem Bild aus und wähle den Kontextmenüpunkt Link kopieren. 3. Erstelle nun einen Prompt der Form /imagine
und lass Midjourney arbeiten (siehe Abbildung 4.30).
172
4.2 KI-gestützte Bildanalyse und Bildmanipulation
Abbildung 4.30 Variation eines eigenen Bildes im Stil von Claude Monet. Der Prompt lautete: »/imagine claude monet style«
173
4
Kunst mit KI
Auch eigene Skizzen können auf diese Weise zum Leben erweckt werden. Angenommen, du möchtest ein Stillleben aus Erdbeeren, einem Apfel und einer Birne erstellen. Skizziere dein Vorhaben zuerst grob und lade die Skizze als Bild in Discord hoch. Ergänze dann den Link zum Bild um einen entsprechenden Prompt, in dem du z. B. den Stil eines Malers vorgibst wie in Abbildung 4.31.
Abbildung 4.31 Aus einer simplen Handskizze entsteht ein Kunstwerk im Van-Gogh-Stil.
174
4.2 KI-gestützte Bildanalyse und Bildmanipulation
Cloudservices zum Thema Auf rundiffusion.com findest du einen kostenpflichtigen Dienst, der direkt aus einer handschriftlichen Skizze ein Kunstwerk erstellen kann. Wer es einfacher und kostenlos mag, kann ScribbleDiffusion (https://scribblediffusion.com) testen.
Abbildung 4.32 ScribbleDiffusion erstellt aus Skizzen Bilder.
Eine weitere interessante Option ist das Verschmelzen von Bildmaterial. Bei diesem Vorgang lädst du zwei oder mehrere Bilder hoch, und die KI verschmilzt diese zu einem neuen Gesamtbild. Die Bilder können entweder aus Midjourney selbst stammen, oder du kannst eigenes Bildmaterial nutzen. Verwende dazu den Prompt /blend wie in Abbildung 4.33 zu sehen.
Abbildung 4.33 Zwei Bilder werden miteinander verschmolzen, ...
175
4
Kunst mit KI
Abbildung 4.34 ... und aus Pudel und Panda entsteht der »Punda«.
4.2.3 Spezialtechniken und -tools nutzen Selbstverständlich gibt es auch ein bildgeneratives Leben jenseits von Midjourney. Auf dem Markt sprießen täglich neue KI-Tools zur Bildbearbeitung hervor. Einige interessante Vertreter möchte ich dir nachfolgend vorstellen.
Knolling-Bilder erstellen Unter dem Begriff Knolling versteht man Bilder, deren Motive ähnlich einer Explosionszeichnung arrangiert werden. Die vielfältigen Bestandteile sind in der Regel im 90-GradWinkel zueinander angeordnet. Eine Vorstellung davon, wie das aussehen kann, liefert die Seite www.midlibrary.io (siehe Abbildung 4.35). Gib dort in die Suchmaske den Begriff »Knolling« ein, und du erhältst einige Beispiele für entsprechende Prompts, mit denen Midjourney gefüttert werden kann. In der Regel genügt es, hinter den Prompt für eine bestimmte Szene das Schlüsselwort knolling zu setzen. Abbildung 4.36 zeigt ein Beispiel für die Knolling-Technik. Der Prompt lautete: /imagine fruit and vegetables from the garden knolling style.
176
4.2 KI-gestützte Bildanalyse und Bildmanipulation
Abbildung 4.35 Die Seite midlibrary.io gibt Tipps zu Prompts für Midjourney. Hier wird die Technik des Knollings umgesetzt.
Abbildung 4.36 Ein Knolling-Bild aus Gartenfrüchten und -gemüse. Allerdings wurden einige Gewächse von der KI erstellt, für die es in der Natur wohl keine Entsprechung gibt, sprich, auch eine bildgenerative KI kann halluzinieren.
177
4
Kunst mit KI
KI-Tools zur Bildretuschierung Mittlerweile bevölkern diverse Bildbearbeitungstools zur KI-gestützten Bildretusche den Markt. Einige findest du in Tabelle 4.3. Name
Internetseite
Funktion
SnapEdit
https://snapedit.app/de
Objekte aus Bild entfernen
Cleanup Pictures
https://cleanup.pictures
Objekte und Text aus Bild entfernen, Artefakte beseitigen
Luminar Neo
https://skylum.com/de/luminar
eigenständige App, Bildverbesserung und Tauschen von Hintergründen
Segment Anything
https://segment-anything.com
Bildobjekt freistellen
Tabelle 4.3 KI-gestützte Tools zur Bildretuschierung
Sehen wir uns konkrete Beispiele an. Du kennst die Situation sicherlich: Du hast ein unwiederbringliches Foto eines schönen Plätzchens geschossen, und zu Hause fällt dir auf, dass ein Störenfried im Hintergrund durch das Bild läuft oder ein anderes Objekt stört. Ein Fall für SnapEdit: Begib dich auf die Seite https://snapedit.app/de und klick auf die Schaltfläche Bild hochladen. Das Bild wird in einem Retuschierfenster geöffnet. Dort bewegst du den virtuellen Pinsel über das störende Objekt, sodass dieses rot übermalt wird (siehe Abbildung 4.37). Klickst du nun auf die Schaltfläche Entfernen, so verschwindet das Objekt endgültig aus der Szene. Das korrigierte Bild kannst du über die Download-Schaltfläche herunterladen. Auf die gleiche Weise lässt sich mithilfe von SnapEdit auch der komplette Himmel austauschen. Das Gegenteil – den kompletten Hintergrund um ein Objekt herum entfernen – erledigt Segment Anything. Experten sprechen in diesem Fall von Freistellen. Das war in der PreKI-Ära mit Photoshop & Co. oft eine sehr aufwendige Geschichte, insbesondere, wenn der Hintergrund des Bildes stark strukturiert war.
178
4.2 KI-gestützte Bildanalyse und Bildmanipulation
Abbildung 4.37 SnapEdit eignet sich hervorragend, um störende Objekte mit KI-Hilfe aus Bildern zu entfernen.
179
4
Kunst mit KI
Begib dich für eine Demonstration der Fähigkeiten auf die Seite https://segmentanything.com und lade dort ein Foto hoch, auf dem sich ein Objekt befindet, dass du freistellen möchtest, gerne mit schwierigem Hintergrund (siehe Abbildung 4.38). Durch Anklicken des Hauptobjekts wird dieses unmittelbar freigestellt.
Abbildung 4.38 Zum Zeitpunkt der Drucklegung dieses Buches befand sich das KI-Freistellungstool Segment Anything noch in der Testphase. Im vorliegenden Fall wird das freizustellende Objekt pixelgenau von der KI erkannt. Inzwischen gibt es ein ähnliches Werkzeug auch in Photoshop.
Memes mit MemeCam erstellen Memes – das sind kleine, witzige Bildbotschaften. Diese lassen sich mittlerweile auch KIgestützt erzeugen. Das entsprechende Tool heißt MemeCam. Begib dich auf die Seite www.memecam.io und lade dort ein Bild aus deiner Sammlung hoch. Den Rest erledigt die KI – aktuell noch in englischer Sprache (siehe Abbildung 4.39).
180
4.2 KI-gestützte Bildanalyse und Bildmanipulation
Abbildung 4.39 MemeCam analysiert die Szene im Bild und ergänzt dazu einen witzigen Spruch.
KI-Tools in Photoshop nutzen Mittlerweile hat die generative KI auch in Adobe Photoshop Einzug gehalten. So ist es in der aktuellen Version möglich, mithilfe von generativen Prompts markierte Bereiche mit Objekten zu füllen oder den Hintergrund eines Bildes komplett zu verändern. Dabei hilft Adobes generative KI Firefly. Das Interessante an Firefly ist, dass der Trainingsdatensatz aus Adobes Stockfotopool stammt und es somit keine rechtlichen Probleme gibt, wenn ein Publisher Elemente seiner eigenen Arbeit in den KI-generierten Bildern entdeckt.
181
4
Kunst mit KI
Abbildung 4.40 Indiana Jones an der Ostsee: Das Krokodil wurde mit der bildgenerativen KI Adobe Firefly via Photoshop ergänzt. Faszinierend ist, dass sogar der Schatten des Tieres mit dem Lichteinfall in der Szene harmoniert. Das Tool beherrscht darüber hinaus die rückstandfreie Entfernung von störenden Objekten im Bild, und auch die komplette Umgebung kann getauscht werden.
182
4.3
KI multimedial einsetzen
4.3 KI multimedial einsetzen Es war ein besonderer Moment, als sich eine generative KI zum ersten Mal einer breiten Öffentlichkeit präsentierte: Ende April 2023 interviewte Moderator Christian Sievers im »heute journal« den Avatar einer künstlichen Intelligenz namens Jenny. Die KI war direkt mit ChatGPT verbunden. Die Reaktionen waren zwiegespalten – die breite Masse war beeindruckt, die technikaffinen Nerds eher enttäuscht. Da geht noch mehr, meinten die Fachleute. Was bereits möglich ist, zeigt der folgende Abschnitt.
4.3.1 KI-Sprachsynthese Die Möglichkeiten der aktuellen Sprachsynthese rufen bei vielen Menschen gemischte Gefühle hervor. Hörbuchsprecher*innen fürchten zu Recht um ihren Job – Sprachroboter erledigen die Umsetzung eines gedruckten Werkes in die Audioform mittlerweile problemlos. Auch die typischen Enkeltrickanrufe erreichen eine neue Dimension, indem sie täuschend echt Notsituationen simulieren. KI-Swatting ist ein Trend in den USA, bei dem Einsätze von SWAT-Teams durch KI-generierte Stimmen ausgelöst werden. Aber es gibt auch Positives zu berichten: Einige Kulturschaffende versuchen, auf den KIZug aufzuspringen. Die Sängerin Grimes hat ihre Stimme für das Training bzw. die Weiterverarbeitung durch eine KI freigegeben, ebenso die Brit-Pop-Gruppe Oasis. Daraus entstand bereits ein neues Album der letztgenannten Band, obwohl sich diese schon vor mehreren Dekaden getrennt hat. Werden wir demzufolge auch eine Wiederauferstehung der Beatles erleben? Es bleibt spannend ... Schauen wir uns einige Möglichkeiten der sprachgenerativen KI an. Deren Einsatz im Bereich des Fremdsprachenlernens hast du ja bereits in Abschnitt 3.3.4, »Der KI-Muttersprachler«, kennengelernt. Bringen wir zunächst ChatGPT das Sprechen und Zuhören bei. Das funktioniert mithilfe des Browsers Chrome und eines Plug-ins namens Talk-toChatGPT. Starte also den Browser Chrome und installiere das genannte Tool von http:// r-wrk.de/djzmg. Anschließend kannst du dich mit ChatGPT per Headset unterhalten.
Abbildung 4.41 Mithilfe eines Chrome-Plug-ins kannst du dich mit ChatGPT unterhalten.
183
4
Kunst mit KI
So richtig überzeugend ist die vom Plug-in verwendete künstliche Stimme allerdings nicht. Wenn du insbesondere eigene Stimmenprofile entwerfen möchtest, die beliebige Texte vorlesen können, dann ist ElevenLabs deine Anlaufstelle. Begib dich auf https:// beta.elevenlabs.io. Zur Erzeugung eigener Stimmenprofile ist das Abschließen eines Abonnements zu 5 US$ im Monat erforderlich. Danach kann es losgehen. Begib dich in den Bereich VoiceLab. Hier kannst du deine erste künstliche Stimme generieren. Du hast die Wahl: Entweder generierst du eine zufällige Stimme durch Anpassen verschiedener Parameter, oder du klonst eine reale Stimme, z. B. deine eigene. Letzteres führen wir nachfolgend einmal durch.
Abbildung 4.42 Bei der Erzeugung künstlicher Stimmen bietet ElevenLabs zwei Optionen an: die parameterbasierte, rein artifizielle Erzeugung sowie die Übernahme einer realen Stimme per Sounddatei.
Klick auf die Schaltfläche Add Voice (siehe Abbildung 4.42). Es öffnet sich ein Fenster mit den beiden Optionen Voice Design und Instant Voice Cloning. Klick die letzte Option an und zieh eine Sounddatei mit deiner Stimme5 in das sich nun öffnende Dialogfenster. Benenne die Stimme, füge eine (englischsprachige) Beschreibung hinzu und klick auf die Schaltfläche Add Voice (siehe Abbildung 4.43). Das war’s auch schon. Du findest dein neues Sprachprofil im Bereich Your Voices. Dort kannst du bis zu zehn KIbasierte Stimmenprofile ablegen.
5 Eine solche Datei lässt sich leicht mit einer Stimmenrekorder-App per Smartphone erstellen.
184
4.3
KI multimedial einsetzen
Abbildung 4.43 Die Stimmendatei wird mit einer Beschreibung versehen und hochgeladen.
Klick nun im Bereich der Stimmen unter der soeben importierten Stimme die Schaltfläche Use an. Als Sprachmodell stellst du Multilingual ein. Nun kannst du einen beliebigen Text in das Textfeld kopieren und diesen von deiner Stimme vorlesen lassen, ohne zuvor ein Training dafür durchgeführt zu haben (siehe Abbildung 4.44).
Vorsicht mit der Weitergabe biometrischer Daten! Du solltest mit den digitalisierten – biometrischen – Daten deiner Stimme sehr vorsichtig umgehen. Wenn deine Stimme in den Besitz von Kriminellen gelangt, ist es für diese ein Leichtes, damit Straftaten zu begehen. Immerhin garantiert ElevenLabs eine Behandlung deiner Daten nach EU-Standarddatenschutzaspekten.
185
4
Kunst mit KI
Abbildung 4.44 Das ist schon recht gruselig: Ein völlig neuer, unbekannter Text wird mit deiner Stimme vorgelesen.
4.3.2 KI und Musik Wie bereits im letzten Abschnitt erwähnt, stößt der Einsatz von KI in der Musikbranche auf ein geteiltes Echo. Ein Altmeister der Popmusik, Sting, positioniert sich klar gegen KI-generierte Musik. Er betont, dass kein Algorithmus die musikalische Genialität des menschlichen Gehirns erreichen könne, siehe http://r-wrk.de/759r5. Fangen wir mal ganz einfach an. Du kennst das Problem: Die eigenen Playlists werden nach x-maligem Hören langweilig, etwas Frisches muss her, ohne aber den Pfad des über Jahre mühsam aufgebauten Musikgeschmacks zu verlassen. Die erste Anlaufstelle ist ChatGPT. Füttere den Bot mit deinen Lieblingsbands und frag nach Alternativen:
186
4.3
KI multimedial einsetzen
Du kennst dich als Musikkritiker sehr gut mit allen erdenklichen Musikstilen aus. Du hast schon mehrere tausend Alben und Songs gehört, hast sozusagen das absolute Gehör. Ich nenne dir nachfolgend einige meiner Lieblingsbands bzw. -interpreten. Nenne mir umwerfende Alben anderer Interpreten oder Bands, die ich deiner Einschätzung nach nicht kenne und die einen ähnlichen Musikstil repräsentieren. Liefere zunächst 5 verschiedene Vorschläge für Alben. Wenn ich dich mit dem Schlüsselwort WEITER bitte, nenne weitere 5 Vorschläge. Natürlich, ich werde mein Bestes tun, um Ihnen einige Alben vorzuschlagen, die Ihren musikalischen Vorlieben entsprechen könnten. Aber zunächst müssen Sie mir bitte die Namen Ihrer Lieblingsbands oder -interpreten nennen, damit ich Ihre Vorlieben besser einschätzen kann.
Es ist Zufall, ob uns der Bot nach einem Prompt siezt oder duzt. Das tut seiner Funktionalität aber keinen Abbruch: Led Zeppelin, Pink Floyd, Supertramp, Dire Straits, AC/DC, Fleetwood Mac, Manfred Manns Earthband, Eric Clapton, The Black Keys Vielen Dank für die Information. Hier sind fünf Albumvorschläge basierend auf den genannten Bands und Interpreten: 1. **Deep Purple - "Machine Head"**: Ein klassisches Album der britischen HardRock-Band Deep Purple, das Elemente von Blues und Progressive Rock enthält, ähnlich wie Led Zeppelin. 2. **Yes - "Close to the Edge"**: Ein Progressive-Rock-Album, das Fans von Pink Floyd gefallen könnte. Es ist voller komplexer Songstrukturen und ambitionierter Konzeptstücke. 3. **Blue Öyster Cult - "Agents of Fortune"**: Dieses Album bietet eine Mischung aus Hard Rock und Psychedelic Rock und könnte Fans von Supertramp und Dire Straits gefallen. 4. **Stevie Ray Vaughan - "Texas Flood"**: Ein hervorragendes Bluesrock-Album von einem der größten Gitarristen aller Zeiten. Fans von Eric Clapton und The Black Keys könnten es genießen. 5. **The Allman Brothers Band - "At Fillmore East"**: Ein klassisches LiveAlbum, das den Southern Rock perfekt einfängt. Es könnte Fans von Fleetwood Mac und AC/DC gefallen. Wenn Sie mit "WEITER" antworten, kann ich Ihnen fünf weitere Alben vorschlagen.
Im Zeitalter der Streamingdienste gilt es nun, die oben genannten Alben in den Medienkatalog aufzunehmen und in einer ruhigen Stunde zu genießen. Was in meiner Jugend die legendären Mixtapes waren, sind heute akribisch zusammengestellte Playlists. Beim Platzhirsch unter den Streamingdiensten – Spotify – werden solche Listen rege ausgetauscht. Natürlich kann auch ChatGPT eine solche Playlist generieren:
187
4
Kunst mit KI
Erstelle mir eine Playlist mit 30 Stücken, die vom Stil her den oben vorgeschlagenen Bands bzw. Interpreten entsprechen. Natürlich, hier sind 30 Songs, die den Stil der genannten Bands reflektieren: 1. Deep Purple - "Smoke on the Water" 2. Yes - "Roundabout" 3. Blue Öyster Cult - "(Don't Fear) The Reaper" 4. Stevie Ray Vaughan - "Pride and Joy" 5. The Allman Brothers Band - "Whipping Post" 6. Led Zeppelin - "Black Dog" 7. Pink Floyd - "Wish You Were Here" [...] 29. Deep Purple - "Perfect Strangers" 30. Yes - "And You and I" Diese Playlist enthält eine Mischung aus Klassikern und weniger bekannten Stücken, die den Stil und den Geist der von Ihnen genannten Bands widerspiegeln. Ich hoffe, Sie genießen sie!
Mittlerweile gibt es auch ChatGPT-Plug-ins, die in der Lage sind, solche Playlists direkt auf deinen Spotify-Account zu übertragen. Dazu musst du dem Plug-in allerdings deine Zugangsdaten mitteilen, was aus datenschutzrechtlicher Sicht kritisch sein kann. Hast du dich auch schon mal gefragt, welcher tiefere Sinn hinter einem Musiktext steckt? Auch hier kann dir ChatGPT weiterhelfen, selbst bei Stücken von Bands, die dafür bekannt sind, keine massenkompatiblen Texte zu produzieren. Versuchen wir es doch mal mit einem Stück der Alternative-Indie-Band R.E.M:6 Du bist Musikkritiker und sollst den Titel "Lotus" von R.E.M. analysieren. Ich übergebe dir den Text anschließend in Originalform. Übersetze den Text zunächst in die deutsche Sprache und interpretiere ihn anschließend. Bestätige meine Anweisungen mit OK. OK, bitte übergeben Sie mir den Text des Liedes "Lotus" von R.E.M. Hey, hey Hey, hey I was hell Sarcastic silver swell That day it rained [...]
6 Übergib derartige Texte stets in Originalform. Ein erster Versuch mit dem obigen Lied hat gezeigt, dass sich ChatGPT einen beliebigen Text herbeihalluziniert hat.
188
4.3
KI multimedial einsetzen
Hier ist die Übersetzung des Liedtextes ins Deutsche: Hey, hey Hey, hey Ich war die Hölle Sarkastische silberne Woge An jenem Tag hat es geregnet [...] Interpretation: "Lotus" ist ein Lied, das sich mit persönlicher Transformation und Erneuerung auseinandersetzt. Der Lotus ist ein Symbol für Reinheit und spirituelle Erweckung in vielen Kulturen, und das "Essen des Lotus" könnte eine Metapher für die Annahme einer neuen Perspektive oder eines neuen Lebensstils sein. [...] Insgesamt scheint das Lied eine Reise der Selbstentdeckung und Transformation darzustellen, mit dem "Essen des Lotus" als zentralem Symbol für diese Veränderung.
Werden wir nun selbst aktiv und lassen uns bei der Komposition von Musikstücken von einer künstlichen Intelligenz unterstützen. Dazu verwenden wir Riffusion, ein neuronales Netzwerk zur Komposition von Musik – quasi das Midjourney für Musikliebhaber. Ähnlich wie Midjourney verwendet Riffusion ein Stable-Diffusion-Modell. Stable Diffusion ist ein bildgeneratives KI-Modell, welches auf einem PC lokal installiert und genutzt werden kann. Du verwendest ebenfalls Prompts, um Musik zu erzeugen. Ruf die Seite www.riffusion.com auf. Lass uns zuerst einen Blick auf die Oberfläche werfen (siehe Abbildung 4.45). Folgende Elemente findest du auf der Webseite: 1 Prompt-Eingabefeld: Hier beschreibst du den Musikstil, den du gerne generiert haben möchtest. Gib ein paar Stichworte ein und betätige die Eingabetaste. Wähle den nun in Fettdruck erscheinenden Prompt durch Anklicken aus und betätige anschließend die Play-Schaltfläche. 2 Würfelsymbol: Wenn du daraufklickst, wird dir ein Musik-Prompt vorgeschlagen. 3 Einstellungen: Hier kannst du einige Parameter für die Songgenerierung voreinstellen, z. B. Seed und Denoising. Seed bestimmt den Charakter des erzeugten Samples, Denoising die Variationsbreite und ist somit vergleichbar mit dem Chaos-Parameter in Midjourney. 4 Teilen: Damit kannst du dein Sample in sozialen Netzwerken teilen. Du kannst auch den Link zum Sample kopieren, um es später wiederzuverwenden.
189
4
Kunst mit KI
5 Abspielen: Durch Anklicken dieser Schaltfläche wird der durch Anklicken ausgewählte Ton abgespielt. 6 Auf der linken Seite wird während der Wiedergabe das Spektrum des Soundsamples angezeigt.
Abbildung 4.45 Riffusion ist das Midjourney für Musiker*innen
Nun kannst du dir selbst einen Prompt überlegen und die Leistungsfähigkeit der KI testen. Die Soundschnipsel, die du mit Riffusion erstellen kannst, sind relativ kurz. Möchtest du längere KI-Kompositionen generieren, z. B. als Untermalung für YouTube-Videos, dann bietet sich Soundraw an. Direkt nach dem Besuch der Seite https://soundraw.io kannst du loslegen, indem du die Schaltfläche Create music anklickst. Anschließend stehen dir verschiedene Bereiche (Mood, Genre, Theme) zur Auswahl. Durch Anklicken der entsprechenden Auswahlbilder werden verschiedene Stücke mit den gewählten Eigenschaften durch die KI generiert. Dabei können Stile auch gemixt werden (siehe Abbildung 4.46).
190
4.3
KI multimedial einsetzen
Abbildung 4.46 Soundraw bietet eine Vielzahl vordefinierter Soundstile, sodass sich auch Laien rasch zurechtfinden.
191
4
Kunst mit KI
Abbildung 4.47 Die KI-generierten Stücke können anschließend probegehört und durch Anklicken der Pfeilschaltfläche heruntergeladen werden. Fortgeschrittene Anwender laden ihr Video in die Vorschau hoch und passen den Stil des Soundclips dem Medium passend an.
Um die Musik in eigenen Produktionen nutzen zu können, muss das entsprechende Stück zunächst heruntergeladen werden (siehe Abbildung 4.47). Zu diesem Zweck ist ein Abonnement des Soundraw-Dienstes erforderlich, das bei ca. 20 US$ monatlich liegt.
Google Music LM , Meta MusicGen und AudioCraft Auch Google und Meta (vormals Facebook) haben mittlerweile Tools auf den Markt gebracht, die Musik per KI generieren können. Die Google-Lösung heißt Google Musik LM, das Meta-Pendant MusicGen. Mittels AudioCraft bietet Meta sogar eine Art ChatGPT für Musiker*innen: Per Prompt lassen sich beliebige Audio-Samples generieren.
192
4.3
KI multimedial einsetzen
4.3.3 KI-Videotools Sehen wir uns abschließend noch Möglichkeiten an, mithilfe von KI-Prompts die Erstellung von Videos zu automatisieren. Der Workflow sieht folgendermaßen aus: 1. Für kurze Videoclips genügt es, dem KI-Tool einen einfachen, knackigen Prompt zu übergeben. Den Rest erledigt die KI vollautomatisch. 2. Für größere Projekte ist es sinnvoll, sich von ChatGPT zunächst ein Skript erstellen zu lassen. Dieses wird dann mithilfe ausgefeilter Werkzeuge umgesetzt. Der Markt ist voll von Angeboten zu dem Thema. Als Beispiel sei an dieser Stelle Deepbrain AI genannt (www.deepbrain.io). Gehe auf die Seite und teste den Workflow zur Erstellung eines Videos mit KI-Hilfe einmal selbst. Das Tool erstellt komplette Präsentationsvideos auf der Basis einiger weniger Stichworte mithilfe von ChatGPT. Zum Testen erhältst du als Exportdatei eine einminütige Videosequenz. Die Abos für den vollwertigen Zugriff sind nicht unbedingt günstig. Sie beginnen bei 30 US$ im Monat für die Basisversion, wobei nach oben kaum Grenzen gesetzt sind.
Abbildung 4.48 Es gibt mittlerweile eine Vielzahl von Tools, die – wie hier Deepbrain von AI Studios – Videopräsentationen mithilfe von Avataren erstellen können.
193
4
Kunst mit KI
Lippensynchrone Übersetzungen mit HeyGen Videotranslate Mitte 2023 streikten die Kreativen in Hollywood, um auf die Gefahren – insbesondere den drohenden Verlust von Arbeitsplätzen – durch den Einsatz von KI in ihrer Branche aufmerksam zu machen. Und in der Tat sind die Möglichkeiten, die sich daraus ergeben, faszinierend bis beängstigend. Ein Beispiel dafür ist das Tool HeyGen Videotranslate, zu finden unter https://labs.heygen.com/video-translate. Damit lassen sich Synchronsprecher*innen komplett ersetzen. Ein Video, in dem ein Schauspieler spricht, wird von einer KI analysiert. Anschließend werden nicht nur die Audiodaten auf der Tonspur simultan übersetzt, sondern auch die Lippenbewegungen des Sprechers oder der Sprecherin im Video an die Zielsprache angepasst – ganz schön gruselig! Du kannst das Tool auch selbst ausprobieren. Nimm mit deinem Handy ein Video von dir auf, das mindestens 30 Sekunden lang ist. Sprich dabei ein paar Sätze in deiner Muttersprache. Dann lade das Video per Drag & Drop auf die oben genannte Seite, wähle die Zielsprache der Übersetzung aus und staune.
Abbildung 4.49 Die Online App »HeyGen Video Translate« erstellt lippensynchrone Videos in vielen Sprachen
194
5
KI im Alltag
Kapitel 5 KI im Alltag Die Werkzeuge der künstlichen Intelligenz sind längst in unserem Alltag angekommen. Alexa, Siri & Co. waren gestern – jetzt schicken sich ChatGPT & Co. an, uns als Alltagshelfer zu unterstützen, sei es bei der Planung und Durchführung handwerklicher Aufgaben oder beim persönlichen Informationsmanagement.
Oft fehlen uns entscheidende Tipps, um scheinbar lästige Aufgaben des Alltags, für die wir sonst Stunden bräuchten, im Handumdrehen zu erledigen. Hier wünscht man sich einen persönlichen Coach, der das Wissen der Welt in sich vereint und der einem auch bei Rechercheaufgaben helfen kann. Im folgenden Abschnitt zeige ich, wie wir künstliche Intelligenz in Form von Chatbots für beide Aspekte nutzen können.
5.1 ChatGPT & Co. – deine persönlichen Assistenten In den vorangegangenen Kapiteln hast du ChatGPT in seiner ursprünglichen Funktion als Textwerkzeug kennengelernt. Was viele noch nicht wissen: Im Chatbot ist eine unglaubliche Menge an Wissen gespeichert, das nur darauf wartet, von uns entdeckt zu werden. Der Trick besteht auch hier darin, dieses Wissen durch ausgeklügelte Prompts zum Vorschein zu bringen. Und wie immer ist es wichtig, die Authentizität der Aussagen zu überprüfen. Dieser Abschnitt zeigt anhand einiger Beispiele, was alles möglich ist.
5.1.1 KI im handwerklichen Bereich Fragen wir zunächst ChatGPT, welche konkreten Fragen der Bot für uns beantworten kann. Welche Fragestellungen kannst du für mich im handwerklichen Bereich beantworten? Als künstliche Intelligenz kann ich in vielen Bereichen des Handwerks helfen. Hier sind einige Beispiele für Fragen, die du mir stellen könntest:
195
5
KI im Alltag
1. 2. 3. 4. 5.
Wie mische ich Beton für ein bestimmtes Projekt? Was sind die besten Techniken zum Schneiden von Holz? Wie kann ich sicher eine Wand in meinem Haus abreißen? Wie wähle ich den richtigen Typ von Schrauben für ein bestimmtes Projekt? Was sind die Vorsichtsmaßnahmen, die ich beim Arbeiten mit Elektrizität beachten muss? 6. Wie installiere ich eine neue Steckdose in meinem Haus? 7. Welche Werkzeuge benötige ich, um Fliesen zu verlegen? 8. Wie repariere ich eine undichte Wasserleitung? 9. Wie pflege ich meine Handwerkzeuge richtig? 10. Was sind die besten Praktiken für die Lackierung von Holzoberflächen? Bitte beachte, dass ich dir zwar grundlegende Ratschläge und Anleitungen geben kann, es aber in vielen Fällen wichtig ist, einen Fachmann zu konsultieren, besonders bei Arbeiten, die spezielle Kenntnisse oder Fähigkeiten erfordern, wie Elektrik, Sanitär oder Bauarbeiten.
Das klingt doch vielversprechend! Dann stellen wir doch mal eine konkrete Frage: Wie wechsle ich die Reifen meines Golf 7? Ein Reifenwechsel an einem Volkswagen Golf 7 ist relativ einfach durchzuführen, wenn du die richtigen Werkzeuge und einige grundlegende Kenntnisse hast. Hier sind die Schritte, die du durchführen musst: 1. **Bereite das Fahrzeug vor**: Stelle das Fahrzeug auf einer ebenen Fläche ab und ziehe die Handbremse an. 2. **Sammle die notwendigen Werkzeuge zusammen**: Du brauchst einen Wagenheber, einen Radkreuz oder Schlagschrauber und einen Drehmomentschlüssel. [...] 7. **Senke das Fahrzeug ab und ziehe die Radmuttern fest**: Senke das Fahrzeug vorsichtig mit dem Wagenheber ab. Sobald das Rad den Boden berührt, ziehe die Radmuttern mit dem Drehmomentschlüssel fest. Achte darauf, dass du sie überkreuz anziehst, um sicherzustellen, dass das Rad gleichmäßig auf der Nabe sitzt. Die genaue Drehmoment-Spezifikation findest du in deinem Fahrzeughandbuch, sie beträgt in der Regel um die 120 Nm. 8. **Überprüfen Sie den Reifendruck**: Stelle sicher, dass der neue Reifen den richtigen Druck hat. Du kannst dies mit einem Reifendruckmesser überprüfen. Die empfohlenen Reifendruckwerte findest du in deinem Fahrzeughandbuch oder auf einem Aufkleber im Türrahmen. Bitte beachte, dass du nach einigen Kilometern Fahrt die Radmuttern nochmals überprüfen und gegebenenfalls nachziehen solltest. Bei Unklarheiten oder Unsicherheiten empfiehlt es sich, einen Fachmann zu konsultieren oder die Arbeit in einer Werkstatt durchführen zu lassen.
196
5.1
ChatGPT & Co. – deine persönlichen Assistenten
So in etwa würde uns das auch ein Werkstattmeister erklären. Aber auch im Haushalt kann ChatGPT nützlich sein: Die Fugen in unserem Bad zeigen leichten Schimmelbefall in Form von dunklen Punkten. Was können wir dagegen tun? Schimmel in den Fugen des Badezimmers kann ein häufiges Problem sein, insbesondere in älteren Häusern oder in Räumen mit schlechter Belüftung. Hier sind einige Schritte, die du unternehmen kannst, um das Problem zu bekämpfen und zu verhindern, dass es erneut auftritt: 1. **Reinigung der Fugen**: Eine einfache Methode zur Entfernung von Schimmel ist die Verwendung einer Mischung aus Backpulver und Wasser, um eine Paste zu erstellen. Trage diese Paste auf die betroffenen Stellen auf und lasse sie einige Stunden einwirken. Anschließend kannst du die Fugen mit einer alten Zahnbürste schrubben und das Gemisch abspülen. Es gibt auch spezielle Fugenreiniger auf dem Markt, die auf die Entfernung von Schimmel abzielen. 2. **Verwendung von Bleichmittel**: Wenn der Schimmel tief in die Fugen eingedrungen ist, könnte Bleichmittel helfen. Es sollte mit Vorsicht verwendet werden, da es bei direktem Kontakt oder Einatmen schädlich sein kann. Verwende es in einem gut belüfteten Raum und trage immer Handschuhe. Eine Mischung aus Bleichmittel und Wasser im Verhältnis 1:10 kann auf die betroffenen Stellen aufgetragen werden. Nach dem Auftragen sollte es einige Minuten einwirken und dann abgespült werden. [...]
5.1.2 Der KI-Berater Von der Praxis geht’s nun in die Theorie, genauer gesagt in den Bereich Consulting. Früher hätte man gesagt: Ich hole mir mal ein paar Tipps von jemandem, der sich mit den wichtigen Dingen des Lebens auskennt. Beginnen wir mit einem Klassiker: Du sollst eine Geburtstagsparty für den Nachwuchs organisieren, hast aber keine Ahnung, womit du den Jüngsten vom Hocker reißen kannst. Wenigstens kennst du seine Vorlieben: Ich möchte eine Geburtstagsparty für einen 11-Jährigen ausrichten, der großer Star-Wars-Fan ist. Kannst du mir dafür 5 Ideen liefern? Natürlich, das klingt nach einer aufregenden Geburtstagsparty! Hier sind fünf Ideen für eine Star Wars-Themenparty: 1. **Jedi Training Academy**: Machen Sie die Party zu einer Jedi-Trainingsakademie. Sie können Lichtschwerttrainingseinheiten durchführen (mit schaum-
197
5
KI im Alltag
stoffbeschichteten Spielzeug-Lichtschwertern), "Die Macht" üben (z. B. mit einem Hindernisparcours oder Spielen, bei denen die Kinder einen Ball ohne Berührung bewegen müssen) und vielleicht sogar eine Zeremonie, bei der jeder seinen eigenen Jedi-Rang erhält. [...] 5. **Themenorientiertes Essen**: Bieten Sie Star Wars-Themenessen an. Zum Beispiel könnten Sie "Wookiee-Cookies", "Yoda-Ohren" (grüne Zuckerkekse in YodaOhren-Form), "Ewok-Häppchen" und "Lichtschwert-Popsicles" oder "LichtschwertPretzelstangen" (Pretzelstangen, die mit verschiedenen farbigen Zuckerguss oder Schokolade überzogen sind) zubereiten. Und natürlich vergessen Sie nicht die Dekoration: Star Wars Ballons, Poster und Tischdecken können helfen, die richtige Atmosphäre zu schaffen. Es könnte auch Spaß machen, ein paar bekannte Zitate aus den Filmen rund um die Party zu platzieren!
Kommen wir zu ernsteren Themen. Du brauchst einen rechtlichen Rat in einem bestimmten Fall und möchtest nicht gleich viel Geld an die nächstbeste Anwältin überweisen für eine Auskunft, die dir vielleicht schon die KI geben kann. Dann probiere ChatGPT doch erst einmal als kostenlosen Rechtsbeistand aus, um dir zumindest einen groben Überblick zu verschaffen. Du bist ein erfahrener Rechtsanwalt und hast dein JuraStudium mit Prädikat abgeschlossen. Bitte berate mich in folgendem Fall und beurteile, ob es für mich sinnvoll ist, den Rechtsweg zu beschreiten: Der Apfelbaum meines Nachbarn ragt über die Grundstücksgrenze. Ständig fallen zur Erntezeit Äpfel von ihm auf mein Grundstück und zerstören mein darunter befindliches Kräuterbeet. Wie schätzt du die Situation juristisch ein? Dein Anliegen bezieht sich auf das Nachbarrecht, welches in Deutschland in den Landesnachbarrechtsgesetzen der einzelnen Bundesländer geregelt ist. Generell gilt dabei der Grundsatz, dass niemand durch überhängende Zweige eines Baumes gestört werden darf, wenn diese über die Grundstücksgrenze ragen. Dies gilt insbesondere dann, wenn dadurch ein Schaden verursacht wird, wie es in deinem Fall durch das Herunterfallen der Äpfel auf dein Kräuterbeet der Fall ist. Laut dem Bundesgerichtshof darf ein Eigentümer verlangen, dass überhängende Äste entfernt werden, wenn diese die Nutzung seines Grundstücks beeinträchtigen (BGH, Urteil vom 14. Juni 2019 - V ZR 102/18). Die Tatsache, dass die Äpfel Schaden an deinem Kräuterbeet verursachen, könnte als solche Beeinträchtigung angesehen werden.
198
5.1
ChatGPT & Co. – deine persönlichen Assistenten
Ein erster Schritt wäre, deinen Nachbarn höflich auf die Situation aufmerksam zu machen und ihn zu bitten, die Äste, die über dein Grundstück ragen, zu entfernen oder zurückzuschneiden. Möglicherweise ist ihm das Problem gar nicht bewusst und er ist bereit, eine Lösung zu finden, die für euch beide funktioniert. Sollte dies nicht zu einer Lösung führen, könntest du rechtliche Schritte einleiten. Hierbei wäre jedoch zu bedenken, dass die Kosten für einen Rechtsstreit in der Regel relativ hoch sind und nicht immer vom Unterlegenen getragen werden müssen. Darüber hinaus kann ein Rechtsstreit zu einer erheblichen Belastung des nachbarschaftlichen Verhältnisses führen. Zusammenfassend lässt sich sagen, dass du grundsätzlich das Recht hast, von deinem Nachbarn die Entfernung der überhängenden Äste zu verlangen. Ob der Gang vor Gericht in diesem Fall allerdings die beste Lösung ist, solltest du sorgfältig abwägen. Es könnte hilfreich sein, zunächst das Gespräch mit deinem Nachbarn zu suchen oder eine Mediation in Betracht zu ziehen, bevor du rechtliche Schritte einleitest.
Eine sehr kluge und umfassende Antwort! Prüfe auf jeden Fall durch eine Google-Recherche, ob die zitierten Urteile tatsächlich existieren (Stichwort Halluzinieren der KI). Solltest du tatsächlich den Rechtsweg beschreiten wollen, ist der Gang zu einem professionellen Anwalt allerdings unumgänglich. Auf die beschriebene Weise kannst du aber schon einmal ungefähr abschätzen, wohin die Reise gehen kann. Und schließlich ein Beispiel aus dem medizinischen Bereich (auch hier gilt, dass ChatGPT bei ernsthaften gesundheitlichen Problemen nicht den Haus- oder Facharzt ersetzen kann): Ich habe eine sehr schmerzhafte Warze unter der Fußsohle. Kannst du mir einige Tipps bzw. Hausmittel nennen, wie ich diese loswerden kann? Ich möchte betonen, dass ich kein Arzt bin und die folgenden Vorschläge nicht den Rat eines Mediziners ersetzen. Bei starken Schmerzen oder einer Warze, die sich verändert oder nicht verschwindet, solltest du unbedingt einen Arzt aufsuchen. Manche Warzen können hartnäckig sein und eine medizinische Behandlung benötigen. Hier sind einige Hausmittel, die Menschen oft zur Warzenbehandlung nutzen: 1. Apfelessig: Viele Menschen schwören auf die Verwendung von Apfelessig zur Behandlung von Warzen. Du kannst ein Stück Baumwolle mit Apfelessig tränken und es mit einem Pflaster über Nacht auf der Warze fixieren. Es wird angenommen, dass die Säure im Essig die Warze langsam auflöst. Dies kann jedoch bei empfindlicher Haut Reizungen verursachen, daher ist Vorsicht geboten.
199
5
KI im Alltag
[...] 6. Bananenschale: Manche Leute glauben, dass das Auflegen einer Bananenschale (mit der Innenseite nach unten) auf die Warze über Nacht helfen kann. Bitte denk daran, dass es wichtig ist, den Bereich sauber und trocken zu halten, und dass du versuchen solltest, die Warze nicht zu berühren oder zu kratzen, da dies sie verschlimmern oder ihre Ausbreitung fördern kann. Wie bereits erwähnt, solltest du einen Arzt aufsuchen, wenn die Warze schmerzhaft ist, sich verändert oder nicht verschwindet.
5.1.3 KI als Recherchewerkzeug Eine Bemerkung gleich zu Beginn: ChatGPT ist kein Ersatz für eine Suchmaschine, wenngleich es die Möglichkeit gibt, den Chatbot mittels Plug-ins an das Internet anzubinden – mehr dazu erfährst du in Abschnitt 5.2.2. Wie aber bereits mehrfach erwähnt, kann man durch entsprechende Prompts Expertenwissen abrufen, z. B. für die Planung von Reisen. Du bist Experte für die Planung von Städtereisen. Ich nenne dir nachfolgend den Namen einer Stadt. Nenne mir 5 Orte oder Dinge, die ich in dieser Stadt unbedingt gesehen haben muss. Ordne diese Orte und Dinge so an, dass ich alle Plätze in Form einer Rundtour mit öffentlichen Verkehrsmitteln abfahren kann. Natürlich, das kann ich tun. Bitte nennen Sie mir die Stadt, die Sie besuchen möchten. Paris Paris ist eine wunderschöne Stadt mit zahlreichen Sehenswürdigkeiten. Hier sind fünf Orte, die Sie unbedingt besuchen sollten, geordnet in einer Route, die Sie mit den öffentlichen Verkehrsmitteln zurücklegen können: 1. **Eiffelturm**: Starten Sie Ihre Reise mit einem Besuch des Eiffelturms, eines der bekanntesten Wahrzeichen der Welt. Sie können mit der Métro-Linie 6 zur Station "Trocadéro" fahren, die einen fantastischen Ausblick auf den Turm bietet. Von dort aus können Sie zu Fuß zum Turm gehen. 2. **Musée du Louvre**: Nehmen Sie die Métro-Linie 9 von Trocadéro zur Station "Franklin D. Roosevelt", und wechseln Sie dort zur Linie 1 Richtung Château de Vincennes. Steigen Sie an der Station "Palais Royal - Musée du Louvre" aus. Das Louvre-Museum beherbergt unzählige Kunstwerke, darunter die Mona Lisa und die Venus von Milo. [...] Bitte beachten Sie, dass dies nur ein Vorschlag ist und es in Paris noch viele weitere sehenswerte Orte gibt. Viel Spaß bei Ihrer Reise!
200
5.1
ChatGPT & Co. – deine persönlichen Assistenten
Die obige Zusammenstellung ist in der Tat schon ein »Best of« der schönsten Orte, die man in Paris besichtigen kann. Aber du kannst mit speziellen Fragen auch noch weiter ins Detail gehen: Ich interessiere mich für Naturwissenschaft und Technik. Insbesondere liebe ich Museen, wo ich selbst Demonstrationsexperimente durchführen kann. Hast du dazu auch einen Tipp für mich? Ja, natürlich! In Paris gibt es auch für Technik- und Naturwissenschaftsbegeisterte großartige Orte zu besuchen. Ein absolutes Muss ist das: **Cité des Sciences et de l'Industrie**: Es ist das größte Wissenschafts- und Technologiemuseum in Europa und befindet sich im Parc de la Villette im 19. Arrondissement von Paris. Das Museum bietet eine Vielzahl interaktiver Ausstellungen zu Themen wie Raumfahrt, Informatik, Licht, Sound, Mathematik und vielem mehr. Es gibt auch ein Planetarium, ein IMAX-Theater und ein U-Boot, das Sie besichtigen können. Um dorthin zu gelangen, können Sie von der Station "Anvers" die Métro-Linie 2 zur Station "Stalingrad" nehmen, dort zur Linie 7 wechseln und bis zur Station "Porte de la Villette" fahren. [...]
Beachte, dass ChatGPT die Routenbeschreibung unmittelbar an die vorherige Frage geknüpft hat. Sämtliche Routenbeschreibungen sind überdies korrekt, und es wurde auch der kürzeste Weg per Metro zwischen den Sehenswürdigkeiten gewählt. Die angegebenen Orte lassen sich mit einem kleinen Trick auch in Google Maps importieren: Erstelle mir von den oben genannten Sehenswürdigkeiten Wegpunkte, die ich in Google Maps importieren kann. Natürlich, gerne helfe ich Ihnen dabei. Zuerst benötigen Sie eine .csv-Datei, die alle Orte und deren Koordinaten enthält. Diese Datei könnte so aussehen: Name,Breitengrad,Längengrad Eiffelturm,48.8584,2.2945 Musée du Louvre,48.8606,2.3376 Notre-Dame-Kathedrale,48.8530,2.3498 Quartier Latin,48.8494,2.3431 Sacré-Cœur,48.8867,2.3431 Cité des Sciences et de l'Industrie,48.8945,2.3852 Palais de la Découverte,48.8662,2.3126 Um diese Datei zu erstellen, können Sie ein Textbearbeitungsprogramm wie Notepad (Windows) oder TextEdit (Mac) verwenden und die obigen Zeilen einfügen. Achten Sie darauf, das Dokument als .csv-Datei zu speichern. Sobald Sie die .csv-Datei erstellt haben, können Sie die folgenden Schritte ausführen, um die Wegpunkte in Google Maps zu importieren:
201
5
KI im Alltag
[...] Jetzt sollten alle Ihre Wegpunkte auf der Karte angezeigt werden. Sie können auf jeden Wegpunkt klicken, um den Namen und die Koordinaten zu sehen.
Abbildung 5.1 Die verschiedenen Orte lassen sich in Form einer CSV-Datei in Google Maps importieren.
Und noch ein abschließendes praktisches Beispiel zu Recherchezwecken. Du planst, dir einen Rasenmähroboter zuzulegen, weißt aber nicht, worauf dabei zu achten ist. Dann lass dich von ChatGPT beraten. Du bist Experte für technische Geräte. Ich möchte mir einen Rasenmähroboter zulegen, weiß aber nicht, worauf ich dabei achten muss. Kannst du mich beraten? Selbstverständlich kann ich das. Beim Kauf eines Rasenmähroboters gibt es mehrere Faktoren zu beachten: 1. **Größe des Rasens**: Das Wichtigste ist, den Mähroboter entsprechend der Größe Ihres Rasens auszuwählen. Jeder Mähroboter hat eine maximale Kapazität, die er bewältigen kann, diese wird normalerweise in Quadratmetern angegeben. Es ist wichtig, dass Sie einen Mähroboter wählen, der die Größe Ihres Rasens bewältigen kann. 2. **Beschaffenheit des Rasens**: Ist Ihr Rasen eben oder hügelig? Einige Rasenmähroboter können besser mit Steigungen umgehen als andere. Wenn Ihr Rasen uneben ist, benötigen Sie einen Mähroboter, der in der Lage ist, Steigungen von mindestens 20 % zu bewältigen.
202
5.1
ChatGPT & Co. – deine persönlichen Assistenten
[...] 8. **Preis**: Schließlich ist der Preis ein entscheidender Faktor. Es gibt Rasenmähroboter in vielen verschiedenen Preisklassen. Stellen Sie sicher, dass Sie ein Modell wählen, das sowohl zu Ihrem Budget als auch zu Ihren Bedürfnissen passt. Es ist auch empfehlenswert, Bewertungen und Benutzererfahrungen zu überprüfen, bevor Sie sich für ein bestimmtes Modell entscheiden. Diese können Ihnen helfen, eine bessere Vorstellung von der Leistung und Zuverlässigkeit des Mähroboters in realen Situationen zu bekommen.
Ausgerüstet mit diesem Basiswissen kannst du nun losziehen, um dir im Fachhandel entsprechende aktuelle Modelle vorstellen zu lassen.
ChatGPT als Wohnungsmakler Auch das gibt es: Ein findiger Berliner Jungunternehmer hat mit ChatGPT einen sogenannten Scraper für Wohnungsanzeigen programmiert. Ein solches Programm durchkämmt das Internet nach relevanten Kontakt-E-Mail-Adressen von Immobilienanbietern in der Nähe. Anschließend ließ er den Bot eine E-Mail an die Immobilienanbieter schreiben und nach deren Reaktion auch beantworten. Auf diese Weise erhielt er immerhin zwei maßgeschneiderte Angebote. (Quelle: http://r-wrk.de/h2en9)
5.1.4 KI als Sparringspartner für Einstellungsgespräche In Abschnitt 3.5.3, »Der KI-Prüfungs- und Klausurassistent«, wurde ChatGPT bereits als Assistent zur Simulation mündlicher Prüfungen eingesetzt. Im Folgenden soll eine weitere Kommunikationssituation betrachtet werden, in der sicheres Auftreten trainiert werden kann: Es geht um Bewerbungsgespräche. Wichtig ist, dass du den Bot zunächst mit einem Prompt vorkonditionierst, der ihn in die Rolle eines Personalchefs versetzt: Du bist Personalchef einer Firma, die Mitarbeiter im Bereich Kundenbetreuung sucht. Das Produkt, das deine Firma anbietet, ist eine Hotline bei Problemen mit Smartphones jeglicher Art. Deine Aufgabe ist es, in einem Vorstellungsgespräch herauszufinden, ob ich für die Stelle geeignet bin. Neben den fachlichen Skills sind für dein Unternehmen auch Soft Skills, insbesondere der persönliche Umgang mit Kundinnen und Kunden, von größter Bedeutung. Stelle mir nun nacheinander geschickte Fragen, die meine fachlichen und menschlichen Kompetenzen prüfen, und triff ein Urteil über meine Eignung, nachdem ich mich mit dem Stichwort "goodbye" verabschiedet habe. Bestätige meine Anweisungen und stelle mir die erste Frage. Bitte stelle immer nur eine einzelne Frage bitte mich um eine Antwort.
203
5
KI im Alltag
Bestätigt, ich werde Ihre fachlichen und menschlichen Kompetenzen einzeln prüfen und ein Urteil erst fällen, nachdem Sie das Gespräch mit "goodbye" beendet haben. Lassen Sie uns mit der ersten Frage beginnen: 1. Können Sie uns bitte einen Überblick über Ihre bisherigen Erfahrungen in der Kundenbetreuung geben, insbesondere im Bezug auf technische Produkte oder Dienstleistungen? Ich habe bisher den First Level Support für ein kleines mittelständisches Unternehmen geleistet. Dabei habe ich den Außendienstmitarbeitern bei Problemen mit ihren Smartphones, Laptops und Tablets geholfen. Das klingt nach einer wertvollen Erfahrung, die für diese Position sehr relevant ist. Nun zur zweiten Frage: Angenommen, ein Kunde ruft an und ist sehr frustriert, weil sein Smartphone nicht funktioniert. Wie würden Sie in dieser Situation vorgehen, um dem Kunden zu helfen und gleichzeitig eine positive Kundenbeziehung zu bewahren? Ich würde den Kunden zunächst dahin gehend beruhigen, dass sein beschriebenes Problem für mich bekannt klingt und ihm unmittelbar einen Lösungsansatz anbieten. Darüber hinaus würde ich ihm vermitteln, dass das beschriebene Problem nicht durch sein Verschulden entstanden ist. Das ist eine sehr empathische und beruhigende Herangehensweise, die sicherlich dazu beiträgt, das Vertrauen des Kunden wiederherzustellen. Nun zur dritten Frage: Können Sie uns bitte ein spezifisches Beispiel dafür geben, wie Sie ein besonders komplexes technisches Problem mit einem Smartphone in der Vergangenheit gelöst haben? [...] goodbye Auf Grundlage Ihrer Antworten, scheinen Sie eine starke Kombination aus technischem Verständnis und Kundenbetreuungsfähigkeiten zu besitzen. Sie haben Erfahrung im First-Level-Support und haben bewiesen, dass Sie effektive Methoden zur Problemlösung anwenden können. Zudem haben Sie eine empathische und beruhigende Herangehensweise im Umgang mit frustrierten Kunden, was in der Kundenbetreuung von großer Bedeutung ist. Ihre Strategien zur Stressbewältigung und Ihr Engagement für kontinuierliche Weiterbildung sind ebenfalls beeindruckend. Diese Qualitäten sind essentiell, um in einer sich ständig weiterentwickelnden Branche wie der Smartphone-Technologie zu bestehen. [...] Vielen Dank für Ihre Zeit und das Gespräch. Wir werden uns in Kürze mit weiteren Informationen bei Ihnen melden.
204
5.1
ChatGPT & Co. – deine persönlichen Assistenten
5.1.5 Brainstorming mit KI ChatGPT ist eine exzellente Anlaufstelle, wenn es darum geht, frische Ideen zu bekommen und Arbeitsprozesse zu optimieren, vorausgesetzt, du fütterst den Bot mit den passenden Prompts: Ich bin freier Autor im Bereich Computertechnik/IT. Nenne mir 7 Ideen, wie mir ChatGPT bei meiner Tätigkeit helfen kann. Sicherlich, ich kann auf viele Arten hilfreich sein. Hier sind sieben Ideen, wie ChatGPT Ihre Arbeit als freier Autor im Bereich Computertechnik und IT unterstützen kann: 1. **Technische Erklärungen**: Wenn Sie über komplexe technische Konzepte schreiben, kann ich helfen, diese Konzepte in einfachere, leichter verständliche Begriffe zu zerlegen. Das ist besonders nützlich, wenn Sie für ein allgemeines Publikum schreiben. 2. **Schreibhilfe**: Ich kann Ihnen bei der Formulierung von Sätzen, Absätzen oder sogar ganzen Artikeln helfen. Mit meiner Fähigkeit, in natürlicher Sprache zu schreiben, kann ich dabei helfen, Ihre Ideen fließend und klar auszudrücken. [...] 7. **Interviewsimulation**: Wenn Sie ein Interview mit einem Experten simulieren möchten, kann ich als der Experte fungieren. Das kann Ihnen helfen, sich auf echte Interviews vorzubereiten oder sogar Ideen für Fragen zu sammeln, die Sie stellen könnten. Punkt Nr. 7 klingt für mich interessant. Ich schreibe gerade an einem Artikel über die Grundlagen neuronaler Netzwerke. Könntest du für mich einen Interviewpartner simulieren, mit dessen Hilfe ich mich in die Thematik einarbeiten kann? Natürlich, gerne simuliere ich für Sie ein Interview über neuronale Netzwerke. Sie können mit Ihren Fragen beginnen, wann immer Sie bereit sind. Als Hinweis: Ich werde so antworten, als ob Sie ein Interview mit einem Experten für neuronale Netzwerke führen. Bitte beginnen Sie mit Ihrer ersten Frage. Was ist ein neuronales Netzwerk? Bitte erkläre es so, dass es auch Laien verstehen können. Ein neuronales Netzwerk ist ein Modell der künstlichen Intelligenz, das von der Art und Weise inspiriert ist, wie das menschliche Gehirn funktioniert. [...] Wenn Sie sich ein neuronales Netzwerk vorstellen, denken Sie an eine Fabrik mit einer Fließbandproduktion. Jede Station auf dem Band (ein Neuron) hat eine spezielle Aufgabe.
205
5
KI im Alltag
[...] Zum Beispiel: Nehmen wir an, wir haben ein neuronales Netzwerk, das Bilder von Hunden und Katzen unterscheiden soll. Zuerst nimmt es das Bild und zerlegt es in seine Bestandteile - einzelne Pixel mit verschiedenen Farben. Dann versucht es Muster zu erkennen, z. B. Formen, Texturen und Farben, die spezifisch für Hunde oder Katzen sind. Es kann lernen, dass Hunde oft spitze Ohren und lange Schnauzen haben, während Katzen oft kleinere Ohren und flachere Gesichter haben. Nach genügend Training kann das Netzwerk aufgrund dieser Merkmale mit hoher Genauigkeit vorhersagen, ob ein neues Bild einen Hund oder eine Katze zeigt. [...]
Unterstützung für Gehandicapte Aktuelle KI-Tools und die darin implementierten Techniken stellen eine große Chance für Menschen mit Behinderungen dar. Ein Beispiel ist die App Seeing AI von Microsoft, eine sprechende Kamera für Blinde. Du nimmst mit der Kamera deines Smartphones eine Szene auf und eine Stimme erklärt dir, was auf dem Bild zu sehen ist. Die App findest du in den App Stores von Android und iOS. Nach der Installation startest du die App und kannst Objekte, Personen oder Szenen erkennen lassen. Zwei Modi sind besonders nützlich: Die App erkennt Texte und liest sie vor. Im anderen Modus werden Geldscheine erkannt.
Abbildung 5.2 Seeing AI von Microsoft unterstützt Sehbehinderte.
206
5.1
ChatGPT & Co. – deine persönlichen Assistenten
5.1.6 KI im Finanzbereich Es klingt zu schön, um wahr zu sein: Wenn du einigen windigen Anbietern auf YouTube & Co. glaubst, kannst du dir mit ChatGPT ein Zusatzeinkommen von mehreren tausend Euro pro Tag verschaffen. Selbstverständlich lassen sich die oben genannten Protagonist*innen ihre Tipps im Vorfeld fürstlich bezahlen und geben dir keine Garantie, dass du mit ihrer Strategie erfolgreich sein wirst. Diesen windigen Versprechungen zum Trotz gibt es aber in der Tat Möglichkeiten, ChatGPT für Recherchen im Finanzbereich zu nutzen oder einfach nur, um sich ein Grundwissen über Finanzen anzueignen. Du kannst dir auch allgemeine Anlagetipps geben lassen. Du bist mein persönlicher Finanzberater und verfügst über jahrzehntelange Erfahrung im Anlagenbereich. Mir steht aktuell ein Kapital von 20.000 € zur Verfügung, dass ich die nächsten 5 Jahre sicher nicht benötigen werde. Welche Anlagestrategie zur möglichst risikolosen Vermehrung des Kapitals kannst du mir empfehlen? Es ist wichtig zu beachten, dass Anlageberatung immer von der individuellen Situation, den Zielen und der Risikobereitschaft des Anlegers abhängt. Ohne ein vollständiges Bild von deiner Situation zu haben, kann ich nur allgemeine Ratschläge geben. Trotzdem können wir einige grundlegende Prinzipien diskutieren. 1. **Sicherheit vor Rendite**: Wenn Sicherheit dein Hauptanliegen ist, könntest du in risikoarme Anlageformen wie Anleihen oder Festgelder investieren. Diese Anlageformen bieten in der Regel eine vorhersehbare, aber meist niedrige Rendite. 2. **Diversifikation**: Es ist immer eine gute Idee, deine Anlagen zu diversifizieren, um Risiken zu reduzieren. Du könntest dein Kapital auf verschiedene Anlageklassen wie Anleihen, Aktien, Immobilien und Cash verteilen. Du könntest auch in verschiedene Sektoren und geografische Regionen investieren, um dein Portfolio weiter zu diversifizieren. [...] 5. **Langfristige Orientierung**: Es ist wichtig, eine langfristige Perspektive zu haben. Kurzfristige Schwankungen an den Märkten sind normal und sollten nicht dazu führen, dass du deine Anlagestrategie überdenkst. Bitte beachte, dass alle Anlagen mit einem gewissen Grad an Risiko verbunden sind. Es gibt keine Garantie für eine bestimmte Rendite, und du könntest auch Geld verlieren. Daher ist es wichtig, sich gut zu informieren und gegebenenfalls professionelle Beratung in Anspruch zu nehmen.
207
5
KI im Alltag
Bereits an dieser Antwort erkennt man, dass ChatGPT recht konservativ agiert und mehrfach davor warnt, sich allein auf sein Urteil zu verlassen. Gehen wir einen Schritt weiter und testen wir sein Wissen in Bezug auf das Börsengeschehen: Kannst du mir 5 Unternehmen bzw. Aktiengesellschaften nennen, die über einen langen Zeitraum gerechnet stets hohe Dividenden ausgeschüttet haben? Ja, ich kann dir einige Unternehmen nennen, die bekannt dafür sind, über lange Zeiträume hinweg konsistent hohe Dividenden ausgeschüttet zu haben. Bitte beachte, dass Dividendenzahlungen von vielen Faktoren abhängen, einschließlich der finanziellen Gesundheit des Unternehmens und seiner Gewinne. Darüber hinaus ist es wichtig zu bedenken, dass frühere Dividendenzahlungen keine Garantie für zukünftige Zahlungen sind. Hier sind einige Beispiele für solche Unternehmen: 1. **Procter & Gamble Co.**: Der Konsumgüterhersteller hat seit über 60 Jahren stetig steigende Dividenden ausgeschüttet. 2. **Coca-Cola Co.**: Coca-Cola hat seit über 50 Jahren eine wachsende Dividendenausschüttung. [...] Es ist jedoch wichtig zu beachten, dass hohe Dividendenzahlungen nicht immer ein Indikator für die finanzielle Gesundheit eines Unternehmens sind. [...]
Das Problem an den dargebotenen Informationen ist die Tatsache, dass die antrainierten Informationen des Chatbots prinzipiell veraltet sind. Man kann den Bot allerdings mithilfe eines Browsing-Plug-ins mit aktuellen Daten füttern und diese einer Analyse unterziehen. Es ist auch möglich, gezielt Rechercheaufträge zu übergeben und basierend auf den in den Artikeln enthaltenen Fakten Anlageempfehlungen aussprechen zu lassen (siehe Abbildung 5.3).
Abbildung 5.3 Mithilfe eines Internet-Such-Plug-ins recherchiert ChatGPT aktuelle Börseninformationen. Klickt man auf den nach unten weisenden Pfeil, so wird gezeigt, von welchen Seiten der Crawler seine Informationen bezieht.
208
5.2
Intelligent suchen
Recherchiere aktuelle börsenrelevante Informationen zur Microsoft Corporation. Erstelle daraus eine Kursanalyse und triff eine Entscheidung, ob man die Aktie zum aktuellen Kurs kaufen sollte oder besser nicht. Basierend auf den Informationen, die ich bisher gesammelt habe, kann ich Ihnen folgende Details zur Microsoft Corporation geben: Microsoft veröffentlichte seine Ergebnisse für das dritte Quartal des Geschäftsjahres 2023 am 25. April 2023. Die Gesamteinnahmen beliefen sich auf 52,9 Milliarden US-Dollar, was einer Steigerung von 7 % im Vergleich zum entsprechenden Vorjahresquartal entspricht. Der operative Gewinn betrug 22,4 Milliarden US-Dollar (+10 %), während der Nettogewinn 18,3 Milliarden US-Dollar (+9 %) betrug. Der Gewinn pro Aktie lag bei 2,45 US-Dollar und stieg um 10 %. [...] Basierend auf diesen Informationen, ist Microsoft ein starkes Unternehmen mit solidem Wachstum in Schlüsselbereichen wie der Cloud. Die aktuelle Cybersecurity-Bedrohung könnte jedoch ein potenzielles Risiko darstellen. Ich konnte nicht alle Informationen finden, die für eine vollständige Aktienanalyse benötigt werden, wie z. B. die Bewertung von Microsoft im Vergleich zu den Branchenkollegen oder die zukünftigen Wachstumsprognosen des Unternehmens.
Der Bot hält sich somit bezüglich einer konkreten Kaufempfehlung bedeckt.
ChatGPT als Fondsmanager Es ist sicherlich nur eine Frage der Zeit, bis spezialisierte KI-unterstützte Tools als Finanzund Anlagestrategieberater den Markt überschwemmen werden. In der Zwischenzeit hat der Bot ChatGPT bereits bewiesen, dass er bei der Zusammenstellung eines Aktienfonds mit professionellen Beratern mithalten, ja diese sogar übertreffen kann (siehe http://r-wrk.de/vxt97).
5.2 Intelligent suchen Eine generative KI ist für die Suche nicht geeignet, da ihre Trainingsdaten begrenzt und nicht aktuell sind. Stimmt diese Aussage? Nein! Es gibt mittlerweile verschiedene Möglichkeiten, dem Chatbot Faktenwissen zu entlocken. Der folgende Abschnitt zeigt, wie das funktioniert.
209
5
KI im Alltag
5.2.1 Die Trainingsdaten von ChatGPT offline durchforsten Der Trainingsdatensatz von ChatGPT ist riesig. Dieser lässt sich auch zur Offlinesuche von Faktenwissen nutzen. Der Bot spielt seine Stärken insbesondere dann aus, wenn du nur eine vage Vorstellung davon hast, wonach du suchen möchtest – hier ist die Suchmaschine Google schlicht überfordert. Ein Beispiel: Du denkst an einen Film, den du vor langer Zeit gesehen hast, kannst dich aber nicht an den Titel erinnern. Dann geh sinngemäß wie in folgendem Beispiel vor: Wie heißt der Film, indem sich zwei Agenten umgekehrt bewegen und alles ist vorwärts und rückwärts in der Zeit vermischt? Der Film, den du wahrscheinlich meinst, ist "Tenet" von Christopher Nolan. In diesem Film spielen Zeitmanipulation und vorwärts und rückwärts laufende Zeitleisten eine zentrale Rolle. "Tenet" wurde 2020 veröffentlicht und beinhaltet viele Elemente der Spionage und Science Fiction.
Die Antwort ist völlig korrekt. Das Verfahren funktioniert bei Verwendung von GPT-4 mit Filmen, aber auch mit anderen Medien, die vor der Einstellung des Trainings im Jahr 2021 veröffentlicht wurden. Ein weiteres Beispiel aus der Rubrik »Unnützes Wissen«: Welche Alternativtitel für den Titel "Yesterday" von den Beatles waren von John Lennon und Paul McCartney im Gespräch? "Yesterday" ist einer der bekanntesten und erfolgreichsten Songs der Beatles, aber es war nicht immer als "Yesterday" bekannt. Tatsächlich hatte der Song ursprünglich einen Platzhalter-Titel, da Paul McCartney die Melodie vor den Text hatte. Der ursprüngliche Arbeitstitel war "Scrambled Eggs" (Rühreier), mit dem Platzhaltertext "Scrambled eggs, oh my baby how I love your legs" als vorläufiger Text. Es ist nicht bekannt, dass es andere ernsthafte Alternativtitel für "Yesterday" von John Lennon und Paul McCartney gab. Der endgültige Titel "Yesterday" wurde gewählt, als McCartney den Text zum Lied schrieb. Der Titel und der Text reflektieren das Thema des Liedes - eine nostalgische Reflexion über bessere Zeiten, die nun vorbei sind.
Natürlich ist es auch hier wieder wichtig, einen Faktencheck durchzuführen. Die Hypothese des Alternativtitels "Scrambled Eggs" ist wahr, bei dem weiteren Fortgang des Textes halluziniert die KI hingegegen. Greift man auf den Trainingsdatensatz von ChatGPT zurück, dann lassen sich auch beliebige statistische Tabellen generieren: Erstelle mir eine Tabelle der folgenden Form: Jahreszahl # beliebtester Heimcomputer. Der Zeitraum soll von 1975 bis 1990 reichen. Selbstverständlich, hier ist die Tabelle, die Sie angefragt haben. Die Populari-
210
5.2
Intelligent suchen
tät der Heimcomputer kann je nach Region variieren. Diese Tabelle basiert auf weltweiten Verkaufszahlen und Einfluss. | Jahreszahl | Beliebtester Heimcomputer | | ---------- | ------------------------- | | 1975 | Altair 8800 | | 1976 | Apple I | | 1977 | TRS-80 | | 1978 | Commodore PET | | 1979 | Atari 400/800 | | 1980 | Apple II | | 1981 | IBM PC | | 1982 | Commodore 64 | | 1983 | Apple Lisa | | 1984 | Apple Macintosh | | 1985 | Amiga 1000 | | 1986 | Atari ST | | 1987 | IBM PS/2 | | 1988 | Apple Macintosh IIx | | 1989 | Amiga 3000 | | 1990 | Windows 3.0 auf verschiedenen IBM-PC-kompatiblen Computern | Diese Tabelle gibt nur einen groben Überblick und ist keine exakte Darstellung der Realität, da viele Faktoren berücksichtigt werden müssen, einschließlich regionaler Vorlieben und der Verfügbarkeit bestimmter Modelle in verschiedenen Ländern.
Wie bereits erwähnt, war der Datensatz zum Zeitpunkt der Drucklegung bei der nativen Nutzung von ChatGPT bis zum Jahr 2021 limitiert. Diese Beschränkung wurde inzwischen aufgehoben. Sie kann außerdem durch Plug-ins umgangen werden, wie der folgende Abschnitt zeigt.
5.2.2 ChatGPT mit dem Internet verknüpfen Zahlende Kund*innen kommen bei OpenAI in den Genuss, ChatGPT per Plug-in mit Browserfähigkeiten auszustatten und somit dem Textbot den aktuellen Datenbestand des Internets im Rahmen des Sprachmodells GPT-4 zugänglich zu machen. Dazu gehst du folgendermaßen vor: 1. Logg dich auf deinem Konto bei ChatGPT ein. Die Browsingoption lässt sich aktuell nur in der bezahlpflichtigen Version aktivieren. 2. Begib dich in die Einstellungen und aktiviere dort das Browsing durch Anklicken der entsprechenden Schaltfläche.
211
5
KI im Alltag
3. Klicke oben auf die Schalfläche GPT-4, um das aktuelle Sprachmodell zu verwenden. 4. Fahre mit der Maus über die Schaltfläche GPT-4. Es öffnen sich einige Optionen. Klick mit der Maus auf die Schaltfläche Browse with Bing1, sodass hinter dem Eintrag ein blauer Haken erscheint. Nun ist das Browsing-Plug-in innerhalb von ChatGPT aktiviert.
Abbildung 5.4 In ChatGPT kannst du das Browsing durch einfaches Anklicken aktivieren. Zuvor ist die Option in den Einstellungen freizuschalten.
1 Die beschriebene native Browsing-Funktion ließ sich während der Erstellung des Manuskripts in ChatGPT aktivieren. Sie wurde allerdings im Juli 2023 deaktiviert, als man feststellte, dass es damit auch möglich war, hinter Paywalls (das sind Sperren für zahlungspflichtige Angebote) zu schauen. Sollte die integrierte Funktion immer noch deaktiviert sein, so kannst du die beschriebene Vorgehensweise auch mit einem beliebigen anderen Browsing-Plug-in, wie beispielsweise WebPilot, nachvollziehen.
212
5.2
Intelligent suchen
Sehen wir uns nun einmal ein Beispiel an, das den Unterschied zwischen ChatGPT ohne und mit Browsing-Plug-in verdeutlichen soll. Ich gebe es zu, von Zeit zu Zeit betreibe auch ich selbst einmal ein wenig Ego-Googling (d. h. die Suche nach dem eigenen Namen). Umso gespannter war ich bei meinen ersten Experimenten darauf, was ChatGPT über mich zu berichten weiß, und wurde ziemlich enttäuscht: Wer ist Rainer Hattenhauer? Bis zu meinem Wissensstand im September 2021 gibt es keinen öffentlich bekannten oder prominenten Menschen namens Rainer Hattenhauer. Daher kann ich keine Informationen zu dieser Person bereitstellen. Es ist möglich, dass sich seitdem Änderungen ergeben haben, aber ich kann diese aufgrund meiner Aktualisierungsgrenze im Jahr 2021 nicht berücksichtigen. Bitte prüfen Sie die aktuellsten Quellen, um genaue Informationen zu erhalten.
Anders sieht die Antwort bei aktiviertem Browsing-Plug-in aus. In diesen Fall wird das Netz durchkämmt, falls ChatGPT keine entsprechenden Antworten in seinem Trainingsdatenbestand findet (siehe Abbildung 5.5).
Abbildung 5.5 ChatGPT greift mit aktiviertem Browsing-Plug-in auf den Datenbestand des Live-Internets zurück.
Nun kannst du noch spezielle Fragen nachschieben: Besitzt Rainer Hattenhauer eine Homepage? Ja, Rainer Hattenhauer besitzt eine Homepage. Sie finden sie unter folgender URL: https://hattenhauer.org/.
213
5
KI im Alltag
Vorsicht bei live recherchierten Daten Zu beachten ist, dass es sich bei den über Browser-Plug-ins generierten Daten mehr oder weniger um reine Suchanfragen handelt, die man auch einfacher über Google, Bing & Co. erhalten könnte. Das Sprachmodell wurde in der Regel nicht mit den Suchdaten trainiert. Der Vorteil solcher Anfragen über ChatGPT besteht aber darin, dass sie mit den trainierten Daten des Sprachmodells verknüpft werden können.
5.2.3 Inhalte aus Dokumenten oder Webseiten verarbeiten Mithilfe geeigneter Plug-ins kannst du auch Zusammenfassungen von Webseiten oder Dokumenten von einer KI erstellen lassen. Bevor du eine Aufgabe an ChatGPT überträgst, die einen Onlinezugriff erfordert, muss ein entsprechendes Plug-in aktiviert sein. Im vorliegenden Beispiel ist dies das Plug-in WebPilot. Mit dessen Hilfe lassen sich Webseiteninhalte zusammenfassen, aber auch gezielte Fragen an Webseiten stellen. Installiere und aktiviere zunächst das Plug-in WebPilot (siehe dazu Kapitel 8, »KI für Fortgeschrittene«). Nun kannst du dir den Inhalt einer Webseite in knapper Form zusammenfassen lassen, ohne diese bis ins Detail gelesen zu haben (siehe Abbildung 5.6): Fasse mir den Inhalt der deutschen Wikipedia-Seite zum Thema "Quantenverschränkung" in einfachen Worten zusammen, sodass es auch ein Siebtklässler verstehen kann.
Abbildung 5.6 WebPilot in Aktion: Wenn du auf den Pfeil neben »Used WebPilot« klickst, erfährst du, wie das Plug-in an seine Informationen kommt.
214
5.2
Intelligent suchen
Das Interessante am vorliegenden Beispiel ist, dass noch nicht einmal eine konkrete URL übergeben wurde. Du kannst auf diese Weise auch Webseiten konkrete Fragen stellen, z. B.: Begib dich auf die folgende Webseite: https://www.steuertipps.de/lexikon. Beantworte mir die Frage, welche Fachzeitschriften ich als Fachliteratur von der Steuer absetzen kann. Die Kosten für die Anschaffung von Fachliteratur können als Werbungskosten bei den Einkünften aus nichtselbstständiger Arbeit, aus Vermietung und Verpachtung oder vor der Einführung der Abgeltungsteuer 2009 bei der Erzielung von Einkünften aus Kapitalvermögen abgesetzt werden. Sie können auch als Betriebsausgaben geltend gemacht werden. Die Voraussetzung für die Abzugsfähigkeit ist, dass die Fachliteratur eindeutig berufsbezogen ist oder mit der Erzielung von Einnahmen im Zusammenhang steht. Dies ist zum Beispiel beim Bezug von Fachzeitschriften (z. B. Betriebsberater) oder Fachbüchern der Fall, die mit der fachlichen Tätigkeit im Zusammenhang stehen. [...]
Du kannst mit einem weiteren Plug-in sogar PDFs Fragen stellen. Installiere dazu das Plug-in AskYourPDF und aktiviere es (siehe Kapitel 8, »KI für Fortgeschrittene«). Nach der Installation erkundigst du dich zunächst, wie man ChatGPT mit PDFs füttern kann. Wie kann ich dir ein PDF übergeben? Sie können mir einen Link zu einem PDF-Dokument geben, den ich dann herunterladen und analysieren kann. Alternativ können Sie das PDF-Dokument auf der Website von AskYourPDF hochladen und mir die resultierende Dokumenten-ID (doc_id) geben. Hier sind die Schritte: 1. Geben Sie mir den URL-Link zu Ihrem PDF-Dokument. Ich werde es dann herunterladen und analysieren. ODER 2. Laden Sie Ihr PDF-Dokument auf [AskYourPDF](https://askyourpdf.com/upload) hoch. 3. Nach dem Hochladen erhalten Sie eine Dokumenten-ID (doc_id). 4. Geben Sie mir diese doc_id, und ich kann dann spezifische Fragen zu Ihrem Dokument beantworten.
Beginnen wir mit der einfachen Variante: Du besitzt einen Link zu einer Internetseite, auf der sich Informationen in Form eines PDFs befinden. Dann übergib den Link einfach an ChatGPT bei aktiviertem Plug-in AskYourPDF (im Beispiel in Abbildung 5.7 übergebe
215
5
KI im Alltag
ich einen Link zu einer Informatikvorlesung von Prof. Dr. Norbert Pohlmann, Westfälische Hochschule Gelsenkirchen).
Abbildung 5.7 Die meisten Hochschullehrer*innen bieten ihre Vorlesungsinhalte mittlerweile als PDF an.
Nach der Verlinkung fasst ChatGPT schon einmal wesentliche Inhalte des Dokuments zusammen. Nun kannst du gezielt Fragen stellen, die auf der Basis des Dokuments beantwortet werden (siehe Abbildung 5.8).
Abbildung 5.8 Es können gezielte Fragen zu den gelesenen Dokumenten gestellt werden. Die Antworten beziehen sich auf die zugrunde liegenden Seiten im Dokument. Diese stimmen jedoch in der aktuellen Version des AskYourPDF-Plug-ins nicht immer mit den Seitenzahlen im PDF überein und sollten vor dem Zitieren überprüft werden.
216
5.2
Intelligent suchen
Das Ganze funktioniert im Übrigen auch sehr gut mit englischsprachigen Dokumenten. Man kann nach dem Einlesen der Datei Fragen in deutscher Sprache stellen und erhält auch die Antworten auf Deutsch.
Eigene Dokumente an AskYourPDF übergeben Mit einem kleinen Trick kannst du auch eigene Dokumente an ChatGPT/AskYourPDF übergeben. Lege dazu dein Dokument in einem Cloud-Speicher (Google Drive, OneDrive, Dropbox ...) ab und erstelle einen Freigabelink zu deinem Dokument. Diesen kannst du an AskYourPDF übergeben. Natürlich ist bei der beschriebenen Vorgehensweise zu beachten, dass deine Dokumente keinen sensiblen Daten enthalten sollten, da sie auf Servern in der Cloud abgelegt werden, die mitunter nicht DSGVO-konform sind.
5.2.4 Spezialisierte KI-Suchmaschinen Mittlerweile gibt es eine Vielzahl spezialisierter Suchmaschinen, die per KI aufgebohrt wurden. Microsofts Bing erlebte dank der Integration von ChatGPT eine echte Renaissance. Um diese leistungsfähige Verbindung zu testen, musst du dich mit einem Microsoft Konto auf www.bing.com anmelden. Als Browser bietet sich Microsoft Edge an, denn dort ist Bing Chat bereits integriert. Danach kannst du sofort loslegen und eine als Prompt formulierte (Such-)Fragestellung in das Chatfeld eingeben (siehe Abbildung 5.9).
Abbildung 5.9 Bing beherrscht die Suchabfrage per Prompt und liefert bei den Ergebnissen auch Verweise zu den Quellen.
217
5
KI im Alltag
Im Prinzip lassen sich alle Prompts, die du bisher kennengelernt hast, auch mit Bing realisieren. Das liegt daran, dass Bing das Sprachmodell von ChatGPT direkt verwenden kann, da Microsoft erhebliche Summen in OpenAI investiert hat. Aber es gibt noch weitere KI-basierte Suchmaschinen: you.com bietet eine Vielzahl spezialisierter KI-Tools an, unter anderem ein Sucheingabefeld auf der Startseite, das in Abbildung 5.10 bereits einen Beispiel-Prompt enthält.
Abbildung 5.10 you.com kann recherchierte Ergebnisse formatiert ausgeben.
Den Spezialisten Perplexity hast du bereits in Kapitel 3, »KI in Bildung und Wissenschaft«, kennengelernt. So bietet perplexity.ai unter anderem die Eigenschaft, Links zu den recherchierten Ergebnissen unter der Antwort aufzulisten (siehe Abbildung 5.11). Für Perplexity gibt es außerdem Plug-ins für die wichtigsten Browser (Chrome, Edge).
218
5.2
Intelligent suchen
Abbildung 5.11 Perplexity weiß auch Antworten zu exotischen Fragen und liefert zudem die Originallinks zu den recherchierten Ergebnissen. Die Antworten stehen oft in einem Mix aus deutscher und englischer Sprache.
Der große KI-Suchmaschinenüberblick Die Zeitschrift c’t hat die wichtigsten KI-basierten Suchmaschinen getestet. Du findest den Vergleich hier: http://r-wrk.de/mdxkt
5.2.5 KI-gestützte Bildsuche Veteran*innen der digitalen Fotografie kennen das leidige Problem: Man hat Tausende Bilder auf der Speicherkarte bzw. Festplatte liegen und sucht das eine, unwiederbringliche Motiv. Profis versehen die Fotos zu diesem Zweck mit sogenannten Tags, das sind kurze Stichwörter, die man in die sogenannten Metadaten der Datei schreibt, z. B. »Leuchtturm, Sonnenuntergang, Meer«. Angenommen, man hat im Urlaub 500 Fotos
219
5
KI im Alltag
gemacht und möchte diese nachträglich mit Tags versehen. Bei drei Tags pro Foto würde das bedeuten, dass du mindestens 1.500 Stichwörter erstellen müsstest – eine mehr als mühsame Arbeit. Wie schön wäre es da, wenn eine KI dir diese Arbeit abnehmen könnte. Tatsächlich hast du ein solches Verfahren bereits in Kapitel 4, »Kunst mit KI«, im Zusammenhang mit Midjourney kennengelernt: Die bildgenerierende KI ist in Verbindung mit dem Prompt /describe in der Lage, ein Foto stichwortartig zu beschreiben (ein Beispiel zeigt Abbildung 5.12). Es wird also nur eine Frage der Zeit sein, bis automatische Tagging-Tools in Adobe Lightroom, Photoshop & Co. Einzug halten.
Abbildung 5.12 Midjourney versieht ein Bild automatisch mit beschreibenden Tags.
Was genau passiert beim KI-gestützten Taggen von Bildern oder Videos? Die KI (im obigen Fall Midjourney) vergleicht Elemente der Szenerie mit dem eigenen Trainingsdatensatz. Übereinstimmungen werden mit den entsprechenden Schlüsselwörtern oder Tags markiert. Es gibt viele Werkzeuge, die bildbeschreibende KI verwenden. Ein Beispiel ist die umgekehrte Bildsuche von Google Lens, die dir Informationen zu dem Bildinhalt beschafft. Ein kleiner Test: Installiere (falls noch nicht geschehen) die Google-App auf deinem Smartphone und starte sie. Lens ist in der Google-App enthalten. Starte Lens, indem du auf das Kamerasymbol tippst. Setz dich nun vor deinen Computerbildschirm und such ein bekanntes Bild im Internet, z. B. die Mona Lisa. Betrachte das Bild mit Google Lens auf deinem Smartphone und drücke auf den Auslöser (siehe Abbildung 5.13).
220
5.2
Intelligent suchen
Abbildung 5.13 Google Lens identifiziert die Mona Lisa unter ihrem bürgerlichen Namen: Lisa del Giocondo.
Verlorene Handbücher und Manuals wiederfinden Die Identifikation von Objekten funktioniert nicht nur bei Berühmtheiten wie der Mona Lisa. Stell dir folgendes Szenario vor: Du besitzt ein technisches Gerät, z. B. eine Fernbedienung, deren Bedienungsanleitung du verloren hast. Nun möchtest du eine bestimmte Funktion der Fernbedienung herausfinden. So kannst du dir die Anleitung besorgen:
221
5
KI im Alltag
1. Verwende Google Lens, um den Namen des technischen Geräts bzw. dessen Typbezeichnung herauszufinden. 2. Führe eine Suchabfrage mit den Stichwörtern » manual pdf« durch. Du wirst unmittelbar zum Handbuch geleitet.
Abbildung 5.14 Google Lens ermittelt die Typbezeichnungen unbekannter Geräte.
222
6
KI für Coder
Kapitel 6 KI für Coder Es ist mehr oder weniger ein Abfallprodukt sprachgenerativer KIs: ChatGPT & Co. haben beim Trainieren ihres zugrunde liegenden Sprachmodells auch Unmengen an Programmcodezeilen durchlaufen und abgespeichert. Das hilft Programmiererinnen und Programmierern ungemein: Die Lösung von Standardproblemen ist nur einen Prompt weit entfernt, und auch bei neuen Problemstellungen liefert der Bot wertvolle Denkanstöße.
Coder – das ist der moderne Begriff für die Spezies der Programmiererinnen und Programmierer – sind seit der Veröffentlichung von ChatGPT & Co. elektrisiert. Mussten sie in der »guten, alten Zeit« noch kryptische Programmiersprachen wie C, Java oder Python lernen, so programmieren selbst Laien heute mithilfe von Chatbots in natürlicher Sprache, sprich Prompts. Mit diesen gelingt auch Anfängern der schnelle Einstieg in die Prinzipien der modernen Programmierung. Profis schätzen die Unterstützung durch GitHubs Copilot, um langweilige Standardaufgaben direkt vom KI-Bot lösen oder sich Denkanstöße bei neuen Problemen geben zu lassen. Dieses Kapitel zeigt dir einige Möglichkeiten der Prompt-gestützten Programmierung auf.
6.1 Programmieren lernen mit KI Obwohl es mithilfe des Plug-ins Code Interpreter bereits möglich ist, Code direkt in ChatGPT auszuführen (siehe Abschnitt 6.1.4), gehen wir zunächst anhand einiger Einstiegsbeispiele den klassischen Weg: Wir lassen uns von ChatGPT Code generieren, kopieren diesen in eine entsprechende Programmierumgebung (via Copy code, siehe Abbildung 6.1) und testen ihn dort. Es ist daher hilfreich, zumindest die Grundlagen der verwendeten Programmiersprache sowie die Programmierumgebung zu kennen.
223
6
KI für Coder
6.1.1 Erste Schritte Möchtest du eine Programmiersprache lernen, so bieten sich diverse Anleitungen auf YouTube & Co. an. Aber auch ChatGPT kann dir beim Einstieg helfen: Ich möchte die Grundlagen der Programmiersprache Python lernen. Kannst du mir dabei helfen?
Abbildung 6.1 Auszug aus der Antwort von ChatGPT. Der erzeugte Code kann bequem durch Anklicken der Schaltfläche »Copy code« in eine Programmierumgebung deiner Wahl kopiert werden. [...] Dies sind nur einige grundlegende Konzepte in Python. Du wirst auch über Themen wie Bedingungsanweisungen (if, elif, else), Dictionaries, Tuples und mehr lernen wollen. Außerdem solltest du dich mit wichtigen Konzepten wie Klassen und Objekten (in der objektorientierten Programmierung), Fehlerbehandlung (try, except) und Dateioperationen vertraut machen. Es gibt viele Ressourcen online, um Python zu lernen, einschließlich kostenlosen Tutorials, Videos und interaktiven Plattformen. Es ist auch sehr hilfreich, eigene kleine Projekte oder Übungen zu machen, um das Gelernte zu üben. Viel Spaß beim Lernen von Python!
Nehmen wir also an, du hast dir mithilfe von YouTube oder ChatGPT einige Grundlagen der Programmiersprache Python angeeignet. Dann lass uns ein erstes einfaches Programm bauen. Die Aufgabe lautet:
224
6.1 Programmieren lernen mit KI
Erstelle mir ein Python-Programm für folgende Aufgabe: Ein Anwender soll eine beliebige natürliche Zahl n nach Aufforderung eingeben. Das Programm bildet dann die Summe aller natürlichen Zahlen von der 1 bis zur Zahl n und gibt diese Summe aus.1 Natürlich, hier ist ein einfaches Python-Programm, das deine Anforderungen erfüllt: ```python def berechne_summe(n): return sum(range(1, n+1)) n = int(input("Bitte geben Sie eine natürliche Zahl ein: ")) summe = berechne_summe(n) print("Die Summe aller natürlichen Zahlen bis " + str(n) + " ist " + str(summe) + ".") ``` In diesem Programm fragt die `input()` Funktion den Benutzer nach einer Eingabe und wandelt sie mit `int()` in eine Ganzzahl um. Die Funktion `berechne_ summe(n)` berechnet die Summe aller natürlichen Zahlen von 1 bis n inklusive mit der eingebauten `sum()` Funktion und der `range()` Funktion. Schließlich wird das Ergebnis mit `print()` ausgegeben. Bitte beachten Sie, dass dieses Programm keine Fehlerbehandlung enthält, z. B. was passiert, wenn der Benutzer keine gültige natürliche Zahl eingibt. Eine vollständige Lösung würde auch solche Fälle behandeln.
Hier sieht man bereits einige interessante Eigenschaften der vom Bot generierten Antwort: Der Code ist sehr kompakt und seine Funktion wird am Ende ausführlich erklärt – eine ideale Vorgehensweise für Programmieranfänger. Schließlich werden noch Tipps gegeben, wie man das Programm verbessern könnte, z. B. durch eine Fehlerbehandlungsroutine. Möchtest du das Python-Programm testen, dann begib dich auf die Seite Google Colab2 (https://colab.research.google.com) und melde dich dort mit einem Google-Konto an. Erstelle ein neues Colab-Notebook durch Anklicken des Links Neues Notebook und kopiere den Code aus der Antwort des Chatbots in die Eingabezeile des Notebooks. Führe den Code schließlich durch Anklicken der vor der Codezeile befindlichen Play-Schaltfläche aus (siehe Abbildung 6.2).
1 Der Legende nach hat der berühmte Mathematiker Carl Friedrich Gauß diese Aufgabe mit n = 100 im Alter von 9 Jahren in kürzester Zeit im Kopf gelöst. 2 Bei Google Colab handelt es sich um eine Implementierung der beliebten Python-Programmierumgebung Jupyter Notebook.
225
6
KI für Coder
Abbildung 6.2 Mithilfe von Google Colab kannst du den Code aus ChatGPT in jedem beliebigen Browser testen. Der Programmname im linken oberen Bereich lässt sich jederzeit durch Anklicken ändern.
6.1.2 Klassische Algorithmen finden und nutzen ChatGPT enthält viele klassische algorithmische Probleme im Trainingsdatensatz. Zur Veranschaulichung ein Beispiel: Bei dem informatischen Problem »Die Türme von Hanoi«3 muss ein Turm von n unterschiedlich großen Scheiben, der sich auf einem Startstift befindet, auf einen anderen Zielstift überführt werden, siehe Abbildung 6.3.
Abbildung 6.3 Bei dem bekannten Problem »Die Türme von Hanoi« soll ein Stapel unterschiedlich großer Scheiben nach bestimmten Regeln von einem Stift auf einen anderen umgestapelt werden. 3 Siehe dazu auch: https://de.wikipedia.org/wiki/Türme_von_Hanoi
226
6.1 Programmieren lernen mit KI
Für die Bewegung der Scheiben steht ein dritter Stift als Hilfsplatz zur Verfügung. Die Bewegung der Scheiben hat nach den folgenden Regeln zu erfolgen: 1. Es darf immer nur eine Scheibe bewegt werden. 2. Es darf nie eine größere auf eine kleinere Scheibe gelegt werden. Die Aufgabe ist es, ein Programm zu schreiben, dass die Zugfolge für eine gegebene Anzahl von n Scheiben ermittelt. Lassen wir uns das Problem zunächst noch einmal von ChatGPT erklären: Erkläre mir das informatische Problem "Die Türme von Hanoi" Die Türme von Hanoi ist ein klassisches Problem in der Informatik und Mathematik, das oft zum Studium von Algorithmen und zur Einführung von Konzepten in der rekursiven Programmierung verwendet wird. Es handelt sich dabei um ein Spiel mit drei Stiften (oder "Türmen") und mehreren unterschiedlich großen Scheiben. Die Regeln des Spiels sind wie folgt: [...] Die Lösung für das Problem der Türme von Hanoi folgt einer rekursiven Strategie. Wenn wir "n" Scheiben haben und wir sie von Stift A nach Stift C bewegen wollen (wobei Stift B als Zwischenlager dient), dann können wir das Problem wie folgt lösen: 1. Bewegen Sie rekursiv "n-1" Scheiben von Stift A nach Stift B, wobei Stift C als Zwischenlager dient. 2. Bewegen Sie die größte (n-te) Scheibe von Stift A nach Stift C. 3. Bewegen Sie rekursiv die "n-1" Scheiben von Stift B nach Stift C, wobei Stift A als Zwischenlager dient. Auf diese Weise kann das Problem der Türme von Hanoi für jede Anzahl von Scheiben gelöst werden. Beachten Sie jedoch, dass die Anzahl der benötigten Schritte exponentiell mit der Anzahl der Scheiben zunimmt - das heißt, für jede zusätzliche Scheibe verdoppelt sich die Anzahl der benötigten Schritte.
Der Chatbot liefert somit neben den Regeln auch gleich die algorithmische Analyse und erkennt, dass das Problem am einfachsten rekursiv zu lösen ist. ChatGPT liefert auf Nachfrage den Code (siehe Abbildung 6.4): Schreibe mir ein Python-Programm zu dem Problem "Die genden Eigenschaften: Der Benutzer gibt zunächst die Das Programm ermittelt dann die Reihenfolge der Züge Bezeichnung: A ist der Startturm, B ist der Zielturm
Türme von Hanoi" mit folAnzahl der Scheiben ein. in der Form "A -> B". Zur und C ist der Hilfsturm.
Der Code wird schließlich, wie oben beschrieben, in Google Colab getestet und für gut befunden (siehe Abbildung 6.5).
227
6
KI für Coder
Abbildung 6.4 ChatGPT liefert nach der Beschreibung den vollständigen Code zum Problem »Die Türme von Hanoi«.
Abbildung 6.5 Google Colab führt den Python-Code aus und gibt die Zugfolge im Fall von vier Scheiben wieder.
228
6.1 Programmieren lernen mit KI
Der Algorithmus kann nun weiter analysiert werden. Eine wichtige Eigenschaft ist sein Zeitverhalten. Dieses wird mit dem folgenden Prompt ermittelt: Wie ist das Laufzeitverhalten des Algorithmus, d. h. wie ändert sich die Laufzeit t in Abhängigkeit von der Anzahl n der umzusetzenden Scheiben? Die Laufzeit des Algorithmus zur Lösung des Problems der Türme von Hanoi ist exponentiell in Bezug auf die Anzahl der Scheiben n. Genauer gesagt, der Algorithmus benötigt 2^n - 1 Züge, um das Problem zu lösen. [...]
Das Problem der Türme von Hanoi wurde ursprünglich 1883 von dem französischen Mathematiker Édouard Lucas erfunden. Er ersann dazu eine hübsche Geschichte, nach der indische Mönche versuchten, mit dieser Methode einen Turm aus 64 Scheiben im großen Tempel von Benares zu verschieben. Doch bevor ihnen dies gelang, sei das Ende der Welt gekommen und die Welt mitsamt den Scheiben und dem Tempel zu Staub zerfallen. Um den Wahrheitsgehalt dieser Aussage zu überprüfen, nehmen wir an, dass das Verschieben einer Scheibe 10 Sekunden dauert, und befragen dazu ChatGPT mit aktiviertem Wolfram-Plug-in. Prompt und Antwort zeigt Abbildung 6.6.
Abbildung 6.6 Die Gesamtzeit für die Bewegung von 64 Scheiben bei einer Zugzeit von 10 Sekunden ist recht beachtlich.
Stack Overflow weist ChatGPT die Tür! Die beliebte Programmiererseite Stack Overflow (https://stackoverflow.com), auf der sich viele Coder*innen tummeln und gegenseitig unterstützen, hat die Nutzung von ChatGPT zur Beantwortung von Fragen mittlerweile strikt untersagt – es widerspreche dem Prinzip der Eigenleistung.
229
6
KI für Coder
Du bist bei der Umsetzung von Programmierproblemen nicht auf spezielle Programmiersprachen beschränkt. Die Lösungen lassen sich universell auf beliebige Dialekte übertragen. Im obigen Beispiel erhält man ein C++-Programm durch folgende Anweisung (siehe Abbildung 6.7): Kannst du das obige Programm bitte in C++ formulieren?
Abbildung 6.7 ChatGPT beherrscht eine Vielzahl aktueller Programmiersprachen.
6.1.3 Debugging, Codeinterpretation und Dokumentation Unter Debugging versteht man die Fehlersuche in Programmen. ChatGPT beherrscht diese perfekt. Dazu kopiert man den Code per Copy-and-paste in den Prompt und lässt diesen analysieren.
230
6.1 Programmieren lernen mit KI
Du bist Spezialist für das Debuggen von Code. Ich werde dir nachfolgend einen Codeausschnitt übergeben. Untersuche diesen auf Fehler. Natürlich, ich helfe Ihnen gerne dabei, Fehler in Ihrem Code zu finden. Bitte geben Sie den Code ein, den ich überprüfen soll. def factorial(n): if n == 0: return 1 else: result = 1 for i in range(1, n): result *= i return result num = input("Geben Sie eine natürliche Zahl ein: ") print("Die Fakultät von", num, "ist", factorial(num)) In Ihrem Code gibt es zwei Fehler: 1. Bei der Berechnung der Fakultät einer Zahl durchläuft die Schleife `range(1, n)` die Zahlen von 1 bis `n-1`. Die richtige Implementierung wäre `range(1, n+1)` um die Zahlen von 1 bis `n` einzuschließen. 2. Die `input()` Funktion gibt einen String zurück, und Sie versuchen, diesen String in der Funktion `factorial()` zu verwenden, was zu einem Typfehler führt, da mathematische Operationen nicht auf Zeichenketten angewendet werden können. Sie müssen die Eingabe in eine Ganzzahl umwandeln, bevor Sie die Funktion `factorial()` darauf anwenden. Hier ist der korrigierte Code: [...] Dieser korrigierte Code wird nun korrekt arbeiten. Stellen Sie bitte sicher, dass der Benutzer eine natürliche Zahl eingibt, da sonst ein ValueError auftreten kann.
Interessant ist hier die Tatsache, dass ChatGPT erkannt hat, welchem Zweck das Programm dient. Die Fehler werden zielsicher erkannt. Es wird darüber hinaus eine Empfehlung gegeben, wie man gegebenenfalls einen Laufzeitfehler, der durch eine falsche Eingabe entsteht, abfangen kann. Sollen umfangreichere Programme analysiert werden, dann empfiehlt sich aufgrund der Limitierung der Eingabezeichen eine Übergabe des Codes per AskYourPDF, siehe Abschnitt 5.2.3, »Inhalte aus Dokumenten oder Webseiten verarbeiten«.
231
6
KI für Coder
Auch bei der Dokumentation von Programmcode – üblicherweise ein Stiefkind von Coder*innen – leistet ChatGPT wertvolle Hilfe. Übergib dem Bot einfach deinen Code und lass diesen mit Kommentaren versehen: Ich habe ein Python-Programm zur Berechnung von Primzahlen mithilfe des Siebs von Eratosthenes geschrieben. Ich habe den Programmcode allerdings nicht mit Kommentaren versehen. Bitte hole das für mich nach. Selbstverständlich, ich werde Ihnen gerne helfen, jedoch benötige ich zunächst den Programmcode, um Kommentare hinzufügen zu können. Bitte teilen Sie mir den Code mit. def Sieb(n): Primzahl=[True]*(n) i =2 while i*i