Der Polygraf als Entlastungsbeweis: Grenzen, Probleme und Lösungen bei der Begutachtung von Aussagen im Strafverfahren [1 ed.] 9783161618130, 9783161619113, 3161618130

Steht Aussage gegen Aussage, ist das Gericht mit der oft folgenschweren Frage konfrontiert, wem es Glauben schenken soll

116 67 2MB

German Pages [216] Year 2022

Table of contents :
Cover
Titel
Vorwort
Inhaltsverzeichnis
1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage
I. Ein paar Worte zur Sexualstrafrechtsreform
II. Wann genau steht Aussage gegen Aussage?
III. Von der „ureigenen Aufgabe“ und der richterlichen Überzeugung
1. Beweiswürdigung bei Aussage gegen Aussage
2. Der Sachverständige ist die Ausnahme
IV. Nonverbale Lügensignale, Menschenkenntnis oder der Wurf mit der Münze
V. Der Status quo
2. Kapitel: Die aussagepsychologische Begutachtung
I. Terminologie
1. Glaubhaftigkeit ist gleich „Wahrheit“?
2. Glaubwürdigkeit und Glaubhaftigkeit
II. Hypothesengeleitete Diagnostik
1. Quellen der Unwahrheit
2. Von der „Nullhypothese“ zur „Lügenhypothese“
a) Nullhypothese
b) Lügenhypothese und „Undeutsch-Hypothese“
c) Die Realkennzeichen der kriterienorientierten Aussageanalyse
d) Weniger wichtig: Konstanz und Motivation
3. Suggestion: „Tod der Inhaltsanalyse“?
III. Grenzen der kriterienorientierten Aussageanalyse
1. Kein ausreichendes Analysematerial
2. Manipulation, Aussagetraining und „Coaching“
3. Akteneinsicht
3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung: „gesunder Menschenverstand“ oder (Schein-)Wissenschaft?
I. „Herrschende Meinung“: eine wissenschaftlich fundierte Methode?
II. Validität der Aussagepsychologie
III. Allgemeines zu Validitätsstudien
1. Laborstudien
2. Feldstudien und das leidige Problem mit dem Außenkriterium
IV. Nur teilweise Bestätigung der Undeutsch-Hypothese
1. Kaum brauchbare Feldstudien
a) Die Anfänge
b) Eine deutsche Feldstudie
c) Hochwertig, aber ernüchternd
d) Drei neue Feldstudien
2. Realitätsfremde Laborstudien
3. Ein „glücklicher Umstand“: das Prinzip der Aggregation
V. Trefferquoten – und warum es nicht wirklich auf sie ankommt
1. Empirische Forschung zu den Trefferquoten
a) Zur Berechnung von Trefferquoten – Statistik für Juristen (Teil 1)
b) Studienanalyse zu den Trefferquoten
2. Auf was es wirklich ankommt
VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)
1. Der prädiktive Wert oder der „vermeintliche Beweiswert“
2. Die Bayes-Regel im Strafprozess
3. Ein Baumdiagramm zur Veranschaulichung
4. „Strafprozessuale Anfangswahrscheinlichkeit“
5. Likelihood-Quotient oder „abstrakte Beweiskraft“
VII. Zusammenfassung: Immerhin besser als die Münze
4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung
I. Das Urteil des Bundesgerichtshofs von 1998
1. Was bedeutet eigentlich „völlig ungeeignet“?
2. Auch beim Polygrafen geht es um den praktischen Nutzen
II. Warum der Polygraf kein „Lügendetektor“ ist
1. Das Instrument
2. Eine konkrete Lügenreaktion gibt es nicht: „no specific lie response“
3. Der Sachverständige
III. Den richtigen Reiz setzen: Methoden polygrafengestützter Glaubhaftigkeitsbegutachtung
1. Das theoretische Fundament
2. Direkte Methoden: Die Vergleichsfragenmethode
a) Gemeinsamkeiten
b) Die Probable-Lie-Technik
c) Das Numerische Scoring System
d) Schwächen der Probable-Lie-Technik
e) Die Directed-Lie-Technik
f) Anhang: Fragensequenz der Directed-Lie-Technik
3. Exkurs: Zur Impraktikabilität der Tatwissenstechnik
IV. Zum Vorwurf der Manipulierbarkeit: „Countermeasures“
5. Kapitel: „Zahlen lügen nicht“: warum der Polygraf kein völlig ungeeignetes Beweismittel ist
I. Einführung
II. Eine kurze Geschichte des ewigen psychophysiologischen Meinungsstreits
1. Das alte Problem der Repräsentativität von Laborstudien
2. Sind Feldstudien überhaupt geeignet?
III. Trefferquoten einschlägiger Feldstudien und der Beweiswert des Polygrafen
1. Die Feldstudie des Bundesgerichtshofs
2. Ein zweites Baumdiagramm
3. Vom Bundesgerichtshof nicht berücksichtigte „high quality field studies“
IV. Neue Forschung zur Vergleichsfragenmethode
1. Die Review des National Research Councils
2. Ein algebraischer Ansatz
3. Was Wiederaufnahmeverfahren mit dem Polygrafen zu tun haben
4. Hochwertige Feldstudien auf einen Blick
V. Eine Auswahl von Laborstudien
VI. Zwischenergebnis: Alles andere als „völlig ungeeignet“
6. Kapitel: Der Polygraf im Strafverfahren
I. Einführung
II. Freiwilligkeit ist und bleibt „zwingend“
III. Die Begutachtung des Beschuldigten
1. Kein Verstoß gegen § 136a StPO
a) Kein körperlicher Eingriff, keine körperliche Untersuchung, sondern Sachverständigenbeweis
b) Keine Täuschung im Sinne von § 136a Absatz 1 Satz 1 StPO
c) § 136a StPO analog: „Einblick in die Seele des Beschuldigten“?
2. Keine verfassungsrechtlichen Bedenken
3. „Richter sind auch nur Menschen“ oder: unzulässig aufgrund des „strafprozessualen Gesamtzusammenhangs“?
a) Mehr Begründungsaufwand ist kein Gegenargument
b) Nemo tenetur heißt auch, sich äußern zu dürfen
c) Das menschliche Problem, wenn der Beschuldigte schweigt
4. Warum nur ein entlastendes Ergebnis verwertbar ist
a) Alibi-Rechtsprechung „analog“
b) Der freundliche Gutachter: Gibt es ein „Friendly Examiner Syndrome“?
VI. Der Einsatz des Polygrafen beim Zeugen
1. Begutachtungspflicht beim Zeugen?
2. Die vom Zeugen gewünschte Begutachtung
3. Folgen einer verweigerten Begutachtung
7. Kapitel: Abschließende (statistische) Überlegungen: nicht „entweder oder“, sondern „sowohl als auch“
I. Indizienring, Gesamt-Likelihood-Quotient und Gesamtbelastungswahrscheinlichkeit
II. Ein letztes Baumdiagramm zur Kombinationslösung
8. Kapitel: Ein Blick in die Zukunft
I. Eine kurze Zusammenfassung
II. Zukunftsmusik
Schrifttum
Sachregister

Recommend Papers

Grundlagen und Grenzen der Begutachtung jugendlicher Rechtsbrecher 9783111510989, 9783111143248

162 81 23MB Read more

Wasser als Gemeinsames: Potenziale und Probleme von Commoning bei Konflikten der Wasserbewirtschaftung 9783839453766

Wasserkonflikte sind insbesondere in Zeiten von Klimawandel, Ressourcenübernutzung und sozialen Verwerfungen mitunter fo

146 103 3MB Read more

Tatprovokation als Ermittlungsmaßnahme: Rechtliche Grenzen der Beweiserhebung und Beweisverwertung beim Einsatz polizeilicher Lockspitzel im Strafverfahren [1 ed.] 9783428541454, 9783428141456

Tatprovokationen sind unter Zustimmung der Rechtsprechung des BGH fester Bestandteil der deutschen Strafverfolgung. Die

100 68 3MB Read more

Defizite bei der Umsetzung der EMRK im deutschen Strafverfahren: V-Leute, Lockspitzel, Telefonüberwachung von Rechtsanwälten [1 ed.] 9783428516469, 9783428116461

Ist es rechtmäßig, die Telefongespräche von Anwälten, Ärzten oder Journalisten uneingeschränkt abzuhören? Hat der Schutz

114 35 1MB Read more

Der Anfang als Freiheit: der Denkweg von Massimo Cacciari im Spannungsfeld von Philosophie und Theologie

Massimo Cacciari ist einer der bedeutendsten zeitgenossischen Philosophen Italiens. Dieses Buch ist die erste umfassende

116 98 2MB Read more

Die normativen Grenzen der Wahrheitserforschung im Strafverfahren: Ideen zu einer Kritik der Funktionsfähigkeit der Strafrechtspflege 9783899495843, 9783899495126

The normative limitations to the investigation of the truth in criminal trials represent the most complex and controvers

137 1 3MB Read more

Der gesetzliche Richter im Strafverfahren 9783110905953, 9783110170665

Die Arbeit untersucht den Stellenwert, der dem Verfassungsprinzip des gesetzlichen Richters (Art. 101 Abs. 1 S. 2 GG) im

158 88 65MB Read more

Aufgaben und Grundsätze des Arztes bei der Begutachtung von Unfallnervenkranken: Antrittsvorlesung gehalten am 14. Februar 1903 in der Aula der Universität Leipzig [Reprint 2022 ed.] 9783112691588

145 68 2MB Read more

Fehlerquellen medizinischer Begutachtung: Fälle und Probleme 9783111506395, 9783111139463

130 30 32MB Read more

Ökokonten und Flächenpools: Die rechtlichen Grundlagen, Möglichkeiten und Grenzen der Flächen- und Maßnahmenbevorratung als Ausgleichsmethoden im Rahmen der Eingriffsregelung im Städtebaurecht [1 ed.] 9783428524020, 9783428124022

Um das Problem des stetig zunehmenden Flächenverbrauchs zu bewältigen, haben Ökologie und Landschaftsplanung in den letz

108 5 2MB Read more

Der Polygraf als Entlastungsbeweis: Grenzen, Probleme und Lösungen bei der Begutachtung von Aussagen im Strafverfahren [1 ed.]
9783161618130, 9783161619113, 3161618130

Author / Uploaded
Johannes Makepeace

0 0 0
Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up

File loading please wait...

Citation preview

Veröffentlichungen zum Verfahrensrecht Band 190 herausgegeben von

Rolf Stürner

Johannes Makepeace

Der Polygraf als Entlastungsbeweis Grenzen, Probleme und Lösungen bei der Begutachtung von Aussagen im Strafverfahren

Mohr Siebeck

Johannes Makepeace, geboren 1992; Studium der Rechtswissenschaft in Regensburg; Rechtsreferendariat im Oberlandesgerichtsbezirk Nürnberg; Wissenschaftlicher Mitarbeiter am Lehrstuhl für Strafrecht, Strafprozessrecht, Wirtschaftsstrafrecht und Europäisches Strafrecht an der Universität Regensburg; 2022 Promotion; seit 2021 Rechtsanwalt in München.

ISBN 978-3-16-161813-0 / eISBN 978-3-16-161911-3 DOI 10.1628/978-3-16-161911-3 ISSN 0722-7574 / eISSN 2568-7255 (Veröffentlichungen zum Verfahrensrecht) Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliographie; detaillierte bibliographische Daten sind über http://dnb.dnb.de abrufbar. © 2023 Mohr Siebeck Tübingen. www.mohrsiebeck.com Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für die Verbreitung, Vervielfältigung, Übersetzung und die Einspeicherung und Verarbeitung in elektronischen Systemen. Das Buch wurde von epline in Böblingen aus der Times gesetzt, von Laupp & Göbel in Gomaringen auf alterungsbeständiges Werkdruckpapier gedruckt und dort gebunden. Printed in Germany.

Meinen Eltern

Vorwort Diese Arbeit wurde von der Fakultät der Rechtswissenschaften der Universität Regensburg im April 2022 als Dissertation angenommen. Schrifttum und Rechtsprechung konnten bis Juni 2022 berücksichtigt werden. Eine solche Arbeit schreibt sich nicht ohne hilfreiche Anregungen und Zuwendungen; die folgenden Seiten wären ohne mannigfaltige freundliche Unterstützung so nicht möglich gewesen. Besonders bedanken möchte ich mich für die hervorragende Betreuung bei meinem Doktorvater, Professor Dr. Tonio Walter, der mich von Anfang an ermutigt hat, mich diesem Thema zu widmen. Seine Rückmeldungen und Anregungen waren unerlässlich für das Gelingen dieser Arbeit. Sie entstand vorwiegend während meiner Zeit als wissenschaftlicher Mitarbeiter an seinem Lehrstuhl. Bedanken möchte ich mich daher auch bei Martina Kellermann, als Sekretärin in gewisser Weise das „Herz“ des Lehrstuhls, und Dr. Lukas Cerny, meinem Lehrstuhlkollegen, für die anregenden und freundschaftlichen Diskussionen. Professor Dr. Henning Ernst Müller danke ich für das zügige Erstellen des Zweitgutachtens. Gisela Klein und Charles R. Honts danke ich für ihre unersetzlich wertvollen Einblicke in die Praxis der polygrafengestützten, psychophysiologischen Glaubhaftigkeitsbegutachtung. Ich hoffe, diese Arbeit vermag meine aufrichtige Wertschätzung ihres Faches zum Ausdruck zu bringen. Ein besonderer Dank gilt meiner Schwester Marie Makepeace für das kritische Korrekturlesen meiner Arbeit und meiner Partnerin Anna Röder für ihren unermüdlichen Rückhalt und ihre Geduld. Schließlich bedanke ich mich von Herzen bei meinen Eltern, Elisabeth Makepeace-Vondrak und Robert Make peace, die mir meine Ausbildung ermöglicht und mich stets tatkräftig und bedingungslos unterstützt haben. Ihnen ist diese Arbeit gewidmet. München, im Juni 2022

Johannes Makepeace

Inhaltsverzeichnis Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII

1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage . . . . . . . . . . 1 I. Ein paar Worte zur Sexualstrafrechtsreform . . . . . . . . . . . . . . . . . . . . . . . 1 II. Wann genau steht Aussage gegen Aussage? . . . . . . . . . . . . . . . . . . . . . . . 5 III. Von der „ureigenen Aufgabe“ und der richterlichen Überzeugung . . . . 7 1. Beweiswürdigung bei Aussage gegen Aussage . . . . . . . . . . . . . . . . . . . . 7 2. Der Sachverständige ist die Ausnahme . . . . . . . . . . . . . . . . . . . . . . . . . . 9

IV. Nonverbale Lügensignale, Menschenkenntnis oder der Wurf mit der Münze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 V. Der Status quo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2. Kapitel: Die aussagepsychologische Begutachtung . . . . . . . . . . . . . . 15 I. Terminologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1. Glaubhaftigkeit ist gleich „Wahrheit“? . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2. Glaubwürdigkeit und Glaubhaftigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

II. Hypothesengeleitete Diagnostik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1. Quellen der Unwahrheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Von der „Nullhypothese“ zur „Lügenhypothese“ . . . . . . . . . . . . . . . . . . . a) Nullhypothese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . b) Lügenhypothese und „Undeutsch-Hypothese“ . . . . . . . . . . . . . . . . . . c) Die Realkennzeichen der kriterienorientierten Aussageanalyse . . . . . d) Weniger wichtig: Konstanz und Motivation . . . . . . . . . . . . . . . . . . . . 3. Suggestion: „Tod der Inhaltsanalyse“? . . . . . . . . . . . . . . . . . . . . . . . . . . .

19 20 20 23 24 26 28

III. Grenzen der kriterienorientierten Aussageanalyse . . . . . . . . . . . . . . . . . . 32 1. Kein ausreichendes Analysematerial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2. Manipulation, Aussagetraining und „Coaching“ . . . . . . . . . . . . . . . . . . . 34 3. Akteneinsicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

X

Inhaltsverzeichnis

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung: „gesunder Menschenverstand“ oder (Schein-)Wissenschaft? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 I. „Herrschende Meinung“: eine wissenschaftlich fundierte Methode? . . 39 II. Validität der Aussagepsychologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 III. Allgemeines zu Validitätsstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 1. Laborstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2. Feldstudien und das leidige Problem mit dem Außenkriterium . . . . . . . . 45

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese . . . . . . . . . . . . . . . 47 1. Kaum brauchbare Feldstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a) Die Anfänge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . b) Eine deutsche Feldstudie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . c) Hochwertig, aber ernüchternd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . d) Drei neue Feldstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Realitätsfremde Laborstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Ein „glücklicher Umstand“: das Prinzip der Aggregation . . . . . . . . . . . .

47 48 51 53 54 57 58

V. Trefferquoten – und warum es nicht wirklich auf sie ankommt . . . . . . . . 62 1. Empirische Forschung zu den Trefferquoten . . . . . . . . . . . . . . . . . . . . . . a) Zur Berechnung von Trefferquoten – Statistik für Juristen (Teil 1) . . b) Studienanalyse zu den Trefferquoten . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Auf was es wirklich ankommt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63 63 65 68

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 1. Der prädiktive Wert oder der „vermeintliche Beweiswert“ . . . . . . . . . . . 2. Die Bayes-Regel im Strafprozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Ein Baumdiagramm zur Veranschaulichung . . . . . . . . . . . . . . . . . . . . . . 4. „Strafprozessuale Anfangswahrscheinlichkeit“ . . . . . . . . . . . . . . . . . . . . 5. Likelihood-Quotient oder „abstrakte Beweiskraft“ . . . . . . . . . . . . . . . . .

70 73 78 79 81

VII. Zusammenfassung: Immerhin besser als die Münze . . . . . . . . . . . . . . . . . 85

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung . . 89 I. Das Urteil des Bundesgerichtshofs von 1998 . . . . . . . . . . . . . . . . . . . . . . 89 1. Was bedeutet eigentlich „völlig ungeeignet“? . . . . . . . . . . . . . . . . . . . . . 90 2. Auch beim Polygrafen geht es um den praktischen Nutzen . . . . . . . . . . . 91

II. Warum der Polygraf kein „Lügendetektor“ ist . . . . . . . . . . . . . . . . . . . . . 93 1. Das Instrument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 2. Eine konkrete Lügenreaktion gibt es nicht: „no specific lie response“ . . 94

Inhaltsverzeichnis

XI

3. Der Sachverständige . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

III. Den richtigen Reiz setzen: Methoden polygrafengestützter Glaubhaftigkeitsbegutachtung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 1. Das theoretische Fundament . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Direkte Methoden: Die Vergleichsfragenmethode . . . . . . . . . . . . . . . . . . a) Gemeinsamkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . b) Die Probable-Lie-Technik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . c) Das Numerische Scoring System . . . . . . . . . . . . . . . . . . . . . . . . . . . . . d) Schwächen der Probable-Lie-Technik . . . . . . . . . . . . . . . . . . . . . . . . . e) Die Directed-Lie-Technik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . f) Anhang: Fragensequenz der Directed-Lie-Technik . . . . . . . . . . . . . . . 3. Exkurs: Zur Impraktikabilität der Tatwissenstechnik . . . . . . . . . . . . . . . .

99 100 100 103 105 105 107 110 110

IV. Zum Vorwurf der Manipulierbarkeit: „Countermeasures“ . . . . . . . . . . . 112

5. Kapitel: „Zahlen lügen nicht“: warum der Polygraf kein völlig ungeeignetes Beweismittel ist . . . . . . 115 I. Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 II. Eine kurze Geschichte des ewigen psychophysiologischen Meinungsstreits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 1. Das alte Problem der Repräsentativität von Laborstudien . . . . . . . . . . . . 118 2. Sind Feldstudien überhaupt geeignet? . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

III. Trefferquoten einschlägiger Feldstudien und der Beweiswert des Polygrafen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 1. Die Feldstudie des Bundesgerichtshofs . . . . . . . . . . . . . . . . . . . . . . . . . . 122 2. Ein zweites Baumdiagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 3. Vom Bundesgerichtshof nicht berücksichtigte „high quality field studies“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

IV. Neue Forschung zur Vergleichsfragenmethode . . . . . . . . . . . . . . . . . . . . . 130 1. Die Review des National Research Councils . . . . . . . . . . . . . . . . . . . . . . 2. Ein algebraischer Ansatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Was Wiederaufnahmeverfahren mit dem Polygrafen zu tun haben . . . . . 4. Hochwertige Feldstudien auf einen Blick . . . . . . . . . . . . . . . . . . . . . . . .

130 133 135 136

V. Eine Auswahl von Laborstudien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 VI. Zwischenergebnis: Alles andere als „völlig ungeeignet“ . . . . . . . . . . . . 138

XII

Inhaltsverzeichnis

6. Kapitel: Der Polygraf im Strafverfahren . . . . . . . . . . . . . . . . . . . . . . . . 143 I. Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 II. Freiwilligkeit ist und bleibt „zwingend“ . . . . . . . . . . . . . . . . . . . . . . . . . . 144 III. Die Begutachtung des Beschuldigten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 1. Kein Verstoß gegen § 136a StPO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a) Kein körperlicher Eingriff, keine körperliche Untersuchung, sondern Sachverständigenbeweis . . . . . . . . . . . . . . . . . . . . . . . . . . . . b) Keine Täuschung im Sinne von § 136a Absatz 1 Satz 1 StPO . . . . . . c) § 136a StPO analog: „Einblick in die Seele des Beschuldigten“? . . . . 2. Keine verfassungsrechtlichen Bedenken . . . . . . . . . . . . . . . . . . . . . . . . . 3. „Richter sind auch nur Menschen“ oder: unzulässig aufgrund des „strafprozessualen Gesamtzusammenhangs“? . . . . . . . . . . . . . . . . . . a) Mehr Begründungsaufwand ist kein Gegenargument . . . . . . . . . . . . . b) Nemo tenetur heißt auch, sich äußern zu dürfen . . . . . . . . . . . . . . . . . c) Das menschliche Problem, wenn der Beschuldigte schweigt . . . . . . . 4. Warum nur ein entlastendes Ergebnis verwertbar ist . . . . . . . . . . . . . . . . a) Alibi-Rechtsprechung „analog“ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . b) Der freundliche Gutachter: Gibt es ein „Friendly Examiner Syndrome“? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

145 146 148 149 152 157 158 158 159 161 162 163

VI. Der Einsatz des Polygrafen beim Zeugen . . . . . . . . . . . . . . . . . . . . . . . . . 165 1. Begutachtungspflicht beim Zeugen? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 2. Die vom Zeugen gewünschte Begutachtung . . . . . . . . . . . . . . . . . . . . . . 167 3. Folgen einer verweigerten Begutachtung . . . . . . . . . . . . . . . . . . . . . . . . . 168

7. Kapitel: Abschließende (statistische) Überlegungen: nicht „entweder oder“, sondern „sowohl als auch“ . . . . . . . . . . . . . . . . 171 I. Indizienring, Gesamt-Likelihood-Quotient und Gesamtbelastungswahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 II. Ein letztes Baumdiagramm zur Kombinationslösung . . . . . . . . . . . . . . . . 174

8. Kapitel: Ein Blick in die Zukunft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 I. Eine kurze Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 II. Zukunftsmusik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 Schrifttum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 Sachregister . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

1. Kapitel

Beweiswürdigung bei Aussage gegen Aussage I. Ein paar Worte zur Sexualstrafrechtsreform Auch wenn seit dem 50. Strafrechtsänderungsgesetz vom 4. November 2016 bereits einige Jahre vergangen sind, erlaube ich mir dennoch ein paar einleitende Worte zur Sexualstrafrechtsreform, durch die die Struktur des 13. Abschnitts des Strafgesetzbuchs weitgehend verändert wurde.1 Besonders hervorheben möchte ich die tatbestandliche Neufassung des § 177 StGB. Ziel der Gesetzesnovelle war vor allem, dessen Anwendungsbereich auszuweiten, da er bestimmte Fallkonstellationen nicht erfasste, obwohl sie für strafwürdig befunden wurden.2 Ursprünglich setzte § 177 Absatz 1 StGB voraus, dass der Täter das Opfer zur Vornahme oder Duldung sexueller Handlungen nötigte, und zwar mit Gewalt, durch qualifizierte Drohung mit gegenwärtiger Gefahr für Leib oder Leben oder unter Ausnutzung einer Lage, in der das Opfer der Einwirkung des Täters schutzlos ausgeliefert war. Ausschlaggebend war somit nicht nur das Vorliegen eines entgegenstehenden Willens, sondern vor allem das Brechen eines solchen. Für die Strafbarkeit entscheidend war also ein von außen erkennbares, objektives Verhalten des Täters, durch das er sich über den entgegenstehenden Willen des Opfers hinwegsetzte, um die sexuelle Handlung zu erzwingen.3 Nicht erfasst waren Fälle, in denen der Täter einen entgegenstehenden Willen nicht durch Gewalt brechen musste, aber wusste oder billigend in Kauf nahm, dass das Opfer wegen besonderer Umstände keine Gegenwehr leistete – zum Beispiel weil es annahm, dem Angreifer ausgeliefert zu sein, obwohl die Lage objektiv nicht schutzlos war. Ferner blieben Fälle straflos, in denen das Opfer die Gegenwehr nicht aus Furcht vor Körperverletzungs- oder Tötungsdelikten unterließ, sondern aus anderen Motiven – etwa aus Furcht vor einer Kündigung, vor ausländerrechtlichen Konsequenzen oder aus Verlustängsten.4 Schließlich konnten auch die sogenannten Überraschungsfälle nicht als sexuelle Nötigung geahndet werden. Diese Fallgruppe ist dadurch gekennzeichnet, dass der Täter für das Opfer unvermittelt eine sexuelle Handlung an diesem vornimmt – etwa 1 2

BGBl. I S. 2460. BT-Drs. 18/8210, S. 7 f.; BT-Drs. 18/9097, S. 2. 3 Vgl. zu dem Erfordernis der „Finalität“ etwa BGH NStZ 2005, 268 (269). 4 Vgl. BT-Drs. 18/8210, S. 10 f.

2

1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage

ein „Busengrapschen“ oder ein Griff an Geschlechtsteile –, obwohl er zumindest billigend in Kauf nimmt, dass die sexuelle Handlung bei dem Opfer nicht auf Zustimmung stoßen wird. Eine Strafbarkeit nach dem 13. Abschnitt des Strafgesetzbuchs entfiel schon deshalb, weil das Opfer wegen der überraschenden Begehung nicht dazu kam, einen entgegenstehenden Willen zu bilden, den der Täter mit Zwang hätte beugen können.5 Durch die Neufassung des § 177 StGB wurden diese Strafbarkeitslücken im Sinne eines zeitgemäßen Verständnisses der Behauptung sexueller Selbstbestimmung geschlossen, indem die sogenannte „Nein heißt Nein“- oder „Nichteinverständnislösung“ implementiert wurde. Das physische Überwinden eines entgegenstehenden Willens ist jetzt nicht mehr erforderlich.6 Gemäß § 177 Absatz 1 StGB in seiner aktuellen Fassung reicht aus, dass der entgegenstehende Wille, das „Nein“ des Opfers, erkennbar ist und der Täter sich über diesen hinwegsetzt, ohne beispielsweise Gewalt anwenden zu müssen – was immerhin zu einer Absenkung der Mindeststrafe von einem Jahr auf sechs Monate geführt hat. Notwendig ist somit einerseits der entgegenstehende Wille des Opfers – also dessen subjektive, innere Einstellung; andererseits setzt die Strafbarkeit die Erkennbarkeit der Ablehnung voraus, und zwar für einen objektiven Dritten, der als „hypothetische Position“ gedacht wird.7 Das heißt das Nichtwollen des Opfers muss in einer objektiv erkennbaren, äußeren Handlung zum Ausdruck gebracht werden, sei es durch ausdrückliche Erklärung („Nein“) oder konkludentes Verhalten (zum Beispiel Weinen oder Abwehren der sexuellen Handlung).8 Eines weiteren objektiven Handlungselements bedarf es zur Erfüllung des Tatbestands aber nicht mehr; und eine Nötigung ist selbst für eine Vergewaltigung gemäß § 177 Absatz 6 Satz 2 Nummer 1 StGB – mit einer Mindeststrafe von weiterhin zwei Jahren – nicht mehr erforderlich.9 Anders bei § 177 Absatz 2 StGB: Hier muss weder ein entgegenstehender Wille des Opfers erkennbar sein, noch bedarf es – mit Ausnahme von § 177 Absatz 2 Nummer 5 StGB – Handlungen des Täters mit Nötigungscharakter. So genügt für eine Strafbarkeit nach § 177 Absatz 2 Nummer 1 StGB, dass der Täter für eine sexuelle Handlung eine Situation ausnutzt, in der das Opfer gar nicht erst in der Lage ist, einen entgegenstehenden Willen zu bilden oder zu 5 Vgl. BT-Drs. 18/9097, S. 25; in Betracht kam damals jedoch eine Strafbarkeit wegen (tätlicher) Beleidigung, T. Walter JR 2016, 361 (362). 6 BT-Drs. 18/9097, S. 2, 21; Hörnle NStZ 2017, 13 (14); kritisch Fischer § 177 Rn. 4; Deckers StV 2017, 410 (411): „Das Modellbild der Frau des 21. Jahrhunderts (selbstbestimmte – wohl auch selbstbewusste Wahl, Sexualkontakt aufzunehmen) wird ersetzt und das durch Scham oder Schüchternheit geprägte wehrlose oder gegen seinen eigenen Willen handelnde Opfergeschöpf zum verallgemeinerbaren Schutzobjekt eines Straftatbestandes stilisiert.“ 7 BT-Drs. 18/9097, S. 22 f.; Fischer NStZ 2019, 580 (581). 8 BT-Drs. 18/9097, S. 22 f.; kritisch zum konkludenten Verhalten Hörnle NStZ 2017, 13 (15); Lederer StraFo 2018, 280 (283). 9 Kritisch zur unterlassenen Anpassung des Strafrahmens bei der nun „gewaltfreien“ Vergewaltigung Deckers StV 2017, 410 (411).

I. Ein paar Worte zur Sexualstrafrechtsreform

3

äußern. Eine solche liegt zum Beispiel vor, wenn das Opfer aufgrund schwerster Behinderung schlicht nicht kommunizieren kann – dann greift in der Regel sogar der Qualifikationstatbestand § 177 Absatz 4 StGB –10 oder durch K.-o.Tropfen oder Alkoholkonsum das Bewusstsein verloren hat.11 Für eine Strafbarkeit nach § 177 Absatz 2 Nummer 2 StGB bedarf es auch dann keines objektiv erkennbaren Willens, wenn das Opfer – etwa bei Trunkenheit – zwar einen natürlichen Willen noch hätte bilden oder äußern können, es aber in dieser Fähigkeit erheblich eingeschränkt war und sich der Täter nicht der Zustimmung des Opfers versichert hat.12 Das läuft an dieser Stelle auf eine „Nur-Ja-heißt-Ja“-Lösung hinaus, „bei der jede einzelne sexuelle Handlung – auch innerhalb ein und desselben Geschlechtsaktes (zum Beispiel: Streicheln der Brust, dann Streicheln des Intimbereiches etc.) – vorab zwischen den beteiligten Sexualpartnern konsentiert sein muss.“13 In § 177 Absatz 2 Nummer 3 StGB sind schließlich die Überraschungsfälle normiert, in denen eine Willensbildung oder Willensäußerung logischerweise unmöglich ist, weil der Täter so schnell vorgeht, dass die sexuelle Handlung bereits geschehen ist, wenn das Opfer den Vorfall registriert oder wenn das Opfer zwischen Erkennen des Vorhabens und der sexuellen Handlung nicht mehr rechtzeitig mit einer Äußerung reagieren kann.14 Warum diese Ausführungen zur Sexualstrafrechtsreform? Ein Blick auf die Website des Statistischen Bundesamts zeigt, dass 2019 wegen Straftaten gegen die sexuelle Selbstbestimmung von insgesamt 11.542 Abgeurteilten – Personen, gegen die Strafbefehle erlassen wurden oder das gerichtliche Verfahren eröffnet und rechtskräftig durch Verurteilung oder Freispruch abgeschlossen worden ist15 – 8.782 verurteilt worden sind.16 Das ist seit 2008 die höchste Verurteilungszahl.17 Nun ist damit nicht gesagt, dass es in diesen Fällen allein auf die Aussage des mutmaßlichen Opfers ankam. Da Straftaten gegen die sexuel10 BT-Drs. 18/9097, S. 27; die Reformkommission empfiehlt, Absatz 4 zu streichen, da kein sachlicher Grund für eine Ungleichbehandlung gegenüber Menschen besteht, die sich aufgrund anderer Umstände in einem Zustand der Unfähigkeit zur Willensbildung oder -äußerung befinden, Bundesministerium der Justiz und für Verbraucherschutz Abschlussbericht, S. 303 f. 11 Beispiele nach Hörnle NStZ 2017, 13 (16). 12 Vgl. BT-Drs. 18/9097, S. 24; kritisch Renzikowski MK-StGB § 177 Rn. 76. 13 BT-Drs. 18/9097, S. 25; kritisch Eisele Schönke/Schröder § 177 Rn. 36–38; da § 177 Absatz 2 Nummer 2 StGB die Abgabe einer zustimmenden Erklärung fordert, die der Gesetzgeber Menschen mit erheblichen Einschränkungen immerhin ausdrücklich zutraut, ist richtigerweise auch für diesen Personenkreis ausreichend, dass der Täter sich erst strafbar macht, sobald er sich über einen erkennbaren Willen hinwegsetzt; § 177 Absatz 2 Nummer 2 StGB bedarf es daher nicht; so auch das Bundesministerium der Justiz und für Verbraucherschutz Abschlussbericht, S. 302 f. 14 Kritisch T. Walter JR 2016, 361 (363 f.). 15 Statistisches Bundesamt Strafverfolgung, Fachserie 10, Reihe 3, 2019, S. 13. 16 Statistisches Bundesamt Strafverfolgung, Fachserie 10, Reihe 3, 2019, S. 30 f. 17 Zu den Vorjahren siehe die Übersicht unter https://www-genesis.destatis.de/genesis/onl ine?sequenz=tabelleErgebnis&selectionname=24311-0001&sachmerkmal=STAT01&sachsch

4

1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage

le Selbstbestimmung aber meist zwischen zwei Personen ohne weitere Zeugen oder sachliche Beweismittel stattfinden, stehen Gerichte immer öfter vor einem kaum zu lösenden Beweisproblem:18 In solchen Verfahren bildet oft allein die Aussage des mutmaßlichen Opfers die Grundlage der Verurteilung. Der Behauptung des Opferzeugen, sexuell missbraucht worden zu sein, steht die Aussage des mutmaßlichen Täters gegenüber (wenn er sich denn überhaupt einlässt), die vorgeworfene sexuelle Handlung gar nicht oder mit Einverständnis des Zeugen vorgenommen zu haben. Da selbst eine Vergewaltigung nunmehr ohne das Erfordernis einer Nötigung oder einer hilflosen Lage verwirklicht werden kann, so dass einer Verurteilung nicht mehr entgegensteht, wenn etwa objektiv nachweisbare Spuren am Körper des Opfers fehlen, reichen die Angaben des mutmaßlichen Opfers zu rein psychischen Prozessen und deren objektiv erkennbaren Verhaltensäußerungen bereits für eine Verurteilung aus; Schilderungen zu etwaigen Abwehrhandlungen zum Beispiel bedarf es nicht mehr. Diese mit der Sexualstrafrechtsreform gewonnene Beweiserleichterung ist sicher plausibel, soll doch laut Gesetzgeber der freie „Wille des Opfers […] in das Zentrum der Verletzung der sexuellen Selbstbestimmung gestellt werden“, ohne dass es auf Zwang und Gewalt ankommt.19 Zwar verspricht diese Beweiserleichterung einerseits eine höhere Erfolgswahrscheinlichkeit der Strafanzeige und soll so das Anzeigeverhalten positiv beeinflussen. Andererseits erhöht sie aber das Risiko „erfolgreicher“ Falschbeschuldigungen.20 Max Steller, einer der renommiertesten Aussagepsychologen Deutschlands, schätzt, dass 30 Prozent aller Vergewaltigungsanzeigen unbegründet sind.21 Der Hamburger Rechtsmediziner Klaus Püschel legte für das Jahr 2009 – also noch vor der Reform – konkretere Zahlen vor: Von 132 Frauen, die bei der ärztlichen Untersuchung angaben, vergewaltigt worden zu sein, hielten die Ärzte 27 Prozent der vorgezeigten Verletzungen für fingiert, 33 Prozent für echt. Bei den restlichen 40 Prozent konnte der Grund für die Verletzungen nicht sicher ermittelt werden. Geht man für diesen Rest von einer 50-50-Wahrscheinlichkeit aus, liegt die Zahl der Falschbezichtigungen bei etwa 50 Prozent.22 Falschbeschuldigungen gab es zwar schon immer; das belegt eine stetig wachsende Liste berühmt-berüchtigter Justizirrtümer, von Horst Arnold und luessel=STGBOV-20,STGBOV-21,STGBOV-22#abreadcrumb, zuletzt abgerufen am 10. Juni 2022. 18 Hofmann Praxis der Rechtspsychologie 27 (2017) S. 7 (17 f.); Wolters/Noltenius SKStGB § 177 Rn. 15; von „strafrechtlichem Neuland“ spricht Hoffmann NStZ 2019, 16 (ebd.). 19 BT-Drs. 18/9097, S. 21; vgl. auch Hörnle ZStW 127 (2016) S. 851 (885 f.). 20 Vgl. Eschelbach BeckOK-StPO § 261 Rn. 59; Lederer/Deckers Praxis der Rechtspsychologie 27 (2017) S. 75 (ebd.); T. Walter JR 2016, 361 (367); anderer Ansicht offenbar Hörnle ZStW 127 (2016) S. 851 (869 in Fn. 70). 21 Steller Wahrheit, S. 17. 22 Zitiert nach Rückert, „Zwei blaue Flecke und ein Nullbefund“, Die Zeit vom 24. Februar 2011, S. 18, abrufbar unter https://www.zeit.de/2011/09/WOS-Kachelmann, zuletzt abgerufen am 13. Juni 2022.

II. Wann genau steht Aussage gegen Aussage?

5

Jörg Kachelmann bis Ralf Witte – ganz zu schweigen von den „Wormser Prozessen“.23 Je voraussetzungsärmer ein Straftatbestand aber ist – und bei § 177 Absatz 1 StGB kommt es für den äußeren Tatbestand nun einmal allein auf einen objektiv erkennbaren entgegenstehenden Willen an –, desto wahrscheinlicher ist es, dass nicht nur eine berechtigte, sondern auch eine bewusst oder unbewusst falsche Anzeige Erfolg hat. Nach neuer Rechtslage muss eine Person lediglich behaupten, eine in Wirklichkeit einvernehmliche sexuelle Handlung habe gegen ihren erkennbaren Willen stattgefunden. Und da hinsichtlich des inneren Tatbestands Eventualvorsatz genügt, der mutmaßliche Täter also einen etwaigen entgegenstehenden Willen bloß für möglich halten und billigend in Kauf nehmen muss – was schnell bejaht ist –, erhöht sich die Gefahr falscher Verurteilungen.

II. Wann genau steht Aussage gegen Aussage? Das neue Sexualstrafrecht verschärft daher das Problem sogenannter Aussagegegen-Aussage-Konstellationen.24 Grundsätzlich ist darunter eine Verfahrenssituation zu verstehen, in der die Sachverhaltshypothese von einer einzigen Aussage und ihrem Beweiswert abhängt.25 Typischerweise steht dann der Einlassung des Angeklagten eine davon im Kern abweichende Schilderung durch den einzigen Belastungszeugen gegenüber, ohne dass ergänzend auf unmittelbar tatbezogene Beweismittel zurückgegriffen werden könnte.26 Mit den Worten Pfisters: Der Angeklagte behauptet „Hü“, der Zeuge sagt „Hott“, und weitere Beweismittel stehen nicht zur Verfügung.27 Obgleich die Bezeichnung begrifflich nicht passt, liegt eine solche Situation auch dann vor, wenn der Beschuldigte selbst keine Aussage tätigt und von seinem Schweigerecht Gebrauch macht, und zwar sowohl wenn er sich überhaupt nicht äußert28 als auch wenn er pauschal bestreitet und im Übrigen 23 Vgl. nur Heintschel-Heinegg Breidling-FS, S. 143 (144 f.); Püschel StraFo 2015, 269 (270); T. Walter JR 2016, 361 (367 f.); jeweils mit weiteren prominenten Beispielen und Nachweisen. 24 Bundesministerium der Justiz und für Verbraucherschutz Abschlussbericht, S. 50 f.; diese Konstellation ist soweit ersichtlich erstmals 1987 vom Bundesgerichtshof angesprochen worden, BGHR StPO § 261 Beweiswürdigung 1 (3 StR 141/87); vgl. Pfister Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 99 (111). 25 Herdegen NJW 2003, 3513 (ebd.). 26 BGH StV 2002, 469 (ebd.); Deckers Hamm-FS, S. 53 (57); Velten SK-StPO § 261 Rn. 36. 27 Pfister Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 99 (112). 28 So ursprünglich der Zweite Strafsenat, BGH StV 1998, 250 (ebd.); dieser Rechtsprechung haben sich der Vierte und Fünfte Strafsenat angeschlossen, BGH NStZ 2013, 180 (181); StV 2019, 524 (ebd.); siehe auch OLG Hamburg NStZ 2015, 105 (107); Sander LR § 261 Rn. 107.

6

1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage

schweigt.29 Teilweise anders sieht das der Dritte Strafsenat: Eine Aussage-gegen-Aussage-Konstellation sei nicht gegeben, wenn der in der Hauptverhandlung schweigende Angeklagte zuvor vor einem Sachverständigen zum Zwecke der Exploration bestreitende Angaben gemacht habe.30 Auch liege eine solche Situation nicht vor, wenn es sich bei der bestreitenden Einlassung um eine schriftliche Verteidigungserklärung handle, die erst im Laufe des zweiten Hauptverhandlungsdurchgangs in Kenntnis des wesentlichen Teils des Beweisergebnisses abgegeben werde und die sich der Angeklagte lediglich als Einlassung zu eigen mache.31 Eine solche formalistische Interpretation ist sicher nicht falsch, ändert aber nichts an der unter solchen Umständen eingeschränkten Beweissituation, dass nur eine belastende Aussage vorhanden ist – ungeachtet dessen, wie man sie bezeichnet.32 Das erkennt auch der Dritte Strafsenat und stellt darauf ab, dass die Belastungsaussage „in ihrer Gesamtheit“ in den Blick zu nehmen ist.33 Dieselbe Beweisarmut und die damit einhergehenden Anforderungen an die Beweiswürdigung liegen zudem vor, wenn sich nicht nur zwei Aussagen gegenüberstehen, sondern wenn mehrere belastende Aussagen einem „Lager“ zuzuordnen sind – zum Beispiel Familienangehörige oder Freunde des Belastungszeugen.34 Unter solchen Umständen liegt beweisrechtlich keine weitere unabhängige Aussage vor, so dass eine solche Situation einer Aussage-gegen-Aussage-Konstellation zumindest nahekommt.35 Zusammenfassend liegt eine Aussage-gegen-Aussage-Konstellation vor – beziehungsweise eine Verfahrenssituation mit derselben Beweisarmut –, wenn der belastenden Aussage einer Aussageperson oder wenn belastenden Aussagen, die demselben Lager zuzuordnen sind, eine im Kern bestreitende Darstellung oder das Schweigen des Angeklagten gegenübersteht, ohne dass andere unabhängige, unmittelbar tatbezogene Beweismittel verfügbar wären.36 29 BGH StV 2002, 466 (467): kein Fall des sogenannten Teilschweigens; siehe auch Brause NStZ 2013, 129 (130). 30 BGH, Beschluss vom 22.3.2005 – 3 StR 47/05 = BeckRS 2005, 4769. 31 BGH NStZ 2003, 498 (499); unabhängig davon lag in diesem Verfahren keine „klassische“ Aussage-gegen-Aussage-Konstellation vor, da die Belastungsaussage anderweitig bestätigt werden konnte. 32 So auch Brause NStZ 2013, 129 (130); Schmandt StraFo 2010, 446 (ebd.). 33 BGH NStZ 2003, 498 (499). 34 OLG Frankfurt am Main StV 2011, 12 (13); OLG Karlsruhe StraFo 2005, 250 (ebd.); zustimmend Eisenberg Beweisrecht, Rn. 1488 in Fn. 321; Staudinger StV 2019, 834 (835 f.); Stuckenberg KMR § 261 Rn. 66; anderer Ansicht KG StraFo 2019, 164 (ebd.); jedoch lagen in diesem Verfahren streng genommen weitere Beweismittel vor wie Lichtbilder und ein Arztbericht, die die Angaben der Zeugen bestätigten; anders noch KG StV 2019, 181 (183): in diesem Verfahren wurde die belastende Aussage des mutmaßlichen Opfers durch ihre Schwester bestätigt, die aufgrund ihrer „familiären Verbundenheit“ demselben „Lager“ zuzuordnen sei, so dass die Verfahrenssituation einer Aussage-gegen-Aussage-Konstellation nahekomme. 35 Deckers Hamm-FS, S. 53 (59); Kannegießer/Eisenberg NStZ 2019, 361 (362). 36 Angelehnt an Deckers StraFo 2010, 372 (375).

III. Von der „ureigenen Aufgabe“ und der richterlichen Überzeugung

7

III. Von der „ureigenen Aufgabe“ und der richterlichen Überzeugung Steht nun eine Aussage des Zeugen gegen die des Beschuldigten, stellt sich für den Richter die Frage, welcher Aussage er Glauben schenkt. Denn die Würdigung des einzigen Belastungsbeweises bei einer solchen Aussage-gegen-Aussage-Konstellation, der Aussage des Belastungszeugen, obliegt als „ureigene Aufgabe“ allein dem Tatrichter.37 Nur wenn er im Sinne des § 261 StPO überzeugt ist, die Aussage des Zeugen entspreche der Wahrheit und sei nicht erfunden, darf es zu einer Verurteilung kommen. Nach ständiger Rechtsprechung genügt für eine Verurteilung grundsätzlich ein „nach der Lebenserfahrung ausreichendes Maß an Sicherheit, das vernünftige Zweifel nicht aufkommen lässt“.38 Und solche Zweifel sind gegeben, wenn die Beweiswürdigung ansonsten nicht auf einer tragfähigen, verstandesmäßig einsehbaren, objektiven Tatsachengrundlage beruht.39 Die subjektive Überzeugung nach § 261 StPO hat somit ein rationales, objektives Fundament und muss allgemein anerkannte Erfahrungssätze ebenso beachten wie die Denkgesetze der Logik und die Regeln statistischer Wahrscheinlichkeitsrechnung.40 Ohne eine solche objektive Umgrenzung liefe das Begründungserfordernis nach § 267 StPO nämlich leer, und die Beweiswürdigung wäre willkürlich, wenn ein Richter seine Entscheidung auf rein subjektive Annahmen stützt.41

1. Beweiswürdigung bei Aussage gegen Aussage Aber wie kommt das Gericht nun zu dem Ergebnis, die belastende Aussage sei glaubhaft? Und zwar so, dass „vernünftige Zweifel“ nicht mehr aufkommen? Auf welchen „objektiven Boden“ darf sich ein Richter stellen? Denn immerhin 37

BGH, Urteil vom 8.7.2020 – 5 StR 80/20 (Rn. 9), insoweit nicht abgedruckt in NStZRR 2020, 286; StV 2020, 446 (447); NStZ-RR 2006, 241 (ebd.); NStZ-RR 2006, 242 (243); siehe auch BGHSt. 8, 130 (131); 23, 8 (12); Becker LR § 244 Rn. 84; Fischer NStZ 1994, 1 (2); Frister SK-StPO § 244 Rn. 61; Krehl KK § 244 Rn. 51; Schmitt Meyer-Goßner/Schmitt § 261 Rn. 3; Stuckenberg KMR § 261 Rn. 62. 38 BGHSt. 58, 212 (215); BGH NStZ-RR 2010, 85 (ebd.); die oft zu lesende, aber missverständliche Formel von der „an Sicherheit grenzender Wahrscheinlichkeit“ ist abzulehnen, da sie nicht die erforderliche subjektive Gewissheit des Richters ersetzen kann, Ott KK § 261 Rn. 2; Sander LR § 261 Rn. 11; eine „mathematische, jede andere Möglichkeit ausschließende Gewissheit“ ist ebenso wenig erforderlich, BGHSt. 58, 212 (215). 39 Vgl. Schluckebier SSW-StPO § 261 Rn. 16. 40 Vgl. BGHSt. 58, 212 (214); BGH NStZ 2016, 490 (492 f.); NStZ 1988, 236 (237); NJW 2019, 945 (ebd.); StV 1993, 510 (511); Fezer StV 1995, 95 (97); Herdegen NJW 2003, 3513 (3515 f.); Nack NJW 1983, 1035 (1036); Neuhaus MAH Strafverteidigung § 61 Rn. 44; Sander LR § 261 Rn. 10; Schluckebier SSW-StPO § 261 Rn. 19 f.; Schweizer, S. 131 f. 41 Geipel Beweiswürdigung, § 9 Rn. 49; Sander LR § 261 Rn. 14.

8

1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage

zeigt die Rechtspraxis, dass das Vorhandensein einer einzigen Zeugenaussage grundsätzlich für eine Verurteilung genügen kann.42 Der Bundesgerichtshof hat sich zu diesen Fragen mehrfach geäußert und stellt in Fällen, bei denen Aussage gegen Aussage steht, besondere Anforderungen an die Darlegung einer zur Verurteilung führenden Beweiswürdigung, die von Verfassungs wegen geboten sind.43 Aus den Urteilsgründen muss sich in solchen Fällen ergeben, „dass das Tatgericht alle Umstände, welche die Entscheidung zu Gunsten oder zu Ungunsten des Angeklagten zu beeinflussen geeignet sind, erkannt, in seine Überlegungen einbezogen und in einer Gesamtschau gewürdigt hat.“44 Es bestehe eine erhöhte Aufklärungspflicht.45 Und das Gericht dürfe grundsätzlich kein erkennbares Beweismittel ungenutzt lassen, wenn nur die entfernte Möglichkeit bestehe, dass die Erhebung des Beweises zu einer Änderung der durch die bisherige Beweisaufnahme begründeten Vorstellung von dem zu beurteilenden Sachverhalt führen könne.46 Das gelte grundsätzlich auch für einen Beweis mit nur gemindertem, geringem oder zweifelhaftem Beweiswert, der daher (zu Recht) nicht mit völliger Ungeeignetheit im Sinne des § 244 Absatz 3 Satz 2 Nummer 4 StPO gleichgesetzt werden dürfe.47 Wichtiger und oft einziger Bestandteil dieser Gesamtschau ist die Analyse der Aussage des mutmaßlichen Opfers. Erforderlich sind – so der Bundesgerichtshof – im Besonderen eine sorgfältige Prüfung des Inhalts und der Entstehungsgeschichte der Aussage sowie eine Bewertung des Aussagemotivs.48 – Diese Vorgaben entsprechen weitgehend der aussagepsychologischen Glaubhaftigkeitsbegutachtung, für die der Erste Strafsenat des Bundesgerichtshofs 1999 Mindeststandards formulierte und um die es im Folgenden gehen soll.49

42 Vgl. nur BGHSt. 44, 153 (158); BGH NStZ-RR 2003, 333 (334); Eschelbach Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 43 (47 f.); Ott KK § 261 Rn. 100. 43 BVerfG NStZ-RR 2003, 299 (300–302); zur ständigen Rechtsprechung BGHSt. 44, 153 (158 f.); BGH NStZ-RR 2021, 24 (ebd.); StV 2020, 446 (447); 2019, 519 (520); NStZ-RR 2018, 220 (220 f.). 44 BGH StV 2020, 446 (447); zum Gebot erschöpfender Beweiswürdigung auch Miebach MK-StPO § 261 Rn. 108; Velten SK-StPO § 261 Rn. 35 f. 45 Vgl. BGH NStZ-RR 2003, 205 (206); StV 2003, 429 (430); Deckers Hamm-FS, S. 53 (57); Jansen Zeuge, Rn. 52. 46 BGH NStZ-RR 2003, 205 (206); explizit bei Aussage gegen Aussage auch Becker LR § 244 Rn. 49; Eisenberg Beweisrecht, Rn. 11 f. 47 BGH NStZ 2008, 116 (ebd.); ebenso, wenn aus einem Beweis nur Schlussfolgerungen „aus dem untersten Wahrscheinlichkeitsbereich“ gezogen werden könnten, BGH StV 1997, 338 (339). 48 BGH NStZ-RR 2021, 24 (ebd.); StV 2020, 446 (447); NStZ-RR 2018, 220 (221); Geipel Beweiswürdigung, § 26 Rn. 2; Schluckebier SSW-StPO § 261 Rn. 39. 49 BGHSt. 45, 164, und ergänzend BGH NStZ 2001, 45.

III. Von der „ureigenen Aufgabe“ und der richterlichen Überzeugung

9

2. Der Sachverständige ist die Ausnahme Bei der Beurteilung und folglich Begutachtung der Glaubhaftigkeit der Aussage ist ein Richter nicht verpflichtet, sich eines Sachverständigen zu bedienen. Im Gegenteil dürfen sich Richter grundsätzlich die Beurteilung der Glaubhaftigkeit der Aussage selbst zutrauen.50 Und dass sie dies in den meisten Verfahren auch tun, belegen mittlerweile mehrere Studien.51 Der Hinzuziehung eines Sachverständigen bedarf es allerdings, wenn die „Eigenart und besondere Gestaltung des Falles eine Sachkunde erfordern, die ein Richter (auch mit speziellen forensischen Erfahrungen) normalerweise nicht hat.“52 Was einen solchen besonders gestalteten Fall ausmacht, bleibt zwar weitgehend unbeantwortet.53 Ein Fall von Aussage gegen Aussage zählt jedoch grundsätzlich nicht dazu.54 Dies gilt vor allem bei erwachsenen Belastungszeugen.55 Das mag verwundern, haben Strafrichter doch mangels entsprechender Ausbildung nur selten fundierte aussagepsychologische Kenntnisse.56 Dann liegt es also an der persönlichen Einschätzung, Menschenkenntnis und Erfahrung des Richters, welcher Aussage er Glauben schenkt und welcher nicht.57 So heißt es nur, er sei gut beraten, sich an den vom Bundesgerichtshof aufgestellten Anforderungen zu orientieren, wenn er auf einen Sachverständigen verzichtet.58 – Dass eine solche Rechtspraxis wohl im Widerspruch steht zu der bereits erwähnten Rechtsprechung des Bundesgerichtshofs, soll an dieser Stelle nicht weiter vertieft werden. Diese verlangt immerhin, grundsätzlich kein Beweismittel ungenutzt zu lassen, das zumindest zu einer Änderung der durch 50

BGH NStZ-RR 2006, 241 (ebd.); Schmitt Meyer-Goßner/Schmitt § 261 Rn. 3. Zu diesen Barton „Vom hochgemuten, voreiligen Griff nach der Wahrheit“, S. 199 (201 f.); anders offenbar Bublitz ZIS 2021, 210 (ebd.). 52 BGHSt. 23, 8 (12); BGH NStZ 1997, 355 (356). 53 Barton „Vom hochgemuten, voreiligen Griff nach der Wahrheit“, S. 199 (211); Pfister Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 99 (103 f.); Krehl KK § 244 Rn. 54; jeweils mit Nachweisen. 54 Fischer Widmaier-FS, S. 191 (222); Heintschel-Heinegg Breidling-FS, S. 143 (155); Pfister Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 3 (10); Sättele SSWStPO § 244 Rn. 65; nur „ausnahmsweise“ Becker LR § 244 Rn. 84; Schluckebier SSW-StPO § 261 Rn. 40: Aussage-gegen-Aussage bei Angaben von Kindern oder Jugendlichen zu Sexualdelikten. 55 Kritisch Deckers Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (193). 56 Dazu Geipel Beweiswürdigung, § 31 Rn. 5 f.; Malek StV 2011, 559 (561–563); Stuckenberg KMR § 261 Rn. 29; von einer „Lebenslüge der Strafjustiz“ schreibt Püschel StraFo 2015, 269 (275). 57 BGHSt. 3, 27 (28); BGH NStZ 2005, 394 (ebd.); Becker LR § 244 Rn. 84; Miebach MK-StPO § 261 Rn. 219. 58 Vgl. BGH NStZ-RR 2018, 220 (221); Deckers Hamm-FS, S. 53 (55); Fischer Widmaier-FS, S. 191 (206 f.); Häcker Bender/Häcker/Schwarz, Rn. 342; Nack StV 2002, 558 (559); Ott KK § 261 Rn. 112; Sander LR § 261 Rn. 129; Schluckebier SSW-StPO § 261 Rn. 41. 51

10

1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage

die bisherige Beweisaufnahme begründeten Sachverhaltsvorstellung führen könnte.59

IV. Nonverbale Lügensignale, Menschenkenntnis oder der Wurf mit der Münze Eine bessere und zulässige Alternative zum Sachverständigen, deren sich ein Richter bedienen kann, gibt es bislang nicht, um zu erkennen, ob ein Zeuge die Wahrheit spricht – auch wenn der Eindruck besteht, Gerichte ließen sich nach wie vor von rein physischen Reaktionen wie Erröten, Stottern, Schwitzen oder Weinen leiten.60 Dass solche körperlichen, nonverbalen Reaktionen nicht geeignet sind, die Glaubhaftigkeit einer Aussage zu bestimmen und eine Lüge erkennen zu lassen, wurde mehrfach empirisch nachgewiesen und sollte mittlerweile eigentlich unstreitig sein.61 Ein für Lügen typisches Verhaltensmuster, das mit dem bloßen Auge zu erkennen ist, gibt es nicht. Verwiesen sei nur auf die umfangreiche Meta-Analyse von DePaulo et al. aus dem Jahr 2003, die anhand von insgesamt 116 Einzelstudien gezeigt hat, dass es kaum Verhaltensunterschiede zwischen Lügnern und Nicht-Lügnern gibt, und wenn überhaupt, sind diese nur unbedeutend gering.62 Im Gegenteil konnte die Studie belegen, dass die nonverbalen Merkmale, die man typischerweise mit einer Lüge assoziiert, in Wirklichkeit nichts mit einer solchen zu tun haben.63 Ebenfalls abzulehnen – da vollkommen untauglich – sind die in Kindesmissbrauchsverfahren früher durchaus beliebten „Methoden“ wie der Einsatz sogenannter anatomisch korrekter Puppen oder die Analyse von Kinderzeichnungen.64 Und selbst die subjektive Eindrucksbildung, die „Lebenserfahrung und Menschenkenntnis“ der Richter, vermögen nicht den Wahrheitsgehalt einer 59 60

Vgl. erneut BGH NStZ-RR 2003, 205 (206). So ausdrücklich BGHSt. 44, 308 (316); zustimmend Frister ZStW 106 (1994) S. 303 (316); zu Recht kritisch aber Häcker Bender/Häcker/Schwarz, Rn. 268 f.; Mohnert Psychologie für Juristen § 5 Rn. 224, 229; Schluckebier SSW-StPO § 261 Rn. 22; Sommer Strafverteidigung, Rn. 1409; zu Unrecht dahingestellt daher von BGH StV 2020, 446 (ebd.). 61 Zutreffend Eisenberg Beweisrecht, Rn. 1458 f., 1462; Geipel Lügenerkennung, S. 55 f.; Köhnken MAH Strafverteidigung § 60 Rn. 38; L. Schneider Nonverbale Zeugnisse, S. 99 f.; Sommer Strafverteidigung, Rn. 1004; Sporer/Köhnken Handbuch der Rechtspsychologie, S. 353 (359 f.). 62 DePaulo/Lindsay/Malone/Muhlenbruck/Charlton/H. Cooper Psychological Bulletin 129 (2003) S. 74 (91–106); ergänzend DePaulo/Morris The Detection of Deception in Forensic Contexts, S. 15 (21, 25); Köhnken/Kraus/Vom Schemm Polizei & Psychologie, S. 361 (367 f.); Vrij/Ganis Credibility Assessment, S. 301 (324 f.). 63 Vrij Finding the truth in the courtroom, S. 163 (171). 64 Richtig BGHSt. 45, 164 (175 f.); Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (28); Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (64); ausführlich Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 207–221.

V. Der Status quo

11

Aussage mit der im Strafverfahren erforderlichen Sicherheit zu bestimmen – auch wenn gerne auf diese Eigenschaften gewissermaßen als „natürliche Befähigung“ verwiesen wird, die nur Richtern vorbehalten sei.65 Im Gegenteil legt eine große Zahl empirischer Untersuchungen nahe, dass sich Aussagebeurteiler maßlos überschätzen, die sich auf ihre Intuition und Erfahrung verlassen.66 Studien ergaben – auch zu vermeintlich professionellen Aussagebeurteilern wie Polizeibeamten, Staatsanwälten und Richtern – Trefferquoten (das heißt der Anteil richtiger Ergebnisse) zwischen lediglich 45 und 60 Prozent im Erkennen von Lügen anhand der eigenen „Erfahrung“.67 Dabei ist zu berücksichtigen, dass bei zwei Entscheidungsalternativen – wahr oder erfunden – die zufällig zu erwartende Trefferquote stets 50 Prozent beträgt. Das Erkennen von Lügen durch subjektive Eindrucksbildung liegt im Zufallsbereich.68 Oder mit den Worten Geipels: „Zwar kann sich niemand der Einwirkung des persönlichen Eindrucks entziehen, jedoch ist dieser regelmäßig wertlos.“ Und: „Dieser ‚Eindruck‘, oder auch die ‚persönliche Intuition‘ oder das ‚Bauchgefühl‘ sind zur Einschätzung nach allen zur Verfügung stehenden Untersuchungen unbrauchbar.“69 Anstatt voreilig auf die eigene Menschenkenntnis und Berufs- und Lebenserfahrung zu verweisen, könnte man daher gleich eine Münze werfen – mit ähnlichen „Entdeckungsquoten“.

V. Der Status quo Unabhängig davon, ob ein Gericht einen Sachverständigen hinzuzieht oder nicht, stellt sich die Frage, ob die aussagepsychologische Begutachtung – vorausgesetzt sie wird im Sinne der vom Bundesgerichtshof begründeten best practice angewandt – überhaupt zuverlässig Aufschluss geben kann über die Glaubhaftigkeit einer Aussage. Oder ob im worst case nicht bloß eine weitere Methode angewandt wird, die ungeeignet ist, glaubhafte Aussagen von bewusst wahrheitswidrigen zu unterscheiden. Dass nach einer Studie von Busse und Vol65 Vgl. nur BGHSt. 3, 52 (53); BGH NStZ 2010, 51 (52); NStZ 2005, 394 (ebd.); kritisch Berlinger, S. 248 f.; Erb Stöckel-FS, S. 181 (183); Strate MAH Strafverteidigung § 28 Rn. 43; mangels entsprechender Ausbildung in der Aussagepsychologie wirken solche Thesen wie Fiktionen, Eschelbach BeckOK-StPO § 261 Rn. 10.2. 66 Vgl. Erb Stöckel-FS, S. 181 (183); Geipel StV 2008, 271 (272); Vrij Detecting Lies, S. 168; T. Walter Strafprozessrecht Rn. 596. 67 Verwiesen sei vorrangig auf die Meta-Analysen von Bond/DePaulo Personality and Social Psychology Review 10 (2006) S. 214 (219, 230) und (auch zu „professionellen“ Aussagebeurteilern) Vrij Detecting Lies, S. 147 f., 162 f.; wie hier und ergänzend Geipel Beweiswürdigung, § 16 Rn. 40, § 17 Rn. 4; Honts/Hartwig Credibility Assessment, S. 37 (48); Vrij Finding the truth in the courtroom, S. 163 (175 f.); Vrij/Ganis Credibility Assessment, S. 301 (331 f.); jeweils mit weiteren Nachweisen. 68 Köhnken MAH Strafverteidigung § 60 Rn. 37. 69 Geipel Beweiswürdigung, § 26 Rn. 7, 9.

12

1. Kapitel: Beweiswürdigung bei Aussage gegen Aussage

bert nur 50 Prozent der Gutachten de lege artis sein sollen, kann an dieser Stelle auf sich beruhen.70 Die strafrechtliche Praxis scheint jedenfalls überzeugt von ihr zu sein. Gemäß einer Studie von König und Fegert folgen Richter, wenn sie sich der Sachkunde eines Gutachters bedienten, in ihrer Entscheidung zu 89 Prozent dem Ergebnis der aussagepsychologischen Begutachtung.71 Nach Langen folgen Gerichte sogar stets den Sachverständigenvoten.72 In Bayern beträgt nach einer Studie von Jordan und Gresser aus dem Jahr 2013 die Übereinstimmungsquote 95,4 Prozent, bei Psychiatern sogar 100 Prozent, zumindest wenn Gutachter das Ergebnis des Verfahrens erfuhren.73 Dass Psychiatern eine höhere Glaubwürdigkeit zugesprochen wird, ist wohl auf die Rechtsprechung zurückzuführen, die Psychiatern grundsätzlich eine höhere Sachkunde zuerkennt.74 Und auch Busse und Volbert kommen zu einer vergleichbaren Übereinstimmungsquote: Bei 24 von Sachverständigen als glaubhaft angesehenen Aussagen gab es weder einen Freispruch noch eine Einstellung wegen fehlenden hinreichenden Tatverdachts, sondern 22 Verurteilungen (91,6 Prozent) sowie zwei Einstellungen nach § 154 und § 154a Absatz 2 StPO.75 All das unterstreicht ohne Frage den Einfluss und Stellenwert der aussagepsychologischen Begutachtung im Strafverfahren. Denn angesichts dieser Zahlen bestehen nur geringe Divergenzen zwischen den Ergebnissen der Gutachten und den Entscheidungen von Staatsanwaltschaften und Gerichten.76 Ein solcher Einfluss auf die richterliche Entscheidungshoheit ist jedoch nur dann gerechtfertigt, wenn die aussagepsychologische Begutachtung tatsächlich bestimmen kann, was sie bestimmen soll: die Glaubhaftigkeit einer Aussage. Dasselbe gilt, wenn ein Richter auf die Hinzuziehung eines Sachverständigen verzichtet, sich aber an die vom Bundesgerichtshof vorgegebenen und empfohlenen aus70 Busse/Volbert Psychologie der Zeugenaussage, S. 131 (136 f.); mit weiteren Nachweisen auch Gerhold ZIS 2020, 431 (432); optimistischer seit dem Grundsatzurteil Pfister Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 3 (11). 71 König/Fegert Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 16 (29). 72 Langen, S. 147; in Spanien ergab eine Analyse von Gerichtsurteilen, dass die Verurteilungsrate bei 93,3 Prozent lag, wenn ein Gutachter anhand der Inhaltsanalyse die Glaubhaftigkeit einer Zeugenaussage bestätigte, und zu 100 Prozent freigesprochen wurde, wenn dies nicht der Fall war, Amado/Arce/Fariña European Journal of Psychology Applied to Legal Context 7 (2015) S. 3 (4). 73 Jordan/Gresser Der Sachverständige 2014, 71 (75); für Österreich ergab eine Studie eine Übereinstimmungsquote von 96,5 Prozent, Kassab/Gresser Der Sachverständige 2015, 268 (271). 74 Vgl. BGHSt. 23, 8 (12 f.); BGH NStZ 2002, 490 (ebd.); NStZ 1998, 366 (367); Krehl KK § 244 Rn. 52; Pfister Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 3 (8); Rogall SK-StPO Vor § 72 Rn. 23; Trüg/Habetha MK-StPO § 244 Rn. 86. 75 Busse/Volbert Psychologie der Zeugenaussage, S. 131 (139 f.). 76 Barton „Vom hochgemuten, voreiligen Griff nach der Wahrheit“, S. 199 (206); nach dessen eigener Erfahrung ebenso Fischer Widmaier-FS, S. 191 (216).

V. Der Status quo

13

sagepsychologischen Standards hält.77 Denn wenn sich auf diese Art und Weise nicht ermitteln lässt, ob die zu begutachtende Aussage tatsächlich wahr und nicht erfunden ist, besteht die Gefahr, dass „das Gericht auf der Grundlage einer sachlich nicht gerechtfertigten Scheinsicherheit urteilt“.78 Die folgenden Ausführungen gehen dieser Gefahr nach, indem sie zunächst die in deutschen Gerichtssälen „herrschende“ aussagepsychologische Glaubhaftigkeitsbegutachtung beleuchten und ihre Grenzen und Schwächen aufdecken sollen (2. Kapitel). Eine zentrale Rolle dabei spielen wird die Bestimmung des (Beweis-)Wertes ihrer strafverfahrensrechtlicher Anwendung (3. Kapitel). Sie werden sich schließlich (4. bis 7. Kapitel) einer Methode widmen, die der Bundesgerichtshof wenige Monate vor seiner Entscheidung zu den Mindestanforderungen der aussagepsychologischen Glaubhaftigkeitsbegutachtung als „völlig ungeeignet“ im Sinne des § 244 Absatz 3 Satz 3 Nummer 4 StPO (aktuelle Fassung) eingestuft hat: der Polygraf.79 Zu Unrecht, wie sich zeigen wird.

77 Dass in diesen Fällen die „Übereinstimmungsquote“ bei 100 Prozent liegen muss, ist zwar nicht empirisch belegt; ein anderes Ergebnis wäre aber aufgrund der Personenidentität von richterlichem Begutachter und Entscheider schlichtweg schizophren. 78 Erb Stöckel-FS, S. 181 (191). 79 BGHSt. 44, 308.

2. Kapitel

Die aussagepsychologische Begutachtung I. Terminologie 1. Glaubhaftigkeit ist gleich „Wahrheit“? Laut Bundesgerichtshof behandelt die aussagepsychologische Glaubhaftigkeitsbegutachtung – sozusagen im weiteren Sinne – die Frage, „ob auf ein bestimmtes Geschehen bezogene Angaben zutreffen“,1 in welchem Ausmaß also eine Aussage einen Sachverhalt korrekt beschreibt.2 Im Idealfall sollte am Ende der Begutachtung feststehen, ob die Aussage der Wahrheit entspricht oder nicht. Diesem Ideal wird die Glaubhaftigkeitsbegutachtung aber selten gerecht, und das beansprucht sie eigentlich auch nicht – obgleich oft Gegenteiliges und vor allem Irreführendes zu lesen ist.3 Denn die Glaubhaftigkeit einer Aussage – und nur diese soll und kann die Aussagepsychologie ermitteln – ist gerade nicht gleichzusetzen mit der objektiven Wahrheit, also der „Faktizität eines Sachverhaltes“.4 Mit anderen Worten kann eine Aussage durchaus glaubhaft sein, aber alles andere als der objektiven Wahrheit entsprechen. So kann die Aussage einer Person, sie sei eingesperrt gewesen, aus aussagepsychologischer Sicht glaubhaft sein, obwohl der Raum tatsächlich nicht verschlossen war, sich die Aussageperson aber eingeschlossen fühlte.5 Trotz zutreffend ermittelter Glaubhaftigkeit wäre eine Verurteilung wegen Freiheitsberaubung falsch.6 Umgekehrt kann 1

BGHSt. 45, 164 (167). Köhnken MAH Strafverteidigung § 60 Rn. 1. 3 Vgl. etwa F. Schneider/Frister/Olzen, S. 400: „Beurteilung einer konkreten Aussage als wahr oder unwahr“; Steller Handbuch der Rechtspsychologie, S. 300 (302); Volbert/Schemmel/Tamm Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108 (113): „Unterscheidung zwischen wahren und erfundenen Aussagen“; missverständlich daher auch BGHSt. 45, 164 (167): „Beurteilung, ob die Angaben […] zutreffen“ (Hervorhebungen des Verfassers); zu Recht kritisch Fischer Widmaier-FS, S. 191 (197 f.). 4 Vgl. Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 27, die von einem „Erlebnishintergrund in der Wachwirklichkeit“ sprechen; deutlich auf S. 49: „Stellungnahmen zur Faktizität […] sind wissenschaftlich nicht haltbar“. 5 Angelehnt an T. Fabian/Greuel/Stadler StV 1996, 347 (349). 6 Vorausgesetzt der Täter hatte dem Opfer nicht bewusst vorgespielt, der tatsächlich unverschlossene Ausgang sei fest verschlossen, vgl. nur Fischer § 239 Rn. 8b; Schluckebier LK § 239 Rn. 15 f. 2

16

2. Kapitel: Die aussagepsychologische Begutachtung

eine Aussage unglaubhaft sein, auch wenn sie objektiv der Wahrheit entspricht: nämlich wenn eine Aussageperson die übermittelte, eigentlich zutreffende Information irrtümlich – also subjektiv – für falsch hält. Glaubhaftigkeit kann daher höchstens gleichgesetzt werden mit „subjektiver Wahrheit“, die alles andere als der objektiven Wahrheit entsprechen muss.7 Mit anderen Worten ist eine Aussage glaubhaft, wenn sie einen „subjektiven Erlebnisbezug“ aufweist wie in dem Fall des vermeintlichen „Eingesperrtseins“: die Aussage ist allein für den Aussagenden erlebnisbezogen und folglich glaubhaft, auch wenn sie objektiv unwahr ist. Ob die Aussage auf einem tatsächlichen eigenen Erleben basiert oder etwa einem irrtumsbedingten „Scheinerlebnis“, ist für die Bestimmung der Glaubhaftigkeit – und schließlich für die Glaubhaftigkeitsbegutachtung selbst – ohne Belang.8 Im Strafverfahren ist allerdings allein die Erforschung der objektiven Wahrheit entscheidend: „als Grundlage für die Verwirklichung von Gerechtigkeit und Rechtsfrieden“.9 Da die Aussagepsychologie nicht ermitteln kann, ob eine Aussage objektiv wahr ist, kann das (dann positive) Ergebnis der aussagepsychologischen Begutachtung, die Aussage sei glaubhaft, höchstens als Indiz für den objektiven Wahrheitsgehalt der Aussage herangezogen werden.10 Unabhängig davon, welchen (Rest-)Wert man diesem Indiz beimisst (dazu später). Die aussagepsychologische Glaubhaftigkeitsbegutachtung dient somit ausschließlich der Feststellung, ob die Aussageperson die vermittelte Information subjektiv als erlebnisbezogen empfunden und daher subjektiv für wahr gehalten hat. Die Frage, ob sich der Inhalt der Aussage tatsächlich zugetragen habe, hat in einem Folgeschritt allein der Richter zu beantworten – lediglich unter Zuhilfenahme des aussagepsychologischen Gutachtens.11 Alles andere würde der aussagepsychologischen Begutachtung einen (Beweis-)Wert zusprechen, den sie gar nicht erbringen kann.

7 Geipel Lügenerkennung, S. 63; Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (85) spricht von „subjektiver Wachwirklichkeit“. 8 Diese (oft fehlende) Klarstellung offenbart zugleich die große Schwäche der Glaubhaftigkeitsbegutachtung, nicht zwischen tatsächlich erlebnisbasierten und auf Irrtum, Suggestion oder false memories beruhenden Aussagen unterscheiden zu können; dazu sogleich in diesem Kapitel unter II 1 (S. 19 f.) und II 3 (S. 28–31). 9 Fischer Widmaier-FS, S. 191 (199); Heintschel-Heinegg Breidling-FS, S. 143; jeweils mit Rechtsprechungsnachweis; Erkenntnisziel ist das materiell richtige Urteil, also wenn der Verurteilte die Tat wirklich begangen hat, Velten SK-StPO Vor § 261 Rn. 3. 10 Brause NStZ 2013, 129 (131); Fischer Widmaier-FS, S. 191 (201), der zudem auf einen ansonsten drohenden Konflikt mit Artikel 92 GG aufmerksam macht; Ott KK § 261 Rn. 116, der jedoch im Ergebnis Glaubhaftigkeit und Wahrheit fälschlicherweise wieder gleichsetzt. 11 Auch hier finden Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 27, deutliche Worte: „Die Rekonstruktion eines ‚realen‘ Sachverhalts obliegt allein der Beurteilung des Gerichts“; zustimmend Fischer Widmaier-FS, S. 191 (201 f.).

I. Terminologie

17

2. Glaubwürdigkeit und Glaubhaftigkeit Auch wenn nach wie vor von der Einholung eines Glaubwürdigkeitsgutachtens zu lesen ist,12 dient die aussagepsychologische Begutachtung nicht der Feststellung der „allgemeinen Glaubwürdigkeit“ der Aussageperson im Sinne einer dauerhaften personalen Eigenschaft.13 Beurteilt wird allein die Glaubhaftigkeit ihrer Aussage. Unter der allgemeinen Glaubwürdigkeit versteht man ein generelles, situa tionsunabhängiges Persönlichkeitskonstrukt bezüglich der Tendenz, generell zu wahren oder unwahren Aussagen zu neigen – wie zum Beispiel ein notorischer Lügner es tut.14 Die allgemeine Glaubwürdigkeit einer Person – wenn es eine solche überhaupt geben kann – sagt aber nichts darüber aus, ob sie in der konkreten Situation die Wahrheit spricht, etwa im Rahmen einer belastenden Aussage.15 Denn auch ein „allgemein glaubwürdiger“ Mensch kann eine wahrheitswidrige Aussage tätigen, wie auch ein „allgemein unglaubwürdiger“, also ein häufig lügender Mensch (ausnahmsweise) eine zutreffende Aussage machen kann.16 In der forensischen Psychologie und der Rechtsprechung wurde zumindest früher zwischen „allgemeiner“ und „spezieller“ Glaubwürdigkeit unterschieden.17 Dabei ist die spezielle Glaubwürdigkeit (oder aussagebezogene Glaubwürdigkeit) nichts anderes als die für das Strafverfahren interessante Glaubhaftigkeit.18 Falsch ist die Bezeichnung „Glaubwürdigkeitsgutachten“ daher nicht, sofern mit ihr das Richtige gemeint ist.19 Um Missverständnisse zu vermeiden, sollte dennoch von dieser Unterscheidung abgesehen werden.20 Auch im 12 Vgl. nur BGH, Beschluss vom 27.11.2019 – 5 StR 557/19; Beschluss vom 2.7.2020 – 6 StR 104/20; Erb Stöckel-FS, S. 181; Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5; Schmitt Meyer-Goßner/Schmitt § 244 Rn. 74. 13 Deckers Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (192). 14 König/Fegert Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 16 (39). 15 Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5 (20 f.); Mohnert Psychologie für Juristen § 5 Rn. 201; Volbert/Steller Psychiatrische Begutachtung, S. 683 (693); kritisch zum persönlichkeitsbezogenen Begriff der allgemeinen Glaubwürdigkeit bereits Undeutsch Forensische Psychologie, S. 26 (51 f.): „fiktiv“, „gegenstandslos“, „unbrauchbar“. 16 Eisenberg Beweisrecht, Rn. 1879. 17 BGH StV 1994, 64 (ebd.); Fischer NStZ 1994, 1 (2); L. Schneider Nonverbale Zeugnisse S. 13 f.; Steller/Wellershaus/Wolf Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151 (156); mittlerweile zu Recht gegen eine solche Unterteilung T. Fabian/ Greuel/Stadler StV 1996, 347 (348); Steller/Volbert Psychologie im Strafverfahren, S. 12 (21). 18 Gödert Glaubhaftigkeitsbeurteilung, S. 2 f.; F. Schneider/Frister/Olzen, S. 400. 19 Zu streng daher Geipel Lügenerkennung, S. 54, Heintschel-Heinegg Breidling-FS, S. 143 (147); dass Auftraggeber jedoch selten das Richtige meinen, kritisieren König/Fegert Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 16 (21, 31). 20 Kritisch auch Fischer Widmaier-FS, S. 191 (192 f.); Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (48).

18

2. Kapitel: Die aussagepsychologische Begutachtung

Folgenden werde ich nur noch von der Glaubwürdigkeit einer Person und der Glaubhaftigkeit ihrer Aussage schreiben; das eine hat mit dem anderen nichts zu tun. Ganz vom Tisch ist die allgemeine Glaubwürdigkeit nicht. Denn es liegt nahe, dass eine hochintelligente, informierte oder motivierte Person besser lügen kann, als eine minderbegabte, ängstliche oder desinteressierte Person die Wahrheit zu sagen vermag. Aus diesem Grund bedarf es im Rahmen der aussagepsychologischen Begutachtung einer umfänglichen „Persönlichkeits- und Motivanalyse“,21 bei der unter anderem „Intelligenz, Fantasie, Eloquenz und besondere Kenntnisse über Fakten und Geschehnisse, die dem fraglichen Ereignis gleichen“, untersucht werden.22 Auch der Bundesgerichtshof hält eine Analyse der Persönlichkeit und der Kompetenz der Aussageperson für erforderlich: „Die […] unter Berücksichtigung des konkreten Tatvorwurfs vorzunehmende Prüfung […] der Persönlichkeitsentwicklung des Untersuchten (etwa Selbstwertprobleme, gesteigertes Geltungsbedürfnis) erfolgt üblicherweise mit den allgemeinen Methoden psychologischer Diagnostik (z. B. Befragung, Beobachtung, Tests, Fragebögen)“.23 In der aussagepsychologischen Glaubhaftigkeitsbegutachtung erfolgt die Prüfung der Kompetenz und Persönlichkeit der Aussageperson im Rahmen der Aussagetüchtigkeit (dazu sogleich). Die allgemeine Glaubwürdigkeit, also eine allgemeine Eigenschaft der Aussageperson, kann für die Glaubhaftigkeitsbeurteilung somit höchstens von indizieller Bedeutung sein.24 Im Ergebnis kommt ihr formal nur die Bedeutung einer Hilfstatsache für die eigentlich bedeutsame Glaubhaftigkeit zu.25 Mit anderen Worten kann die allgemeine Glaubwürdigkeit der Aussageperson wiederum nur ein Indiz sein für das (ohnehin nur) Indiz der Glaubhaftigkeit ihrer Aussage.

21 Fischer Widmaier-FS, S. 191 (204); siehe auch Steller Praxis der Rechtspsychologie 23 (2013) S. 11 (21): „Einschätzung von Lügenkompetenzen und potenziellen Dispositionen für Falschaussagen“. 22 Deckers Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (192). 23 BGHSt. 45, 164 (175); inwieweit diese „allgemeinen Methoden“ empirisch belegt und wissenschaftlich begründet sind, bleibt jedoch unbeantwortet; kritisch Berlinger, S. 36; Eisenberg Beweisrecht, Rn. 1890; Köhnken Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 25 (37–40); König/Fegert Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 16 (30). 24 Krehl KK § 244 Rn. 50. 25 Eisenberg Beweisrecht, Rn. 1426.

II. Hypothesengeleitete Diagnostik

19

II. Hypothesengeleitete Diagnostik 1. Quellen der Unwahrheit Dass eine Aussage unwahr ist, kann verschiedene Ursachen haben. So kann eine Aussage bewusst unwahr sein, das heißt die Aussageperson erfindet einen Sachverhalt, sie lügt.26 Jedoch kann eine Aussage auch dann objektiv unwahr sein, wenn sich die Aussageperson irrt (wie in dem Beispielsfall des vermeintlichen Einsperrens) und sie von der Richtigkeit der eigenen Aussage subjektiv überzeugt ist, obwohl sich der Sachverhalt gar nicht oder jedenfalls nicht in der beschriebenen Form zugetragen hat. Solche sogenannten Schein- oder Pseudoerinnerungen („false memories“) können durch suggestive Prozesse entstehen, die entweder von außen auf die Aussageperson einwirken – etwa durch (nicht notwendig absichtliche) suggestive Befragung durch Dritte (Fremdsuggestion) – oder die von der betroffenen Person selbst generiert werden (Autosuggestion).27 Zudem kann die Aussageperson schon aufgrund geringer kognitiver Fähigkeiten außerstande sein, zuverlässig zwischen Erlebtem und Fantasie zu unterscheiden; in diesem Fall fehlt es bereits an der sogenannten Aussagetüchtigkeit.28 Bei der Überprüfung der Aussagetüchtigkeit wird unter anderem untersucht, ob eine Aussageperson über die kognitiven Voraussetzungen und allgemeine Kompetenz verfügt für eine korrekte Wahrnehmung, Speicherung im und Abruf aus dem Gedächtnis sowie für die Verbalisierung erinnerter Erlebnisse oder Wahrnehmungen.29 Die Prüfung der Aussagetüchtigkeit erfolgt daher sinnvollerweise als erstes und wird in der Regel – vor allem bei psychisch gesunden Erwachsenen – gegeben sein. Ist sie es ausnahmsweise nicht, zum Beispiel bei der Begutachtung von Kleinkindern oder Zeugen mit starken kognitiven Einschränkungen, erübrigt sich grundsätzlich die Überprüfung der anderen potenziellen Ursachen einer unwahren Aussage.30 26 Die bewusste gedankliche Konstruktion und Erfindung eines Sachverhalts wird auch Konfabulation genannt, Deckers Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (191). 27 Köhnken MAH Strafverteidigung § 60 Rn. 22; ausführlich zur Entstehung von Suggestion Greuel Psychologie der Zeugenaussage, S. 211–220; Steller Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 71–96; Volbert Handbuch der Rechtspsychologie, S. 331–341. 28 Vgl. Mohnert Psychologie für Juristen § 5 Rn. 215–219; F. Schneider/Frister/Olzen, S. 404; näher zur Aussagetüchtigkeit BGH NJW 2005, 1519 (1521); Greuel/H. Offe/A. Fabian/ Wetzels/T. Fabian/S. Offe/Stadler, S. 79–88; Loohs Fachanwalt Strafrecht 37. Kapitel Rn. 17– 36. 29 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 79; Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (26). 30 Vgl. Volbert/Lau Handbuch der Rechtspsychologie, S. 289 (291–296).

20

2. Kapitel: Die aussagepsychologische Begutachtung

Der Aussagebegutachter – entweder der psychologische Sachverständige oder der Richter, wenn er auf die Hinzuziehung eines psychologischen Sachverständigen verzichtet – muss grundsätzlich alle potenziellen Ursachen einer unwahren Aussage in Erwägung ziehen. Erst wenn er diese ausschließt, kann die Glaubhaftigkeit der Aussage positiv festgestellt werden. Bei der aussagepsychologischen Glaubhaftigkeitsbegutachtung geht es also um die Prüfung der Frage, ob eine Aussage anders als durch einen tatsächlichen Erlebnishintergrund zustande gekommen sein kann.31 Volbert erweiterte diese Leitfrage der aussagepsychologischen Begutachtung wie folgt (Hervorhebungen im Original):32 „Könnte dieser Zeuge mit den gegebenen individuellen Voraussetzungen unter den gegebenen Befragungsbedingungen und unter Berücksichtigung der im konkreten Fall möglichen Einflüsse von Dritten diese spezifische Aussage machen, ohne dass sie auf einem realen Erlebnishintergrund basiert?“

Aus dieser Leitfrage ergibt sich das gesamte Prüfverfahren der aussagepsychologischen Begutachtung. Die Beurteilung der Glaubhaftigkeit von Aussagen im weiteren Sinne umfasst also: – die Analyse der Aussagetüchtigkeit und Aussagekompetenz (zum Beispiel des intellektuellen und sprachlichen Entwicklungsstands oder sexualitätsbezogenen Wissens der Aussageperson), – die Analyse der sogenannten Aussagevalidität, also möglicher Fehlerquellen im Rahmen der Aussageentstehung (zum Beispiel Motive für eine Falschaussage oder eine suggestive Beeinflussung) und – die Analyse der inhaltlichen Qualität der Aussage selbst. Diese Dreiteilung entspricht der namentlich von Volbert und Steller favorisierten Trias der aussagepsychologischen Begutachtung, nämlich Analyse von Aussageperson, Aussagegenese und Aussageinhalt.33

2. Von der „Nullhypothese“ zur „Lügenhypothese“ a) Nullhypothese Von Bedeutung ist vor allem der letzte Halbsatz der Leitfrage: „ohne dass die Aussage auf einem realen Erlebnishintergrund basiert“. Ausgangspunkt der aussagepsychologischen Begutachtung ist also die sogenannte Nullhypothese oder Unwahrhypothese: Es wird davon ausgegangen, dass der vorgetragene Sachverhalt unwahr ist – aus welchem der oben genannten Gründe auch immer.34 31 32

Volbert Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12 (ebd.). Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (176). 33 Vgl. Steller Praxis der Rechtspsychologie 23 (2013) S. 11 (21); ähnlich Loohs Fachanwalt Strafrecht 37. Kapitel Rn. 15. 34 BGHSt. 45, 164 (167 f.); Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (19).

II. Hypothesengeleitete Diagnostik

21

Diese Klarstellung ist die wahrscheinlich größte Errungenschaft der Grundsatzentscheidung des Bundesgerichtshofs. Denn dieses hypothesengeleitete Vorgehen entspricht nicht nur professioneller psychologischer Diagnostik und dient der Vermeidung einer vorschnellen Parteilichkeit und einer voreingenommenen Bestätigungsdiagnostik.35 Zumindest bei belastenden Aussagen korreliert es auch in gewisser Weise mit dem strafrechtlichen In-dubio-Grundsatz und der Unschuldsvermutung nach Artikel 6 Absatz 2 EMRK.36 Die globale Nullhypothese wird wiederum in einzelne Subhypothesen zu den jeweiligen möglichen Aussagequellen unterteilt. Denn diese bestimmen und beeinflussen das gesamte weitere diagnostische Vorgehen. Wird die falsche Subhypothese gewählt oder werden nicht alle erforderlichen Hypothesen aufgestellt und geprüft, besteht die Gefahr einer unberechtigten Zurückweisung der Nullhypothese.37 So sind zum Beispiel die Subhypothesen aufzustellen, es handle sich um eine bewusst unwahre Aussage (Lügenhypothese) oder eine auf vermeintliche (Schein-)Erinnerungen gestützte Aussage (Suggestionshypothese). Da immer nur die spezifische Aussage einer konkreten Aussageperson begutachtet wird, gibt es kein standardmäßiges „Subhypothesen-Muster“. Die Hypothesenbildung unterscheidet sich von Fall zu Fall und hat sich „reflexiv am gesamten Untersuchungsablauf“ zu orientieren. So kann etwa von Vorschulkindern nicht erwartet werden, dass sie sich potenziell suggestive Inhalte angelesen haben könnten. Jedoch hat der Begutachter anhand der Umstände des Einzelfalls und der Aktenanalyse stets alle in Betracht kommenden Subhypothesen aufzustellen und gegebenenfalls im Laufe der Begutachtung anzupassen, zum Beispiel wenn weitere Anknüpfungstatsachen wie eine bislang unbekannte Psychotherapie bekannt werden.38 Jede Subhypothese wird dann so lange aufrechterhalten, bis sie anhand der Umstände des Einzelfalls zurückgewiesen werden kann. Erst wenn sich alle aufgestellten Subhypothesen mit den gesammelten Fakten nicht mehr in Ein35 Köhnken MAH Strafverteidigung § 60 Rn. 74; das verkennt Jansen StV 2000, 224 (ebd.), die im Ergebnis keinen Unterschied darin sieht, ob man anfangs von der Nullhypothese ausgeht oder davon, dass die Aussage glaubhaft ist. 36 Deckers Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (182); Häcker Bender/Häcker/Schwarz, Rn. 349; Heintschel-Heinegg Breidling-FS, S. 143 (153 f.); König/Fegert Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 16 (17); Mohnert Psychologie für Juristen § 5 Rn. 203; Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (106); anderer Ansicht Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (80 f.); Volbert Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 52 (55): Psychologische Diagnostik sei immer hypothesengeleitet und habe nichts mit dem Zweifelssatz gemein. 37 Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (20). 38 Vgl. Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 45 f.; Köhnken MAH Strafverteidigung § 60 Rn. 65; ein (nicht vollständiger) Überblick über die infrage kommenden Subhypothesen findet sich bei Jansen Zeuge, Rn. 397–473.

22

2. Kapitel: Die aussagepsychologische Begutachtung

klang bringen lassen, kann auch die Nullhypothese insgesamt zurückgewiesen werden. Und erst dann gilt im Umkehrschluss die Alternativhypothese oder Erlebnishypothese, dass es sich um eine zumindest subjektiv wahre und glaubhafte Aussage handelt.39 Dieses Vorgehen entspricht dem in den empirischen Wissenschaften etablierten „Popper’schen Falsifikationsprinzip“.40 Wird eine Subhypothese nicht zurückgewiesen, kann auch die Nullhypothese nicht verworfen werden und ist ein eindeutiger Rückschluss auf eine Erlebnisgrundlage versperrt. Anders formuliert kann die Erlebnishypothese im Ergebnis erst bejaht werden, wenn die Nullhypothese vollständig zurückgewiesen wird. Und die Nullhypothese kann wiederum erst zurückgewiesen werden, wenn erstens die Aussagefähigkeit bejaht und zweitens alle ihre in Betracht kommenden Subhypothesen verworfen werden. Wird die Nullhypothese aufrechterhalten, heißt das nicht immer automatisch, dass die Aussage tatsächlich unwahr, auf Suggestion beruhend oder gar erlogen ist.41 Die Unwahrheit der Aussage lässt sich dann nur nicht mehr anhand der aussagepsychologischen Begutachtung mit der Sicherheit ausschließen, deren es im Strafverfahren bedarf. In diesem Fall wird letztendlich nur die von Volbert aufgeworfene Leitfrage bejaht: „Ja, der Zeuge könnte diese Aussage gemacht haben, ohne dass sie auf einem realen Erlebnishintergrund basiert.“ Ob die Aussage tatsächlich ohne Erlebnishintergrund gemacht wurde, bleibt aber in aller Regel unbeantwortet. Letztendlich liegt dann – vorausgesetzt es gibt keine anderen Sachbeweise, was in einer Aussage-gegen-Aussage-Konstellation meist der Fall sein wird – eine strafrechtliche Non-liquet-Situation vor. Im Strafverfahren bedeutet das nichts anderes als in dubio pro reo. Der Ausschluss der verschiedenen potenziellen Quellen einer unwahren Aussage, das heißt die Prüfung und letztendlich Verwerfung der einzelnen Subhypothesen, erfolgt – und das ist entscheidend – anhand unterschiedlicher diagnostischer Methoden.42 Es gibt nicht das eine aussagepsychologische „Werkzeug“, um alle „Unwahrhypothesen“ gleichermaßen zu verwerfen und im Umkehrschluss die Glaubhaftigkeit einer Aussage zu bejahen. Bei der Variante der aussagepsychologischen Begutachtung, für die der Bundesgerichtshof 1999 Mindeststandards definierte, handelt es sich um ein methodisches Vorgehen allein zur Unterscheidung von subjektiv wahren und bewusst wahrheitswidrigen Aussagen, also um eine Methode ausschließlich zur Zurückweisung der Lügenhypothese. 39 Köhnken MAH Strafverteidigung § 60 Rn. 67; missverständlich wieder BGHSt. 45, 164 (168): „wahre Aussage“. 40 Bublitz ZIS 2021, 210 (211); Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (19). 41 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 204 f.; Volbert Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12 (16 f.); Volbert/Schemmel/Tamm Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108 (112). 42 Köhnken MAH Strafverteidigung § 60 Rn. 35.

II. Hypothesengeleitete Diagnostik

23

b) Lügenhypothese und „Undeutsch-Hypothese“ Grundannahme der Lügenhypothese ist, dass sich subjektiv wahrheitsgemäße Aussagen in ihrer inhaltlichen Qualität von bewusst wahrheitswidrigen Aussagen unterscheiden. Sie ist weitgehend auf Undeutsch zurückzuführen: „Aussagen über selbsterlebte faktische Begebenheiten müssen sich von Äußerungen über nicht selbsterlebte Vorgänge unterscheiden durch Unmittelbarkeit, Farbigkeit und Lebendigkeit, sachliche Richtigkeit und psychologische Stimmigkeit, Folgerichtigkeit der Abfolge, Wirklichkeitsnähe, Konkretheit, Detailreichtum, Originalität und – entsprechend der Konkretheit jedes Vorfalls und der individuellen Erlebnisweise eines jeden Beteiligten – individuelles Gepräge.“43

Mit anderen Worten sei es um einiges leichter, die Wahrheit zu sagen als zu lügen, da es schwierig sei, eine Aussage über ein komplexes Geschehen zu erfinden und über längere Zeit aufrechtzuerhalten. Ein (subjektiv) wahres Geschehen könne aus dem Gedächtnis rekonstruiert und einfach nacherzählt werden, während ein (subjektiv) fiktiver Vorfall von einer lügenden Person erst konstruiert und frei erfunden werden müsse. Letzteres stelle eine lügende Person zumindest bei komplexen Geschehensabläufen vor hohe Anforderungen an ihre kognitive Leistungsfähigkeit. Hinzu komme, dass nebensächliche Details, abgebrochene Handlungsketten, unerwartete Komplikationen oder unverstandene Handlungselemente oftmals fehlten, da sich eine lügende Person – anders als eine aufrichtige Person – auf den wesentlichen, belastenden Handlungsablauf beschränken werde, um „nicht aufzufliegen“ und um glaubwürdig zu erscheinen.44 Zudem wird angenommen, dass das Lügen ein zielorientiertes Verhalten ist, und davon ausgegangen, dass sich eine lügende Person bemühen wird, nicht als solche wahrgenommen zu werden. Sie werde versuchen, den Eindruck einer erlebnisbezogenen Aussage zu erzeugen und daher Verhaltensweisen vermeiden, die ihrer Ansicht nach mit einer wahrheitswidrigen Aussage assoziiert werden könnten. Glaube ein Lügner, dass das Eingestehen von Gedächtnislücken oder Selbstkorrekturen gegen seine Glaubwürdigkeit sprechen, werde er sich während der Aussage bemühen, solche zu vermeiden, obwohl das Gegenteil der Fall sei.45 Zwar werde sich auch eine Person, die nicht lügt, bemühen, einen aufrichtigen und glaubwürdigen Eindruck zu machen.46 Allerdings achteten aufrichti43 Undeutsch Forensische Psychologie, S. 26 (125 f.); jedoch insofern missverständlich, da es eben nicht um die Aufdeckung einer „selbsterlebte[n] faktische[n] Begebenheit“ geht, sondern nur um die Aufdeckung einer subjektiv selbsterlebten Begebenheit (Hervorhebungen des Verfassers). 44 BGHSt. 45, 164 (170); Steller Wahrheit, S. 45; siehe auch DePaulo/Lindsay/Malone/ Muhlenbruck/Charlton/H. Cooper Psychological Bulletin 129 (2003) S. 74 (82). 45 Köhnken The Detection of Deception in Forensic Contexts, S. 41 (49); Volbert Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12 (14). 46 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 12.

24

2. Kapitel: Die aussagepsychologische Begutachtung

ge Personen seltener auf ihr Erscheinungsbild und ihren äußeren Eindruck.47 Eine wahrheitsgemäße Aussage werde daher eher Merkmale enthalten, die mit den Stereotypen der Glaubwürdigkeit nicht vereinbar seien.48

c) Die Realkennzeichen der kriterienorientierten Aussageanalyse Nach der „Undeutsch-Hypothese“49 lassen sich diese qualitativen Unterschiede anhand bestimmter Aussageinhaltsmerkmale feststellen, die zwar in subjektiv wahren, aber nicht oder nur selten in bewusst falschen Aussagen auftreten. Darauf aufbauend entwickelten Steller und Köhnken bereits 1989 einen Katalog von 19 sogenannten Realkennzeichen – ursprünglich für die Beurteilung kindlicher Zeugenaussagen –, der von psychologischer Seite weitgehend angenommen wird und im deutschen Strafverfahren zum Einsatz kommt.50 Gödert lehnt die Bezeichnung „Realkennzeichen“, wie ich meine, zu Recht ab, da weder die kriterienorientierte Inhaltsanalyse noch die aussagepsychologische Begutachtung insgesamt geeignet sind, die „Realität“, das heißt die objektive Wahrheit zu ermitteln.51 Dennoch wird sie hier beibehalten, da sie sich in der Praxis durchgesetzt hat. Anhand dieser Realkennzeichen soll sich also erkennen lassen, ob eine Aussage subjektiv wahr oder bewusst wahrheitswidrig ist. Denn eine Aussage – so die Theorie – hat eine größere Wahrscheinlichkeit, jedenfalls subjektiv wahr zu sein, je mehr sie von den folgenden Realkennzeichen enthält: Allgemeine Merkmale 1. Konsistenz Logische Konsistenz 2. Reproduktionsstil52 Unstrukturierte Darstellung 3. Details Quantitativer Detailreichtum Spezielle Inhalte 4. Verknüpfungen 5. Interaktionen 6. Gespräche 7. Komplikationen

Raum-zeitliche Verknüpfungen Interaktionsschilderungen Wiedergabe von Gesprächen Schilderung von Komplikationen im Handlungsverlauf

Inhaltliche Besonderheiten 8. Ausgefallen Schilderung ausgefallener Einzelheiten 47 48

Zweifelnd Geipel Lügenerkennung, S. 92; Häcker Bender/Häcker/Schwarz, Rn. 358. Vrij/Ganis Credibility Assessment, S. 301 (337). 49 Begriff ursprünglich von Steller Credibility Assessment, S. 135 (139). 50 Zitiert nach Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 135; vgl. zu den ursprünglichen Kennzeichen Undeutsch Forensische Psychologie, S. 26 (127–159); eine ausführliche und vergleichende Darstellung findet sich bei Eisenberg Beweisrecht, Rn. 1427c; im Englischen Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (5). 51 Gödert Glaubhaftigkeitsbeurteilung, S. 8; kritisch auch T. Fabian/Greuel/Stadler StV 1996, 347 (349). 52 Gödert Glaubhaftigkeitsbeurteilung, S. 9, bezeichnet Kriterium 2 treffender als „Unordnung“ (ungeordnete sprunghafte Darstellung).

II. Hypothesengeleitete Diagnostik

25

9. Nebensächlich Schilderung nebensächlicher Einzelheiten 10. Unverstanden Phänomengemäße Schilderung unverstandener Handlungselemente 11. Indirekt Indirekt handlungsbezogene Schilderungen 12. Eigenseelisch Schilderung eigener psychischer Vorgänge 13. Fremdseelisch Schilderung psychischer Vorgänge des Beschuldigten Motivationsbezogene Inhalte 14. Verbesserungen Spontane Verbesserungen der eigenen Aussage 15. Erinnerungslücken Eingeständnis von Erinnerungslücken 16. Selbsteinwände Einwände gegen die Richtigkeit der eigenen Aussage 17. Eigenbelastung Selbstbelastungen 18. Fremdentlastung Entlastung des Angeschuldigten Deliktspezifische Inhalte 19. Deliktspezifisch Deliktspezifische Aussageelemente

Die ersten drei Kategorien gelten grundsätzlich als zu schwierig zu erfinden, da ein Lügner zum Beispiel kaum psychische Vorgänge des Beschuldigten oder Interaktionen mit dem Beschuldigten beschreiben könne. Das Vorhandensein solcher inhaltlichen Qualitätsmerkmale weise daher im Umkehrschluss auf eine subjektiv wahre Darstellung hin. Die übrigen Realkennzeichen bezögen sich vor allem auf die Art und Weise einer Aussage. Da eine lügende Person nicht als solche identifiziert werden wolle, werde sie Inhalte weglassen, die sie nach ihrer Ansicht „auffliegen“ lassen könnten, zum Beispiel das Eingestehen von Erinnerungslücken, obwohl das Gegenteil der Fall sei.53 Enthalte eine Aussage mehr Details, ausgefallene, lebendige Einzelheiten und Selbstbelastungen, spreche dies somit eher für eine subjektiv wahre und gegen eine erfundene Aussage.54 Das Fehlen einzelner Realkennzeichen indiziert aber nicht zwingend eine bewusst wahrheitswidrige Darstellung. Denn eine geringe Aussagequalität kann auch andere Gründe haben, zum Beispiel wenn bei der Aussageperson eine reduzierte Aussagekompetenz vorliegt oder sie aus Angst und Nervosität nicht in der Lage ist, über das eigentlich Erlebte zu berichten.55 Auch dann muss die Leitfrage von Volbert wieder bejaht werden: „Ja, der Zeuge könnte diese Aussage gemacht haben, ohne dass sie auf einem realen Erlebnishintergrund 53 Sogenannte Stereotypen über „typisches“ Lügenverhalten, Gödert/Gamer/Rill/Vossel Polizei & Psychologie, S. 519 (520 f.); Köhnken The Detection of Deception in Forensic Contexts, S. 41 (49); Vrij/Ganis Credibility Assessment, S. 301 (337): „stereotypes of truthfulness“. 54 Zu den einzelnen Realkennzeichen im Detail sei verwiesen auf Köhnken MAH Strafverteidigung § 60 Rn. 100–122; Niehaus Glaubhaftigkeitsmerkmale, S. 40–64; Vrij Detecting Deception, S. 3 (7–10). 55 Griesel/Ternes/Schraml/B. Cooper/Yuille Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, S. 293 (296); Häcker Bender/Häcker/ Schwarz, Rn. 339; Volbert Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12 (16); anderer Ansicht Geipel Beweiswürdigung, § 17 Rn. 13, dessen Verweis auf Häcker a. a. O. (in der Vorauflage Rn. 299) seine Auffassung aber gerade nicht stützt.

26

2. Kapitel: Die aussagepsychologische Begutachtung

basiert“. Weder die Lügenhypothese noch im Ergebnis die Nullhypothese können dann zurückgewiesen werden.

d) Weniger wichtig: Konstanz und Motivation Die kriterienorientierte Aussageanalyse gilt als „Kernstück“ der aussagepsychologischen Begutachtung.56 Der Begutachtungsprozess umfasst de lege artis aber auch eine Konstanz- und Motivationsanalyse, bevor die Lügenhypothese insgesamt verworfen werden kann.57 Während bei der Inhaltsanalyse eine Aussage überprüft wird, werden bei der Konstanzanalyse – wenn vorhanden – zeitlich einander nachfolgende Aussagen derselben Aussageperson über denselben Sachverhalt miteinander verglichen und auf Übereinstimmungen, Widersprüche, Ergänzungen und Auslassungen geprüft.58 Dabei wird erwartet, dass Schilderungen eigener Erlebnisse, die zu verschiedenen Zeitpunkten gegeben werden – zum Beispiel bei der polizeilichen Vernehmung und der Aussage bei der eigentlichen Begutachtung –, eher übereinstimmen als solche über ausgedachte Geschichten. Die Begründung ist weitgehend dieselbe wie bei der Realkennzeichenanalyse: Erinnerungen an Selbsterlebtes bleiben länger im Gedächtnis, können einfacher rekonstruiert und ergänzt und müssen nicht frei erfunden werden. Bei gegebenem subjektiven Erlebnisbezug kann sich die Aussageperson einfach erneut auf ihr autobiografisches Gedächtnis beziehen, während eine intentional falschaussagende Person sich an ihre frühere Falschaussage zurückerinnern muss, was die Gedächtnisleistung weiter herausfordert.59 Werden hinreichend hohe Übereinstimmungen oder qualifizierte Ergänzungen festgestellt, könne dies also ein weiterer Indikator gegen die Lügenhypothese sein.60 Allerdings darf man der Konstanzanalyse nicht zu viel Wert zusprechen, obgleich der Bundesgerichtshof sie als „wesentliches methodisches Element der Aussageanalyse“ versteht.61 Einerseits soll aus der Konstanz einer Aussage nicht automatisch auf ihre Wahrhaftigkeit geschlossen werden dürfen.62 Je nach Kompetenz kann eine Aussageperson komplizierte oder einfache Sachverhalte 56 Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (77); die Inhaltsanalyse wird im englischsprachigen Raum als Criteria Based Content Analysis bezeichnet, die aussagepsychologische Begutachtung „im weiteren Sinne“ als Statement Validity Analysis; vgl. Köhnken The Detection of Deception in Forensic Contexts, S. 41 (43); Steller Forensische Psychiatrie, Psychologie, Kriminologie 14 (2020) S. 188 (189). 57 Schoreit StV 2004, 284 (285). 58 BGHSt. 45, 164 (172); Berlinger, S. 31; Ott KK § 261 Rn. 121: „aussageübergreifende Qualitätsmerkmale“. 59 Arntzen, S. 51; H. Offe/S. Offe Praxis der Rechtspsychologie 18 (2008) S. 97 (98). 60 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 129; Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (36). 61 BGHSt. 45, 164 (172). 62 Vgl. BGH StV 1996, 249 (250).

II. Hypothesengeleitete Diagnostik

27

erfinden und konstant reproduzieren.63 Andererseits kann nicht jede Inkonstanz ein Hinweis auf mangelnde Glaubhaftigkeit sein, da Gedächtnisunsicherheiten, spontane Ergänzungen und nachträgliche Präzisierungen im Einzelfall sogar auf den tatsächlichen Erlebnisbezug einer Bekundung hinweisen können.64 Auch ist weitgehend unklar, wie exakt zwei Angaben übereinstimmen müssen, um im Sinne der Konstanzanalyse als übereinstimmend gewertet zu werden. Denn konkrete Regeln, wie ein solcher Vergleich vorgenommen werden soll, gibt es nicht, so dass eine klare Grenzziehung zwischen Übereinstimmungen, Ergänzungen oder Widersprüchen selten möglich ist.65 Konstanz wird daher selbst von Vertretern der Aussagepsychologie lediglich als Mindestanforderung und Ausschlusskriterium empfohlen.66 Hinzu tritt die Motivationsanalyse, die zum Ziel hat, mögliche Motive und Anreize für eine absichtliche Falschbelastung aufzudecken.67 Anhaltspunkte für potenzielle Belastungsmotive sollen durch Analyse der Beziehung zwischen Zeugen und Beschuldigtem sowie der Konsequenzen der Anschuldigungen für den Zeugen, den Beschuldigten oder Dritte gewonnen werden können.68 Ergeben sich bei der Rekonstruktion der Entstehungsgeschichte konkrete Anhaltspunkte für das Vorhandensein eines Falschbelastungsmotivs, steigen grundsätzlich die Anforderungen an die Begutachtung und die richterliche Beweiswürdigung.69 Allerdings gibt es keine Motive, die typischerweise und zwingend zu einer Falschaussage führen.70 Denn jedem Handeln liegen komplexe Motivbündel zugrunde. Grundsätzlich können daher alle Motive, die zu einer Falschaussage beitragen können, auch zu einer zutreffenden Aussage führen. Ärger oder Rache zum Beispiel können für eine Falschaussage sprechen; sie können jedoch ebenso Gründe für eine zutreffende – und nachvollziehbare – Anschuldigung sein.71 Zudem hat eine Falschaussage oft gar nichts mit dem Beschuldigten zu tun, sondern das Motiv liegt etwa in dem Bestreben, sich selbst zu entlasten, 63

Vgl. BGH NStZ 2015, 602 (ebd.). Arntzen, S. 55 f.; Deckers StV 2017, 50 (54); Eisenberg Beweisrecht, Rn. 1483b; siehe bereits Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (59). 65 H. Offe/S. Offe Praxis der Rechtspsychologie 18 (2008) S. 97 (104, 112). 66 Vgl. Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 161 f.; Loohs Fachanwalt Strafrecht 37. Kapitel Rn. 105; Volbert/Steller Psychiatrische Begutachtung, S. 683 (692). 67 Nicht zu verwechseln mit den motivationsbezogenen Realkennzeichen, vgl. S. Offe/H. Offe Rechtspsychologie kontrovers, S. 80 (87 f.). 68 BGHSt. 45, 164 (175); F. Schneider/Frister/Olzen, S. 406. 69 Vgl. BGH NStZ-RR 2003, 206 (208); BGH, Beschluss vom 25.2.2016 – 2 StR 308/15, Rechtsprechungsnachweis bei Miebach NStZ-RR 2018, 36 (38); siehe auch Ott KK § 261 Rn. 123. 70 S. Offe/H. Offe Rechtspsychologie kontrovers, S. 80 (89). 71 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 173; S. Offe/H. Offe Rechtspsychologie kontrovers, S. 80 (83). 64

28

2. Kapitel: Die aussagepsychologische Begutachtung

sich Vorteile zu verschaffen oder aus Verlegenheit ein außereheliches Verhältnis nicht offenbaren zu müssen.72 Wirklich ausschließen kann man eine Falschaussagemotivation daher so gut wie nie.73 Zu Recht betonte der Bundesgerichtshof daher bereits in seinem Grundsatzurteil, dass etwaige Feststellungen von Belastungsmotiven beim Zeugen nicht zwingend gegen die Glaubhaftigkeit der Aussage sprechen.74 Eine Falschaussagemotivation kann unentdeckt bleiben, und eine subjektiv wahre Aussage kann vorliegen, selbst wenn sich ein Belastungsmotiv abzeichnet.75 Aus dem Vorhandensein oder Fehlen eines Motivs lassen sich keine verlässlichen Schlussfolgerungen ziehen.76 Das heißt: Finden sich keine Motive für eine absichtliche Falschbeschuldigung, darf nicht ohne Weiteres angenommen werden, die Aussage sei subjektiv wahr. Und findet sich ein Motiv, muss die Aussage nicht zwangsläufig falsch sein. Im Ergebnis hat die Aussagemotivation daher wenig mit dem subjektiven Wahrheitsgehalt einer belastenden Aussage zu tun und wenn überhaupt einen nur eingeschränkten (Indiz-)Wert.77 Zuzustimmen ist daher Susanne und Heinz Offe, die darauf hinweisen (müssen), dass ein Gutachter – oder ein Richter – in jeder Begutachtung gründlich und genau arbeiten sollte, und zwar ungeachtet der Motivation der Aussageperson.78

3. Suggestion: „Tod der Inhaltsanalyse“? Eine auf Suggestion zurückzuführende Aussage darf nicht gleichgesetzt werden mit einer bewusst wahrheitswidrigen Aussage. Für die Prüfung und Zurückweisung der Suggestionshypothese ist die Inhaltsanalyse daher unstreitig ungeeignet.79 Suggerierte Aussagen unterscheiden sich nämlich nicht zwingend von 72 Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (34); weitere Beispiele bei Jansen Zeuge, Rn. 698–704; Rechtsprechungsübersicht zu Motiven, die vom Beschuldigten unabhängig sind, a. a. O bei Rn. 88. 73 H. Offe Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 87 (95). 74 BGHSt. 45, 164 (175). 75 Baumhöfener/Daber/Wenske NStZ 2017, 562 (564); Häcker Bender/Häcker/Schwarz, Rn. 294, 296; Köhnken Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 25 (41 f.). 76 S. Offe/H. Offe Rechtspsychologie kontrovers, S. 80 (83); anders Häcker Bender/Häcker/Schwarz, Rn. 288, die dem (Nicht-)Vorliegen eines Motivs „erhebliche Bedeutung“ zusprechen. 77 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 178; H. Offe Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 87 (95, 97): die Motivationsanalyse ist unergiebig zur Beurteilung des subjektiven Erlebnisbezugs und wird nicht gebraucht. 78 S. Offe/H. Offe Rechtspsychologie kontrovers, S. 80 (86). 79 Vgl. nur BGHSt. 45, 164 (171 f.); BGH StV 2017, 9 (10); Häcker Bender/Häcker/ Schwarz, Rn. 365; Jansen Zeuge, Rn. 461; Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (110); Sander LR § 261 Rn. 129; Steller Forensische Psychiatrie, Psychologie, Kriminologie 14 (2020) S. 188 (13, 15); Volbert/Schemmel/Tamm Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108 (115 f.).

II. Hypothesengeleitete Diagnostik

29

auf eigenem Erleben beruhenden Aussagen. Die beeinflusste Person ist nämlich subjektiv von der Richtigkeit ihrer Aussage überzeugt, für sie ist ihre Aussage subjektiv wahr, so dass sie das geschilderte Geschehen weder bewusst noch unter Aufbringen kognitiver Energie erfinden muss. Es ist sozusagen in ihr Gedächtnis „implantiert“ und daher wie eine „echte Erinnerung“ rekonstruierbar.80 Das Analysematerial ist „kontaminiert“ und eine Analyse anhand der Realkennzeichen nicht mehr sinnvoll.81 Oder mit den Worten Stellers: „Suggestive Befragungen können also nicht nur zur Entstehung von Scheinerinnerungen […] führen, sondern sie entwerten auch den Indizcharakter von Realkennzeichen für den Erlebnisgehalt von Aussagen“.82 Undeutsch und Klein werden noch deutlicher: Suggestion führt zu einem Todesurteil über die kriterienorientierte Aussageanalyse.83 Somit ist Volbert zuzustimmen, wenn sie schreibt, die aussagepsychologische Begutachtung sei „mehr als merkmalsorientierte Inhaltsanalyse“.84 Denn das muss sie sein, wenn sie nicht in der Lage ist, zwischen aufgrund von Suggestion für wahr empfundenen und (ebenfalls nur subjektiv wahren) erlebnisbezogenen Aussagen zu unterscheiden. Die Frage ist nur, ob sich suggerierte Falschaussagen in der Begutachtungspraxis tatsächlich positiv identifizieren lassen, wie Steller behauptet,85 beziehungsweise mit welcher Sicherheit suggestive Einflüsse ausgeschlossen werden können. Die Suggestionshypothese kann nach derzeitigem wissenschaftlichem Stand lediglich durch Rekonstruktion der Aussageentstehung und -entwicklung geprüft werden.86 Somit überschneidet sie sich zum Teil mit der Konstanz- und Motivationsanalyse. Andere Methoden, die eine Differenzierung zwischen suggerierten und erlebnisfundierten Aussagen erlauben, existieren nicht.87 Gibt es im Rahmen der Aussagegenese keine Hinweise, die für Suggestion sprechen, unterbleibt meist eine gesonderte Prüfung der Suggestionshypothese. Oft werden sich jedoch irgendwelche suggestive Einflüsse finden, zum Beispiel bei Befragungen durch Familienangehörige, oft voreingenommene Vernehmungspersonen oder Therapeuten oder durch suggestive Interaktionen zwischen Pro80 Köhnken MAH Strafverteidigung § 60 Rn. 148; Volbert/Steller Psychiatrische Begutachtung, S. 683 (699 f.). 81 Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (40 f.). 82 Steller Praxis der Rechtspsychologie 23 (2013) S. 11 (20). 83 Undeutsch/Klein Rechtspsychologie kontrovers, S. 67 (74). 84 Volbert Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12 (ebd.). 85 Steller Forensische Psychiatrie, Psychologie, Kriminologie 14 (2020) S. 188 (189). 86 Zur „herrschenden Meinung“ Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/ Stadler, S. 199; Köhnken MAH Strafverteidigung § 60 Rn. 30; F. Schneider/Frister/Olzen, S. 406; Steller Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 71 (80); Volbert Handbuch der Rechtspsychologie, S. 331 (338 f.). 87 Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (77).

30

2. Kapitel: Die aussagepsychologische Begutachtung

zessbegleitern und Opferzeugen, so dass die Suggestionshypothese – „die Aussage ist nicht erlebnisbezogen, weil suggeriert“ – streng genommen nur selten zurückgewiesen werden kann.88 Solche oft gut gemeinten Befragungen oder Gespräche liegen typischerweise in Aussage-gegen-Aussage-Konstellationen vor, so dass zumindest immer an die Möglichkeit suggestiver Bedingungen gedacht werden muss.89 Nach Greuel sind die Grenzen der aussagepsychologischen Begutachtung jedoch erst erreicht, wenn suggestive Einflüsse „als naheliegend und wahrscheinlich angenommen werden müssen“, auch wenn damit nicht automatisch feststeht, dass sie wirklich eine Suggestion bewirkt haben. Der (subjektive) Wahrheitsgehalt der Aussage lasse sich dann nicht mehr zweifelsfrei feststellen.90 Das sei vor allem bei suggestiven Bedingungen vor der ersten offiziellen Aussage der Fall, da dann selten ausgeschlossen werden könne, dass diese durch Suggestion beeinflusst worden sei. Fänden suggestive Beeinflussungen dagegen erst nach der „Geburt“ der Aussage statt, lasse sich die Suggestionshypothese zumindest zurückweisen, wenn sich danach der wesentliche Aussageinhalt gegenüber der Erstaussage nicht entscheidend verändert habe.91 Einen Schwellenwert, wann eine Aussage „kaputt suggeriert“ sei, gebe es allerdings nicht.92 Vielmehr soll es dem Gutachter – und schließlich dem Richter – überlassen bleiben, suggestive Einflüsse für „wahrscheinlich“ oder „naheliegend“ und damit erheblich zu halten. Hält er sie dagegen für lediglich „nicht bedeutsam“93 oder „leicht bis mittelgradig potent“,94 sollen sie unbeachtlich sein. Im Strafverfahren kann es aber nicht darauf ankommen, wie wahrscheinlich ein suggestiver Einfluss ist, ungeachtet der fehlenden Trennschärfe dieser Begrifflichkeiten. Denn bereits die bestehende Möglichkeit sät „vernünftige Zweifel“ am Wahrheitsgehalt der Aussage. Zwar dürfen solche „Suggestionsquellen“ nicht dahingehend fehlinterpretiert werden, dass sie bewusst angewandt werden, um eine falsche Aussage zu erzeugen. Im Gegenteil besteht ein leicht zu übersehendes Suggestionsrisiko gerade bei „nicht-intentionalem“ fremdsuggestivem Verhalten.95 Hinzu kom88 Vgl. auch Häcker Bender/Häcker/Schwarz, Rn. 369 f.; Neuhaus StV 2017, 55 (61); Volbert Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 52 (64). 89 Im Falle von Therapie spricht Deckers von einem „Therapieknoten gordischen Ausmaßes“, Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (195). 90 Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (77). 91 Häcker Bender/Häcker/Schwarz, Rn. 369; Köhnken MAH Strafverteidigung § 60 Rn. 30; Volbert Handbuch der Rechtspsychologie, S. 331 (339). 92 Greuel Psychologie der Zeugenaussage, S. 211 (215). 93 Volbert Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12 (17). 94 Greuel Psychologie der Zeugenaussage, S. 211 (219). 95 Köhnken MAH Strafverteidigung § 60 Rn. 71; Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (180); wie schnell eine Befragung unabsichtlich suggestiven Charakter haben kann, zeigen die Beispiele bei Sommer Strafverteidigung, Rn. 949–956.

II. Hypothesengeleitete Diagnostik

31

men autosuggestive Prozesse durch intensive Beschäftigung mit der ausschlaggebenden Thematik, zum Beispiel durch den Konsum von Inhalten, die in Büchern, Filmen und vor allem im Internet präsent sind.96 Zumindest die Möglichkeit autosuggestiver Verläufe bei der Aussagegenese darf nicht unterschätzt werden, zumal derartige Prozesse selten erkannt werden.97 Bedenkt man, wie einfach es heutzutage ist, auf entsprechendes – zum Beispiel pornografisches – Material zuzugreifen, wird es selten möglich sein, mit Sicherheit auszuschließen, dass die Aussageperson Kenntnis erlangt hat über bestimmte sexuelle Praktiken, ohne sie selbst erlebt haben zu müssen – ein Problem, das auch das Risiko erhöht, dass eine lügende Person einen entsprechenden Sachverhalt einfacher und „glaubwürdiger“ konstruiert. Konsequenterweise hat die Prüfung der Suggestionshypothese stets kumulativ zur Aussageanalyse zu erfolgen. Da sich die Überprüfung der Lügenhypothese weitgehend erübrigt, wenn Suggestion nicht ausgeschlossen werden kann, empfiehlt unter anderem Köhnken, die Prüfung und Verwerfung der Suggestionshypothese vor der Aussageanalyse vorzunehmen.98 Da eine potenzielle (Auto-)Suggestion mittlerweile immer „in der Luft liegt“, stellt sich jedoch die Frage, inwiefern die aussagepsychologische Begutachtung noch einen Mehrwert bringen kann – oder welchen „Restwert“ man ihr im Übrigen beimisst. Nach Eschelbach taugt die Aussagepsychologie insgesamt allein und höchstens zur Unterscheidung von subjektiv erlebnisbezogenen und bewusst wahrheitswidrigen Aussagen – also zur Prüfung der Lügenhypothese. Auf Suggestion zurückzuführende Aussagen könne sie allerdings gar nicht oder zumindest nicht zuverlässig aufdecken. Lediglich könne sie Angaben machen zum Grad der Suggestibilität, auf Alternativhypothesen hinweisen und weitere Problembereiche benennen. Sicher ausschließen kann sie Suggestion aber nicht.99

96

Köhnken MAH Strafverteidigung § 60 Rn. 24; Volbert Handbuch der Rechtspsychologie, S. 331 (335); Volbert/Schemmel/Tamm Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108 (114). 97 Deckers Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (197). 98 Köhnken MAH Strafverteidigung § 60 Rn. 90; vgl. auch Steller Praxis der Rechtspsychologie 23 (2013) S. 11 (21): „obsolet“; dass andere Autoren empfehlen, die Suggestionshypothese nach der Lügenhypothese zu prüfen, zum Beispiel Greuel Psychologie der Zeugenaussage, S. 211 (215), macht im Ergebnis jedoch keinen Unterschied. 99 Eschelbach Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 43 (57 f.).

32

2. Kapitel: Die aussagepsychologische Begutachtung

III. Grenzen der kriterienorientierten Aussageanalyse Ungeachtet der Probleme, die sich bereits aus dem theoretischen Fundament hypothesengeleiteten Vorgehens ergeben, stößt die aussagepsychologische Begutachtung gerade in Aussage-gegen-Aussage-Konstellationen an ihre methodischen Grenzen. Köhnken und Gallwitz fassen diese wie folgt zusammen: „Während […] die Anwendbarkeit dieser Methode unten an eine Grenze stößt, wenn keine verwertbare Aussage vorhanden ist, wird die obere Grenze durch die spezifischen Fähigkeiten und Kenntnisse der Aussageperson markiert“.100

1. Kein ausreichendes Analysematerial Die aussagepsychologische Glaubhaftigkeitsbegutachtung setzt selbsterklärend eine begutachtungsfähige Aussage voraus, deren Merkmalsausprägung Aufschlüsse über ihren Wirklichkeitsgehalt ermöglicht.101 Daher kann die Aussageanalyse nicht zum Zuge kommen, wenn gar keine Aussage vorhanden ist. Wesentlich problematischer ist die Konstellation, in der eine Aussage zwar vorhanden ist, das darin enthaltene Aussagematerial für eine Analyse jedoch nicht reicht. Denkt man an die Undeutsch-Hypothese zurück, muss für die Anwendung der Aussageanalyse nämlich ein einigermaßen komplexer Handlungsablauf vorhanden sein. Knappe und inhaltlich nicht konkretisierbare Sachverhaltsschilderungen verhindern somit eine Beurteilung des möglichen Erlebnisgehaltes mit aussagepsychologischen Methoden. Bei einem nur kurzen, flüchtigen Ereignis, bei dem sich naturgemäß weniger sagen lässt, wird es auch für eine lügende Person ein Leichtes sein, das dann erfundene Geschehen über längere Zeiträume aufrechtzuerhalten.102 Selbst bei einer auf den ersten Blick detailreichen Aussage kommt es für ihre Analyse allein auf den Teil an, der für die Strafbarkeit entscheidend ist: das diagnostisch relevante Kerngeschehen.103 Das ist aber nur derjenige Teil einer Aussage, der sich auf strafrechtlich erhebliche und vor allem strittige Aspekte bezieht. Denn nur dieser müsste im Fall einer bewusst wahrheitswidrigen Aussage erfunden werden. Besonders in Aussage-gegen-Aussage-Konstellationen mit sexualstrafrechtlichem Bezug wird nur selten eine für die Aussageanalyse ergiebige Aussage über das Kerngeschehen vorliegen.

100 Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (41). 101 Friedrichs Forensische Psychologie, S. 3 (ebd.). 102 Vgl. Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 158; Undeutsch Forensische Psychologie, S. 26 (159). 103 Knapp BGH StV 2014, 720 (721); vgl. Deckers StV 2017, 50 (51); Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (40).

III. Grenzen der kriterienorientierten Aussageanalyse

33

Sexualdelikten ist oft gemeinsam, dass das Geschehen von Zeugen und Beschuldigten weitgehend identisch geschildert und das vom mutmaßlichen Opfer behauptete Ereignis selten gänzlich abgestritten wird. Meist ist der sexuelle Kontakt selbst unstreitig und steht allein das Einvernehmen in Frage. Diagnostisch bedeutsam ist dann nur der Teil der Aussage zur fehlenden Einvernehmlichkeit bezüglich der behaupteten sexuellen Handlung. Somit kann sich die Aussageanalyse sinnvollerweise nur auf diejenigen Aspekte beziehen, die unmittelbar mit der fehlenden Einvernehmlichkeit zusammenhängen, wie Diskussionen, Gegenwehr und deren Überwindung. Alles andere, das sogenannte periphere Randgeschehen, ist diagnostisch irrelevant.104 Ein derart reduziertes Untersuchungsmaterial reichte selbst nach alter Rechtslage kaum aus für eine ausreichende Aussageanalyse – obwohl damals immerhin ein objektives Nötigungselement vorliegen musste.105 Noch seltener wird ein ausreichendes Analysematerial aber in den Fällen des neuen § 177 StGB vorliegen. Aufgrund der dem § 177 StGB zugrundeliegenden „Nein heißt Nein“-Lösung erschöpft sich die Aussage oft darin, dass ein entgegenstehender Wille vorgelegen habe – dieser ist immerhin für die Strafbarkeit und Schuld des Angeklagten entscheidend, sofern er objektiv erkennbar ist.106 Eine solche Aussage genügt aber nicht dem Mindestumfang, der für eine Glaubhaftigkeitsbegutachtung erforderlich ist. Die Behauptung, „Nein“ gesagt – oder gedacht – zu haben, ist für eine aussagepsychologische Begutachtung zu einfach strukturiert und zu kurz.107 Entsprechendes gilt für § 177 Absatz 2 Nummer 3 StGB: Aussagepsychologische Beurteilungen von „Überrumpelungen“ dürften nach den Kriterien der Realkennzeichenanalyse kaum möglich sein.108 Zudem verliert die Konstanzanalyse weiter an Gewicht bei einfachen und übersichtlichen Aussagen ohne nähere Details.109 Denn auch sie kann sich nur auf Schilderungen beziehen, die exklusiv den inkriminierenden Sachverhalt betreffen. Andere Details mögen zwar hilfreich sein, die Gedächtnisleistung insgesamt widerzuspiegeln, berühren aber nicht das fragliche Geschehen und kön104 Köhnken Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 25 (43 f.). 105 Vgl. Köhnken The Detection of Deception in Forensic Contexts, S. 41 (55); Lederer/ Deckers Praxis der Rechtspsychologie 27 (2017) S. 75 (ebd.); zur alten Rechtslage bereits Steller Aussagebeurteilung, S. 167. 106 Lederer/Deckers Praxis der Rechtspsychologie 27 (2017) S. 75 (f.); von einem Dilemma spricht Rohmann Praxis der Rechtspsychologie 27 (2017) S. 27 (30–32), der vor den sich ergebenden Grenzen warnt und versucht, die Aussageanalyse zumindest für manche Fälle des § 177 StGB zu „retten“. 107 Lederer StraFo 2018, 280 (284). 108 Vgl. Bundesministerium der Justiz und für Verbraucherschutz Abschlussbericht, S. 51 mit Verweis auf das Impulsreferat von Röhrig; Köhnken MAH Strafverteidigung § 60 Rn. 143; Lederer/Deckers Praxis der Rechtspsychologie 27 (2017) S. 75 (78); Steller Forensische Psychiatrie, Psychologie, Kriminologie 14 (2020) S. 188 (194). 109 So auch BGH StV 2017, 9 (ebd.).

34

2. Kapitel: Die aussagepsychologische Begutachtung

nen daher keine maßgebliche Grundlage für die Konstanzanalyse bilden. Das Kerngeschehen muss daher in jedem Fall und deutlich vom Randgeschehen getrennt werden.110

2. Manipulation, Aussagetraining und „Coaching“ Dass eine lügende Aussageperson versuchen wird, den Gutachter oder den Richter während der Vernehmung von der Wahrhaftigkeit seiner Aussage zu überzeugen, ist genaugenommen keine Schwäche der aussagepsychologischen Glaubhaftigkeitsbegutachtung. Ihre Aufgabe besteht bekanntlich darin, solche Täuschungen und Manipulationsversuche aufzudecken. Das gilt letztlich für jede Methode zur Ermittlung des Wahrheitsgehalts einer Aussage. Trotzdem fußt die Aussagepsychologie auf der Annahme, eine lügende Aussageperson wisse nicht um die aussagepsychologischen Grundannahmen, sondern glaube an die „Stereotypen der Glaubwürdigkeit“. Wenig behandelt wurde bislang die Frage, inwiefern die Aussage einer aufgeklärten und informierten Person noch zulänglich begutachtet werden kann. Denn heutzutage werden die meisten Zeugen wissen, dass sie aussagepsychologisch begutachtet werden. Es liegt auf der Hand, dass sowohl aufrichtige als auch lügende Aussagepersonen – sei es mit oder ohne Hilfe – versuchen werden, realkennzeichenreiche Aussagen zu produzieren, damit diese – zu Recht oder zu Unrecht – als glaubhaft eingestuft werden.111 Damit geht die Frage einher, ob sich Realkennzeichen antrainieren lassen. Die vorhandene Datenbasis deutet darauf hin, dass ein solches Training nicht nur möglich und vor allem erfolgversprechend ist,112 sondern dass frei käufliche Literatur existiert, die Tipps zum Erfinden und „Üben“ von Realkennzeichen für den praktischen „Ernstfall“ enthält.113 Untersuchungen haben ergeben, dass wahrheitswidrige, aber „gecoachte“ Aussagen mehr Realkennzeichen enthalten als wahrheitswidrige Aussagen ohne entsprechendes Training, so dass gecoachte Aussagen nicht von subjektiv wahren Aussagen unterschieden werden können.114 So konnte in einer Studie mit erwachsenen Teilnehmern ein Gutachter 69 Prozent der „normalen“, aber nur 27 Prozent der gecoachten Lügner korrekt klassifizieren. Selbst als er darüber informiert wurde, dass einige der Probanden 110 Vgl. BGH NStZ-RR 2003, 332 (333); Deckers StV 2017, 50 (52); Ott KK § 261 Rn. 121. 111 Vgl. Eisenberg JR 2016, 390 (393 f.); Püschel StraFo 2015, 269 (275); Schwenn StV 2010, 705 (708). 112 Vgl. Häcker Bender/Häcker/Schwarz, Rn. 412–414; Köhnken MAH Strafverteidigung § 60 Rn. 144; Volbert/Steller European Psychologist 19 (2014) S. 207 (212). 113 Vgl. Schwenn StV 2010, 705 (708) mit Verweis auf das Buch „Trotz Allem: Wege zur Selbstheilung für sexuell missbrauchte Frauen“ von Ellen Bass und Laura Davis. 114 Vgl. Eschelbach BeckOK-StPO § 261 Rn. 59.5; Gödert Glaubhaftigkeitsbeurteilung, S. 20; Hohoff NStZ 2020, 387 (390); jeweils mit weiteren Nachweisen.

III. Grenzen der kriterienorientierten Aussageanalyse

35

gecoacht worden waren, stieg bei einer wiederholten Auswertung die Trefferquote für gecoachte Lügner auf lediglich 40 Prozent.115 Selbst wenn sich der Gutachter des Risikos von Coaching bewusst ist und besonders sorgfältig vorgeht, besteht also die Gefahr, dass manipulierte Aussagen fälschlicherweise als glaubhaft eingestuft werden. Köhnken sieht in einem solchen Coaching daher eine ähnliche Kontamina tion der Aussage wie bei einer suggestiven Beeinflussung.116 Wie etwaige Coaching-Einflüsse aufgedeckt werden sollen oder wie intensiv eine Vorbereitung sein muss, um erfolgreich zu sein, ist noch unklar.117 Analog zur Suggestionshypothese wird in Zukunft wohl ein genaueres Augenmerk auf die Aussagegenese geworfen werden müssen. Besteht der Verdacht, dass die Aussageperson angeleitet wurde, kann die Lügenhypothese jedenfalls nicht mehr entschieden zurückgewiesen werden.118

3. Akteneinsicht Ein mit dem Coaching verwandtes Problem steht im Gesetz: § 406e StPO gewährt dem Verletzten ein grundsätzliches Akteneinsichtsrecht. Da sich die meisten Verfahrensbeteiligten für den Inhalt der Akten aus naheliegenden Gründen interessieren werden, bedarf es eines berechtigten Interesses, so dass die Akteneinsicht zwar nicht automatisch gewährt wird (§ 406e Absatz 1 Satz 1 StPO). Jedoch muss ein mutmaßlich Verletzter eines Delikts gegen die sexuelle Selbstbestimmung sein berechtigtes Interesse nicht darlegen (§ 406e Absatz 1 Satz 2, § 395 Absatz 1 Nummer 1 StPO). Bei Sexualdelikten muss daher einer der in § 406e Absatz 2 StPO genannten Gründe vorliegen, damit das Akteneinsichtsrecht versagt wird: nämlich das Entgegenstehen überwiegender schutzwürdiger Interessen des Beschuldigten oder anderer Personen, die Gefährdung des Untersuchungszwecks oder die erhebliche Verzögerung des Verfahrens. Bei der Entscheidung über die Gewährung der Akteneinsicht sind die Interessen gegeneinander abzuwägen.119 Steht Aussage gegen Aussage – hängt also die Verurteilung allein von der Aussage des mutmaßlich Verletzten ab –, könnte man meinen, das Aktenein115

Vrij/Kneller/Mann Legal and Criminological Psychology 5 (2000) S. 57 (65). Köhnken Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 25 (48); so auch in der Folgeauflage Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (40 f.); nach Vrij Detecting Lies, S. 238, wird die Realkennzeichenanalyse durch Coaching zu einem „ineffizienten Instrument der Wahrheitsfindung“ („inefficient veracity detection tool“). 117 Köhnken MAH Strafverteidigung § 60 Rn. 144; Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (27 f., 33). 118 Geipel Lügenerkennung, S. 100; Neuhaus StV 2015, 185 (190): „Den klassischen Prüfungskriterien für die Glaubhaftigkeit der Zeugenaussage […] wird auf diese Weise ersichtlich der Boden entzogen.“ 119 Vgl. KG StV 2019, 181 (182). 116

36

2. Kapitel: Die aussagepsychologische Begutachtung

sichtsrecht werde im Sinne der Wahrheitsermittlungspflicht stets versagt. Kann sich der Opferzeuge mithilfe der Akte auf seine Aussage vorbereiten, ist eine aussagepsychologische Begutachtung in den meisten Fällen nämlich überflüssig und sinnlos. Eschelbach geht sogar von einem endgültigen Beweisverlust aus.120 Mindestens die ohnehin zu relativierende Konstanzanalyse ist nicht mehr durchführbar, wenn zumindest nicht ausgeschlossen werden kann, dass die Aussage auf dem Studieren von Akteninhalten basiert.121 So sehen es auch die Oberlandesgerichte Hamburg, Schleswig und Düsseldorf, denen zufolge die Akteneinsicht gemäß § 406e Absatz 2 Satz 2 StPO nach pflichtgemäßem Ermessen versagt werden muss.122 Immerhin erscheint der Untersuchungszweck mehr als gefährdet, und eine abstrakte Gefahr reicht unstreitig aus.123 Anders aber das Oberlandesgericht Braunschweig, das zwar eine Beeinträchtigung der Glaubhaftigkeitsprüfung durchaus sieht, wenn der Verletzte den Akteninhalt einschließlich seiner Aussagen kennt. Dem Kriterium der Aussagekonstanz werde jedoch zu viel Bedeutung beigemessen, so dass die Verletztenrechte unverhältnismäßig beschnitten würden, wenn man die Akteneinsicht versage. Dies gelte jedenfalls dann, wenn der anwaltliche Beistand des Verletzten zugesichert habe, seinem Mandanten keine Akteninhalte weiterzuleiten. Auch wenn eine solche Erklärung nicht durchsetzbar sei, zeige die Erfahrung, dass Nebenklagevertretern die (wohl doch wieder) Bedeutung der Konstanzanalyse bekannt sei und diese daher von sich aus bemüht seien, den Beweiswert der Aussagen der Mandanten nicht zu reduzieren. Außerdem sei zu berücksichtigen, dass dem Verletzten Inhalte seiner früheren Vernehmungen in der Regel aufgrund anderer Quellen ohnehin zur Verfügung stünden.124 Auch das Berliner Kammergericht lehnt bei Aussage gegen Aussage eine Ermessensreduktion auf Null ab. Ursprünglich nur in der Berufungsinstanz: Das Risiko einer präparierten Zeugenaussage aufgrund der erstmals in zweiter Instanz wahrgenommenen Akteneinsicht sei deutlich reduziert.125 Mittlerweile haben das Kammergericht und zwischenzeitlich der Fünfte Strafsenat aber entschieden, dass mit der Akteneinsicht des Verletzten bei Aussage-gegen-Aussage-Konstellationen „nicht typischerweise“ eine Entwertung der Konstanz120 Eschelbach BeckOK-StPO § 261 Rn. 59.5; ders. Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 43 (54 f.); siehe auch Eisenberg JR 2016, 390 (394); Hohoff NStZ 2020, 387 (389); Ott KK § 261 Rn. 121. 121 Daber Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 169 (174 f.); Deckers StraFo 2015, 265 (268); Gubitz NStZ 2016, 367 (368). 122 OLG Hamburg NStZ 2015, 105 (106); Beschluss vom 23.10.2018 – 1 Ws 108/18, BeckRS 2018, 28084; OLG Schleswig StraFo 2016, 157 (ebd.); OLG Düsseldorf, Beschluss vom 26.5.2014 – 1 Ws 196/14, BeckRS 2016, 1698. 123 Baumhöfener NStZ 2014, 135 (138). 124 OLG Braunschweig NStZ 2016, 629 (630 f.); zustimmend Nepomuck KMR § 406e Rn. 24; Schöch SSW-StPO § 406e Rn. 12; ders. NStZ 2016, 631 (632). 125 KG NStZ 2016, 438 (440).

III. Grenzen der kriterienorientierten Aussageanalyse

37

analyse einhergehe, und zwar auch bei nur einer Tatsacheninstanz. Ansonsten werde die freie Entscheidung des Belastungszeugen beeinträchtigt, Akteneinsicht zu beantragen, was den Schutzfunktionen der §§ 406 ff. StPO widerspreche.126 Richtig daran ist allein, dass Opferanwälte als Organe der Rechtspflege gut beraten sind, von einer Weitergabe der Akten abzusehen.127 Kann nämlich nicht ausgeschlossen werden, dass die im Rahmen der Konstanzanalyse festgestellten Übereinstimmungen nicht andere Ursachen haben als ein tatsächliches Erleben, muss die Lügenhypothese letztlich bestehen bleiben. Erlangt die Aussageperson Aktenkenntnis, liegt zumindest die Möglichkeit einer solchen anderen Ursache nahe. So weist das Oberlandesgericht Braunschweig zwar darauf hin, dass es sich doch zu Gunsten des Angeklagten auswirkt, wenn eine festgestellte Konstanz in der Aussage des Verletzten wegen vorheriger Akteneinsicht an Wert verliert. Daher könne die Akteneinsicht auch ohne Weiteres gewährt werden.128 Eine solche Auslegung entspricht aber einerseits nicht, sondern widerspricht dem Opferschutz, da sie gerade dem wahrheitsgemäß aussagenden Zeugen schadet,129 und würde andererseits voraussetzen, dass etwaige Manipulationen überhaupt erkannt werden.130 Jedenfalls kann die Nichtbeachtung derartiger potenzieller Fehlerquellen zu falschen Gutachtenergebnissen führen und schließlich zu falschen Urteilen – und das in jeder Instanz. Um dieser Gefahr zu begegnen, ist daher den Oberlandesgerichten Hamburg, Schleswig und Düsseldorf beizupflichten und die Akteneinsicht des Belastungszeugen in Aussage-gegen-Aussage-Konstellationen zu versagen.131 Das gebietet nicht nur der überwiegende Schutzanspruch des Beschuldigten vor einer falschen Verurteilung,132 sondern steht im Gesetz: § 406e Absatz 2 Satz 2 StPO lässt eine Gefährdung des Untersuchungszwecks genügen, die in solchen Situationen stets gegeben ist,133 und § 58 StPO verlangt 126

BGH StV 2017, 146 (ebd.); NStZ 2016, 367 (ebd.); KG StV 2019, 181 (183). Dass diese Annahme aber offenbar nicht der Praxis entspricht, beweist der Nebenklagevertreter Breu StraFo 2015, 248 (251), der „erst recht“ die Weitergabe der Akte an den Zeugen empfiehlt; dessen Begründung, der Zeuge sei „im Unterschied zum Beschuldigten unter Strafandrohung zur Wahrheit verpflichtet“, ist nicht falsch, verkennt aber, dass sich falschaussagende Zeugen von dieser Pflicht regelmäßig unbeeindruckt zeigen. 128 OLG Braunschweig NStZ 2016, 629 (630). 129 Daber Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 169 (175 f.); das verkennt Breu StraFo 2015, 248 (249), denn eine solche beschuldigtenfreundliche Auslegung schützt gerade nicht den Verletzten vor den „negativen Folgen eines Strafverfahrens“, wenn es zu einem „falschen“, aber dann nur folgerichtigen Freispruch kommt. 130 Solche Modifizierungen sind aber „schwerlich rekonstruierbar“, Eisenberg JR 2016, 390 (394); siehe bereits oben zum „Coaching“. 131 Zustimmend Baumhöfener NStZ 2014, 135 (137). 132 Velten/Greco/Werkmeister SK-StPO § 406e Rn. 20. 133 Ähnlich Hilgert NJW 2016, 985 (988 f.), der das Akteneinsichtsrecht auf „unkritische“ Teile beschränken möchte. 127

38

2. Kapitel: Die aussagepsychologische Begutachtung

nun einmal die Unvoreingenommenheit und Unbefangenheit des Zeugen sowie die Selbstständigkeit seiner Aussage.134 Zuletzt widerspricht eine solche Rechtspraxis den besonderen Anforderungen an die Beweiswürdigung bei Aussage gegen Aussage, wenn Gerichte durch Gewähren der Akteneinsicht der Konstanzanalyse und damit einhergehend der gesamten aussagepsychologischen Glaubhaftigkeitsbegutachtung den Boden entziehen.135 Immerhin hat das Bundesverfassungsgericht mittlerweile darauf hingewiesen, dass zumindest eine Prüfung der Versagung der Akteneinsicht verfassungsrechtlich geboten ist, wenn der mutmaßlich Verletzte der einzige Tatzeuge ist.136 Wird Akteneinsicht gewährt, müssen sich Gerichte nämlich bewusst sein, dass sie ansonsten die Grenzen der Aussageanalyse unumkehrbar überschreiten.

134

Vgl. BGHSt. 3, 386 (388); Neuhaus StV 2015, 185 (190); Rogall SK-StPO § 58 Rn. 7. Vgl. auch Baumhöfener/Daber/Wenske NStZ 2017, 562 (564); Eschelbach BeckOKStPO § 261 Rn. 59.1; Gubitz NStZ 2016, 367 (369); Püschel StraFo 2015, 269 (275). 136 BVerfG NJW 2017, 1164 (1166); ähnlich mittlerweile auch der Zweite Strafsenat, BGH StV 2017, 7 (8): Erläuterungspflicht bei Verlesung und Eigenlektüre des polizeilichen Vernehmungsprotokolls. 135

3. Kapitel

Beweiswert der aussagepsychologischen Begutachtung: „gesunder Menschenverstand“ oder (Schein-)Wissenschaft? I. „Herrschende Meinung“: eine wissenschaftlich fundierte Methode? So viel zur Theorie der aussagepsychologischen Glaubhaftigkeitsbegutachtung. Ungeachtet ihrer bereits theoretischen Einschränkungen ist entscheidend, ob sie – und konkret die kriterienorientierte Inhaltsanalyse – in ihrer praktischen Anwendung wirklich hält, was sie verspricht: nämlich zwischen subjektiv wahren und bewusst wahrheitswidrigen Aussagen unterscheiden zu können, und zwar mit einem Ausmaß an Genauigkeit, das ihren beliebten Einsatz im Strafverfahren rechtfertigt. Tatsächlich wurde die aussagepsychologische Begutachtung drei Jahrzehnte lang an deutschen Gerichten praktiziert, ohne dass dieser Frage wissenschaftlich nachgegangen worden wäre.1 Ursprünglich wurde sogar vertreten, dass sich die aussagepsychologische Begutachtung empirisch nicht überprüfen lasse.2 Undeutsch selbst leitete seine Hypothese aus dem „gesunden Menschenverstand“ ab.3 Nun ist nichts am gesunden Menschenverstand auszusetzen. Für das Strafverfahren ist aber entscheidend, welchen Wert – oder wie ich ihn bezeichnen möchte: konkreten Beweiswert – das (dann positive) Ergebnis eines aussagepsychologischen Gutachtens hat: „Die Aussage des Zeugen ist glaubhaft.“ Denn ob der Beschuldigte verurteilt wird, hängt in Aussage-gegen-Aussage-Konstellationen meist allein von diesem Ergebnis ab – und dem indiziellen Wert, den man ihm zuspricht. Vertreter und Befürworter der aussagepsychologischen Glaubhaftigkeitsbegutachtung beanspruchen wenig überraschend für sich, dass es sich um ein mittlerweile wissenschaftlich begründetes und empirisch bestätigtes Verfahren handle.4 Immerhin ist die Aussagepsychologie ihr täglich Brot. So resü1

Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 133; Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (77 f.). 2 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 133 mit Nachweisen. 3 Undeutsch Forensische Psychologie, S. 26 (126). 4 Vgl. nur Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (71); Schoon/Briken Forensische Psychiatrie, Psychologie, Kriminologie 13

40

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

miert Arntzen, dass die forensische Aussagepsychologie eine „Arbeitsgenauigkeit“ erreicht habe, die den Ansprüchen der Praxis entspreche.5 Nach Steller basiert die „praktische aussagepsychologische Glaubhaftigkeitsbegutachtung“ auf einem „soliden wissenschaftlichen Fundament“.6 Auch die juristische Literatur begnügt sich weitgehend mit dem Hinweis auf die Wissenschaftlichkeit der aussagepsychologischen Begutachtung – und (wenn überhaupt) unter Verweis auf jene befürwortenden aussagepsychologischen Stimmen.7 Und der Bundesgerichtshof hat schließlich in seinem Grundsatzurteil deutlich gemacht, dass auch er die Methode für wissenschaftlich und empirisch belegt ansieht.8 Jansen meint sogar, dass durch das Grundsatzurteil der Diskussion um die Anerkennung und Beachtung aussagepsychologischer Erkenntnisse im Strafprozess ein Ende gesetzt worden sei.9 All dies vermittelt recht erfolgreich einen Eindruck von Wissenschaftlichkeit und Zuverlässigkeit der aussagepsychologischen Glaubhaftigkeitsbegutachtung, was die hohen Übereinstimmungsquoten von Urteilen und Sachverständigengutachten bestätigen. Von ein paar Fehleinschätzungen abgesehen, die es im Einzelfall immer geben mag, hieße das, dass die aussagepsychologische Glaubhaftigkeitsbegutachtung – vorausgesetzt sie wird innerhalb ihrer Grenzen angewendet – das Mittel der Wahl ist, um die Glaubhaftigkeit einer Aussage zu bestimmen und die Wahrheit ans Licht zu bringen. Anders wären die hohen Übereinstimmungsquoten von bis zu 100 Prozent nämlich nicht gerechtfertigt, sondern im Gegenteil: gefährlich. Aber der Eindruck täuscht. Denn in der psychologischen Literatur ist die Methode nicht nur umstritten. Vielmehr liegen Studien vor, die den Stellenwert, den die aussagepsychologische Begutachtung im deutschen Strafverfahren genießt, in Zweifel ziehen. Bereits an dieser Stelle ist klarzustellen, dass es bislang an Studien fehlt, die sich der aussagepsychologischen Glaubhaftigkeitsbegutachtung als Ganzem widmen.10 Nur die kriterienorientierte Inhaltsanalyse – als Methode allein (2019) S. 125 (126); Steller Handbuch der Rechtspsychologie, S. 300 (301 f.); Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (82). 5 Arntzen, S. 14. 6 Steller Praxis der Rechtspsychologie 23 (2013) S. 11 (15). 7 Siehe etwa Geipel Beweiswürdigung, § 26 Rn. 1; Häcker Bender/Häcker/Schwarz, Rn. 326; Heintschel-Heinegg Breidling-FS, S. 143 (146 f.); Jansen Zeuge, Rn. 717; Sander LR § 261 Rn. 129; Schmitt Meyer-Goßner/Schmitt § 244 Rn. 74a. 8 BGHSt. 45, 164 (170 f.) sowie bereits im Leitsatz: „Wissenschaftliche Anforderungen an aussagepsychologische Begutachtungen“; siehe auch BGH, Beschluss vom 3.5.2019 – 3 StR 462/18: „Die Aussageanalyse, die unter anderem das Vorliegen sogenannter Realkennzeichen untersucht, ist aber Bestandteil eines wissenschaftlich fundierten Glaubhaftigkeitsgutachtens“, insoweit nicht abgedruckt in NStZ-RR 2019, 317 (Hervorhebungen des Verfassers). 9 Jansen StV 2000, 224 (ebd.). 10 Vgl. Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (45); Schoon/Briken Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 125 (126); Volbert/Steller European Psychologist 19 (2014) S. 207 (217).

I. „Herrschende Meinung“: eine wissenschaftlich fundierte Methode?

41

zur Zurückweisung der Lügenhypothese – wurde bislang untersucht. Somit entbehrt die Auffassung, die aussagepsychologische Begutachtung sei insgesamt wissenschaftlich begründet, einer empirischen Grundlage.11 Letztendlich stellte auch der Bundesgerichtshof in seinem Grundsatzurteil fest, dass zwar die Realkennzeichenanalyse als empirisch überprüft angesehen werden kann.12 Zu der etwaigen Wissenschaftlichkeit der übrigen Bestandteile der aussagepsychologischen Begutachtung schweigt das Urteil jedoch.13 Weder konnten die wenigen Studien dazu die Konstanzanalyse validieren,14 noch existieren empirische Daten zu der ohnehin zweifelhaften Motivationsanalyse.15 Auch zur Zuverlässigkeit der Aussagegenese als bislang einziger Methode zur Zurückweisung der praktisch bedeutsamen Suggestionshypothese liegen nach wie vor keine empirischen Nachweise vor.16 – Wissenschaftlich erforscht wurde somit lediglich ein kleiner Teilbereich der gesamten aussagepsychologischen Begutachtung: die kriterienorientierte Inhaltsanalyse als eines der „Werkzeuge“ zur Zurückweisung der Lügenhypothese. Ein Teilbereich, auf den es laut Volbert nur in fünf Prozent aller aussagepsychologisch begutachteten Fälle ankommt.17

11 Anders aber Steller Forensische Psychiatrie, Psychologie, Kriminologie 14 (2020) S. 188 (189); ders. Handbuch der Rechtspsychologie, S. 300 (301). 12 BGHSt. 45, 164 (170 f.). 13 Falsch daher unter Verweis auf die Grundsatzentscheidung BGH, Beschluss vom 3.5.2019 – 3 StR 462/18, insoweit nicht abgedruckt in NStZ-RR 2019, 317: „Die Aussageanalyse […] ist aber Bestandteil eines wissenschaftlich fundierten Glaubhaftigkeitsgutachtens“; missverständlich auch F. Schneider/Frister/Olzen, S. 403. 14 Vgl. Berlinger, S. 46 f.; Eschelbach BeckOK-StPO § 261 Rn. 59.1; Köhnken MAH Strafverteidigung § 60 Rn. 96; Volbert/Steller Psychiatrische Begutachtung, S. 683 (689–691); Volbert/Steller/Galow Handbuch der forensischen Psychiatrie, S. 623 (643, 646 f.); so ergab die Laborstudie von H. Offe/S. Offe aufgrund der kleinen Stichprobe von 36 Aussagepersonen und der angewandten Methode (intraindividueller Vergleich und Diskriminanzanalyse), dass gute Übereinstimmungen selbst bei erfahrenen Beurteilern nur schwer zu erreichen sind, Praxis der Rechtspsychologie 18 (2008) S. 97 (110, 112 f.). 15 Vgl. Berlinger, S. 103; Geipel Lügenerkennung, S. 91; Loohs Fachanwalt Strafrecht 37. Kapitel Rn. 66; H. Offe Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 87 (94): „eine wissenschaftlich begründete Methode, die Motivation […] zu ergründen […], gibt es nicht“; siehe erneut BGHSt. 45, 164 (175); S. Offe/H. Offe Rechtspsychologie kontrovers, S. 80 (83). 16 Vgl. Eschelbach Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 43 (58); Geipel Lügenerkennung, S. 97; Griesel/Ternes/Schraml/B. Cooper/Yuille Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, S. 293 (297); Oberlader/Naefgen/Koppehele-Gossel/Quinten/Banse/Schmidt Law and Human Behavior 40 (2016) S. 440 (453); dass suggestive Einflussnahmen möglich sind und weitreichende Folgen haben, lässt sich aufgrund der extensiven Forschungslage kaum bezweifeln, Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (180). 17 Volbert Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12 (18).

42

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

II. Validität der Aussagepsychologie Bei der Frage, ob mit Hilfe der aussagepsychologischen Glaubhaftigkeitsbegutachtung festgestellt werden kann, dass eine Aussage subjektiv wahr ist und damit zu Recht als glaubhaft eingestuft wird, geht es schließlich um ihre Validität und Zuverlässigkeit. Die Validität ist eines der drei Hauptgütekriterien, an der die Wissenschaftlichkeit einer Testmethode gemessen wird; daneben bedarf es der Kriterien Objektivität und Reliabilität.18 Erfüllt eine Methode nicht alle drei Gütekriterien, kann sie grundsätzlich keine brauchbaren Informationen liefern und darf konsequenterweise nicht als „wissenschaftlich fundiert“ bezeichnet werden.19 Die Objektivität bezeichnet den Grad, in dem eine Einschätzung oder ein Befund unabhängig von der Person des Gutachters zustande kommt.20 Eine Methode erfüllt also das Gütekriterium der Objektivität, wenn verschiedene Gutachter bei Vorliegen derselben Beurteilungskriterien und Informationen sowie unter Einhaltung derselben Begutachtungsschritte zum selben Ergebnis gelangen.21 Unter Reliabilität versteht man grundsätzlich die Zuverlässigkeit einer Messung oder Begutachtung. In der Regel lässt sich das Maß der Zuverlässigkeit bestimmen, indem man denselben Test oder dieselbe Begutachtung unter vergleichbaren Umständen wiederholt und das Ergebnis der Wiederholung mit dem ursprünglichen Ergebnis vergleicht.22 Der Begriff der Validität bezeichnet schließlich den Umstand, wonach ein Test- oder Begutachtungsverfahren tatsächlich dasjenige Merkmal abbildet, das es messen soll. Nur so kann die Gültigkeit und vor allem Praktikabilität bestimmt werden. Die Validität gibt somit Auskunft über die Leistungsfähigkeit der konkreten Methode.23 Während aufgrund der Komplexität des gesamten Begutachtungsprozesses die Anwendungstauglichkeit jedenfalls der Kriterien Objektivität und Reliabilität selbst von Befürwortern bezweifelt wird24 und es ohnehin kaum über18

Eisenberg Beweisrecht, Rn. 1619b; F. Schneider/Frister/Olzen, S. 89; Tsambikakis MAH Strafverteidigung § 81 Rn. 28–31. 19 So auch Köhnken MAH Strafverteidigung § 60 Rn. 77; Mokros Psychiatrische Begutachtung, S. 29 (42); siehe auch Miebach MK-StPO § 261 Rn. 327: Validität und Aussagekraft konkret der aussagepsychologischen Begutachtung sind zwingend im Rahmen der Beweiswürdigung darzustellen. 20 Vgl. auch zum Folgenden Berlinger, S. 85–87; Mokros Psychiatrische Begutachtung, S. 29 (30–33). 21 Vgl. auch Fiedler Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5 (11); Steller/ Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (149 in Fn. 41); die Auswerterobjektivität wird im Englischen (missverständlich) auch als inter-rater reliability bezeichnet, vgl. nur Rill Psychophysiologie, S. 28. 22 Effer-Uhe/Mohnert Psychologie für Juristen § 1 Rn. 16; sogenannte Test-retest-Reliabilität, National Research Council, S. 29 f. 23 Vgl. National Research Council, S. 30 f.; Schüssler Polygraphie, S. 102 f. 24 Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess,

II. Validität der Aussagepsychologie

43

zeugende Studien zu diesen Gütekriterien gibt, will ich die folgenden Seiten der Validität widmen.25 Ohnehin kann selbst eine hohe Übereinstimmungsquote nicht gewährleisten, dass die Einschätzungen auch richtig vorgenommen werden.26 Obgleich eine solche Befundlage eher gegen ihre Wissenschaftlichkeit spricht, kommt es in der Praxis entscheidend darauf an, ob die Methode wirklich misst, was sie zu messen verspricht. Die Validität ist zweckmäßiger Mindestmaßstab für die Eignung der aussagepsychologischen Aussagebeurteilung.27 Bei der kriterienorientierten Inhaltsanalyse umfasst die Prüfung der Validität genaugenommen zwei Stufen.28 Die erste Stufe läuft auf eine Überprüfung der Undeutsch-Hypothese hinaus. Hier wird geprüft, ob der postulierte qualitative Unterschied tatsächlich zutrifft, subjektiv wahre Aussagen also signifikant häufiger und stärker Realkennzeichen aufweisen als bewusst wahrheitswidrige Aussagen. Mit anderen Worten geht es um die Gültigkeit der 19 Realkennzeichen. Entscheidend für die Validität ist aber vor allem die daran anknüpfende Frage, nämlich mit welcher Treffgenauigkeit anhand der kriterienorientierten Inhaltsanalyse subjektiv wahre von bewusst wahrheitswidrigen Aussagen unterschieden werden können: Wie viele subjektiv wahre Aussagen werden zutreffend als „glaubhaft“ eingestuft, und wie viele bewusst wahrheitswidrige Aussagen werden zu Recht als „nicht glaubhaft“ abgelehnt, wenn ein Gutachter – oder ein Richter – auf Basis der Inhaltsanalyse sein diagnostisches Urteil fällt? Strenggenommen baut die zweite Stufe auf der ersten Stufe auf. Denn sie setzt zwingend voraus, dass die Realkennzeichen in subjektiv wahren Aussagen häufiger und stärker ausgeprägt vorkommen als in erfundenen Aussagen. Kommt es bei der Überprüfung der ersten Stufe zu keinem befriedigenden Ergebnis, erübrigt sich eigentlich die Prüfung der Folgestufe. Da es mit Blick auf S. 17 (38): „unvermeidliche Ungenauigkeiten“; vgl. auch Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (161) jedoch zur polygrafengestützten Aussagebeurteilung; deren Bedenken müssen aber „analog“ für die aussagepsychologische Begutachtung gelten; kritisch daher Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 4 (9). 25 Meist wurde die Inter-rater-Reliabilität untersucht, der Grad der Übereinstimmung verschiedener unabhängiger Auswerter („rater“) untereinander, jedoch mit nicht immer zufriedenstellenden Ergebnissen; ein Überblick findet sich bei Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (16–19); neuere Studien: Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (239 f.); Niveau/Lacasa/Berclaz/Germond Journal of Forensic Sciences 60 (2015) S. 1247 (1249–1251); Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (114, 118). 26 So bereits Steller/Wellershaus/Wolf Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151 (163 f.). 27 Wieder „analog“ Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (162). 28 Zu dieser Zweiteilung und dem Folgenden Gödert Glaubhaftigkeitsbeurteilung, S. 18, und Steller/Wellershaus/Wolf Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151 (152).

44

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

die Praxis aber unter anderem mehr auf die Trefferquoten ankommt,29 werde ich die empirische Forschung zu beiden Stufen weitgehend unabhängig voneinander darlegen.

III. Allgemeines zu Validitätsstudien Es gibt zwei Möglichkeiten, die Validität einer Methode empirisch zu überprüfen – wie auch die der 19 Realkennzeichen: Feldstudien, die bereits existierende Aussagen aus der forensischen Praxis untersuchen, und Laborstudien (oder experimentelle Simultanstudien), die wahre und wahrheitswidrige Aussagen auswerten, die von Studienteilnehmern generiert werden. Jeder Ansatz hat seine Vor- und Nachteile, und die Stärke des einen ist die Schwäche des anderen.30

1. Laborstudien Der Vorteil von Laborstudien ist, dass diejenigen, die die Studie durchführen, das „Setting“, das heißt die Umstände und die Variablen bestimmen können. So ist gesichert, ob ein Proband die Wahrheit sagt oder lügt. In einer Laborstudie wissen sie, wer etwa das Scheinverbrechen („mock crime“), zu dem alle Probanden befragt werden, begangen hat und wer nicht. Die objektive Wahrheit („ground truth“) steht fest, so dass eindeutige Ergebnisse ermittelt werden können.31 Der Nachteil ist immer, dass Laborstudien die Lebenswirklichkeit nur eingeschränkt wiedergeben können. Sie sind realitätsfremd und ihre Ergebnisse daher – wenn überhaupt – nur restriktiv auf den „Ernstfall“ unter realen Bedingungen übertragbar.32 Das Ergebnis einer Studie, bei der die begutachteten (kindlichen) Probanden über das tatsächliche oder erfundene Annähen eines Knopfes berichten sollten, ist kaum mit einem Fall sexuellen Missbrauchs vergleichbar.33 Und über den Inhalt eines Films zu berichten, den der Proband zuvor gesehen hat, unterscheidet sich aus naheliegenden Gründen von der Beschreibung einer erlebten Sexualstraftat.34 29 30

Jedoch nicht nur, siehe dazu 3. Kapitel V 2 (S. 68–70). Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (8). 31 Honts The Detection of Deception in Forensic Contexts, S. 103 (108); Raskin/Kircher Credibility Assessment, S. 63 (79 f.); die Auswerter haben selbstverständlich keine Kenntnis von der objektiven Wahrheit während der Begutachtung. 32 Griesel/Ternes/Schraml/B. Cooper/Yuille Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, S. 293 (295 f.); Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (176); Volbert/Steller European Psychologist 19 (2014) S. 207 (210); Laborstudien daher generell ablehnend Arntzen, S. 8–10; weitere Nachweise bei Niehaus Glaubhaftigkeitsmerkmale, S. 74 f. 33 So aber die Studie von Blandon-Gitlin/Pezdek/Rogers/Brodie Law and Human Behavior 29 (2005) S. 187 (190). 34 Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (9); davon zu unterscheiden ist

III. Allgemeines zu Validitätsstudien

45

Dieses Dilemma versucht man zu lösen, indem man Situationen schafft, die dem Ernstfall zumindest nahekommen. Jedoch stößt man dabei rasch an ethische Grenzen, da sich ein Sexualdelikt und die damit verbundene persönliche und emotionale Betroffenheit kaum zumutbar inszenieren lassen.35 Einen Mittelweg versuchten Steller, Wellershaus und Wolf, indem sie Grundschüler zu medizinischen Eingriffen und körperlichen Angriffen befragten wie einer Injektion, Blutabnahme oder Zahnextraktion. Solche Sachverhalte seien vergleichbar mit einer sexuellen Missbrauchserfahrung aufgrund der Eigenbeteiligung, der vorwiegend negativen emotionalen Tönung des Geschehens und des weitgehenden Kontrollverlusts über die Situation aufseiten der Aussageperson.36 Als studienexternen Nachweis für die objektive Wahrheit und damit als Außenkriterium („ground truth criterion“), eigne sich die Bestätigung des medizinischen Eingriffs durch die Eltern des Probanden.37 Gleichwohl gehen entscheidende Bestandteile der Aussageanalyse verloren, so dass mangels Vergleichbarkeit mit dem Erleben eines Sexualdelikts Ergebnisse von Laborstudien zumindest relativiert werden müssen.38

2. Feldstudien und das leidige Problem mit dem Außenkriterium Diese bei Laborstudien fehlende „ökologische Validität“ (im Englischen ist oft von „external validity“ zu lesen)39 ist der Vorteil von Feldstudien, da echte Fälle begutachtet werden. Allerdings lässt sich kaum oder nur schwer sagen, ob eine Aussage auch tatsächlich subjektiv wahr oder bewusst unwahr ist, da ein verlässliches Außenkriterium zur Beantwortung dieser Frage oft fehlt.40 Die das generelle Problem, dass Ergebnisse aus statistischen Gruppendaten nur eingeschränkt auf den individuellen Einzelfall übertragen werden können, sogenannte Group to Individual (G2i) Inference; dazu bereits Müller JZ 2000, 267 (268); ausführlich Faigman/Monahan/Slobogin The University of Chicago Law Review 81 (2014) S. 417 (420–422); Mokros Figurationen von Unsicherheit, S. 241 (247–250). 35 Niehaus Glaubhaftigkeitsmerkmale, S. 74; Oberlader/Naefgen/Koppehele-Gossel/ Quinten/Banse/Schmidt Law and Human Behavior 40 (2016) S. 440 (452). 36 Steller/Wellershaus/Wolf Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151 (161); zweifelnd Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (111). 37 Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (9). 38 Fiedler Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5 (24) sowie Iacono/ Patrick Clinical Assessment of Malingering and Deception, S. 361 (366) lehnen aus diesem Grund das Heranziehen von Laborstudienergebnissen ab; dabei beziehen sie sich jedoch auf Studien zur polygrafengestützten Aussagebeurteilung mithilfe eines Polygrafen; ihre Argumentation muss aber „analog“ genauso für die aussagepsychologische Begutachtung gelten. 39 Zum Begriff Anderson/Lindsay/Bushman Current Directions in Psychological Science 8 (1999) S. 3 (ebd.); Rill Psychophysiologie, S. 73; Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (162 f.). 40 Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (108 f.); Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (78, 93); Volbert Psycho-

46

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

Trefferquote eines positiven Begutachtungsergebnisses, nämlich dass die Aussage nach Einschätzung des Gutachters glaubhaft sei, ist aber der prozentuale Anteil, in dem das Gutachten mit dem tatsächlichen Hintergrund der Aussage – sozusagen der objektiven Wahrheit – übereinstimmt. Bei den Trefferquoten geht es also um die Frage, wie viele der subjektiv wahren Aussagen nach Anwendung der kriterienorientierten Aussageanalyse korrekt als solche klassifiziert, also entdeckt werden.41 Lässt sich der tatsächliche Hintergrund jedoch erst gar nicht ermitteln – hier der tatsächliche subjektive Erlebnisbezug –, kann man auch keine aufschlussreiche Trefferquote ermitteln. In Aussage-gegen-Aussage-Konstellationen, in denen die aussagepsychologische Begutachtung typischerweise zur Anwendung kommt, fehlt in aller Regel ein solcher Beweis – zum Beispiel eine DNA-Spur oder eine Videoaufzeichnung –, dass die Tat tatsächlich begangen wurde und der Zeuge die Wahrheit sagt. Daher werden bei Feldstudien oft Geständnisse, Ergebnisse von psychophysiologischen, polygrafengestützten Begutachtungen, Freisprüche und Verurteilungen oder Aussagewiderrufe herangezogen, um zu belegen, ob eine Aussage tatsächlich subjektiv wahr oder erfunden war. Gesteht der Beschuldigte oder wird er verurteilt, gilt die belastende Aussage als subjektiv wahr. Wird der Beschuldigte freigesprochen oder revidiert der Zeuge seine Aussage, wird angenommen, dass die ursprüngliche belastende Aussage wohl bewusst wahrheitswidrig war. Die zwingend erforderliche Unabhängigkeit des Außenkriteriums von der Wahrheitsermittlung im Übrigen ist aber in solchen Fällen nur selten gewährleistet.42 Ein Freispruch zum Beispiel kann darauf zurückzuführen sein, dass der Belastungszeuge nicht in der Lage war, dem Gericht gegenüber überzeugend auszudrücken, was er erlebt hatte; das bedeutet aber nicht zwingend, dass er lügt.43 Und dass sich Gerichtsentscheidungen insgesamt nicht als unabhängiges Außenkriterium eignen, ist selbsterklärend, wenn man sich die Übereinstimmungsquoten in Erinnerung ruft. Vor allem Geständnisse eignen sich – unabhängig davon, dass es durchaus falsche Geständnisse geben kann – nur eingeschränkt als Außenkriterium. Selten ist garantiert, dass sie unabhängig vom Ausgang der aussagepsychologischen Begutachtung zustande gekommen sind. Ein Geständnis wird oft aus prologische Begutachtung im Strafverfahren, S. 171 (176); nach Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (73) besteht das Außenkriterium im „Wirklichkeitsstatus einer Erinnerung“, die die Aussage wiedergibt. 41 Siehe im Detail, 3. Kapitel V (S. 62–70). 42 Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (106); Saxe/Ben-Shakhar Psychology, Public Policy, and Law 5 (1999) S. 203 (213): obgleich sich deren Kritik konkret auf Validitätsstudien zur polygrafengestützten Begutachtung bezieht, hat sie ebenso für die Aussagepsychologie zu gelten. 43 Wells/Loftus The Suggestibility of Children’s Recollections, S. 168 (169).

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

47

zesstaktischen Gründen und somit gerade aufgrund des Gutachtenergebnisses abgelegt.44 Es besteht die Gefahr eines Zirkelschlusses.45

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese Trotz dieser Mängel können Labor- und Felduntersuchungen grundsätzlich Aufschluss geben über die Eignung einer Methode, sofern erstere nicht völlig realitätsfremd sind und letztere zumindest ansatzweise dem Einwand eines fehlenden unabhängigen Außenkriteriums begegnen. Ist dies gewährleistet, bietet es sich an, beide Forschungsstrategien zu kombinieren, auch um eine gegenseitige Kompensation der jeweiligen Nachteile zu erreichen.46 – Doch selbst unter Einhaltung dieser Mindestvoraussetzungen ist die Befundlage zur Überprüfung der Undeutsch-Hypothese, also zur Validierung der 19 Realkennzeichen, eher dürftig.

1. Kaum brauchbare Feldstudien Nach Auswertung der dazu vorliegenden Feldstudien ist festzustellen, dass der Großteil der Realkennzeichen gerade nicht geeignet ist, zwischen subjektiv wahren und bewusst wahrheitswidrigen Aussagen zu unterscheiden. Entgegen der Undeutsch-Hypothese sind sie nicht notwendig häufiger und stärker in subjektiv wahren Aussagen zu finden. Nur sieben der insgesamt 19 Realkennzeichen können wohl als hinreichend validiert angesehen werden, nämlich die Kriterien (2) „Reproduktionsstil“, (3) „Details“, (4) „Verknüpfungen“, (5) „Interaktionen“, (6) „Gespräche“, (12) „Eigenseelisches“ und (15) „Erinnerungslücken“. Dieses Fazit entspricht weitgehend den Ergebnissen früherer MetaAnalysen, obgleich meine Einschätzung großzügiger ist.47 Dieses bescheidene Resultat liegt zunächst daran, dass die meisten Feldstudien an den oben skizzierten Mängeln leiden, so dass sie sich kaum zur Bestätigung der Undeutsch-Hypothese eignen. Ein weiteres Problem ist, dass die meisten Feldstudien lediglich Aussagen kindlicher Probanden untersuchten. 44

Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (238); Iacono/Patrick The Handbook of Forensic Psychology, S. 613 (622 f.); Rill/Vossel NStZ 1998, 481 (483); Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (8 f.); die Zuverlässigkeit von Geständnissen und Aussagewiderrufen als Außenkriterium überschätzt daher Arntzen, S. 12 f. 45 Niehaus Glaubhaftigkeitsmerkmale, S. 73; Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (106); Wells/Loftus The Suggestibility of Children’s Recollections, S. 168 (170). 46 Effer-Uhe/Mohnert Psychologie für Juristen § 1 Rn. 20; Gödert Glaubhaftigkeitsbeurteilung, S. 87; allgemein zur Eignung von Laborstudien Anderson/Lindsay/Bushman Current Directions in Psychological Science 8 (1999) S. 3 (8). 47 Vgl. Gödert Glaubhaftigkeitsbeurteilung, S. 24 f.; Vrij Detecting Lies, S. 228 f.

48

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

Das ist darauf zurückzuführen, dass die kriterienorientierte Inhaltsanalyse ursprünglich zur Analyse von Aussagen mutmaßlicher Kindesmissbrauchsopfer entwickelt wurde.48 Somit entbehrt die These, die kriterienorientierte Inhaltsanalyse sei ohne Weiteres auch bei Aussagen Erwachsener und im nicht-sexualstrafrechtlichen Zusammenhang anwendbar,49 eines empirischen Nachweises unter realen Bedingungen.50 Erb hält die aussagepsychologische Glaubhaftigkeitsbegutachtung zumindest in dieser Hinsicht für ein völlig ungeeignetes Beweismittel im Sinne von § 244 Absatz 3 Satz 3 Nummer 4 StPO.51 Festzuhalten ist, dass sich Erkenntnisse aus Studien zu Kinderaussagen zumindest nicht verallgemeinern lassen, zumal (sexuell erfahrene) Erwachsene Details zum Kerngeschehen eher erfinden werden können als Kinder.52

a) Die Anfänge Die erste und oft zitierte Feldstudie von Esplin, Boychuk und Raskin (1988) konnte die Undeutsch-Hypothese noch für die meisten der 19 Realkennzeichen bestätigen.53 Ausgewertet wurden 40 Aussagen von Kindern zwischen dreieinhalb und 17 Jahren als mutmaßliche Opfer von Sexualdelikten. Esplin und Raskin fassten das Ergebnis ihrer Feldstudie wie folgt zusammen:54 „In line with the [Undeutsch-]hypotheses, criteria 1, 3, and 19 were present in all confirmed statements and criterion 2 was present in all but one. It is of interest to note that criteria 1 and 3 were also present in about half of the doubtful statements, but criterion 48 Siehe bereits Undeutsch Forensische Psychologie, S. 26 (69 und passim); Vrij Detecting Lies, S. 222; so auch in der Entscheidung des BGH zur Zuziehung eines Sachverständigen bei Kinderaussagen BGHSt. 7, 82 (83–86). 49 So etwa Gödert/Gamer/Rill/Vossel Polizei & Psychologie, S. 519 (522); Köhnken The Detection of Deception in Forensic Contexts, S. 41 (42 f.); Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (49); lediglich wenn das fragliche Erlebnis länger zurückliege, stelle eine aussagepsychologische Begutachtung Erwachsener eine „Herausforderung“ dar, Steller Forensische Psychiatrie, Psychologie, Kriminologie 14 (2020) S. 188 (190). 50 Kritisch auch Colwell/Hiscock-Anisman/Fede Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, S. 259 (262 f.): „potential misapplication with adults“; Wolf Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 136 (140 f.). 51 Erb Stöckel-FS, S. 181 (189). 52 Deckers Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 181 (193); unabhängig davon unterscheiden sich die Feldstudien teilweise stark in ihrer Methodik, so dass ein Vergleich untereinander und eine Verallgemeinerung insgesamt nur eingeschränkt möglich sind; zu diesem Problem, auf das ich hier nicht weiter eingehen werde, Griesel/Ternes/Schraml/B. Cooper/Yuille Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, S. 293 (295); Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (113). 53 Die Feldstudie wurde lediglich als Kongressbeitrag präsentiert und erschien nicht in einer peer-reviewed Zeitschrift; zitiert daher nach Raskin/Esplin The Suggestibility of Childrens Recollections, S. 153 (160–162); siehe auch Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 136 f.; Vrij Detecting Lies, S. 223 f. 54 Raskin/Esplin The Suggestibility of Children’s Recollections, S. 153 (161 f.).

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

49

2 was present in only a few of them. Some of the other criteria occurred very frequently in the confirmed statements but with only moderate frequency in the doubtful statements (criteria 4, 5, 12, and 15), whereas many other criteria appeared almost exclusively in the confirmed statements (6, 7, 8, 9, 13, 14, 17, and 18). A few criteria were seldom present (10, 11, and 16), and the surprising occurrence of criteria 10 and 18 in a doubtful statement was explained when the child later admitted to substituting the perpetrator, which is the most difficult type of case for CBCA and other assessment procedures.“55

Mit Ausnahme der Realkennzeichen (1) „Konsistenz“ und (3) „Details“ konnten die Autoren alle übrigen Merkmale mindestens doppelt so häufig bei den „bestätigten“, das heißt subjektiv wahren Aussagen nachweisen als bei den „zweifelhaften“. Wells und Loftus bezeichneten diese Resultate – wohl ironischerweise – als die „beeindruckendsten“ (im Original: „most impressive“), die ihnen je in einer psychologischen Studie begegnet seien.56 Tatsächlich wird die Studie von Esplin et al. stark kritisiert, so auch von Vertretern der Aussagepsychologie.57 Ein Problem ist, dass nur eine einzige Begutachterin die Aussagen bewertet hatte,58 so dass die Reliabilität mehr als zweifelhaft ist.59 Wells und Loftus wiesen zudem darauf hin, dass die Ergebnisse aufgrund gravierender Altersunterschiede der kindlichen Aussagepersonen zu relativieren sind. Tatsächlich waren die Kinder, deren Aussagen als „zweifelhaft“ (bewusst wahrheitswidrig) eingestuft worden sind, im Durchschnitt deutlich jünger als die Kinder mit subjektiv wahren Aussagen (6,9 und 9,1 Jahre). So befanden sich in der Gruppe der zweifelhaften Aussagen acht Kinder unter fünf Jahren, während die subjektiv wahren Aussagen nur eine Aussage eines 55 Diese und die folgenden Übersetzungen stammen vom Verfasser: „In Übereinstimmung mit der [Undeutsch-]Hypothese waren die Realkennzeichen 1, 3 und 19 in allen bestätigten Aussagen vorhanden, und auch das Kriterium 2 war mit einer Ausnahme in allen Aussagen vorhanden. Interessant ist jedoch, dass die Realkennzeichen 1 und 3 auch in etwa der Hälfte, das Kriterium 2 hingegen nur in wenigen der zweifelhaften Aussagen vorkamen. Einige der übrigen Kriterien waren sehr häufig in den bestätigten Aussagen vorhanden, aber nur mäßig häufig in den zweifelhaften Aussagen (Kriterien 4, 5, 12 und 15), während viele der anderen Realkennzeichen fast ausschließlich in den bestätigten Aussagen auftraten (6, 7, 8, 9, 13, 14, 17 und 18). Einige wenige Realkennzeichen waren nur selten vorhanden (10, 11 und 16), und das überraschende Auftreten der Kriterien 10 und 18 in einer der zweifelhaften Aussagen konnte damit erklärt werden, dass das Kind später zugab, den Täter verwechselt zu haben – was für die kriterienorientierte Inhaltsanalyse sowie andere Beurteilungsmethoden die schwierigste Fallgruppe ist.“ 56 Wells/Loftus The Suggestibility of Children’s Recollections, S. 168 (169); Welle/Berclaz/ Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (112): „too good to be true“. 57 Siehe etwa Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 137 („zweifelhaft“), und Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (178) („methodisch nicht unproblematisch“). 58 Vgl. Raskin/Esplin The Suggestibility of Children’s Recollections, S. 153 (161). 59 Steller/Wellershaus/Wolf Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151 (160); Vrij Detecting Lies, S. 224; zur Reliabilität in diesem Kapitel bereits unter II (S. 42).

50

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

Kindes unter fünf Jahren enthielten. Aufgrund des unterschiedlichen kognitiven Entwicklungsstands sind die beiden Gruppen nicht vergleichbar.60 Abgesehen von kaum vorhandenen und von den Autoren nicht näher definierten „medizinischen Beweisen“ ist zudem keines der verwendeten Außenkriterien zur Bestimmung der objektiven Wahrheit von der Aussage unabhängig. Für die „Zweifelsfälle“, die als bewusst wahrheitswidrig eingestuften Aussagen, wurden als Außenkriterien herangezogen: prozessuale Einstellungen, fehlende Geständnisse oder hartnäckiges Leugnen der Beschuldigten. Somit ist gar nicht ersichtlich, ob es sich bei den „zweifelhaften“ Aussagen tatsächlich um bewusst wahrheitswidrige Aussagen handelte.61 Im Ergebnis muss die Studie daher aufgrund der oben genannten Gründe unberücksichtigt bleiben.62 Die methodischen Mängel dieser Feldstudie gestand selbst Esplin später im Rahmen einer neueren Feldstudie ein.63 Auch die oft zitierte Folgestudie von Boychuk (1991) kann nicht zur Bestätigung der Undeutsch-Hypothese herangezogen werden.64 Die Autorin untersuchte die Aussagen von 75 mutmaßlich sexuell missbrauchten Kindern im Alter von vier bis 16 Jahren. Boychuk ging zwar auf einige der Kritikpunkte an der Studie ein, die sie mit Esplin et al. durchgeführt hatte. So wurden die Aussagen diesmal von drei Begutachtern analysiert. Auch schloss sie in ihre Stichprobe neben subjektiv wahren und bewusst wahrheitswidrigen Aussagen eine dritte Kategorie ein: „wahrscheinlich-erlebnisbezogen“ (im Original: „likely abused“). Diese Kategorie enthielt – anders als die anderen beiden Kategorien – Aussagen, bei denen lediglich Geständnisse der Beschuldigten oder gerichtliche Entscheidungen vorlagen, also kein unabhängiges Außenkriterium. Nach Niehaus konnte die Studie mit Ausnahme des Merkmals (14) „Spontane Verbesserungen“ keine statistisch signifikanten Unterschiede zwischen subjektiv wahren und erfundenen Aussagen finden.65 Vrij hält die Studie dagegen insgesamt für unbrauchbar, da Boychuk in ihrer Untersuchung die subjektiv wahren und wahrscheinlich-erlebnisbezogenen Aussagen am Ende wieder zusammenfasste, so dass im Ergebnis wieder kein unabhängiges Außenkriterium 60 Wells/Loftus The Suggestibility of Children’s Recollections, S. 168 (170); siehe auch Niehaus Glaubhaftigkeitsmerkmale, S. 69 f. 61 Steller/Wellershaus/Wolf Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151 (160). 62 So auch Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (ebd.); Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 136 f.; Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (78); Vrij Detecting Deception, S. 3 (13); ders. Detecting Lies, S. 224 f. 63 Lamb/Sternberg/Esplin/Hershkowitz/Orbach Learning and Individual Differences 9 (1997) S. 175 (178 f.). 64 Auch diese Studie liegt nicht im Original vor, es handelt sich um eine unveröffentlichte (und somit nicht peer-reviewte) Dissertation; die Studie wird zitiert nach Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 137, und Vrij Detecting Lies, S. 224 f. 65 Niehaus Glaubhaftigkeitsmerkmale, S. 70.

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

51

gegeben war.66 Steller und Volbert bezweifeln schließlich die Repräsentativität der Studie.67 – Mit entsprechenden Argumenten sind auch die Feldstudien von Craig et al.68 sowie von Parker und Brown69 abzulehnen.70

b) Eine deutsche Feldstudie Zu erwähnen ist auch die Feldstudie von Krahé und Kundrotas (1992).71 Während die eben genannten Studien Kinderaussagen begutachteten, bestand hier das Untersuchungsmaterial aus 30 Vernehmungsprotokollen zu Vergewaltigungsvorwürfen erwachsener Frauen, von denen je die Hälfte als glaubhaft (subjektiv wahr) beziehungsweise bewusst wahrheitswidrig eingestuft wurden. Das Ergebnis dieser Studie war jedoch ernüchternd: So ergab die Studie, dass sich lediglich bei drei der 19 Realkennzeichen „signifikante“ Unterschiede zwischen wahren und bewusst wahrheitswidrigen Aussagen fanden.72 Während die Kriterien (1) „Konsistenz“ und (12) „Eigenseelisches“ häufiger in subjektiv wahren Aussagen auftraten und damit die Undeutsch-Hypothese zumindest hinsichtlich dieser beiden Kriterien bestätigten, wurde das Kriterium (8) „Ausgefallenes“ sogar häufiger in Falschbezichtigungen identifiziert, was gegen die theoretischen Grundeinordnungen der aussagepsychologischen Begutachtung spricht. Die übrigen Realkennzeichen ergaben keine wesentlichen Unterschiede.73 Die Autorinnen weisen selbst darauf hin, dass insgesamt kaum stark ausgeprägte Unterschiede festgestellt werden konnten.74 Der Nachweis nur statistisch signifikanter hypothesenkonformer Unterschiede sagt nämlich nicht viel aus über den diagnostischen – und letztlich praktischen – Nutzen der Realkenn66

(13).

Vrij Detecting Lies, S. 224 f.; ders. Psychology, Public Policy, and Law 11 (2005) S. 3

67 Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (79); so auch Lamb/Sternberg/Esplin/Hershkowitz/Orbach Learning and Individual Differences 9 (1997) S. 175 (181 f.). 68 Craig/Scheibe/Raskin/Kircher/Dodd Applied Developmental Science 3 (1999) S. 77– 85; siehe dort S. 79 f. zu den nicht unabhängigen Außenkriterien und der eher überschaubaren Ausbildung der Auswerter („police investigators“). 69 Parker/Brown Legal and Criminological Psychology 5 (2000) S. 237–259 (vor allem S. 241 zu den fragwürdigen und nicht unabhängigen Außenkriterien); hervorzuheben ist jedoch, dass die Autoren Aussagen von Erwachsenen evaluierten. 70 Zur Kritik siehe auch Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (ebd. in Fn. 1); Gödert Glaubhaftigkeitsbeurteilung, S. 24 („keine Aufschlüsse über die Validität einzelner Kriterien“); Vrij Detecting Lies, S. 225; ders. Psychology, Public Policy, and Law 11 (2005) S. 3 (13 f.). 71 Krahé/Kundrotas Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598–620. 72 Krahé/Kundrotas Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598 (607, 616). 73 Vgl. dazu auch Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5 (18). 74 Krahé/Kundrotas Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598 (607 in Fn. 2); vgl. zur Beurteilung der Ausprägung a. a. O. S. 604.

52

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

zeichen. Ein solcher kann nämlich nur bejaht werden, wenn ein Kriterium in subjektiv wahren Aussagen sehr oft – also idealerweise immer – und in sehr starker Ausprägung vorzufinden ist, aber in erfunden Aussagen nur sehr selten – idealerweise nie – und allenfalls in schwacher Ausprägung. Ein signifikanter Unterschied – gemeint ist „signifikant im statistischen Sinne“ – sagt allerdings wenig aus über die Größe oder Stärke dieses Unterschieds, und er liegt bereits vor, wenn ein Kriterium zwar auch in bewusst wahrheitswidrigen Aussagen oft und in starker Ausprägung vorkommt, in subjektiv wahren Schilderungen aber noch ein wenig häufiger und stärker ausgeprägt zu finden ist.75 Eine solche Terminologie suggeriert im Zweifel daher eine Exaktheit und Aussagekraft, mit einem Wort: Validität, welche die einzelnen Realkennzeichen gar nicht erreichen können.76 Aus diesen Gründen lehnt nicht nur die American Statistical Association das Verwenden von statistischen Signifikanzwerten in Studien generell ab.77 Auch unabhängig von dem relativ überschaubaren Untersuchungsmaterial ist die Feldstudie angreifbar. So geben die Autorinnen selbst zu, dass die Auswerter – erfahrene Polizeibeamte – kein ausreichendes Training zur Realkennzeichenanalyse hatten.78 Die Repräsentativität der Studie ist daher zweifelhaft, zumal da in der Praxis die Realkennzeichenanalyse von Psychologen – oder von Richtern – durchgeführt wird. Zudem leidet die Studie an dem Mangel, dass das verwendete Analysematerial nicht aus wörtlichen Aussagetranskripten, sondern lediglich aus Zusammenfassungen polizeilicher (und damit subjektiv gewichteter) Vernehmungsprotokolle bestand, so dass offen bleibt, in welchem Ausmaß Aussageteile, die grundsätzlich für die Inhaltsanalyse bedeutsam sind, erst gar nicht in die Auswertung gelangten.79 Im Übrigen leidet auch die Studie von Krahé und Kundrotas an dem allgemeinen „Feldstudienproblem“ eines fehlenden unabhängigen Außenkriteriums: Als Außenkriterium für die als wahrheitswidrig eingestuften Aussagen 75 Eisenberg Beweisrecht, Rn. 1428c; Gödert Glaubhaftigkeitsbeurteilung, S. 33 f.; siehe zu der „Fehlinterpretation solcher inferenzstatistischer Signifikanzanagaben“ auch Köhnken/ Kraus/Vom Schemm Polizei & Psychologie, S. 361 (373); so auch in der Medizin, Hilgers/ Bauer/Scheiber, S. 142, 219, und der Sozialforschung, Krebs/Menold Handbuch Methoden der empirischen Sozialforschung, S. 489 (502). 76 Fischer Widmaier-FS, S. 191 (214). 77 Wasserstein/Lazar The American Statistician 70 (2016) S. 129–133; siehe auch Amrhein/Greenland/McShane Nature 567 (2019) S. 305–307; Trafimow/Marks Basic and Applied Social Psychology 37 (2015) S. 1 (2): „statistical significance […] sometimes serves as an excuse for lower quality research“; Wasserstein/Schirm/Lazar The American Statistician 73 (2019) S. 1–19. 78 Krahé/Kundrotas Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598 (613); kritisch daher Griesel/Ternes/Schraml/B. Cooper/Yuille Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, S. 293 (299); Hommers Psychologie der Zeugenaussage, S. 87 (88). 79 Gödert Glaubhaftigkeitsbeurteilung, S. 24; Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (81 in Fn. 19).

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

53

dienten Eingeständnisse der mutmaßlichen Vergewaltigungsopfer, dass ihre belastende Aussage unwahr war. Als Außenkriterium für die als glaubhaft eingestuften Aussagen wurden Tätergeständnisse sowie von den Autorinnen leider nicht näher definierte Sachbeweise herangezogen.80

c) Hochwertig, aber ernüchternd Lamb et al. (1997) prüften lediglich 14 und nicht 19 Realkennzeichen.81 Die Autoren folgten damit der Auffassung von Horowitz et al. (1997), die in einer der wenigen Feldstudien zur Objektivität der Realkennzeichenanalyse zu dem Ergebnis kamen, dass die Kriterien (8) „Ausgefallenes“, (9) „Nebensächliches“, (11) „Indirektes“, (14) „Spontane Verbesserungen“ und (15) „Erinnerungslücken“ generell unzuverlässig seien und keine brauchbaren Ergebnisse liefern könnten.82 Hingegen gelang erstmals eine sorgfältigere Bestimmung eines unabhängigen Außenkriteriums. Die Autoren berücksichtigten lediglich Fälle, in denen es Beweise gab für einen tatsächlichen physischen Kontakt zwischen dem Beschuldigten und dem Kind. Die oben erwähnte Schwierigkeit, ein solches unabhängiges Außenkriterium zu finden, wird deutlich, wenn man beachtet, dass sich von ursprünglich 1.187 in Frage kommenden Aussagen lediglich 98 als Material für die eigentliche Studie eigneten.83 Dieses Phänomen ist typisch für Felduntersuchungen, die versuchen, ein möglichst unabhängiges Außenkriterium zu finden. So gewinnt die Studie zwar an Qualität, büßt aber an Repräsentativität ein, da ihre Ergebnisse aufgrund der kleinen Stichprobe nur eingeschränkt verallgemeinert werden können.84 Dennoch wird der Feldstudie von Lamb et al. nicht nur aufgrund der zumindest relativ unabhängigen Außenkriterien eine hohe Aussagekraft zugesprochen.85 Das Ergebnis der Studie war jedoch ernüchternd und konnte die Undeutsch-Hypothese ebenfalls nicht bestätigen. Lediglich fünf von 19 Realkennzeichen seien geeignet, zwischen subjektiv wahren und bewusst wahrheits80 Krahé/Kundrotas Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598 (603). 81 Lamb/Sternberg/Esplin/Hershkowitz/Orbach/Hovav Child Abuse & Neglect 21 (1997) S. 255 (256). 82 Horowitz/Lamb/Esplin/Boychuk/Krispin/Reiter-Lavery Legal and Criminological Psychology 2 (1997) S. 11 (19 f.): „Before they are used in the future, these five criteria need to be defined more clearly. Alternatively, they should be eliminated“; zustimmend auch Roma/ San Martini/Sabatello/Tatarelli/Ferracuti Child Abuse & Neglect 35 (2011) S. 613 (614). 83 Lamb/Sternberg/Esplin/Hershkowitz/Orbach/Hovav Child Abuse & Neglect 21 (1997) S. 255 (258–260); siehe auch Lamb/Sternberg/Esplin/Hershkowitz/Orbach Learning and Individual Differences 9 (1997) S. 175 (180). 84 Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (13 in Fn. 1). 85 Vgl. Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (ebd. in Fn. 2); Vrij Detecting Lies, S. 226; siehe auch Berlinger, S. 90; differenzierender Niehaus Glaubhaftigkeitsmerkmale, S. 73.

54

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

widrigen Aussagen zu unterscheiden: (2) „Reproduktionsstil“, (3) „Details“, (4) „Verknüpfungen“, (5) „Interaktionen“ und (6) „Gespräche“.86 So resümieren die Autoren:87 „CBCA scores should not yet – and perhaps should never – be used in forensic contexts to evaluate individual statements.“88

d) Drei neue Feldstudien Akehurst et al. führten 2011 eine Feldstudie durch, bei der sich die Autorinnen bei der Bestimmung der studienexternen Außenkriterien zunächst an der Studie von Lamb et al. orientierten, darüber hinaus aber weitere Kriterien hinzufügten.89 Eine Aussage wurde als subjektiv wahr eingestuft, wenn sie mindestens drei der folgenden Kriterien enthielt, von denen mindestens eines ein starkes Indiz („strong indicator“) sein musste, das sowohl hier wie in der Studie mit einem Asterisk (*) gekennzeichnet wird: (1) Medizinische Beweise* (zum Beispiel DNA-Beweise) (2) Videoaufzeichnung des vom Beschuldigten gefilmten Ereignisses* (3) Bestätigung durch ein weiteres unabhängiges Opfer oder weitere Zeugen, die dem mutmaßlichen Opfer nicht bekannt waren* (4) Schuldspruch vor Gericht (5) Geständnis des Beschuldigten (vor einer etwaigen Urteilsabsprache)90 Um als bewusst wahrheitswidrig eingestuft zu werden, musste die Aussage mindestens drei der folgenden Kriterien enthalten und wieder mindestens ein gekennzeichnetes: (1) Widersprüchliche Beweise* (zum Beispiel Beweise, die darauf hinwiesen, dass die Tat nicht in der Art und Weise, wie sie geschildert wurde, begangen worden sein konnte) (2) Alibibeweise* (3) Umfassender und plausibler Widerruf der Aussage durch den Zeugen (4) Fundiertes Bestreiten der Tat durch den Beschuldigten Von ursprünglich 176 Aussagen kindlicher Aussagepersonen erfüllten lediglich 31 die von den Autorinnen festgelegten Voraussetzungen,91 so dass die Re86

Lamb/Sternberg/Esplin/Hershkowitz/Orbach/Hovav Child Abuse & Neglect 21 (1997) S. 255 (260); siehe auch Gödert Glaubhaftigkeitsbeurteilung, S. 25, 33. 87 Lamb/Sternberg/Esplin/Hershkowitz/Orbach/Hovav Child Abuse & Neglect 21 (1997) S. 255 (262 f.). 88 „Die kriterienorientierte Inhaltsanalyse sollte noch nicht – und vielleicht auch niemals – im forensischen Kontext angewendet werden, um [die Glaubhaftigkeit] einzelne[r] Aussagen zu bewerten.“ 89 Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236–243. 90 Die Kritik an dem Benutzen eines Geständnisses als Außenkriterium war den Autorinnen bekannt, Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (237). 91 Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (238).

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

55

präsentativität der Studie bereits aufgrund der überschaubaren Stichprobe angezweifelt wird.92 Allerdings überzeugt sie durch ihre sorgfältige Bestimmung der objektiven Wahrheit.93 Der Fokus der Studie lag zwar weniger auf der Überprüfung der Undeutsch-Hypothese als auf einer Überprüfung der sogenannten Inter-Rater-Reliabilität und der Trefferquoten der kriterienorientierten Inhaltsanalyse (dazu später). Die Studie ergab jedoch auch, dass lediglich die Realkennzeichen (2) „Reproduktionsstil“, (4) „Verknüpfungen“ und (15) „Erinnerungslücken“ häufiger und stärker in subjektiv wahren als in erfundenen Aussagen auftreten und sich somit zur Unterscheidung eignen.94 Roma et al. untersuchten 2011 von ursprünglich 487 in Frage kommenden Aussagen in Kindesmissbrauchsfällen am Ende 109 Aussagen.95 Für die 60 „bestätigten“ Fälle, in denen der Täter verurteilt wurde, lagen zwar weitgehend unabhängige Außenkriterien vor, so dass jeweils vom subjektiven Wahrheitsgehalt der Aussage ausgegangen werden konnte: unter anderem Telefonüberwachungen, unabhängige Zeugen, pornografisches Material über das mutmaßliche Opfer und biologische Missbrauchsspuren (DNA) – aber auch Geständnisse.96 In keinem der 49 „unbestätigten“ Fälle gab es jedoch – vom Freispruch des Angeklagten abgesehen – ein unabhängiges Außenkriterium. Die Autoren versuchten dieses Problem zu lösen, indem sie die Fallakten einem dreiköpfigen Expertengremium zur Einschätzung des subjektiven Erlebnisbezugs vorlegten. Stimmte die Einstufung der Experten mit der Gerichtsentscheidung überein, wurde die entsprechende Aussage in die Studie miteinbezogen. Doch auch diese Art von Außenkriterium ist selten vollends unabhängig, selbst wenn den Experten (wie in dieser Studie) die Zeugenaussage und die Gerichtsentscheidung vorenthalten werden. Denn die Einschätzungen von Expertengremien basieren gerade auf den Fallakten, also sämtlichen Informationen, die über den Fall vorhanden sind, und werden damit weitgehend auf der gleichen Grundlage wie Gerichtsurteile gefällt. Zudem werden aussagepsychologische Gutachten in aller Regel bei dünner Beweislage angefordert, so dass auch der Expertenentscheid auf denselben dürftigen Informationen basiert.97 Unabhängig davon war das Ergebnis auch dieser Feldstudie eher bescheiden. Zwar traten neun der 14 getesteten Realkennzeichen (wieder nur) signifikant 92

Niveau/Lacasa/Berclaz/Germond Journal of Forensic Sciences 60 (2015) S. 1247 (1248). 93 Vrij Detecting Deception, S. 3 (13); kritisch aber Amado/Arce/Fariña European Journal of Psychology Applied to Legal Context 7 (2015) S. 3 (9). 94 Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (240). 95 Roma/San Martini/Sabatello/Tatarelli/Ferracuti Child Abuse & Neglect 35 (2011) S. 613 (615 f.). 96 Dass ein Angeklagter ein falsches Geständnis ablegen sollte, halten die Autoren ohne Begründung für unwahrscheinlich, Roma/San Martini/Sabatello/Tatarelli/Ferracuti Child Abuse & Neglect 35 (2011) S. 613 (615). 97 Berlinger, S. 157; Gödert Glaubhaftigkeitsbeurteilung, S. 83.

56

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

häufiger bei den bestätigten als bei den unbestätigten Fällen auf.98 Während bei den Kriterien 1, 2, 8 und 11 gar keine (statistisch signifikanten) Unterschiede festgestellt werden konnten, kamen die Autoren zu dem Ergebnis, dass sich nur drei Kriterien gut, und das heißt diagnostisch brauchbar, zur Unterscheidung zwischen subjektiv wahren und erfundenen Aussagen eignen: (3) „Details“, (5) „Interaktionen“ und (12) „Eigenseelisches“.99 Denn der Nachweis nur statistisch signifikanter Unterschiede sagt wie gezeigt wenig aus über den praktischen Nutzen der Kriterien.100 Welle et al. versuchten in ihrer Feldstudie 2016 ebenfalls, ein möglichst unabhängiges Außenkriterium zu etablieren. So schlossen die Autoren Gerichtsentscheidungen generell als Außenkriterium aus. Als „unabhängige“ Kriterien berücksichtigten sie voneinander unabhängige Einschätzungen „erfahrener“ Auswerter sowie „medizinisch-juristische Erkenntnisse“ („medico-legal findings“) wie medizinische Befunde, aber auch Aussagewiderrufe und (wieder einmal) Geständnisse. Als Stichprobe blieben 60 Aussagen – 40 bestätigte und 20 unbestätigte – mutmaßlicher Kindesmissbrauchsopfer.101 Hinsichtlich der Validität der einzelnen Realkennzeichen kamen die Autoren zu dem Schluss, dass lediglich die Kriterien (6) „Gespräche“ und (12) „Eigenseelisches“ geeignet seien, zwischen subjektiv wahren und erfunden Aussagen zu differenzieren; mit den Worten der Autoren:102 „The frequency of occurrence of Criterion 8 was close to zero, in both confirmed and unconfirmed accounts. The frequency of absence/presence of seven criteria (7, 10, 14 16, 17, 18, 19) did not differ between the confirmed and the unconfirmed cases. Of all the 19 criteria, the presence of items 6 ‚Reproduction of conversation‘ and 12 ‚Accounts of subjective mental state‘ revealed the strongest association with the statements where the accounts were genuine.“103

98 Auch in dieser Studie wurden lediglich 14 statt 19 Kriterien getestet, Roma/San Martini/

Sabatello/Tatarelli/Ferracuti Child Abuse & Neglect 35 (2011) S. 613 (614). 99 Roma/San Martini/Sabatello/Tatarelli/Ferracuti Child Abuse & Neglect 35 (2011) S. 613 (618). 100 Siehe erneut Gödert Glaubhaftigkeitsbeurteilung, S. 33 f.; deutlich wird das, wenn man die Ergebnisse und meist nur geringfügigen Unterschiede der Studie genauer betrachtet, Roma/ San Martini/Sabatello/Tatarelli/Ferracuti Child Abuse & Neglect 35 (2011) S. 613 (618, dort in Tabelle 4). 101 Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (113). 102 Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (114). 103 „Kriterium 8 trat sowohl bei den bestätigten als auch den nichtbestätigten Aussagen so gut wie gar nicht auf. Die Häufigkeit des Fehlens oder Auftretens von sieben Kriterien (7, 10, 14, 16, 17, 18, 19) unterschied sich nicht bei den bestätigten und unbestätigten Fällen. Von allen 19 Realkennzeichen zeigte das Vorhandensein der Kriterien 6 ‚Wiedergabe des Gesprächs‘ und 12 ‚Schilderung der subjektiven psychischen Befindlichkeit‘ den stärksten Zusammenhang bei den subjektiv wahren Aussagen.“

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

57

Ihr Fazit ist daher so eindeutig wie ernüchternd:104 „Clearly, the results from the present study confirm that the CBCA is not sufficient in itself, and the use of additional criteria seems the only direction to take in order to reach a higher level of discriminative accuracy between true and false allegations. Additional tools designed to discern the presence of untruthful statements […] should be developed and used alongside the CBCA as a ‚counterbalance,‘ in order to increase its accuracy.“105

2. Realitätsfremde Laborstudien Die Befundlage experimenteller Validierungsstudien fällt ähnlich heterogen aus, und zwar ungeachtet ihrer ohnehin nur eingeschränkten Aussagekraft, da die meisten Laborstudien lediglich Aussagen über eher harmlose Ereignisse untersuchten.106 Im Vergleich zu den meisten Felduntersuchungen zeigen sie insgesamt sogar weniger Unterschiede zwischen subjektiv wahren und bewusst wahrheitswidrigen Aussagen.107 Jedoch ergeben sich ähnliche Ergebnisse für Aussagen von Kindern und Erwachsenen, so dass zumindest die experimentellen Studien belegen konnten, dass manche Realkennzeichen sowohl bei Kindern als auch bei Erwachsenen auftreten.108 Neben teils erheblicher methodischer Unterschiede – so fehlte Auswertern oftmals die erforderliche Expertise oder wurden unterschiedliche Ratingskalen verwendet – ist das Hauptproblem von Laborstudien, dass unterschiedliche Paradigmen der Datengewinnung zum Einsatz kommen, so dass sich die Ergebnisse schwer verallgemeinern lassen.109 Während Probanden in manchen Laborstudien an einem Ereignis, zum Beispiel einem Scheinverbrechen, teilnehmen, um im Anschluss über dieses wahrheitsgemäß oder wahrheitswidrig zu berichten, oder in anderen – wie in der bereits erwähnten Studie von Steller, Wellershaus und Wolf – über tatsächliche oder erfundene autobiografische Erlebnisse erzählen sollen, wird in manchen Studien lediglich ein Film oder ein inszeniertes Ereignis vorgeführt, über den oder das die Studienteilnehmer 104

Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (118). „Die Ergebnisse der vorliegenden Studie bestätigen eindeutig, dass die kriterienorientierte Inhaltsanalyse allein nicht ausreicht, so dass der Einsatz weiterer Kriterien der einzige Weg zu sein scheint, um besser zwischen subjektiv wahren und bewusst wahrheitswidrigen Aussagen unterscheiden zu können. Zusätzliche Methoden zur Erkennung bewusst unwahrer Aussagen […] sollten entwickelt und als ‚Gegengewicht‘ neben der kriterienorientierten Inhaltsanalyse eingesetzt werden, um deren Treffsicherheit zu erhöhen.“ 106 Griesel/Ternes/Schraml/B. Cooper/Yuille Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, S. 293 (295): „relatively benign events“. 107 Oberlader/Naefgen/Koppehele-Gossel/Quinten/Banse/Schmidt Law and Human Behavior 40 (2016) S. 440 (445); Vrij Detecting Lies, S. 227; ein Überblick findet sich jeweils bei Geipel Lügenerkennung, S. 86–89, Gödert Glaubhaftigkeitsbeurteilung, S. 26, Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 137–144, und Vrij Detecting Lies, S. 258 f. 108 Vgl. Vrij Detecting Lies, S. 228. 109 Gödert Glaubhaftigkeitsbeurteilung, S. 27. 105

58

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

später berichten sollen.110 Studien mit dem Filmparadigma gewährleisten zwar einen perfekten Nachweis der objektiven Wahrheit, können aber nicht zur Überprüfung der Undeutsch-Hypothese beitragen, da diese auf den subjektiven Erlebnisbezug einer Aussage abstellt („Sachverhalt subjektiv erlebt oder nicht erlebt“) und nicht darauf, ob die Aussageperson einen Sachverhalt beobachtete oder nicht.111 Auch Scheinverbrechen-Studien eignen sich kaum zur Validierung der Undeutsch-Hypothese. In solchen werden manche der Probanden beauftragt, zum Beispiel einen simulierten Diebstahl zu begehen, indem sie ein Portemonnaie oder Schmuck entwenden. Andere Probanden sollen das Portemonnaie mit Erlaubnis des Berechtigten abholen,112 die „Tat“ nur beobachten oder nur behaupten, den Diebstahl beobachtet zu haben.113 Im Anschluss werden dann alle Probanden anhand der Realkennzeichenanalyse begutachtet. Bei dieser Art von Laborstudien wird die fehlende externe Validität besonders deutlich. Porter und Yuille gestehen zum Beispiel in ihrer Studie selbst ein, dass neun der 19 Realkennzeichen ohnehin nicht überprüfbar sind und unberücksichtigt bleiben müssen, da sie bei einer Simulation generell nicht anwendbar sind. Außerdem konnten sie bei den verbleibenden nur bei drei Realkennzeichen statistisch signifikante Unterschiede feststellen.114 Da die Laborstudien ohnehin nicht mehr Realkennzeichen bestätigen konnten, ändert sich nichts am Ergebnis der Feldstudien. Gödert beispielsweise hält lediglich das Kriterium (3) „Details“ für durch Laborstudien bestätigt.115 Ungeachtet dieses pessimistischen Fazits bleibt die Befundlage zur UndeutschHypothese also selbst nach Berücksichtigung der experimentellen Studien eher bescheiden.

3. Ein „glücklicher Umstand“: das Prinzip der Aggregation Es mag überraschen, dass Vertreter und Befürworter der aussagepsychologischen Glaubhaftigkeitsbegutachtung dieses doch eher dürftige Ergebnis nicht bestreiten, sondern die kriterienorientierte Inhaltsanalyse weiterhin (man hat den Eindruck erst recht) als ein wissenschaftlich begründetes und empirisch 110 Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (9). 111 Gödert/Rill/Vossel MschrKrim 86 (2003) S. 273 (276); Niehaus

Glaubhaftigkeitsmerkmale, S. 76; Steller/Wellershaus/Wolf Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151 (157 f.). 112 So in der Studie von Porter/Yuille Law and Human Behavior 20 (1996) S. 443 (447). 113 So bei Gödert/Rill/Vossel MschrKrim 86 (2003) S. 273 (276 f.). 114 Porter/Yuille Law and Human Behavior 20 (1996) S. 443 (453 f.). 115 Gödert Glaubhaftigkeitsbeurteilung, S. 33; siehe auch DePaulo/Lindsay/Malone/Muhlen-bruck/Charlton/H. Cooper Psychological Bulletin 129 (2003) S. 74 (91 f.); Geipel Lügenerkennung, S. 85.

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

59

bestätigtes Verfahren ansehen.116 Volbert findet die Befunde sogar „wenig erstaunlich“, und sie müssten „keineswegs dazu führen, die gesamte aussagepsychologische Methodik infrage zu stellen“.117 Auch der Bundesgerichtshof sieht die kriterienorientierten Inhaltsanalyse gleichwohl als empirisch überprüft an; er führt dazu aus (Hervorhebungen des Verfassers):118 „Zwar handelt es sich um Indikatoren mit jeweils für sich genommen nur geringer Validität, d. h. mit durchschnittlich nur wenig über dem Zufallsniveau liegender Bedeutung. Eine gutachterliche Schlußfolgerung kann aber eine beträchtlich höhere Aussagekraft und damit Indizwert für die Glaubhaftigkeit zu beurteilender Angaben erlangen, wenn sie aus der Gesamtheit aller Indikatoren abgeleitet wird.“

Der Bundesgerichtshof begründet dies unter Verweis auf das vorbereitende Gutachten von Fiedler und Schmid mit dem „mathematisch und psychometrisch eingehend untersuchte[n] Prinzip der Aggregation“, also einer Art Kumulation der jeweiligen Realkennzeichen.119 In diesem Gutachten heißt es dazu wörtlich: „Logisch und mathematisch lasse sich dieser glückliche Umstand durch ein Prinzip begründen, das in seiner Stärke und Bedeutung dem gesunden Menschenverstand nicht unbedingt zugänglich ist, das aber die Grundlage für viele induktive Schlüsse bildet: das Prinzip der Aggregation.“120

Das ist auf den ersten Blick tatsächlich logisch, lässt man sich dieses „Prinzip der Aggregation“ durch den Kopf gehen. So ist richtig, dass sich die Wahrscheinlichkeit, dass eine Aussage subjektiv wahr ist, insgesamt erhöhen muss, je mehr Realkennzeichen (Indikatoren) sie enthält.121 Und mittels des „Prinzips des induktiv-statistischen Schließens“122 lässt sich aus vielen kleinen unabhängigen Indikatoren, die für sich genommen im Durchschnitt nur wenig besser als der Zufall sind, unterm Strich dennoch ein „beträchtlicher diagnostischer Wert“ erreichen. Aus vielen an sich unbedeutenden Indikatoren und „QuasiNichtigkeiten“ kann durch Kumulation ein Gesamtwert erzielt werden, der nach statistischen Schlussfolgerungen in vielen Fällen auf ein wahres Erleben hindeutet.123 Dabei kann sogar ein Ausgleich für einige wenige unter der Zu116 Vgl. nur Greuel Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70 (71); Schoon/Briken Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 125 (126); Steller Handbuch der Rechtspsychologie, S. 300 (301 f.); Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (82). 117 Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (178). 118 BGHSt. 45, 164 (171). 119 BGHSt. 45, 164 (171). 120 Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5 (11); zustimmend Volbert Psycho-logische Begutachtung im Strafverfahren, S. 171 (178 f.). 121 So im Ergebnis auch Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 161 f. 122 Zur Logik induktiven Schließens Schweizer, S. 84–89. 123 Schoreit StV 2004, 284 (286).

60

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

fallswahrscheinlichkeit anzusiedelnde Merkmale erreicht werden; diese sind in der Summe unbeachtlich und werden einfach „weggekürzt“.124 Wahrhaftig ein „glücklicher Umstand“. Jedoch setzt dieser zwingend voraus, dass die einzelnen Indikatoren überhaupt einen messbaren Wert aufweisen; und einen, der zumindest erwiesenermaßen überzufällig, also überwiegend besser als der Zufall ist. Nur wenn beides gewährleistet ist, ist der Verweis auf das Aggregationsprinzip berechtigt.125 Zudem verliert das Argument der Aggregation an Überzeugungskraft, je weniger erhebliche, überzufällige Einzelindikatoren vorliegen. Fiedler und Schmid gehen in ihren abstrakten Rechenbeispielen einmal von zehn, ein andermal von 20 unabhängigen Indikatoren aus, die jeweils die Voraussetzung „besser als der Zufall“ erfüllen.126 Von theoretisch 19 denkbaren Realkennzeichen können jedoch allenfalls sieben als hinreichend validiert angesehen werden.127 In der Konsequenz eine Mindestzahl an Realkennzeichen zu fordern, steht allerdings im Widerspruch zu der unter Aussagepsychologen herrschenden Auffassung, der sich auch der Bundesgerichtshof angeschlossen hat, die eine bestimmte Anzahl an Realkennzeichen als Schwellen- oder Cut-off-Wert ablehnt:128 Es existierten gerade keine Verknüpfungsregeln, die bei Vorliegen einer bestimmten Anzahl inhaltlicher Merkmale ein entsprechendes Glaubhaftigkeitsurteil nahelegten.129 Dann muss dies aber konsequenterweise auch für das Aggregationsprinzip gelten. Dieses setzt nun einmal eine Mindestanzahl homogener und überzufälliger Realkennzeichen voraus – mit anderen Worten: einen Schwellenwert. Und das kann aufgrund der dürftigen Befundlage zumindest nicht für alle Indikatoren bejaht werden, so dass Fischer zuzustimmen ist: „Der zutreffende Hinweis auf das Überzeugungs-stiftende Wirken der ‚Aggregation‘ vermag den Nachweis der Validität der Einzelelemente nicht zu ersetzen: Aus lauter Nullen wird auch durch noch so viel Aggregation keine Eins.“130 124

Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5 (12). Vgl. auch Eisenberg Beweisrecht, Rn. 1429 in Fn. 178; ausführlich Hommers Psychologie der Zeugenaussage, S. 87 (91–100). 126 Vgl. Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5 (12); Schoreit StV 2004, 284 (287) wirft Fiedler und Schmid daher zu Recht vor, sie hätten sich mit einer „sehr einfachen Erklärung des Prinzips der Aggregation“ zufriedengegeben. 127 Auf diese Schwäche weisen selbst Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5 (12 f.) hin; der Bundesgerichtshof hielt die Gefahr „massiv verfälschter Ergebnisse“ (S. 13) jedoch für nicht erwähnenswert. 128 Vgl. BGHSt. 45, 164 (171); Geipel Beweiswürdigung, § 26 Rn. 19; Steller/Volbert Praxis der Rechtspsychologie 9 (1999) S. 46 (53); Volbert/Schemmel/Tamm Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108 (113); immerhin verlangen Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 161 f., dass mindestens die Kriterien (1) „Konsistenz“ und (3) „Details“ erfüllt und die Aussagekonstanz gegeben sein müssen. 129 Niehaus Handbuch der Rechtspsychologie, S. 311 (315). 130 Fischer Widmaier-FS, S. 191 (216). 125

IV. Nur teilweise Bestätigung der Undeutsch-Hypothese

61

Nun lässt sich mit Vertretern der aussagepsychologischen Begutachtung wieder einwenden, dass stets der Einzelfall und die individuellen, kognitiven Fähigkeiten der konkreten Aussageperson berücksichtigt werden müssten.131 Erst ein solcher „Qualität-Kompetenz-Vergleich“ ermögliche eine psychologische Einschätzung, ob die Aussageperson in der Lage war, die konkrete Aussage zu erfinden.132 Bei der kriterienorientierten Inhaltsanalyse handle es sich gerade nicht um eine Methode zur Analyse der Aussagequalität im Sinne einer „Checklisten-Diagnostik“.133 Die Auswertung der Realkennzeichenanalyse erfolge nicht anhand statistischer Regeln, die ein standardisiertes Vorgehen garantieren könnten, sondern obliege letzten Endes allein der professionellen Einschätzung des Gutachters („expert’s clinical judgement“).134 Und Volbert begründet die Heterogenität der Studien damit, dass sie „erhebliche Unterschiede aufweisen hinsichtlich der verwendeten Aussagethematik, der unterschiedlichen Altersgruppen, der motivationalen Aussagebedingungen, der Art der Unwahrbedingungen, der Befragungstechniken sowie des Trainings und der Erfahrung der Beurteiler“ (Hervorhebungen im Original).135 Wirklich schlau wird man aus diesen Ausführungen nicht. Mangels Standardisierbarkeit oder entsprechenden Beurteilungsregeln sowie aufgrund „erheblicher Unterschiede“ der Studien untereinander – so die Befürworter der aussagepsychologischen Begutachtung – frage ich mich, wie (nicht nur) der Bundesgerichtshof zu dem Ergebnis kommt, die Methode sei grundsätzlich wissenschaftlich fundiert und empirisch nachweisbar, sagt er doch selbst, dass „teilweise nicht unerhebliche Fehlerspannen“ bestehen.136 Zusammengefasst muss es daher bei der Begründung von Undeutsch bleiben: Die Grundannahmen der aussagepsychologischen Glaubhaftigkeitsbegutachtung basierten auf dem gesunden Menschenverstand und der beruflichen Erfahrung des Gutachters.137 Denn empirisch nachgewiesen werden konnte die Undeutsch-Hypothese bislang nicht. Doch besteht man darauf, ein Beweismittel sei wissenschaftlich fundiert, muss dieses mindestens auf seine Validität, seinen Wert, überprüft werden.138 Und hält es einer solchen Prüfung nicht stand, darf es im Strafverfahren zumindest nicht unreflektiert herangezogen werden. Zu groß ist die Gefahr, aufgrund eines Scheinbeweises zu verurteilen.139 131 Vgl. Köhnken The Detection of Deception in Forensic Contexts, S. 41 (52); Volbert/ Schemmel/Tamm Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108 (113). 132 Steller Handbuch der Rechtspsychologie, S. 300 (302 f.). 133 Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 159; Oberlader/Naefgen/Koppehele-Gossel/Quinten/Banse/Schmidt Law and Human Behavior 40 (2016) S. 440 (441); Volbert/Steller European Psychologist 19 (2014) S. 207 (216). 134 Köhnken The Detection of Deception in Forensic Contexts, S. 41 (53). 135 Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (178). 136 BGHSt. 45, 164 (171). 137 Undeutsch Forensische Psychologie, S. 26 (126). 138 Vgl. Mokros Psychiatrische Begutachtung, S. 29 (42). 139 Für Plaum bewegt sich die aussagepsychologische Glaubhaftigkeitsbegutachtung auf

62

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

V. Trefferquoten – und warum es nicht wirklich auf sie ankommt Im Folgenden soll es daher um den praktischen Wert der aussagepsychologischen Glaubhaftigkeitsbegutachtung gehen. Angenommen ein Gutachter liegt so gut wie immer richtig, wenn er die Methode anwendet, stellt also fast ausnahmslos die Glaubhaftigkeit positiv fest, wenn die Aussage tatsächlich subjektiv wahr ist, und lehnt sie ab, wenn die Aussage erlogen ist, so wird wohl kaum jemand an der Tauglichkeit zweifeln – unabhängig davon, dass nicht alle Realkennzeichen empirisch nachgewiesen werden können. Geht es um die Tauglichkeit einer Methode, wird daher meist auf ihre Trefferquoten, also gewissermaßen ihre „Entdeckungsquoten“ („accuracy rates“) verwiesen – so auch bei der aussagepsychologischen Glaubhaftigkeitsbegutachtung. Die Treffgenauigkeit ist die bereits erwähnte, zweite Stufe der Validität.140 Will man aber ganz konkret den praktischen Nutzen einer Methode bestimmen, kommt es genau genommen nicht allein auf die Trefferquoten an. Bei der kriterienorientierten Inhaltsanalyse liegt das nicht etwa daran, dass die erste Stufe nicht zufriedenstellend ist – obgleich die zweite Stufe auf der ersten aufbaut. Auch liegt es nicht daran, dass die Trefferquoten der kriterienorientierten Inhaltsanalyse ohnehin nur mit Vorsicht zu genießen und zu relativieren sind, da es sich – wie Vertreter der Methode nicht müde werden zu betonen – um einen wertenden und interpretativen Prozess handle, der keinen allgemeingültigen Beurteilungsregeln unterliege, sondern auf den konkreten Einzelfall abgestimmt werden müsse. Streng kontrollierte Untersuchungen zu den Trefferquoten der kriterienorientierten Inhaltsanalyse seien somit nicht möglich. Die fehlende Standardisierbarkeit der Methode und die damit verbundene Abhängigkeit des Untersuchungsergebnisses von der Kompetenz des Untersuchers erlaubten keine generalisierbaren und vom konkreten Untersucher unabhängigen Angaben zu Validität.141 Ungeachtet dieser Gründe, die, wie ich meine, eher gegen als für die propagierte Wissenschaftlichkeit sprechen, gibt es nun einmal Studien, die „hohe“ Trefferquoten der kriterienorientierten Inhaltsanalyse nachweisen und auf die (dann doch) auch Befürworter der Methode verweisen.142 Und selbst der Bun-

„dem (un)wissenschaftlichen Niveau, welches methodisch anders orientierten Psychologinnen/Psychologen von Vertretern der Aussagepsychologie gerne unterstellt wird“, Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (113). 140 Siehe bereits 3. Kapitel II (S. 43). 141 Siehe nur Gödert Glaubhaftigkeitsbeurteilung, S. 18 f.; Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 159 f.; Volbert Psychologische Begutachtung im Strafverfahren, S. 171 (179). 142 Vgl. Köhnken Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess,

V. Trefferquoten – und warum es nicht wirklich auf sie ankommt

63

desgerichtshof geht davon aus, dass die mit der kriterienorientierten Inhaltsanalyse erzielten Ergebnisse „deutlich über dem Zufallsniveau“ liegen.143 Nein, diese Trefferquoten sind deshalb unter Umständen sogar irreführend, da sie wenig aussagen über den diagnostischen und praktischen Nutzen – vor allem mit Blick auf die strafverfahrensrechtliche Beweissituation. Für den Schuldspruch interessiert nämlich nicht, wie viele subjektiv wahre Aussagen als solche klassifiziert werden können – das geben die Trefferquoten wieder. Sondern entscheidend ist der umgekehrte „Blick“: In wie vielen Fällen, in denen das Gutachten zu dem Ergebnis kommt, die Aussage sei glaubhaft, ist die Aussage auch wirklich subjektiv wahr – und in welchen nicht? Kurz gesagt geht es um den konkreten Beweiswert der kriterienorientierten Inhaltsanalyse. Diese Frage beantworten am Ende nicht die Trefferquoten. Aber der Reihe nach. Denn sie lässt sich nur beantworten, wenn – sozusagen als Vorfrage – die Trefferquoten feststehen. Sind sie bekannt, lässt sich in einem Folgeschritt anhand des Satzes von Bayes, der sogenannten Bayes-Regel, der konkrete Beweiswert berechnen. Dafür werde ich mir ein paar Ausführungen zur statistischen Wahrscheinlichkeitsberechnung erlauben. So viel sei vorweggenommen: Selbst wenn es keine exakten Trefferquoten geben mag, lässt sich zumindest eine grobe Richtung erkennen, welcher indizielle Beweiswert einer aussagepsychologischen Begutachtung zugesprochen werden kann. Die Zahlen und Rechnungen auf den folgenden Seiten sind daher als Richtwerte zu verstehen.

1. Empirische Forschung zu den Trefferquoten a) Zur Berechnung von Trefferquoten – Statistik für Juristen (Teil 1) Sollen anhand einer Studie Trefferquoten bestimmt werden, lassen sich diese recht anschaulich durch eine sogenannte Vierfeldertafel abbilden (Tabelle 1).144 Um die Trefferquoten zu ermitteln, muss zunächst angegeben sein, wie viele der begutachteten Aussagen insgesamt tatsächlich subjektiv wahr (a + c) oder erfunden waren (b + d).145 Die Trefferquote bei einem positiven Ergebnis wird auch Sensitivität genannt, das heißt hier die bedingte Wahrscheinlichkeit für ein positives Ergebnis unter den tatsächlich subjektiv wahren Aussagen. S. 25 (47); Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (39); Volbert/Steller European Psychologist 19 (2014) S. 207 (210). 143 BGHSt. 45, 164 (171). 144 Allgemein zur Vierfeldertafel Hilgers/Heussen/Stanzel Medizinische Laboratoriumsdiagnostik, S. 2448 f. 145 Anders, aber meines Erachtens falsch Plaum Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102 (107), der in der Wirklichkeitsspalte auf einen etwaigen sexuellen Missbrauch abstellt; ob ein solcher tatsächlich stattgefunden hat, kann die aussagepsychologische Begutachtung jedoch nicht ermitteln; es geht allein um die Bestimmung des subjektiven Wahrheitsgehalts der Aussage als Indiz für die Täterschaft.

64

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

Tabelle 1: Vierfeldertafel zur Treffgenauigkeit der aussagepsychologischen Begutachtung Wirklichkeit Ergebnis positiv (G) (Aussage glaubhaft) negativ (nG) (Aussage nicht glaubhaft) Gesamt:

Aussage subjektiv wahr (W)

Aussage bewusst wahrheitswidrig (nW)

Gesamt:

a zutreffend-positive Fälle

b falsch-positive Fälle

a + b positive Ergebnisse

c falsch-negative Fälle

d zutreffend-negative Fälle

c + d negative Ergebnisse

a + c

b + d

G: Das Gutachten kommt zu dem Ergebnis, die Aussage ist glaubhaft (positives Ergebnis); nG: Das Gutachten kann die Glaubhaftigkeit der Aussage nicht bestätigen (negatives Ergebnis); W: Die begutachtete Aussage ist tatsächlich subjektiv wahr; nW: Die Aussage ist tatsächlich nicht subjektiv wahr, sondern bewusst wahrheitswidrig.

Die Schreibweise „P(G|W)“ – „P“ steht für Wahrscheinlichkeit („probabi lity“) – trennt die Bedingung von dem gesuchten Ereignis. Rechts von dem senkrechten Strich in der Klammer wird die Bedingung notiert, links das zu berechnende Ereignis.146 „P(G|W)“ heißt hier die (bedingte) Wahrscheinlichkeit eines positiven Ergebnisses („G“ = „Aussage glaubhaft“) unter der Bedingung „W“, nämlich dass die Aussage tatsächlich subjektiv wahr ist. Die Sensitivität wird also rechnerisch geschätzt durch:147 P(G|W) =

Zahl der wahren Aussagen mit positivem Ergebnis a = Gesamtzahl der subjektiv wahren Aussagen a + c

Die Sensitivität lässt sich als Empfindlichkeit der Begutachtungsmethode verstehen, da sie die Wahrscheinlichkeit für die richtige Entscheidung unter den subjektiv wahren Aussagen angibt. Daher wird sie im Englischen (wenn auch missverständlich) „True Positive Rate“ genannt. Ist die Sensitivität hoch, wird die Methode kaum tatsächlich subjektiv wahre Aussagen übersehen. Angenommen die Begutachtungsmethode hat eine Sensitivität von 85 Prozent; aus einer Stichprobe von 100 subjektiv wahren Aussagen werden dann 85 als solche identifiziert, wohingegen bei 15 Aussagen ein falsch-negatives Gutachtenergebnis ausgestellt wird. Diese 15 Aussagen sind zwar tatsächlich subjektiv wahr, werden aber fälschlicherweise nicht als glaubhaft eingestuft. 146 147

Schweizer, S. 92. Vgl. auch zum Folgenden Finkelstein, S. 8 f., und vor allem zu den Formeln, Hilgers/ Bauer/Scheiber, S. 83.

V. Trefferquoten – und warum es nicht wirklich auf sie ankommt

65

Spezifität heißt die (bedingte) Wahrscheinlichkeit für ein negatives Ergebnis unter den bewusst wahrheitswidrigen Aussagen: „P(nG|nW“) oder alternativ: „P(⌐G|⌐W)“. Sie wird geschätzt durch: P(nG|nW) =

Zahl bewusst wahrheitswidriger Aussagen mit negativem Ergebnis d = Gesamtzahl bewusst wahrheitswidriger Aussagen b + d

Die Spezifität reflektiert die Treffsicherheit der Methode insofern, als sie die Wahrscheinlichkeit für die richtige Entscheidung unter den bewusst wahrheitswidrigen Aussagen quantifiziert. Sie wird auch „True Negative Rate“ genannt. Eine spezifische Methode wird daher bewusst wahrheitswidrige Aussagen kaum als glaubhaft einstufen, zum Beispiel wenn von 100 bewussten Falschaussagen 90 als nicht-glaubhaft beurteilt werden. Die meisten Studien zur Treffsicherheit der aussagepsychologischen Begutachtung geben ausschließlich die Trefferquoten an, also Sensitivität und Spezifität, jedoch ohne die Gesamtzahl der Aussagen mitzuteilen. Dies trifft vor allem (nicht nur bei der Aussagepsychologie) auf Meta-Studien zu.148 Von der Richtigkeit der Berechnung ist dann gezwungenermaßen auszugehen.

b) Studienanalyse zu den Trefferquoten Soweit ersichtlich existieren lediglich zwei brauchbare Feldstudien zur Bestimmung der Trefferquoten der kriterienorientierten Inhaltsanalyse, und zwar die oben bereits erwähnten von Akehurst, Manton und Quandte sowie von Welle et al. aus den Jahren 2011 und 2016.149 Die jeweils von Esplin, Boychuk und Raskin,150 Krahé und Kundrotas151 sowie von Parker und Brown152 ermittelten Trefferquoten lasse ich aus den bereits genannten Gründen außen vor (unter anderem mangels eines unabhängigen Außenkriteriums).153 Die beiden Studien nennen glücklicherweise die Gesamtaussagenzahl, so dass sich die Ergebnisse beider Studien jeweils durch eine Vierfeldertafel abbilden lassen:

148 Zum Beispiel Gödert Glaubhaftigkeitsbeurteilung, S. 35; Oberlader/Naefgen/Koppehele-Gossel/Quinten/Banse/Schmidt Law and Human Behavior 40 (2016) S. 440 (448); Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (23 f.). 149 Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236–243; Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111–119. 150 Zitiert nach Raskin/Esplin The Suggestibility of Children’s Recollections, S. 153 (160– 162); zu den Trefferquoten Vrij Detecting Lies, S. 233. 151 Krahé/Kundrotas Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598 (611). 152 Parker/Brown Legal and Criminological Psychology 5 (2000) S. 237 (243 f.). 153 Vgl. zur Kritik auch Vrij Detecting Deception, S. 3 (13); Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (112).

66

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

Tabelle 2: Vierfeldertafel zur Feldstudie von Akehurst/Manton/Quandte (2016) Wirklichkeit Ergebnis positiv (Aussage glaubhaft) negativ (Aussage nicht glaubhaft) Trefferquote:

subjektiv wahr (N = 21)

bewusst wahrheitswidrig (N = 10)

Gesamt:

18,5 zutreffend-positive Fälle

3 falsch-positive Fälle

21,5

2,5 7 falsch-negative Fälle zutreffend-negative Fälle 88 % Sensitivität

9,5

70,5 % Spezifität

In der Studie von Akehurst, Manton und Quandte stuften zwei Beurteilerinnen die insgesamt 31 Aussagen entweder als glaubhaft oder nicht glaubhaft ein. Zu betonen ist, dass beide allerdings lediglich eine Art „Crashkurs“ zur Realkennzeichenanalyse absolviert hatten.154 Während die erste Beurteilerin zu einer Sensitivität von 95 Prozent kam und einer Spezifität von 60 Prozent, konnte die zweite Beurteilerin Trefferquoten von je 81 Prozent erzielen.155 Die Tabelle gibt den jeweiligen Durchschnittswert an von 88 und 70,5 Prozent – darum die „halben“ Fälle. Tabelle 3: Vierfeldertafel zur Feldstudie von Welle et al. (2011) Wirklichkeit Ergebnis positiv (Aussage glaubhaft) negativ (Aussage nicht glaubhaft) Trefferquote:

subjektiv wahr (N = 40)

bewusst wahrheitswidrig (N = 20)

Gesamt:

34 zutreffend-positive Fälle

10 falsch-positive Fälle

44

6 10 falsch-negative Fälle zutreffend-negative Fälle 85 % Sensitivität

16

50 % Spezifität

In der Studie von Welle et al. bewerteten drei mit der Realkennzeichenanalyse besser vertraute Beurteiler insgesamt 60 Aussagen entweder als glaubhaft oder nicht glaubhaft. Während die Beurteiler zu einer Sensitivität von 90, 85 154 155

Vgl. Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (239). Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (240).

V. Trefferquoten – und warum es nicht wirklich auf sie ankommt

67

und 80 Prozent kamen, lag die Spezifität lediglich bei 40, 50 und 55 Prozent – also teils unterhalb des Zufallswerts.156 Die in Tabelle 3 angegebenen Durchschnittswerte liegen folglich bei 85 und (aufgerundet) 50 Prozent. Ungeachtet der jeweils nur geringen Stichprobe, so dass die Repräsentativität der beiden Studien eingeschränkt ist,157 können wir festhalten, dass die Realkennzeichenanalyse eher geeignet ist, subjektiv wahre Aussagen zutreffend als solche zu erkennen als bewusst wahrheitswidrige. Hält man hier kurz inne, scheinen die Trefferquoten zu bestätigen, dass die kriterienorientierte Inhaltsanalyse als Methode zur Glaubhaftigkeitsermittlung gut geeignet ist. Jedoch zeigen die Vierfeldertafeln auch, dass das Risiko eines falsch-positiven Ergebnisses größer ist als das eines falsch-negativen. Gutachter, die Aussagen einer kriterienorientierten Inhaltsanalyse unterziehen, neigen also eher dazu, erfundene Aussagen fälschlicherweise als glaubhaft zu klassifizieren, als subjektiv wahre Aussagen für nicht glaubhaft zu halten.158 Diese Trefferquoten decken sich größtenteils mit den Ergebnissen der Laborstudien zur Treffgenauigkeit der kriterienorientierten Inhaltsanalyse. Vrij untersuchte 2008 in einer umfassenden Meta-Analyse die Trefferquoten mehrerer Laborstudien.159 20 Studien gaben konkrete Werte an zur Sensitivität (zwischen 44 und 91 Prozent) und Spezifität (zwischen 35 und 100 Prozent). Daraus ergibt sich eine durchschnittliche Sensitivität von 70,35 Prozent sowie eine durchschnittliche Spezifität von 68,1 Prozent.160 Diese Zahlen sind jedoch aus mehreren Gründen zu relativieren. Einerseits wurden etliche dieser Trefferquoten von ungeübten Studierenden oder Beurteilern ohne nennenswerte Ausbildung erzielt.161 Solche Trefferquoten sagen wenig aus über den praktischen „Ernstfall“, nämlich wenn Richter oder Sachverständige Aussagen professionell begutachten. Andererseits wurden die meisten dieser Trefferquoten anhand sogenannter Diskriminanzanalysen berechnet.162 Bei diesen werden die Trefferquoten einer Laborstudie bestimmt, 156

Welle/Berclaz/Lacasa/Niveau J Forensic Leg Med 43 (2016) S. 111 (114 f.). Vgl. Niveau/Lacasa/Berclaz/Germond Journal of Forensic Sciences 60 (2015) S. 1247 (1248); allgemein gilt: je geringer die Stichprobe, desto größer das Risiko verzerrter Ergebnisse, Schemmel/Volbert Praxis der Rechtspsychologie 27 (2017) S. 79 (85 f.). 158 So auch Gödert Glaubhaftigkeitsbeurteilung, S. 19. 159 Vrij Detecting Lies, S. 233–235; weitgehend deckungsgleich Gödert Glaubhaftigkeitsbeurteilung, S. 35. 160 Ähnlich die jüngere Meta-Analyse von Oberlader/Naefgen/Koppehele-Gossel/Quinten/Banse/Schmidt Law and Human Behavior 40 (2016) S. 440 (452): durchschnittliche Trefferquoten von jeweils ungefähr 70 Prozent. 161 Vgl. Volbert/Steller Psychiatrische Begutachtung, S. 683 (688); Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (22): manche dieser training sessions dauerten nur 45 Minuten. 162 So auch bei der Feldstudie von Krahé/Kundrotas Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598 (611): die Sensitivität lag bei 88,33, die Spezifität bei 78,33 Prozent; auch Akehurst/Manton/Quandte Applied Cognitive Psychology 25 (2011) S. 236 (240) führten zusätzlich eine Diskriminanzanalyse durch und kamen so zu einer Sensi157

68

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

indem die Realkennzeichen-Ergebnisse (also die Ergebnisse der ersten Stufe der Validität) in einen Computer eingegeben werden, der dann anhand eines Algorithmus die Probanden entweder in die Kategorie „Wahrheitssager“ oder die Kategorie „Lügner“ einordnet. Diese rein computerbasierte Zuordnung wird schließlich mit dem tatsächlichen Status des Probanden verglichen, der bei einer Laborstudie ja stets bekannt ist,163 und die Trefferquote entspricht dem Prozentsatz der korrekten Zuordnung.164 Diskriminanzanalysen führen allerdings in der Regel zu überoptimistischen und verzerrten Trefferquoten und sind wenig repräsentativ, da ein solches Vorgehen gerade nicht der Praxis entspricht.165 – Eine Analyse der lediglich vier verbleibenden Laborstudien in der Meta-Analyse von Vrij, die praxisnähere klinisch-intuitive Urteile zur Bestimmung der jeweiligen Trefferquote verwendeten, ergibt eine durchschnittliche Sensitivität von 81 Prozent und eine durchschnittliche Spezifität von lediglich 57,75 Prozent.166

2. Auf was es wirklich ankommt Auch wenn es sicher keine „absoluten“ Trefferquoten gibt, lässt sich festhalten, dass anhand der kriterienorientierten Inhaltsanalyse subjektiv wahre Aussagen recht deutlich über dem Zufallsniveau als solche erkannt werden können, bewusst wahrheitswidrige Aussagen aber annähernd so oft falsch wie richtig klassifiziert werden.167 Legt man etwa die „bereinigten“ Trefferquoten der Meta-Analyse von Vrij zugrunde (was zum Beispiel auch Volbert und Steller tun)168 und die durchschnittlichen Trefferquoten der beiden Feldstudien, ergibt sich eine Sensitivität von ungefähr 85 Prozent und eine Spezifität von 60 Prozent.169

tivität von 67 und einer Spezifität von 70 Prozent; die Meta-Analyse von Oberlader/Naefgen/ Koppehele-Gossel/Quinten/Banse/Schmidt Law and Human Behavior 40 (2016) S. 440 (445) enthält ebenfalls Studien mit Diskriminanzanalysen, auch wenn den Autoren die Schwächen bekannt waren (444). 163 Vgl. dazu 3. Kapitel III 1 (S. 44 f.). 164 Vrij Detecting Lies, S. 231. 165 Kritisch auch Gödert Glaubhaftigkeitsbeurteilung, S. 36 f.; Volbert/Steller European Psychologist 19 (2014) S. 207 (210); Vrij Psychology, Public Policy, and Law 11 (2005) S. 3 (23). 166 Ob diese vier Laborstudien methodisch beanstandungsfrei sind, sei an dieser Stelle dahingestellt; kritisiert wird vor allem die Studie von Landry/Brigham Law and Human Behavior 16 (1992) S. 663–676; so bedient sich die Studie des Filmparadigmas (dazu 3. Kapitel IV 2 [S. 57 f.]); kritisch Gödert Glaubhaftigkeitsbeurteilung, S. 37, 39; Vrij Detecting Lies, S. 227 f. 167 Berlinger, S. 101; Gödert Glaubhaftigkeitsbeurteilung, S. 40. 168 Volbert/Steller European Psychologist 19 (2014) S. 207 (210). 169 Auch wenn es sich wie bereits erwähnt um keine absoluten Zahlen handelt, sollen sie im Folgenden als Richtwert und Berechnungsgrundlage dienen.

V. Trefferquoten – und warum es nicht wirklich auf sie ankommt

69

Tabelle 4: Trefferquoten der kriterienorientierten Aussageanalyse: Ergebnis

Wirklichkeit

positiv (Aussage glaubhaft) negativ (Aussage nicht glaubhaft)

subjektiv wahr

bewusst wahrheitswidrig

85 % zutreffend-positive Fälle

40 % falsch-positive Fälle

15 % falsch-negative Fälle

60 % zutreffend-negative Fälle

Im Vergleich zu der eingangs erwähnten Meta-Analyse von Bond und DePaulo, die ergab, dass ohne spezifisches Auswertungsverfahren Trefferquoten von lediglich 61 Prozent für wahrheitsgemäße und 47 Prozent für bewusst wahrheitswidrige Aussagen erzielt werden können,170 bietet die aussagepsychologische Begutachtung also zweifellos einen Mehrwert. – Doch was sagen diese Trefferquoten nun aus über den diagnostischen und vor allem praktischen Nutzen der Aussageanalyse? Für die Beweiswürdigung – und somit für den Richter – ist entscheidend, ob die zu würdigende belastende Aussage tatsächlich subjektiv wahr ist. Nur dann ist überhaupt an eine Verurteilung zu denken – unabhängig davon, dass der Erlebnisbezug einer Aussage (= „subjektive Wahrheit“) auch nur ein Indiz für die objektive Wahrheit ist.171 Da sich ein Richter wie bei jedem Indiz selten sicher sein kann, geht es schließlich um die Wahrscheinlichkeit, dass die begutachtete Aussage subjektiv wahr ist oder nicht – statistisch ausgedrückt: P(W) und P(nW)

„P(W)“ bedeutet die Wahrscheinlichkeit der zu beweisenden Tatsache „W“, hier also die Wahrscheinlichkeit des subjektiven Erlebnisbezugs. „nW“ oder „⌐W“ heißt „W ist nicht wahr“, die konkrete Aussage ist also nicht subjektiv wahr. Die Wahrscheinlichkeit einer Tatsache liegt stets zwischen 0 und 1, etwa eine Wahrscheinlichkeit von 0,7. Alternativ und herkömmlicherweise spricht man dann von einer Wahrscheinlichkeit oder einem Wahrscheinlichkeitsgrad von 70 Prozent.172 Die aussagepsychologische Begutachtung beansprucht für sich, eine diagnostische Methode zu sein, den subjektiven Erlebnisbezug – besser: die Wahrscheinlichkeit des subjektiven Erlebnisbezugs – einer Aussage zu bestimmen. Sie wird diesem Anspruch gerecht, wenn das positive Ergebnis der Begutachtung („die Aussage ist glaubhaft“) mit der Wirklichkeit weitgehend übereinstimmt – hier dem subjektiven Wahrheitsgehalt der Aussage (denn nur dieser 170 Siehe erneut Bond/DePaulo Personality and Social Psychology Review 10 (2006) S. 214 (223). 171 Dazu 2. Kapitel I 1 (S. 15 f.). 172 Schweizer, S. 89 f.

70

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

lässt sich durch die Aussageanalyse überhaupt ermitteln). Der Idealfall wäre, dass mit einem positiven Ergebnis auch zu 100 Prozent feststeht, dass die Aussage tatsächlich subjektiv wahr und nicht erfunden ist. Dann hätte das positive Ergebnis einer aussagepsychologischen Begutachtung einen konkreten Beweiswert von 100 Prozent. Statistisch würde man dies wie folgt ausdrücken: P(W|G) = 1

„P(W|G)“ heißt hier die (bedingte) Wahrscheinlichkeit für den subjektiven Erlebnisbezug einer Aussage „W“ unter der Bedingung, dass ein positives Ergebnis vorliegt („G“ = „Aussage glaubhaft“) – oder: Wie wahrscheinlich ist es, dass die Aussage subjektiv wahr ist, wenn ein positives Ergebnis vorliegt? Eine Wahrscheinlichkeit von 1 oder 100 Prozent ist ein utopisches Ergebnis, das auch niemand ernsthaft behauptet (obgleich die hohen Übereinstimmungsquoten deutscher Gerichte etwas anderes vermuten lassen). Doch auch ein konkreter Beweiswert unter 100 Prozent lässt sich berechnen und zumindest schätzen. Soll die praktische Eignung einer Methode nachgewiesen werden, wird jedoch nahezu ausschließlich auf die Trefferquoten verwiesen, also „P(G|W)“ und „P(nG|nW)“. Für die Beweiswürdigung ist allerdings entscheidend, ob die als glaubhaft eingestufte Aussage auch tatsächlich subjektiv wahr ist. Das ist aber eine ganz andere Ausgangslage. Während beispielsweise die Sensitivität bestimmt, wie viele subjektiv wahre Aussagen zutreffend als glaubhaft eingestuft werden, wird einem Richter im Strafverfahren allein das Ergebnis mitgeteilt: Die Aussage ist glaubhaft oder nicht. Die Wahrheit, nämlich ob die Aussage tatsächlich auf einen subjektiven Erlebnisbezug zurückzuführen ist, kennt er gerade nicht. Ihn interessiert nur, wie oft – also mit welcher Wahrscheinlichkeit – dieses Resultat stimmt. Mit anderen Worten wird sich der Richter fragen: In wie vielen Fällen, in denen das Gutachten zu dem Ergebnis kommt, die Aussage sei glaubhaft, ist die Aussage auch wirklich subjektiv wahr? Was für einen konkreten Beweiswert hat ein solches positives Begutachtungsergebnis? Statistisch ausgedrückt interessiert daher „P(W|G)“ und gerade nicht „P(G|W)“. Das ist für die Praktikabilität der Methode, für den Beweiswert, ein kleiner, aber entscheidender Unterschied.

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2) 1. Der prädiktive Wert oder der „vermeintliche Beweiswert“ Zumindest auf den ersten Blick lässt sich die Frage nach dem praktischen Mehrwert eines positiven Ergebnisses anhand des sogenannten positiven prädiktiven Werts oder positiven Vorhersagewerts beantworten – allerdings nur scheinbar.

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)

71

Der positive prädiktive Wert sagt gewissermaßen die Wahrscheinlichkeit voraus, dass die begutachtete Aussage auch tatsächlich subjektiv wahr ist, wenn ein positives Ergebnis vorliegt. Er wird ermittelt, indem man die positiven Ergebnisse, denen tatsächlich eine subjektiv wahre Aussage zugrunde lag, auf die Gesamtzahl der positiven Ergebnisse bezieht, also die Summe aus den zutreffend- und falsch-positiven Fällen:173 P(G|W) =

Zahl der subjektiv wahren Aussagen mit positivem Ergebnis a = Gesamtzahl der positiven Ergebnisse a + b

Entsprechend gibt der negative prädiktive Wert oder negative Vorhersagewert die Wahrscheinlichkeit wieder, dass die Aussage tatsächlich erfunden ist, falls ein negatives Ergebnis vorliegt, die Glaubhaftigkeit der Aussage also zu Recht nicht bejaht werden kann: P(nW|nG) =

Zahl der erfundenen Aussagen mit negativem Ergebnis d = Gesamtzahl der negativen Ergebnisse c + d

Zur Veranschaulichung sollen nochmals die Zahlen der Feldstudie von Welle et al. (2011) aus Tabelle 3 dienen: Wirklichkeit Ergebnis positiv (Aussage glaubhaft) negativ (Aussage nicht glaubhaft) Trefferquote:

subjektiv wahr (N = 40)

bewusst wahrheitswidrig (N = 20)

Gesamt:

34 zutreffend-positive Fälle

10 falsch-positive Fälle

44

6 10 falsch-negative Fälle zutreffend-negative Fälle 85 % Sensitivität

16

50 % Spezifität

Während diese Feldstudie zwar eine Sensitivität von 85 Prozent aufweist, liegt der prädiktive Wert eines positiven Ergebnisses lediglich bei ungefähr 77 Prozent: a 34 34 = = ≈ 0,77 a + b 34 + 10 44

Dieser besagt also, dass in der Studie von Welle et al. in 77 Prozent der Gutachten, in denen der Gutachter zu dem Ergebnis kam, die Aussage sei glaubhaft, die Aussage auch tatsächlich subjektiv wahr war. Der positive prädiktive Wert besagt aber auch, dass in 23 Prozent der Gutachten die begutachtete Aussage 173 Vgl. zu den Formeln erneut Hilgers/Bauer/Scheiber, S. 84 f., sowie National Research Council, S. 38 f.

72

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

als glaubhaft eingestuft wurde, obwohl die Aussage tatsächlich bewusst wahrheitswidrig war. Umgekehrt wurde in der Studie zwar nur die Hälfte der bewusst wahrheitswidrigen Aussagen als solche erkannt: eine Spezifität von lediglich 50 Prozent. Der umgekehrte Fall hingegen, das heißt der prädiktive Wert eines negativen Ergebnisses – also die Wahrscheinlichkeit, dass die Aussage tatsächlich erfunden wurde, wenn ein negatives Ergebnis vorliegt – liegt hier bei 62,5 Prozent: d 10 10 = = = 0,625 c + d 6 + 10 16

Mit anderen Worten liegt die Wahrscheinlichkeit, dass die Glaubhaftigkeit der Aussage zu Recht nicht bejaht wurde, bei 62,5 Prozent – und damit über dem bloßen Zufallswert. Auf den konkreten Beweiswert einer Methode per se lässt sich allerdings nur scheinbar von den prädiktiven Werten schließen. Für die Berechnung der prädiktiven Werte muss zunächst die Gesamtaussagezahl überhaupt feststehen (sogenannte Prävalenz), also a + b und c + d. Viele (vor allem Meta-)Studien schweigen aber zur Prävalenz und verraten lediglich die Trefferquoten. Selbst wenn die Prävalenz feststeht, ist der prädiktive Wert aber nur bedingt geeignet, den konkreten Beweiswert zu bestimmen, da der prädiktive Wert unmittelbar von der Verteilung („base rate“) der Aussagen abhängt. Geht man zum Beispiel einerseits weiterhin von den Trefferquoten der Studie von Welle et al. aus – also 85 und 50 Prozent –, erhöht man aber andererseits die Zahl der untersuchten Aussagen auf (hypothetisch) 200 bei gleichmäßiger Verteilung, ändern sich schnell die prädiktiven Werte: Wirklichkeit Ergebnis positiv (Aussage glaubhaft) negativ (Aussage nicht glaubhaft) Trefferquote:

subjektiv wahr (N = 100)

bewusst wahrheitswidrig (N = 100)

Gesamt:

85 zutreffend-positive Fälle

50 falsch-positive Fälle

135

15 50 falsch-negative Fälle zutreffend-negative Fälle 85 % Sensitivität

65

50 % Spezifität

Bei gleichbleibender Sensitivität und Spezifität und gleichmäßiger Verteilung der Aussagestichprobe liegt der positive prädiktive Wert nun bei etwa 63 Prozent, während sich der negative prädiktive Wert auf etwa 77 Prozent erhöht – also genau andersrum als bei der ursprünglichen Aussagegesamtzahl der Studie von Welle et al.

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)

73

Hinzu kommt, dass eine gleichmäßige Verteilung der Aussagestichprobe gerade bei Feldstudien selten gewährleistet ist.174 Da sich die Verteilung der Aussagestichprobe aber unmittelbar auf die Berechnung des prädiktiven Werts auswirkt, eignet sich dieser nur wenig zur Ermittlung des konkreten Beweiswerts – nämlich eines gleichbleibenden und prävalenzunabhängigen Werts.175

2. Die Bayes-Regel im Strafprozess Die Anwendung des unter Mathematikern unbestrittenen Satzes von Bayes (auch Bayes-Regel oder Bayes’ Theorem) liefert einen hilfreichen – wenn nicht sogar den einzig sinnvollen – Ansatz zur Bestimmung des konkreten Beweiswerts, sofern die Trefferquoten – also Sensitivität und Spezifität – bekannt sind.176 Und selbst wenn es keine exakten Zahlen gibt, kann die Bayes-Regel helfen, Fehlschlüsse im Rahmen der Beweiswürdigung zu erkennen und zu vermeiden. Denn auch eine Fehlschätzung kann fatale Folgen haben.177 Benannt nach Thomas Bayes (um 1701 bis 1761), einem englischen Geistlichen und Mathematiker, lässt sich anhand der Bayes-Regel die sogenannte Belastungswahrscheinlichkeit – auch Endwahrscheinlichkeit oder wie Bayes sie nannte: A-posteriori-Wahrscheinlichkeit – bestimmen, nämlich wie hoch die Wahrscheinlichkeit einer Haupttatsache ist, wenn bestimmte Informationen neu hinzukommen und berücksichtigt werden.178 Zurückzuführen ist die Regel auf einen Essay von Bayes über die „Wahrscheinlichkeit von Ursachen“, in dem er einen Anfangswert, den er „guess“, also Vermutung nannte, mit Wahrscheinlichkeiten kombiniert hat, die auf wiederholbaren und gesicherten (empirischen) Beobachtungen beruhten. Erst nach dem Tod von Bayes fand Richard Price, ebenfalls Geistlicher und Amateurmathematiker, das Manuskript unter den ihm hinterlassenden Arbeiten seines verstorbenen Freundes. Nach einigen Überarbeitungen veröffentlichte er posthum die Herleitungen von Bayes 1763 unter dem Titel „An Essay Towards Solving a Problem in the Doctrine of Chances“. Weder Bayes noch Price drückten die Regel jedoch in algebraischer Form aus. Es war der französische Mathematiker Pierre Simon Laplace (1749 bis 1827), der unabhängig von Bayes eine Formel entwickelte, die wir noch heute – und auch im Folgenden – benutzen, obgleich er die ursprüngliche Entdeckung von Bayes offen eingestand.179 174

Siehe bereits oben 3. Kapitel III 2 (S. 45 f.). Siehe hierzu auch Fiedler/Schmid/Stahl Basic and Applied Social Psychology 24 (2002) S. 313 (317); Finkelstein, S. 9 f.; Rill Psychophysiologie, S. 62. 176 Zum Ganzen auch Geipel Beweiswürdigung, § 9 Rn. 51–69; Schweizer, S. 132–139; in Kurzform Risse NJW 2020, 2383 (2385 f.). 177 Effer-Uhe Psychologie für Juristen § 3 Rn. 78. 178 Effer-Uhe Psychologie für Juristen § 3 Rn. 84; Eisenberg Beweisrecht, Rn. 97; Geipel Beweiswürdigung, § 9 Rn. 54. 179 Siehe zum biografischen Hintergrund die ersten beiden Kapitel bei McGrayne, S. 3–37, 175

74

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

Die Bayes-Regel beschreibt nichts anderes als die Beweissituation vor Gericht.180 Auch hier besteht zunächst eine bestimmte Vermutung hinsichtlich der Wahrscheinlichkeit eines Ereignisses – hier zum Beispiel die anfängliche Wahrscheinlichkeit oder „neutrale Anfangswahrscheinlichkeit“, dass die Aussage des Belastungszeugen subjektiv wahr ist, und zwar ohne dass irgendwelche weiteren Informationen vorliegen.181 Mit anderen Worten: Was ist die „nackte“ Wahrscheinlichkeit, dass eine zum Beispiel vor Gericht getätigte Aussage subjektiv wahr oder etwa erlogen ist? Steht diese Anfangswahrscheinlichkeit fest, fragt sich, wie sich diese verändert, sobald man zusätzliche Informationen – besser: Indizien – erhält. Ein solches Indiz kann etwa das Ergebnis eines Glaubhaftigkeitsgutachtens sein. Dann stellt sich die Frage nach der Wahrscheinlichkeit, dass die Aussage subjektiv wahr beziehungsweise erfunden ist, nachdem die aussagepsychologische Begutachtung durchgeführt wurde – und unter Berücksichtigung ihres Ergebnisses. Diese nun ermittelte Belastungswahrscheinlichkeit gibt schließlich den konkreten Beweiswert wieder, und zwar jeweils den eines positiven oder eines negativen Ergebnisses.182 Ich möchte die Bayes-Regel gleich für die Bestimmung des Beweiswerts eines aussagepsychologischen Gutachtens formulieren.183 Die Parameter der Formel lauten: P(W)

Neutrale Anfangswahrscheinlichkeit, dass die Aussage subjektiv wahr ist, ohne dass ein Indiz wie ein aussagepsychologisches Gutachten vorliegt. P(nW) Neutrale Anfangswahrscheinlichkeit, dass die Aussage nicht subjektiv wahr, also bewusst wahrheitswidrig und erfunden ist, ohne dass weitere Indizien vorliegen; das entspricht 1 – P(W). P(G|W) Wahrscheinlichkeit eines positiven Begutachtungsergebnisses unter der Bedingung, dass die Aussage tatsächlich subjektiv wahr ist; das ist die Sensitivität und True Positive Rate, die wir bereits berechnet haben. P(G|nW) Wahrscheinlichkeit eines positiven Ergebnisses unter der Bedingung, dass die Aussage nicht subjektiv wahr, also bewusst wahrheitswidrig ist; das ist die False Positive Rate.

die dafür plädiert, die Regel nach ihren drei Schöpfern zu benennen: BPL, was für Bayes- Price-Laplace steht (S. 36). 180 Schwarz Bender/Häcker/Schwarz, Rn. 714. 181 Näher zur neutralen Anfangswahrscheinlichkeit sogleich in diesem Kapitel unter VI 4 (S. 79 f.). 182 Für Schwarz ist die Belastungswahrscheinlichkeit zutreffend die „prozessentscheidende Frage“, Bender/Häcker/Schwarz, Rn. 653. 183 Angelehnt an Effer-Uhe Psychologie für Juristen § 3 Rn. 86; Geipel Beweiswürdigung, § 9 Rn. 56; Schwarz Bender/Häcker/Schwarz, Rn. 718.

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)

75

P(nG|nW) Wahrscheinlichkeit eines negativen Ergebnisses unter der Bedingung, dass die Aussage tatsächlich bewusst wahrheitswidrig ist; also die bereits berechnete Spezifität beziehungsweise True Negative Rate. P(nG|W) Wahrscheinlichkeit eines negativen Ergebnisses unter der Bedingung, dass die Aussage subjektiv wahr ist – die False Negative Rate. P(W|G) Endwahrscheinlichkeit oder Belastungswahrscheinlichkeit, dass die Aussage subjektiv wahr ist, unter der Bedingung, dass ein positives Gutachtenergebnis („Die Aussage ist glaubhaft, da subjektiv wahr“) gegeben ist, also nachdem das Indiz des Glaubhaftigkeitsgutachtens berücksichtigt ist; das ist der gesuchte konkrete Beweiswert. Nach der Bayes-Regel ergibt sich folgende Formel zur Bestimmung des konkreten Beweiswerts eines positiven Gutachtenergebnisses:184 P(W|G) =

P(W) × P(G|W) P(W) × P(G|W) + P(nW) × P(G|nW)

Verbal lässt sich dies für den Beweiswert eines positiven Gutachtachtenergebnisses der aussagepsychologischen Begutachtung wie folgt ausdrücken: Belastungswahrscheinlichkeit =

Anfangswahrscheinlichkeit, dass die Aussage subjektiv wahr ist Anfangswahrscheinlichkeit, dass die Aussage subjektiv wahr ist × Wahrscheinlichkeit eines positiven Ergebnisses, wenn die Aussage subjektiv wahr ist

× +

Wahrscheinlichkeit eines positiven Ergebnisses, wenn die Aussage subjektiv wahr ist Anfangswahrscheinlichkeit, dass die Aussage erfunden ist × Wahrscheinlichkeit eines positiven Ergebnisses, wenn die Aussage erfunden ist

Die Wahrscheinlichkeit eines positiven Ergebnisses, wenn die Aussage subjektiv wahr ist, „P(G|W)“, ist also nichts anderes als die Sensitivität oder True Positive Rate. Und die Wahrscheinlichkeit eines positiven Ergebnisses, wenn die Aussage bewusst wahrheitswidrig ist, „P(G|nW)“, gibt die False Positive Rate wieder, also „1 – Spezifität“. Somit lässt sich die Bayes-Regel auch (und einfacher) mithilfe der Trefferquoten ausdrücken: P(W|G) =

P(W) × Sensitivität P(W) × Sensitivität + P(nW) × (1 – Spezifität)

184 Die Formel lautet eigentlich P(W|G) = P(W) × P(G|W)/P(G); „P(G)“, hier die Wahrscheinlichkeit eines positiven Gutachtenergebnisses, lässt sich wiederum schätzen durch P(G) = P(W) × P(G|W) + P(nW) × P(G|nW); ausführlich, auch zur Herleitung der Formel, EfferUhe Psychologie für Juristen § 3 Rn. 84–87; Geipel Beweiswürdigung, § 9 Rn. 55–64; Hagen, S. 18–20; Hilgers/Bauer/Scheiber, S. 80 f.; Schwarz Bender/Häcker/Schwarz, Rn. 717–720.

76

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

In Worten: Belastungswahrscheinlichkeit =

Anfangswahrscheinlichkeit, dass die Aussage subjektiv wahr ist Anfangswahrscheinlichkeit, dass die Aussage subjektiv wahr ist × Sensitivität

× +

Sensitivität

Anfangswahrscheinlichkeit, dass die Aussage erfunden ist × (1 – Spezifität)

Will man nun den Beweiswert eines negativen Gutachtenergebnisses ermitteln, ergibt sich folgende Formel:

Oder eben:

P(nW|G) = P(nW|G) =

P(nW) × P(nG|nW) P(nW) × P(nG|nW) + P(W) × P(nG|W)

P(nW) × Spezifität P(nW) × Spezifität + P(W) × (1 – Sensitivität)

Wieder in Worten: Belastungswahrscheinlichkeit =

Anfangswahrscheinlichkeit, dass die Aussage erfunden ist Anfangswahrscheinlichkeit, dass die Aussage erfunden ist × Spezifität

× +

Spezifität

Anfangswahrscheinlichkeit, dass die Aussage subjektiv wahr ist × (1 – Sensitivität)

Legen wir nun die Trefferquoten aus Tabelle 4 zugrunde – eine Sensitivität von 85 Prozent und eine Spezifität von 60 Prozent – ergibt sich für ein positives Ergebnis ein konkreter Beweiswert von 68 Prozent: P(E|G) =

P(E) × Sensitivität = P(E) × Sensitivität + P(nE) × (1 – Spezifität) 0,5 × 0,85 = 0,68 0,5 × 0,85 + 0,5 × (1 – 0,6)

Dieser Wert liegt zwar über dem Zufallswert von 50 Prozent. Allerdings muss man sich die Bedeutung eines solchen Beweiswerts vor Augen führen. Denn dieser sagt, dass zwar in 68 Prozent, also in ungefähr zwei Drittel aller Fälle, in denen der Gutachter zu dem Ergebnis kommt, die Aussage sei glaubhaft, die Aussage auch tatsächlich subjektiv wahr war. Er sagt aber auch, dass in 32 Prozent der Fälle die Glaubhaftigkeit einer Aussage bejaht wird, obwohl die Aussage tat-

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)

77

sächlich bewusst wahrheitswidrig war. Die Auswirkungen für die Praxis wären fatal: Folgt der Richter uneingeschränkt dem Gutachten – was er in den meisten Fällen auch tut –, legt er in einem von drei Fällen eine bewusste Falschaussage der Verurteilung des dann unschuldigen Angeklagten zugrunde. Ein willkürliches und damit fehlerhaftes Ergebnis richterlicher Beweiswürdigung.185 Dieses Beispiel verdeutlicht aber auch Folgendes: Zwar erkennt die Methode 60 von 100 bewusst wahrheitswidrigen Aussagen, verneint also die Glaubhaftigkeit zutreffend zu 60 Prozent. Die Konsequenz ist wie bereits berechnet eine False Positive Rate von 40 Prozent. Diese sagt aber wiederum nichts aus über den konkreten Beweiswert eines negativen Ergebnisses, nämlich wie hoch die Wahrscheinlichkeit ist, dass die Aussage erfunden ist unter der Bedingung, dass ein negatives Ergebnis vorliegt – die Wahrscheinlichkeit, dass die Glaubhaftigkeit der Aussage richtigerweise nicht bejaht wird. Der entsprechende Beweiswert eines negativen Ergebnisses, also die Wahrscheinlichkeit, dass die Aussage erfunden ist unter der Bedingung, dass ein negatives Ergebnis („nicht glaubhaft“) vorliegt, liegt nämlich bei 80 Prozent: P(nW|nG) =

P(nW) × Spezifität = P(nW) × Spezifität + P(W) × (1 – Sensitivität) 0,5 × 0,6 = 0,8 0,5 × 0,6 + 0,5 × (1 – 0,85)

In praktischer Hinsicht würde dieser konkrete Beweiswert eines negativen Ergebnisses bedeuten, dass ein Richter, wenn er das negative Gutachtenergebnis bei der Begutachtung des Belastungszeugen übernimmt, immerhin zu 80 Prozent zu Recht freispricht. Tabelle 5: Trefferquoten und Beweiswert der kriterienorientierten Aussageanalyse Ergebnis

Wirklichkeit

positiv (Aussage glaubhaft) negativ (Aussage n. glaubhaft)

subjektiv wahr

bewusst wahrheitswidrig

Beweiswert

85 % zutreffend-positive Fälle

40 % falsch-positive Fälle

68 %

15 % falsch-negative Fälle

60 % zutreffend-negative Fälle

80 %

Diese Formeln mögen für Juristen auf den ersten Blick befremdlich und kompliziert erscheinen. Eine verständliche Reaktion, wenn man bedenkt, dass Wahrscheinlichkeitsrechnung kein Bestandteil der juristischen Ausbildung ist. Die Bayes-Regel ist allerdings kein Fremdkörper im Recht, sind doch recht185

Vgl. Sander LR § 261 Rn. 14 a. E.

78

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

liche Wahrscheinlichkeiten meist Bayes’scher Natur – obgleich sie nicht immer als solche benannt oder erkannt werden. Konkret fürs Strafverfahren empfiehlt mittlerweile sogar der Bundesgerichtshof, die Bayes-Regel als „logisch korrekten Umgang mit Unsicherheiten“ heranzuziehen. Ihre Anwendung führt auch – so der Bundesgerichtshof – nicht zu einer „Mathematisierung der Beweiswürdigung“, sondern ergibt sich aus der Notwendigkeit, innerhalb mathematischer Wahrscheinlichkeitsberechnungen und zur Vermeidung logischer Fehlschlüsse die systemimmanenten Denkgesetze als Fundament der subjektiven Überzeugungsbildung einzuhalten.186 Jedenfalls kann sie als Modell dienen, den Denkprozess bei der Beweiswürdigung verständlich zu beschreiben und um rationaler argumentieren zu können.187 Und immerhin ist ein rationales, objektives Fundament zwingende Voraussetzung der Beweiswürdigung.

3. Ein Baumdiagramm zur Veranschaulichung Die Bayes-Regel lässt sich für denjenigen, der nicht mit Formeln rechnen möchte, auch anhand eines sogenannten Baumdiagramms veranschaulichen:188 1.000 Aussagen 50 %

50 %

500 subjektiv wahr 85 % 425 zutreffend

500 erfunden 15 %

75 falsch

60% 300 zutreffend

40% 200 falsch

300/375 = 80 % 425/625 = 68% 186 BGH NStZ 2016, 490 (492 f.) = BGHR StPO § 261 Beweiskraft 8 – DNA-Analyse, Bayes’sche Theorem (2 StR 112/14); zustimmend Effer-Uhe Psychologie für Juristen § 3 Rn. 96; Eisenberg Beweisrecht, Rn. 97; Neuhaus MAH Strafverteidigung § 61 Rn. 53; Risse NJW 2020, 2383 (2385 f.); Sommer Strafverteidigung, Rn. 211 f.; Simmross/Schneiders Handbuch Staatsanwalt 6. Kapitel Rn. 65; konkret bei Zeugenaussagen Sander LR § 261 Rn. 126 f.; noch ablehnend für das Zivilverfahren BGH NJW 1989, 3161 (3162): sofern die Beweiswürdigung nachvollziehbar sei, bedürfe es keiner weiteren Kontrolle anhand von Wahrscheinlichkeitsberechnungen; es bestehe die Gefahr, dass bei ungesicherter empirischer Grundlage für die Anfangswahrscheinlichkeit die Anwendung der Bayes-Regel zu einer manipulierbaren Scheingewissheit führen könne; dazu kritisch Geipel Beweiswürdigung, § 9 Rn. 66 f. 187 Schwarz Bender/Häcker/Schwarz, Rn. 716; für Eschelbach lässt sich anhand der Bayes-Regel zumindest das Beweisgewicht von Indizien und der durch Gesamtwürdigung erreichte Wahrscheinlichkeitsgrad systematisieren und annäherungsweise taxieren, BeckOK-StPO § 261 Rn. 21.5; gemäß Schweizer, S. 167 f., ist sie von elementarer Bedeutung für die Beweiswürdigung und richterliche Überzeugungsbildung. 188 Siehe zu einem solchen Baum- oder Häufigkeitsdiagramm Effer-Uhe Psychologie für Juristen § 3 Rn. 80 f.; Risse NJW 2020, 2383 (2385 f.); Schweizer, S. 134.

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)

79

Hier gehen wir der Einfachheit halber davon aus, dass von insgesamt 1.000 Aussagen jeweils 500 subjektiv wahr und bewusst wahrheitswidrig sind (jeweils also 50 Prozent). Nach den oben zugrundgelegten Trefferquoten werden subjektiv wahre zu 85 Prozent, bewusst wahrheitswidrige Aussagen zu 60 Prozent als solche klassifiziert: Sensitivität und Spezifität oder True Positive Rate und True Negative Rate. Von den 500 subjektiv wahren Aussagen werden somit 425 als solche erkannt. Bei den tatsächlich wahrheitswidrigen Aussagen werden 200 fälschlicherweise als glaubhaft eingestuft: eine False Positive Rate von 40 Prozent. Insgesamt werden also 625 Aussagen als glaubhaft eingestuft. Da von diesen nur 425 zutreffend klassifiziert worden sind, liegt der Beweiswert eines positiven Ergebnisses bei 68 Prozent: 425/(425 + 200) = 425/625. Entsprechend liegt der Beweiswert eines negativen Ergebnisses („die Aussage ist nicht glaubhaft“) bei 80 Prozent: 300/375. Das verdeutlichen in dem Baumdiagramm die geschwungenen Klammern.

4. „Strafprozessuale Anfangswahrscheinlichkeit“ Entscheidend für diese Berechnungsmethode ist, dass neben den Trefferquoten die Anfangswahrscheinlichkeit bekannt oder zumindest bestimmbar sein muss; explizit bei der aussagepsychologischen Begutachtung die A-priori-Wahrscheinlichkeit, wie wahrscheinlich es ist, dass die begutachtete Aussage subjektiv wahr oder bewusst wahrheitswidrig ist, und zwar unabhängig von und vor der Durchführung der aussagepsychologischen Begutachtung. Sie wird daher auch „Pre-Test Probability“ genannt. Es gibt allerdings keine unabhängige und feststehende Wahrscheinlichkeit, die sagt, zu wie viel Prozent eine Aussage vor Gericht subjektiv wahr oder erfunden ist. So wird zum Teil vermutet, dass allenfalls die Hälfte aller Zeugenaussagen als zuverlässig eingestuft werden kann.189 Empirisch sicher belegen lässt sich die Anfangswahrscheinlichkeit aber nicht.190 Jedenfalls sollte die Quote von Falschaussagen (gerade in Sexualstrafverfahren) nicht unterschätzt werden.191 Ich gehe daher – wie in der Berechnung oben – von einer „strafprozessualen Anfangswahrscheinlichkeit“ von 50 Prozent aus. Denn ohne weiteres Indiz – wie es etwa eine aussagepsychologische oder polygrafengestützte Aussagebegutachtung wäre – kann der Beurteiler, also letztendlich der Richter, intuitiv nur zwischen zwei Alternativen wählen: die Aussage ist entweder subjektiv wahr oder nicht. Da es ansonsten (noch) keine Möglichkeit gibt, zu bestimmen, ob eine Aussage subjektiv wahr oder erfunden ist, hängt das Ergebnis wie bei 189 190

Deckers Eisenberg-FS, S. 473 (483); Geipel StV 2008, 271 (272). Vgl. Barton Ostendorf-FS, S. 41 (45 f.). 191 Eschelbach BeckOK-StPO § 261 Rn. 10.4; Heintschel-Heinegg Breidling-FS, S. 143 (148); siehe bereits 1. Kapitel I (S. 4 f.).

80

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

einem Münzwurf vom Zufall ab. Und die Zufallswahrscheinlichkeit – sozusagen der (auch für den Richter) strafprozessuale Status quo – liegt bei 50 Prozent. Eine solche A-priori-Wahrscheinlichkeit wird üblicherweise auch herangezogen, wenn es wie hier nur zwei sich ausschließende Hypothesen gibt.192 Die Anfangswahrscheinlichkeit höher anzusetzen, wie es manche Autoren fordern, widerspricht, wenn sie nicht hinreichend begründet wird, nicht nur dieser strafprozessualen Ausgangslage, sondern bereits der Unschuldsvermutung.193 Auch steht sie nicht in Einklang mit den bereits angesprochenen, von Klaus Püschel vorgelegten Zahlen, die eine 50-50-Quote zumindest nahelegen.194 Und zudem sprechen für die Annahme einer Anfangswahrscheinlichkeit von 50 Prozent die bereits genannten Studien, nach denen selbst professionelle Aussagebeurteiler subjektiv wahre und wahrheitswidrige Aussagen nur wenig besser als durch bloßes Raten erkennen können.195 – Eher würde sich anbieten, die Anfangswahrscheinlichkeit, dass die Aussage subjektiv wahr ist, herabzusetzen, um dem strafrechtlichen Zweifelssatz besser Rechnung zu tragen: Im Zweifel für den Angeklagten wird davon ausgegangen, die Aussage sei eher erfunden als subjektiv wahr.196 Eine solche Anpassung der Anfangswahrscheinlichkeit sei dem Richter überlassen; denn unabhängig davon, welche Anfangswahrscheinlichkeit man wählt, bleiben die Formeln dieselben.197 Eine Anfangswahrscheinlichkeit von 50 Prozent vermeidet jedoch erstens jegliche Voreingenommenheit sowohl in die eine als in die andere Richtung und ist zweitens leichter verständlich, so dass sie sich als bessere Berechnungsgrundlage eignet: bei der Anwendung der Bayes-Regel und nach Ermittlung des sogenannten Likelihood-Quotienten, den ich im folgenden Abschnitt behandeln möchte. 192

Namentlich BGHSt. 38, 320 (323) bei der DNA-Analyse; BGH NJW 2006, 3416 (3419) für zivilrechtliche Vaterschaftsprozesse; Baur StV 2010, 175 (176): „neutrale Anfangswahrscheinlichkeit“; in diesem Sinne auch Finkelstein, S. 6 f., 14; Geipel Lügenerkennung, S. 100 f.; Mokros Figurationen von Unsicherheit, S. 241 (254); Schwarz Bender/Häcker/ Schwarz, Rn. 662 f. 193 Vgl. aber Geipel Beweiswürdigung, § 12 Rn. 1, der eine Anfangswahrscheinlichkeit, dass die Zeugenaussage subjektiv wahr ist, von 90 Prozent ohne nähere Begründung ursprünglich für „plausibel“ hielt; eine so hohe Anfangswahrscheinlichkeit würde aber jede Verteidigung in einem Aussage-gegen-Aussage-Verfahren hinfällig machen; insofern widersprüchlich auch zu § 9 Rn. 77: „Nachdem es sich um die Ausgangsmeinung des Richters vor Würdigung der weiteren Indizien handelt, kommt eine höhere A-priori-Wahrscheinlichkeit als 0,5 nicht in Betracht“; mittlerweile eindeutig wie hier für eine Anfangswahrscheinlichkeit von 50 Prozent, ders. Lügenerkennung, S. 100 f. 194 Siehe bereits 1. Kapitel I (S. 4) und Rückert, „Zwei blaue Flecke und ein Nullbefund“, Die Zeit vom 24. Februar 2011, S. 18, abrufbar unter https://www.zeit.de/2011/09/WOSKachelmann, zuletzt abgerufen am 20. Juni 2022. 195 Vgl. 1. Kapitel IV (S. 11). 196 In diesem Sinne Nack, zitiert nach Geipel Beweiswürdigung, § 9 Rn. 74 in Fn. 99, sowie Schwarz Bender/Häcker/Schwarz, Rn. 663. 197 Ein beispielhafter Überblick über die Auswirkung unterschiedlicher Anfangswahrscheinlichkeiten auf den konkreten Beweiswert folgt am Ende des nächsten Abschnitts (S. 85).

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)

81

5. Likelihood-Quotient oder „abstrakte Beweiskraft“ Der konkrete Beweiswert lässt sich ebenso anhand der Likelihood Ratio oder des Likelihood-Quotienten berechnen: eine statistische Methode, die unter anderem im medizinischen Bereich eingesetzt wird, um die Qualität eines medizinisch-diagnostischen Testverfahrens zu bestimmen.198 Doch auch die Likelihood Ratio hat mittlerweile im Strafverfahren Einzug gehalten: So wird sie selbst vom Bundesgerichtshof angeführt zur Bestimmung des Beweiswerts eines DNA-Gutachtens.199 Das entspricht nur der Empfehlung des European Network of Forensic Science Institutes (ENFSI), beweiserhebliche Wahrscheinlichkeiten stets anhand der Likelihood Ratio auszudrücken:200 „Note that if a likelihood ratio cannot be assigned by the forensic practitioner […], then no appropriate evaluative assessment of the findings can be made.“201 Vorteil dieser Berechnungsmethode ist, dass sich die Likelihood-Quotienten ausschließlich anhand der Trefferquoten ermitteln lassen, denn es geht kurz gesagt um das Verhältnis von Sensitivität und Spezifität. Die Likelihood Ratio wird daher auch „abstrakte Beweiskraft“ genannt.202 Unterschieden wird grundsätzlich zwischen positiver und negativer Likelihood Ratio.203 Die positive Likelihood Ratio oder der positive Likelihood-Quotient „LRP“ gibt an, wie viel Mal wahrscheinlicher oder weniger wahrscheinlich ein positives Testergebnis beispielsweise bei Kranken eintritt als bei Gesunden. Sie beschreibt das Verhältnis der Wahrscheinlichkeit für ein positives (dann zutreffendes) Testergebnis unter den Erkrankten zur Wahrscheinlichkeit für ein positives (dann falsches) Testergebnis unter den Gesunden. Bei der aussagepsychologischen Begutachtung kann sie angeben, wie viel Mal wahrscheinlicher das Indiz eines positiven Ergebnisses („die Aussage ist glaubhaft“) bei einer tatsächlich subjektiv wahren Aussage – die zu beweisende Tatsache – eintritt 198

(33).

Siehe McGee JGIM 17 (2002) S. 647–650; Mokros Psychiatrische Begutachtung, S. 29

199 BGHSt. 63, 187 (190); siehe auch die „Allgemeine Empfehlungen der Spurenkommission zur statistischen Bewertung von DNA-Datenbank-Treffern“ von P. Schneider/H. Schneider/Fimmers/Brinkmann NStZ 2010, 433 (435); zur Verwendung der Likelihood Ratio bei der Stimmanalyse Braun Fachanwalt Strafrecht 38. Kapitel Rn. 55 f.; Nack NJW 1983, 1035 (1036) bezeichnet den Likelihood-Quotienten als „Asymmetrie“. 200 European Network of Forensic Science Institutes Guideline for Evaluative Reporting in Forensic Science, S. 6, 12; zustimmend Finkelstein, S. 7, 18; Geipel Beweiswürdigung, § 9 Rn. 83: „Wird die abstrakte Beweiskraft eines Indizes gedanklich anders […] ermittelt, liegt ein Verstoß gegen ein Denkgesetz vor“. 201 „Kann der forensische Praktiker keinen Likelihood-Quotienten bestimmen […], kann auch keine angemessene Würdigung der Befunde vorgenommen werden.“ 202 Geipel Beweiswürdigung, § 9 Rn. 78; Nack NJW 1983, 1035 (1036); Schwarz Bender/ Häcker/Schwarz, Rn. 730; Schweizer, S. 146. 203 Vgl. auch zum Folgenden Hilgers/Heussen/Stanzel Medizinische Laboratoriumsdiagnostik, S. 1466 (1467); Schwarz Bender/Häcker/Schwarz, Rn. 726–733.

82

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

als bei einer bewusst wahrheitswidrigen. Sie lässt sich mathematisch wie folgt ausdrücken: LRP =

Das ist nichts anderes als:

LRP =

P(G|W) P(G|nW)

Sensitivität 1 – Spezifität

Mit anderen Worten gibt der positive Likelihood-Quotient das Verhältnis der True Positive Rate und der False Positive Rate wieder. Die negative Likelihood Ratio „LR–“ gibt an, wie viel Mal wahrscheinlicher etwa ein negatives Testergebnis bei Kranken eintritt als bei Gesunden, das heißt in unserem Fall wie viel Mal wahrscheinlicher ein (dann unzutreffendes) negatives Ergebnis („die Aussage ist nicht glaubhaft“) bei subjektiv wahren Aussagen eintritt als bei erfundenen. Sie berechnet sich wie folgt: LR– =

P(nG|W) 1 – Sensitivität ≙ P(nG|nW) Spezifität

Das ist für die Beweiswürdigung und den konkreten Beweiswert eines aussagepsychologischen Gutachtenergebnisses eigentlich uninteressant. Man kann über den Kehrwert der negativen Likelihood Ratio jedoch auch bestimmen, wie viel Mal wahrscheinlicher ein (dann wiederum zutreffendes) negatives Ergebnis („die Aussage ist nicht glaubhaft“) bei tatsächlich erfundenen Aussagen eintritt als bei subjektiv wahren, indem man wie folgt rechnet – mangels offizieller Bezeichnung verwende ich zur Bestimmung der „abstrakten Beweiskraft“ eines negativen Ergebnisses die Likelihood Ratio „LRN“: LRN =

1 P(nG|nW) Spezifität oder gleich: ≙ P(nG|W) 1 – Sensitivität LR–

Mit anderen Worten gibt dieser Likelihood-Quotient das Verhältnis der True Negative Rate und der False Negative Rate wieder. Legen wir die Trefferquoten aus Tabelle 5 zugrunde,204 ergeben sich folgende Likelihood-Quotienten: LRP =

LR– =

Sensitivität 0,85 = = 2,215 1 – Spezifität 1 – 0,6

1 – Sensitivität 1 – 0,85 = = 0,25 Spezifität 0,6

LRN =

204

Spezifität 0,6 = =4 1 – Sensitivität 1 – 0,85

Siehe oben 3. Kapitel VI 2 (S. 77).

VI. Ermittlung des „konkreten Beweiswerts“ – Statistik für Juristen (Teil 2)

83

Was bedeuten nun die Zahlen 2,125, 0,25 und 4? Ein Likelihood-Quotient über 1 bedeutet grundsätzlich, dass das Ergebnis („die Aussage ist glaubhaft“) zumindest für die zu ermittelnde Wirklichkeit („die Aussage ist tatsächlich subjektiv wahr“) diagnostisch relevant ist. Ein Likelihood-Quotient von 1 heißt, es besteht überhaupt kein Zusammenhang, da die Wahrscheinlichkeit für ein positives Ergebnis sowohl bei subjektiv wahren als auch bei bewusst wahrheitswidrigen Aussagen gleich groß ist, nämlich 1:1. Daher ist ein diagnostisches Verfahren von höherer Qualität, je weiter die Likelihood Ratio von 1 entfernt ist.205 Eine LRP (und folglich eine LRN) über 3 wird grundsätzlich als akzeptabel angesehen, über 10 als gut; entsprechend gilt eine LR– unter 0,3 als akzeptabel und eine unter 0,1 als gut.206 Hier bedeutet eine positive Likelihood Ratio von 2,125, dass die Wahrscheinlichkeit für ein positives Ergebnis unter den tatsächlich subjektiv wahren Aussagen lediglich 2,125-mal so hoch ist wie unter den erfundenen Aussagen. Die aussagepsychologische Begutachtung ist, wenn wir diese Zahl zugrunde legen, somit keine akzeptable diagnostische Methode, um zu ermitteln, ob eine Aussage subjektiv wahr und damit glaubhaft ist. Hingegen ist sie „akzeptabel“, wenn es um die Frage geht, ob die begutachtete Aussage bewusst wahrheitswidrig ist, da ein negatives Ergebnis („die Aussage ist nicht glaubhaft“) bei bewusst wahrheitswidrigen Aussagen immerhin viermal so oft eintritt wie bei subjektiv wahren Aussagen. Zugegeben sind diese Zahlen weder leicht einzuordnen noch vermittelbar. Doch anhand der Likelihood-Quotienten – oder der „abstrakten Beweiskraft“ – lässt sich in einem zweiten Schritt sogar recht einfach der konkrete Beweiswert der Methode ermitteln, und zwar indem man den errechneten Likelihood-Quotienten mit der Anfangswahrscheinlichkeit kombiniert. So lässt sich wieder die Belastungswahrscheinlichkeit berechnen, nämlich wie wahrscheinlich es ist, dass zum Beispiel die Aussage tatsächlich subjektiv wahr ist, nachdem das Gutachten zu einem positiven Ergebnis kam. Dafür muss zunächst die (strafprozessuale) Anfangswahrscheinlichkeit von 50 Prozent in einen sogenannten Anfangswahrscheinlichkeitswert umgewandelt werden („a-priori odds“ oder „pre-test odds“). Man berechnet diesen Wert wie folgt: 205 Schweizer, S. 144 f.; vgl. auch European Network of Forensic Science Institutes Guideline for Evaluative Reporting in Forensic Science, S. 16–18; Geipel Beweiswürdigung, § 9 Rn. 87; Schwarz Bender/Häcker/Schwarz, Rn. 732 f. 206 Hilgers/Bauer/Scheiber, S. 89; deutlich strenger das European Network of Forensic Science Institutes Guideline for Evaluative Reporting in Forensic Science, S. 17: erst eine Likelihood Ratio ab 10 sei akzeptabel („moderate support“), eine ab 100 mittelmäßig stark („moderately strong support“) und erst eine ab 1.000 sei ein starkes Indiz („strong support“) für die Richtigkeit der Aussage; so auch Weimar/Katterwe/Braune MAH Strafverteidigung § 69 Rn. 95; siehe die Übersicht und weitere Nachweise bei Schweizer, S. 148.

84

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

Anfangswahrscheinlichkeit =

Anfangswahrscheinlichkeit 0,5 = =1 1 – Anfangswahrscheinlichkeit 1 – 0,5

Hier wird deutlich, weshalb sich mit einer Anfangswahrscheinlichkeit von 50 Prozent leicht rechnen lässt: der Anfangswahrscheinlichkeitswert beträgt dann immer 1. Der Endwahrscheinlichkeitswert lässt sich dann wie folgt berechnen: Endwahrscheinlichkeitswert = Anfangswahrscheinlichkeitswert × LRP oder LR– oder LRN

Hier demnach für LRP: 1 × 2,125 = 2,125. Man sieht, dass bei einer Anfangswahrscheinlichkeit von 50 Prozent der Likelihood-Quotient mit dem Endwahrscheinlichkeitswert identisch ist, so dass man sich diesen Rechenschritt eigentlich sparen kann. Der Endwahrscheinlichkeitswert ist dann wieder zurück in eine Wahrscheinlichkeit umzuwandeln: Endwahrscheinlichkeit =

Endwahrscheinlichkeitswert 2,125 = = 0,68 1 + Endwahrscheinlichkeitswert 1 + 2,125

Somit ergibt sich eine End- beziehungsweise Belastungswahrscheinlichkeit – oder eben wieder ein konkreter Beweiswert –, dass die Aussage tatsächlich subjektiv wahr ist, von 68 Prozent. Für LRN ergibt sich eine Belastungswahrscheinlichkeit, nämlich dass die Aussage erfunden ist, von 80 Prozent: 4/(1 + 4) = 0,8. Diese Zahlen sollten bekannt vorkommen, denn sie entsprechen exakt dem jeweils anhand der Bayes-Regel berechneten Beweiswert. Da die jeweiligen Likelihood-Quotienten prävalenzunabhängig sind, das heißt immer die gleichen bleiben, eignen sie sich gut zur Bestimmung des konkreten Beweiswertes, selbst wenn man – anders als ich es tue – von einer anderen Anfangswahrscheinlichkeit ausgehen möchte. Auch das lässt sich anhand der eben genannten Formel berechnen, die Einzelschritte werden dann nur etwas komplizierter. Aus folgender Tabelle lässt sich grob ablesen, wie sich die Belastungswahrscheinlichkeit bei unterschiedlicher Anfangswahrscheinlichkeit und Beweiskraft verändert.207 Die Tabelle zeigt aber auch, dass bei einer Likelihood Ratio von nur 2,125 erst bei einer (strafprozessualen) Anfangswahrscheinlichkeit von etwa 32 Prozent ein überzufälliger konkreter Beweiswert angenommen werden kann; bei einer Likelihood Ratio von 4 genügt immerhin eine Anfangswahrscheinlichkeit von nur 20 Prozent. 207 Übernommen von Schwarz Bender/Häcker/Schwarz, Rn. 752; alternativ kann das Fagan Nomogramm herangezogen werden, um einfach und unkompliziert den Zusammenhang zwischen Anfangswahrscheinlichkeit, Likelihood-Quotienten und Belastungswahrscheinlichkeit aufzudecken, vgl. Schweizer, S. 149; ein solches findet sich etwa unter http:// araw.mede.uic.edu/cgi-bin/testcalc.pl, zuletzt abgerufen am 20. Juni 2022.

85

VII. Zusammenfassung: Immerhin besser als die Münze

Anfangswahrscheinlichkeit in % Beweiskraft

0,1

1

10

25

50

60

80

90

2 0,2

2

18

40

67

75

89

95

5 0,5

5

36

63

83

88

95

97,8

10 1

9

53

77

91

94

97,6

98,9

100 9

50

92

97

99

99,3

99,75

99,89

1.000 50

91

99,1

99,7

99,9

99,93

99,97

99,99

Endwahrscheinlichkeit in %

Vor allem aber lässt sich anhand der Likelihood-Quotienten und der Bayes-Regel leicht die Gesamtbelastungswahrscheinlichkeit ermitteln, wenn mehrere Indizien vorliegen, indem man die jeweiligen Likelihood-Quotienten einfach addiert – ein Vorteil, der später noch wichtig wird.208

VII. Zusammenfassung: Immerhin besser als die Münze Gleich wie ernüchternd diese zugegeben zahlenlastigen Ergebnisse zur aussagepsychologischen Glaubhaftigkeitsbegutachtung klingen mögen, möchte ich ihre Bedeutung für das Strafverfahren keinesfalls abstreiten. Ganz im Gegenteil handelt es sich trotz dürftiger Befundlage „unterm Strich“ um eine der wenigen Methoden, die überzufällige Ergebnisse erzielen können – zumindest bei der Unterscheidung zwischen subjektiv wahren und erfundenen Aussagen. Dennoch will ich aufmerksam machen auf die Grenzen und Schwächen dieser von Strafgerichten angewandten Methode. Schon nach ihrem theoretischen Fundament handelt es sich um keine Methode zur Aufdeckung der „objektiven Wahrheit“ – auch wenn ab und an Gegenteiliges zu lesen ist. Ob sich der Sachverhalt tatsächlich so zugetragen hat, vermag die aussagepsychologische Begutachtung nicht zu bestimmen. Im Idealfall lässt sich anhand der aussagepsychologischen Glaubhaftigkeitsbegutachtung allein der subjektive Wahrheitsgehalt einer Aussage belegen. Für die Ermittlung der objektiven Wahrheit, die allein der Richter vorzunehmen hat, kann die aussagepsychologische Begutachtung lediglich ein Indiz sein.209 Schon 208 Finkelstein, S. 18; Neuhaus MAH Strafverteidigung § 61 Rn. 53; Schwarz Bender/Häcker/Schwarz, Rn. 675 f.; deutlich Schweizer, S. 139 f.: „Bayes’ Regel erlaubt es, den Beweiswert mehrerer Beweismittel rational zu kombinieren und zu einem Überzeugungsgrad für die interessierende Tatsachenbehauptung unter Berücksichtigung aller Beweismittel zu gelangen“. 209 Siehe bereits 2. Kapitel I 1 (S. 15 f.).

86

3. Kapitel: Beweiswert der aussagepsychologischen Begutachtung

unter diesem Gesichtspunkt verwundern die Übereinstimmungsquoten der Gerichte.210 Die kriterienorientierte Inhaltsanalyse, für die der Bundesgerichtshof Mindeststandards definierte, ist neben Konstanz- und Motivanalyse eine Methode allein zur Prüfung der Lügenhypothese. Sie ist das „Werkzeug“, um subjektiv wahre von bewusst wahrheitswidrigen Aussagen zu unterscheiden. Kann die Lügenhypothese zurückgewiesen werden, gilt aber nicht automatisch die Alternativhypothese, dass die Aussage glaubhaft ist. Denn die globale Nullhypothese kann insgesamt nur zurückgewiesen werden, wenn auch andere Subhypothesen verworfen werden. Natürlich ist die aussagepsychologische Glaubhaftigkeitsbeurteilung mehr als kriterienorientierte Inhaltsanalyse, auf die es nach Volbert in der forensischen Begutachtungspraxis nur in fünf Prozent aller Fälle ankommt.211 Doch weder existieren zufriedenstellende Studien zu den Methoden, mit denen die übrigen Subhypothesen, wie die Suggestionshypothese, zurückgewiesen werden sollen, noch geben wissenschaftliche Studien zur kriterienorientierten Inhaltsanalyse ein homogenes Bild ab. Zweifelhaft ist bereits die Validität der Realkennzeichen. So existieren kaum zuverlässige Feldstudien, die die Undeutsch-Hypothese hinreichend bestätigen können. Und die Handvoll Studien, die sich um ein einigermaßen unabhängiges Außenkriterium bemüht haben, fallen eher bescheiden aus: Allenfalls sieben der insgesamt 19 Realkennzeichen können als validiert angesehen werden. Unabhängig davon, dass die wenigsten Laborstudien ein mit der Realität vergleichbares Setting schaffen und sich unterschiedlicher Methoden bedienen, können auch sie nicht die Validität der übrigen Kriterien bestätigen. Über dieses Ergebnis kann schließlich das von Fiedler und Schmid vorgeschlagene „Prinzip der Aggregation“ nicht vollständig hinweghelfen.212 Auf etwaige Gesamtscores zur Bestätigung der Undeutsch-Hypothese zu verweisen, ist zumindest aus praktischer Sicht verfehlt, denn: „Aus lauter Nullen wird auch durch noch so viel Aggregation keine Eins.“213 Angesichts ihrer beliebten Anwendung bei Zeugenaussagen interessiert vor allem der Beweiswert der aussagepsychologischen Glaubhaftigkeitsbegutachtung, speziell der kriterienorientierten Inhaltsanalyse. Doch auch die Studien zu den Trefferquoten können nur dürftige Ergebnisse vorweisen. Legt man die einzigen beiden Feldstudien mit einer Gesamtstichprobe von 91 Aussagen zugrunde, denen eine einigermaßen unabhängige Bestimmung der ground truth 210 Vgl. zu diesen 1. Kapitel V (S. 12). 211 Siehe erneut Volbert Forensische Psychiatrie,

Psychologie, Kriminologie 2 (2008) S. 12 (18). 212 Vgl. erneut BGHSt. 45, 164 (171); Fiedler/Schmid Praxis der Rechtspsychologie 9 (1999) S. 5 (11). 213 Fischer Widmaier-FS, S. 191 (216).

VII. Zusammenfassung: Immerhin besser als die Münze

87

gelang, sowie diejenigen Laborstudien, die praxisnähere klinisch-intuitive Urteile zur Bestimmung der jeweiligen Trefferquote verwendeten, liegt der konkrete Beweiswert eines positiven, also den Beschuldigten belastenden Gutachtenergebnisses bei höchstens 70 Prozent. Besorgniserregend sind die hohen Übereinstimmungsquoten der Gerichte, die den Gutachten in den meisten Fällen folgen: Denn das heißt – bei einer unterstellt, aber nicht praxisfernen 100-prozentigen Übereinstimmungsquote –, dass drei von zehn Beschuldigten zu Unrecht verurteilt werden. Ein solches Vertrauen in die Wissenschaftlichkeit der aussagepsychologischen Glaubhaftigkeitsbegutachtung widerspricht den vom Bundesgerichtshof aufgestellten Anforderungen an die Beweiswürdigung – im Besonderen bei Aussage gegen Aussage, einem der Hauptanwendungsfälle der aussagepsychologischen Glaubhaftigkeitsbegutachtung. Nach ständiger Rechtsprechung des Bundesgerichtshofs muss das Tatgericht in solchen Fällen nämlich „alle Umstände, welche die Entscheidung zu Gunsten oder zu Ungunsten des Angeklagten zu beeinflussen geeignet sind, erkannt, in seine Überlegungen einbezogen und in einer Gesamtschau gewürdigt [haben]“.214 Würdigt es nur das Ergebnis der Aussageanalyse, kann bei dieser Befundlage kaum von einem „nach der Lebenserfahrung ausreichende[m] Maß an Sicherheit“ die Rede sein, das „vernünftige Zweifel nicht aufkommen lässt“.215 Selbsterklärend müsste jeder noch so geringe „vernünftige Zweifel“ eigentlich zu einem Freispruch führen. Und das gilt zumindest so lange, bis nicht andere Beweismittel oder Indizien mit überzufälligem Beweiswert diese verbleibenden Zweifel beseitigen – in die eine oder die andere Richtung. Sich dabei auf nonverbale „Lügensignale“ zu berufen, ist dazu ebenso ungeeignet, wie auf Menschenkenntnis oder Lebenserfahrung abzustellen. Abhilfe schaffen könnte eine Methode, der der Bundesgerichtshof nicht einmal ein Jahr vor seiner Entscheidung zu den Mindestanforderungen der aussagepsychologischen Glaubhaftigkeitsbegutachtung eine Abfuhr erteilt hat, die aber in den letzten Jahren eine „Renaissance“ zu erleben scheint: der Polygraf.216

214

BGH StV 2020, 446 (447). BGH NStZ-RR 2010, 85 (ebd.). 216 So Momsen KriPoZ 2018, 142 (ebd.). 215

4. Kapitel

Die polygrafengestützte Glaubhaftigkeitsbegutachtung I. Das Urteil des Bundesgerichtshofs von 1998 Heute wird der Einsatz eines Polygrafen im Strafverfahren so gut wie ausnahmslos abgelehnt. Richtungsweisend war die Entscheidung des Ersten Strafsenats des Bundesgerichtshofs aus dem Jahr 1998 (BGHSt. 44, 308) – desselben Senats, der sieben Monate später die Mindeststandards der aussagepsychologischen Glaubhaftigkeitsbegutachtung zu definieren versuchte.1 Kernaussage war, dass – anders noch der Bundesgerichtshof 1954 (BGHSt. 5, 332) – zwar keine rechtlichen Bedenken bestünden; insbesondere verstoße der Einsatz beim Beschuldigten unter dessen Einwilligung nicht gegen Verfassungsgrundsätze wie das Fair-trial-Prinzip, den Nemo-tenetur-Grundsatz und die Menschenwürde oder gegen § 136a StPO.2 Der Grund war, weshalb der Bundesgerichtshof den Polygrafen erneut ablehnte, dass es sich bei einem „Lügendetektor“ um ein völlig ungeeignetes Beweismittel gemäß § 244 Absatz 3 Satz 3 Nummer 4 StPO (aktuelle Fassung) handle. Die sogenannte Vergleichsfragenmethode – um die es hier vor allem gehen wird – sei keine „in den maßgebenden Fachkreisen allgemein und zweifelsfrei als richtig und zuverlässig eingestufte Methode“. Zudem fehle eine „hinreichend breite Datenbasis“, die belegen könnte, dass „bestimmte gemessene Körperreaktionen mit einem Verhalten (hier: wahre oder unwahre Äußerung) in hohem Maße zusammenhängen“. Läge eine solche Datenbasis vor, könne ein „gewisser indizieller Beweiswert“ zwar nicht abgesprochen werden. Gegen die damals mitgeteilten Trefferquoten – immerhin von 70 bis 90 Prozent – hatte der Bundesgerichtshof aber derart „tiefgreifende Bedenken“, dass er der Vergleichsfragenmethode eine selbst minimale indizielle Bedeutung absprach.3 Diese Begründung überrascht, wenn man sich an die Worte desselben Senats zur Zulässigkeit und Geeignetheit der aussagepsychologischen Glaubhaf1 2

Bekräftigt durch BGH NStZ 2011, 474. Vgl. BGHSt. 44, 308 (315–318). 3 BGHSt. 44, 308 (322 f.); missverstanden von Miebach MK-StPO § 261 Rn. 260: der Bundesgerichthof hatte einen geringfügigen indiziellen Beweiswert gerade nicht angenommen; anders noch der Vorprüfungsausschuss des BVerfG NStZ 1981, 446 (447), der selbst eine erwiesene Treffsicherheit von 90 Prozent für zu niedrig erachtete; zu Recht kritisch Amelung NStZ 1982, 38 (39); deutlich Schwabe NJW 1982, 367 (f.): „Logisch nachvollziehen läßt sich dieser Gedankengang nicht mehr“.

90

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

tigkeitsbegutachtung erinnert. Denn dort sprachen und sprechen ihm zufolge weder die bescheidene Befundlage zur Bestätigung der Undeutsch-Hypothese – zur Erinnerung: „Zwar handelt es sich um Indikatoren mit jeweils für sich genommen nur geringer Validität, d. h. mit durchschnittlich nur wenig über dem Zufallsniveau liegender Bedeutung“ – noch die „teilweise nicht unerheblichen Fehlerspannen“ und der nur limitierte Beweiswert gegen ihre Zulässigkeit und tagtägliche Anwendung.4 Liest man beide Entscheidungen zusammen – sozusagen als Anleitung für methodische Mittel, deren sich ein Sachverständiger bedienen kann –, hieße das, dass der Zulässigkeit des Polygrafen im deutschen Strafverfahren nichts (mehr) im Wege steht, sofern dieses Untersuchungsverfahren mindestens so valide ist wie die aussagepsychologische Begutachtung. Denn alles andere würde letztere unbegründet begünstigen und jene psychologischen Sachverständige benachteiligen und in ihrem Auswahlermessen beeinträchtigen, die einen Polygrafen als Begutachtungsmethode nutzen möchten.

1. Was bedeutet eigentlich „völlig ungeeignet“? Nimmt man das Argument der Bundesrichter für voll, die polygrafengestützte Glaubhaftigkeitsbegutachtung sei als Beweismittel völlig ungeeignet, da es sich bei ihr nicht um eine „in den maßgebenden Fachkreisen allgemein und zweifelsfrei als richtig und zuverlässig eingestufte Methode“ handle,5 muss konsequenterweise die aussagepsychologische Glaubhaftigkeitsbegutachtung ebenso ein ungeeignetes Beweismittel sein.6 Auch diese ist in den „maßgebenden Fachkreisen“ alles andere als unumstritten – unabhängig davon, dass so gut wie jede Methode an irgendeiner Stelle angezweifelt wird, obgleich sie in der Praxis zum Einsatz kommt. Dass der Bundesgerichtshof keinen absoluten Konsens innerhalb der Fachwelt gemeint haben kann, findet man an anderem Ort: Methoden, „die bisher erst wenig erprobt oder Gegenstand eines wissenschaftlichen Meinungsstreites“ sind, hat er ausdrücklich gestattet und dem Tatgericht sogar die Pflicht aufgelegt, sich zumindest „über Methoden und Verfahren zu unterrichten, die noch nicht allgemein anerkannt sind“.7 Die völlige Ungeeignetheit einer Methode 4

BGHSt. 45, 164 (171). BGHSt. 44, 308 (322). 6 So auch Dettenborn FPR 2003, 559 (565); Schüssler JR 2003, 188 (190). 7 BGHSt. 41, 206 (215–217); BGH StV 1994, 227 (228); NStZ 1998, 528 (529); vgl. auch Detter Fachanwalt Strafrecht 35. Kapitel Rn. 77; Miebach MK-StPO § 261 Rn. 107; Wenske MK-StPO § 267 Rn. 248 f., der in Rn. 250 zutreffend auch die Aussagepsychologie zu solchen Methoden zählt; so auch Roxin/Schünemann § 45 Rn. 51; siehe aber erneut Miebach MK-StPO § 261 Rn. 320, der einen indiziellen Beweiswert beim Polygrafen zwar zu Recht bejaht, aber „grundsätzliche Einwände“ hat unter Bezugnahme auf die Rechtsprechung und a. a. O. Rn. 260 (missverständlich, siehe hier 4. Kapitel Fn. 3). 5

I. Das Urteil des Bundesgerichtshofs von 1998

91

kann daher nicht mit einem bloßen Verweis auf den wissenschaftlichen Diskurs begründet werden. Es hat ein strengerer Maßstab zu gelten.8 In diesem Sinne auch der Bundesgerichtshof – zumindest an anderer Stelle: Ein geminderter, geringer oder zweifelhafter Beweiswert darf nicht mit völliger Ungeeignetheit gleichgesetzt werden. Dies gelte selbst dann, wenn die vorhandenen Anknüpfungstatsachen dem Sachverständigen die Darlegung solcher Erfahrungssätze oder Schlussfolgerungen erlaubten, die für sich allein die unter Beweis gestellte Behauptung lediglich mehr oder minder wahrscheinlicher machten.9 Was der Bundesgerichtshof also genau mit dem Maßstab der Akzeptanz in den „maßgeblichen Fachkreisen“ gemeint hat, bleibt ein Rätsel.10 Kann nicht die fehlende allgemeine Akzeptanz einer Methode völlige Ungeeignetheit begründen, steht und fällt die Zulässigkeit mit ihrer Validität.11 Denn nur wenn das Gericht überzeugt ist, dass „nach sicherer Lebenserfahrung“ das gewünschte Beweisergebnis mit dem beantragten Beweismittel nicht zu erlangen ist, darf Ungeeignetheit angenommen werden. Das Beweismittel muss für die Beweiserhebung also geradezu nutzlos sein.12 Und nutzlos ist es dann, wenn es gar keinen Beweiswert hat. Zu denken ist an den Lehrbuchfall eines blinden Zeugen, der Tatsachen bekunden soll, die er optisch wahrgenommen haben müsste.13 Wie mit dem blinden Zeugen hält es der Bundesgerichtshof mit der Verwendung eines Polygrafen im Strafverfahren: Er sieht den Beweiswert für nicht erwiesen an; immerhin hätte er für einen „gewissen indiziellen Beweiswert“ genügen lassen, wenn er durch „eine hinreichend breite Datenbasis“ belegt worden wäre.14 Dass bereits 1998 eine solche Datenbasis existierte, die der polygrafengestützten Glaubhaftigkeitsbegutachtung einen überzufälligen Beweiswert bezeugte, haben die Bundesrichter übersehen (wollen). Jedenfalls sprechen neuere Studien gegen diese Rechtsprechung – und für die Zulässigkeit des Polygrafen im Strafverfahren. Dazu später mehr.

2. Auch beim Polygrafen geht es um den praktischen Nutzen Für den praktischen Nutzen der polygrafengestützten Glaubhaftigkeitsbegutachtung geht es mit anderen Worten darum, ob eine mithilfe eines Polygrafen vorgenommene Glaubhaftigkeitsbegutachtung einen überzufälligen Beweis8

Becker LR § 244 Rn. 232, 239; Krehl KK § 244 Rn. 149. BGH NStZ 2012, 345 (ebd.); NStZ 2008, 116 (ebd.); siehe auch Sättele SSW-StPO § 244 Rn. 199. 10 So auch Rogall SK-StPO § 136a Rn. 91; Seiterle StraFo 2014, 58 (60). 11 Schüssler JR 2003, 188 (190). 12 BGH NStZ 2016, 116 (117); Krehl KK § 244 Rn. 149; Schmitt Meyer-Goßner/Schmitt § 244 Rn. 58. 13 Trüg/Habetha MK-StPO § 244 Rn. 289. 14 BGHSt. 44, 308 (323). 9

92

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

wert erbringen kann – wie es etwa eine aussagepsychologische Begutachtung tut. Somit kann es nur auf Folgendes ankommen: Leistet der Polygraf irgendeinen Mehrwert gegenüber der jetzigen Lage, dem strafprozessualen (und aussagepsychologischen) Status quo, muss er zugelassen werden. Nur so kann einer ordnungsgemäßen Beweiswürdigung entsprochen werden, die verlangt, dass kein Beweismittel ungenutzt bleiben soll, das zu einer Änderung der durch die bisherige Beweisaufnahme begründeten Vorstellung von dem zu beurteilenden Sachverhalt führen kann.15 Auch aus diesem Grund werde ich mir immer wieder einen Vergleich mit der aussagepsychologischen Glaubhaftigkeitsbegutachtung erlauben. Ob darüber hinaus rechtliche Bedenken bestehen, hat der Bundesgerichtshof abschließend verneint, so dass sich eine weitere Auseinandersetzung (zumindest weitgehend) erledigt hat. Auch das Bundesverfassungsgericht ließ die Frage der verfassungsrechtlichen Zulässigkeit des Einsatzes und die Verwertbarkeit von mithilfe eines Polygrafen erstellten Gutachten letzten Endes ausdrücklich offen.16 Sie steht und fällt daher (eigentlich) mit dessen Beweiswert. Dennoch werde ich auf etwaige rechtliche Bedenken eingehen, zumal der Bundesgerichtshof nicht alle in der Literatur vorgebrachten Vorbehalte hinreichend berücksichtigt hat. Damit einher geht die Frage, wie und bei wem eine Glaubhaftigkeitsbegutachtung mithilfe eines Polygrafen durchgeführt werden kann. Bisher wurde sie – so auch vom Bundesgerichtshof – vor allem beim Beschuldigten diskutiert. Doch ein Einsatz beim (Belastungs-)Zeugen könnte gleichermaßen gewinnbringend sein für die Würdigung seiner Aussage als oft einzigem Beweismittel. Dass diese Fragen gestellt werden müssen, liegt nicht nur an dem Beweisdilemma, das in Aussage-gegen-Aussage-Konstellationen besteht. Unter anderem das Amtsgericht Bautzen hat den Einsatz des Polygrafen mittlerweile in drei Strafverfahren gestattet und im Rahmen der Beweiswürdigung herangezogen. Nach Auffassung des Bautzener Strafrichters bestehen die Bedenken des Bundesgerichtshofs hinsichtlich der Validität nicht (mehr). Sowohl in der ersten (2013) als auch in der dritten Entscheidung (2018) ging es um den Vorwurf der Vergewaltigung nach alter Rechtslage,17 in der zweiten Entscheidung 2017 um den Vorwurf des sexuellen Missbrauchs von Kindern nach § 176 StGB.18 Jedenfalls in familienrechtlichen Sorge- und Umgangsrechtsverfahren ist der Polygraf mittlerweile ein anerkanntes Mittel, einen Unschuldigen zu ent15

Vgl. BGH NStZ 2003, 205 (206); Eisenberg Beweisrecht, Rn. 11. BVerfG StraFo 1998, 16 (ebd.) unter Aufgabe einer früheren Entscheidung des Vorprüfungsausschusses, NStZ 1981, 446 (447); siehe erneut oben 4. Kapitel Fn. 3. 17 AG Bautzen, Urteil vom 26.3.2013 – 40 Ls 330 Js 6351/12; Urteil vom 17.12.2018 – 40 Ls 640 Js 31646/16. 18 AG Bautzen, Urteil vom 26.10.2017 – 42 Ds 610 Js 411/15 = Recht & Psychiatrie 36 (2018) S. 184. 16

II. Warum der Polygraf kein „Lügendetektor“ ist

93

lasten.19 Die Ausgangslage – auch in diesen Verfahren steht in aller Regel Aussage gegen Aussage – ist dieselbe wie im Strafverfahren.

II. Warum der Polygraf kein „Lügendetektor“ ist Wie bei der aussagepsychologischen Begutachtung bedarf es vorweg einiger Klarstellungen zum Einsatz eines Polygrafen zur Beurteilung der Glaubhaftigkeit; denn gerade hier bestehen etliche Missverständnisse. Allgemein handelt es sich bei einem Polygrafen um einen Mehrkanalschreiber (wörtlich: „Vielschreiber“), der mehrere unwillkürliche, vom vegetativen Nervensystem gesteuerte körperliche Reaktionen misst und grafisch festhält: in der Regel Blutdruck, Puls, Atmung (Respiration), Schweißabsonderung und elektrischer Hautwiderstand (elektrodermale Aktivität). Konkret bei der Glaubhaftigkeitsbegutachtung soll dadurch die subjektive Richtigkeit – also der subjektive Erlebnisbezug – des Ausgesagten ermittelt werden.20 Wie bei der Aussageanalyse kann allein ermittelt werden, was der Proband subjektiv für wahr hält, also ob er die vermittelte Information als erlebnisbezogen empfunden hat – unabhängig davon, ob die Aussage auf einem tatsächlichen eigenen Erleben beruht oder zum Beispiel auf Wahrnehmungsirrtümern oder false memories.21 Auch die Aussagebeurteilung mithilfe eines Polygrafen kann daher nur ein (weiteres) Indiz sein für den objektiven Wahrheitsgehalt der Aussage.

1. Das Instrument Bei der Untersuchung mithilfe eines Polygrafen werden genau genommen gleich mehrere Messinstrumente eingesetzt, die Blutdruck, Atmung, Puls und Schweißabsonderung fortlaufend registrieren. Die Aktivität des kardiovaskulären Systems wird durch Messung des Blutdrucks ermittelt – zum Beispiel mit einem Elektrokardiogramm oder einer Blutdruckmanschette. Die Atmungsaktivität wird durch einen sogenannten Pneumografen erfasst, der sowohl die thorakale als auch die abdominale Respiration misst. Der Puls wird mittels eines Finger-Plethysmografen festgestellt.22 Bei der elektrodermalen Aktivität wird durch Auflegen non-invasiver Oberflächenelektroden entweder der elektrische Hautwiderstands oder die Leitfähigkeit der Haut für schwache Ströme 19 Vgl. nur OLG Dresden FamFR 2013, 501; OLG München FamRZ 1999, 674; Undeutsch Psychologie der Zeugenaussage, S. 303 (306–308); Ziegler Weinreich/Klein § 1671 Rn. 67; jeweils mit weiterem Rechtsprechungsnachweis. 20 Rill Psychophysiologie, S. 12; Seiterle Hirnbild, S. 23; ausführlich Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (129 f.). 21 Siehe dazu bereits 2. Kapitel I 1 (S. 15 f.). 22 Bell/Raskin/Honts/Kircher Polygraph 28 (1999) S. 1 (4 f.); Delvo, S. 20; Matte, S. 164– 167, 175 f.

94

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

erfasst.23 Zur Unterstützung der Erkennung etwaiger Manipulationsversuche („countermeasures“) wird zudem die Verwendung sogenannter Aktivitätssensoren empfohlen („activity sensors“).24 Eine solche Vorgehensweise bei der Messung physiologischer Reaktionen ist nicht der forensischen Glaubhaftigkeitsbegutachtung vorenthalten. Sie findet sich bei fachgerechter Anwendung in den unterschiedlichsten Anwendungsbereichen, zum Beispiel im medizinischen Kontext – zu denken ist nur an ein Elektrokardiogramm (EKG) –, und wird daher fachbereichsübergreifend weitgehend unstreitig als zuverlässig eingestuft.25

2. Eine konkrete Lügenreaktion gibt es nicht: „no specific lie response“ Die psychophysiologische Glaubhaftigkeitsbegutachtung mittels einer polygrafischen Untersuchung – oder: polygrafengestützte Glaubhaftigkeitsbegutachtung26 – beruht auf der Prämisse, dass eine subjektiv unwahre Aussage von „intentionaler Gespanntheit“ und „emotionaler Erregtheit“ begleitet wird und zu vegetativ gesteuerten und deshalb unwillkürlichen Begleiterscheinungen führt, die mit dem Gerät festgestellt und aufgezeichnet werden können.27 Es gehört zwar zur allgemeinen Lebenserfahrung, dass das Lügen mit Aufregung verbunden ist, denn es ist stets mit dem Risiko behaftet, entdeckt zu werden.28 Eindeutig „erkennen“ lassen sich Lügen mit dem Polygrafen aber nicht: Konkrete physiologische Reaktionen, die speziell einer Lüge eigentümlich wären – wie etwa Erröten, Stottern oder Schwitzen –, gibt es wie bereits gezeigt nach derzeitigem Kenntnisstand nicht („no specific lie response“).29

23 Schüssler Polygraphie, S. 21 f.; Steller Psychologie im Strafverfahren, S. 89 (96 f.); ausführlich Matte, S. 170–172. 24 Handler/Honts/Goodson Polygraph 44 (2015) S. 129 (134); Nelson Polygraph 44 (2015) S. 28 (38); zum Vorwurf der Manipulierbarkeit siehe sogleich 4. Kapitel IV (S. 112–114). 25 Iacono/Patrick The Handbook of Forensic Psychology, S. 613 (614 f.); Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (130). 26 Eine einheitliche Terminologie für die Glaubhaftigkeitsbegutachtung mithilfe eines Polygrafen gibt es bislang nicht; Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 235: „psychophysiologische Glaubhaftigkeitsbegutachtung“; Steller Aussagebeurteilung, S. 4 f.: „psychophysiologische Aussagebeurteilung“; Vehrs Praxis der Rechtspsychologie 11 (2001) S. 16 (ebd.); „psychophysiologische Aussagebegutachtung“; Schüssler Polygraphie, S. 17 f., verwendet den Begriff „psychophysiologische Glaubwürdigkeitsbegutachtung“; da wie bei der aussagepsychologischen Glaubhaftigkeitsbegutachtung nicht die allgemeine Glaubwürdigkeit untersucht wird, ist diese Bezeichnung jedoch missverständlich; weitere Beispiele bei Seiterle Hirnbild, S. 17–19. 27 Mohnert Psychologie für Juristen § 5 Rn. 227; Rogall SK-StPO § 136a Rn. 87. 28 Undeutsch ZStW 87 (1975) S. 650 (ebd.). 29 Vgl. Artkämper Kriminalistik 2009, 349 (355); Raskin/Kircher Credibility Assessment, S. 63 (67); Steller Wahrheit, S. 95; siehe bereits 1. Kapitel IV (S. 10 f.).

II. Warum der Polygraf kein „Lügendetektor“ ist

95

Ein spezifisches Lügenmuster ist aber weder Voraussetzung noch Gegenstand einer Glaubhaftigkeitsbegutachtung mithilfe eines Polygrafen.30 Vielmehr werden physiologische Reaktionen des Probanden auf einen gewissen äußeren Einfluss, einen Reiz, in einem ersten Schritt gemessen, um sie – und das ist das Entscheidende – in einem zweiten zu interpretieren.31 Eines Reizes (eines Bildes oder einer Frage) bedarf es, um zu gewährleisten, dass sich dessen Bedeutung verändert in Abhängigkeit etwa von der Täterschaft oder eines tatsächlichen subjektiven Erlebnisbezugs.32 Mit anderen Worten geht es darum, Reize zu setzen, so dass zwischen verschiedenen psychischen Zuständen – zum Beispiel eine subjektiv wahre versus eine bewusst wahrheitswidrige Aussage – als Ursache der messbareren physiologischen Erregung unterschieden werden kann. Ansatzpunkt der polygrafengestützten Glaubhaftigkeitsbegutachtung ist die allgemein geteilte Annahme, dass das Ausmaß einer körperlichen Reak tion mit der individuellen Bedeutsamkeit des zugrunde liegenden Reizes einhergeht.33 Konkret bei der polygrafengestützten Glaubhaftigkeitsbegutachtung geht es um die Messung körperlicher Veränderungen auf Fragen, die der Gutachter der Aussageperson stellt. Die Bezeichnung „Lügendetektor“ ist daher so irreführend wie tautologisch, so dass ich auf sie im Folgenden verzichten möchte.34 Allerdings hat dieser Begriff einen wahren Kern: Auch mithilfe eines Polygrafen lassen sich lediglich subjektiv wahre von erlogenen, also bewusst wahrheitswidrigen Aussagen unterscheiden. Damit ist die polygrafengestützte Glaubhaftigkeitsbegutachtung wie die kriterienorientierte Inhaltsanalyse – in ihrem Zusammenspiel mit Konstanz- und Motivanalyse – eine Methode allein zur Prüfung und Zurückweisung der Lügenhypothese. Somit kann auch der Polygraf eine Lücke nicht schließen: Auf Suggestion beruhende Aussagen lassen sich durch sie genauso wenig erkennen wie mit der aussagepsychologischen Glaubhaftigkeitsbegutachtung.

30 So bereits Steller Aussagebeurteilung, S. 5; kritisch aber Ben-Shakhar Handbook of Polygraph Testing, S. 103 (106). 31 Eisenberg Beweisrecht, Rn. 693b; Mohnert Psychologie für Juristen § 5 Rn. 227; Schüssler Polygraphie, S. 25. 32 Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (133); Grubin The Cambridge Handbook of Forensic Psychology, S. 276 f.: „The aim […] is to establish a ‚psychological set‘ in the examinee that will increase the likelihood that any observed arousal is the result of deceptive responding.“ 33 Vgl. Seiterle Hirnbild, S. 24; Steller Psychologie im Strafverfahren, S. 89 (91). 34 So auch Greuel Praxis der Rechtspsychologie 8 (1998) S. 54 (55); Putzke/Scheinfeld/ Klein/Undeutsch ZStW 121 (2009) S. 607 (611); Seiterle StraFo 2014, 58 (59); jeweils mit weiteren Nachweisen.

96

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

3. Der Sachverständige Ein damit zusammenhängendes Missverständnis ist, dass die Glaubhaftigkeitsbegutachtung mithilfe eines Polygrafen beschränkt sei auf den Messvorgang der physiologischen Reaktionen – dass ausschließlich anhand der gemessenen Werte auf die Glaubhaftigkeit oder Nichtglaubhaftigkeit einer Aussage geschlossen werde. Messung und numerische Auswertung sind aber nur ein kleiner Bestandteil des gesamten Begutachtungsprozesses. Es handelt sich vielmehr um eine alternative Form der Aussagebeurteilung, und zwar – wie bei der Aussagepsychologie – um eine Begutachtung durch einen Sachverständigen. Zu diesem Gesamtprozess gehören neben der Messung selbst und der Interpretation der Messungen auch ein ausführliches Vorgespräch („pre-test interview“) und eine anschließende Exploration. Kurz gesagt macht sich der sachverständige Gutachter während des gesamten Prozesses Gedanken über die Glaubhaftigkeit. Zum Beispiel wird er schon während des Vorgesprächs auf etwaige Täuschungsversuche und Unstimmigkeiten achten.35 Angenommen einem lügenden Probanden gelingt es, Messergebnisse zu erzielen, die ihn entlasten. Bemerkt der Gutachter aber die Manipulationsversuche – oder noch drastischer: gesteht der Proband während der oder im Anschluss an die Begutachtung, gelogen zu haben – wird er, wenn er im Prozess als Sachverständiger gehört wird, kaum nur die Zahlen nach den Messungen ablesen, sondern von diesen Auffälligkeiten berichten.36 Nicht die „Maschine“, sondern der Mensch zieht die Schlussfolgerung, ob die Aussage subjektiv wahr oder erlogen ist.37 Der Polygraf als solcher lässt sich lediglich als eine Art „Vergrößerungsglas“ für den Sachverständigen verstehen.38 Zur Veranschaulichung ein nicht-juristischer Vergleich: Auch bei einer medizinischen Untersuchung zeichnet das EKG lediglich Kurven und Zahlen auf, die für einen Laien zunächst keine Bedeutung haben. Der Patient selbst verfügt nicht über den notwendigen Sachverstand. Es bedarf der Expertise des Arztes, um die nötigen Schlüsse aus den gemessenen Werten zu ziehen: Ist der Patient gesund? Bedarf es einer Anpassung der Medikation? Sind aufgrund der Werte weitere Untersuchungen geboten? Nicht anders verhält es sich bei der Glaubhaftigkeitsbegutachtung mithilfe eines Polygrafen, und auch sie versteht sich als komplexer Gesamtprozess. Wie beim EKG bedarf es eines Spezialisten, um die gemessenen körperlichen Er35

Grubin The Cambridge Handbook of Forensic Psychology, S. 276 (278). So erzählte mir Charles Honts von einer Begutachtung, bei der der Proband zwar wahrheitsgemäß verneint hatte, mit Methamphetamin Handel getrieben zu haben – der Grund für die Begutachtung –, aber beiläufig gestand, Kokain gedealt zu haben. 37 Delvo, S. 283 f.; Rogall SK-StPO § 136a Rn. 87; Schüssler JR 2003, 188 (ebd.); Steller/ Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (189). 38 L. Fischer/Paul/Voigt Zeitschrift für Soziologie 48 (2020) S. 418 (428). 36

II. Warum der Polygraf kein „Lügendetektor“ ist

97

regungszustände zu interpretieren.39 Der Polygraf selbst erfüllt nur eine verhältnismäßig periphere Funktion,40 ist „interagierendes Teil [eines] soziotechnischen Ensembles“.41 Zu kurz greift daher die Ansicht, nach der „das eigentliche Beweismittel das Ergebnis des Tests“ sei, das der Sachverständige vor Gericht lediglich präsentieren und erläutern müsse.42 – Ungeachtet dieses verkürzten Verständnisses ist die Begrifflichkeit „Test“ wie schon bei der aussagepsychologischen Glaubhaftigkeitsbegutachtung zu vermeiden, da sie der Komplexität der Psychophysiologie nicht gerecht wird.43 All das erinnert an die Argumentation der Befürworter der Aussagepsychologie. Auch sie verstehen die kriterienorientierte Inhaltsanalyse lediglich als kleinen Bestandteil des gesamten Begutachtungsprozesses. Der Gutachter habe im Einzelfall die individuellen, kognitiven Fähigkeiten der konkreten Aussageperson zu berücksichtigen.44 Erst ein solcher „Qualität-Kompetenz-Vergleich“ ermögliche eine psychologische Einschätzung, ob der Proband in der Lage war, die konkrete Aussage zu erfinden.45 Die Beurteilung der Glaubhaftigkeit obliege allein der professionellen Einschätzung des Gutachters.46 Die Idee eines solchen „Qualität-Kompetenz-Vergleichs“ – die zuletzt den Bundesgerichtshof von der Zulässigkeit der aussagepsychologischen Begutachtungspraxis überzeugt hatte – lässt sich auf die polygrafengestützte Glaubhaftigkeitsbegutachtung übertragen. Der Unterschied ist, dass die Trefferquoten – und damit der Beweiswert – allein der polygrafischen Untersuchung höher liegen als die der kriterienorientierten Inhaltsanalyse. Mit anderen Worten ist der – zugegeben empirisch kaum überprüfbare – Anteil der subjektiven, „professionellen Einschätzung“ des Gutachters bei der polygrafengestützten Begutachtungspraxis deutlich geringer. Ich komme darauf zurück. Damit ist gleichzeitig klargestellt, dass es für den Einsatz eines Polygrafen im Strafprozess nicht der Schaffung eines neuen Beweismittels bedarf, das noch nicht im Numerus clausus der zugelassenen Beweismittel enthalten wäre: Die Glaubhaftigkeitsbegutachtung mithilfe eines Polygrafen fällt wie die aussagepsychologische Begutachtung unter den Sachverständigenbeweis; nicht der 39

Vgl. auch Putzke ZJS 2011, 557 (ebd.). Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (632); Tavor Gericht und Expertise, S. 153 (162); Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (50). 41 L. Fischer/Paul/Voigt Zeitschrift für Soziologie 48 (2020) S. 418 (431). 42 So aber Momsen KriPoZ 2018, 142 (143); wie hier Mohnert Psychologie für Juristen § 5 Rn. 226. 43 Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (160 f.); Vehrs Praxis der Rechtspsychologie 11 (2001) S. 16 (21); siehe aber nur Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (613 und passim); Schüssler JR 2003, 188 (ebd. und passim). 44 Köhnken The Detection of Deception in Forensic Contexts, S. 41 (52); Volbert/Schemmel/Tamm Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108 (113). 45 Steller Handbuch der Rechtspsychologie, S. 300 (302 f.). 46 Köhnken The Detection of Deception in Forensic Contexts, S. 41 (53). 40

98

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

Polygraf, sondern der Gutachter ist das Beweismittel.47 Daraus ergeben sich die bereits gewohnten Rechte und Pflichten eines Sachverständigen. So hat der Sachverständige den Beschuldigten analog § 136 Absatz 1 Satz 2 StPO zu belehren, wenn er die Glaubhaftigkeit von dessen Einlassung zu begutachten hat. Hat der Zeuge im Fall der Begutachtung seiner Aussage ein Zeugnisverweigerungsrecht, hat ihn der Sachverständige über dessen Mitwirkungsverweigerungsrecht aufzuklären.48

III. Den richtigen Reiz setzen: Methoden polygrafengestützter Glaubhaftigkeitsbegutachtung Bei der polygrafengestützten Glaubhaftigkeitsbegutachtung geht es zunächst darum, körperliche Reaktionen auf äußere Reize (auch „Items“ genannt) zu messen, die der Sachverständige in einem Folgeschritt miteinander vergleicht und interpretiert. Ein Beispiel: Angenommen man möchte herausfinden, ob ein Proband lieber Bier oder Wein trinkt, ohne dass er sich ausdrücklich dazu äußert. Nun könnte man auf die Idee kommen, den Probanden an einen Polygrafen zu schließen und die jeweiligen körperlichen Reaktionen – Blutdruck, Schweiß, Puls, Atmung und Hautleitfähigkeit – auf den äußeren Reiz zu messen: einmal nachdem man ihm ein Glas Bier und ein zweites Mal, nachdem man ein Glas Rotwein auf den Tisch gestellt hat. In diesem fiktiven Experiment zeigt der Proband stärkere und höhere physiologische Reaktionen auf das Glas Rotwein. Der Gutachter kommt zu dem Schluss: Der Proband trinkt lieber Rotwein. Dieser Schluss ist nur zulässig, wenn erwiesen ist, dass die stärkeren Reaktionen tatsächlich ein Indiz sind für die Vorliebe für ein bestimmtes Getränk. Diese Annahme ließe sich erklären, wenn das physische (hier optische) Wahrnehmen des favorisierten Getränks automatisch komplexe physiologische Reaktionen auslöst, die sich vom Normalzustand unterscheiden und die mit einem Polygrafen gemessen werden können. Das wäre gegeben, wenn das Wahrnehmen des Lieblingsgetränks zu einer Erhöhung des Hautleitwerts und des Blutdrucks führt sowie zu einer Verminderung der Atmungsaktivität. Gleichzeitig muss ausgeschlossen sein, dass nur das Erkennen solche physiologischen Veränderungen auslöst und es nicht einen anderen Grund für diese Reaktionen gibt. So könnte man die Gegenhypothese aufstellen, dass solche Reaktionen auch oder eher derjenige zeigt, der eine große Abneigung für Wein hat und zum Beispiel aus Ekel vor dem aufgetischten „Getränke-Item“ derart angeregt reagiert. 47 Wie hier Rakete-Dombek Polygraphie, S. 105 (114); Schüssler Polygraphie, S. 69–71; Seiterle Hirnbild, S. 45; Wagner, S. 49; insofern richtig auch BGH NStZ 2011, 474 (475). 48 Vgl. für eine Zeugenbelehrungspflicht analog § 81c Absatz 3 Satz 2, § 52 Absatz 3 Satz 1 StPO bei der aussagepsychologischen Begutachtung nur Trück MK-StPO § 81c Rn. 55 mit Rechtsprechungsnachweisen.

III. Den richtigen Reiz setzen

99

Erst wenn diese Gegenhypothese ausgeschlossen werden kann und es keine alternative Begründung gibt, ist die Schlussfolgerung hinreichend fundiert. Bei der polygrafengestützten Glaubhaftigkeitsbegutachtung ist es etwas komplizierter. Hier werden nicht Reaktionen auf Gegenstände, sondern auf Fragen gemessen und miteinander verglichen. Dabei wird angenommen, dass ein bewusst wahrheitswidrig aussagender Proband anders, nämlich erregter – oder besser: angeregter – auf bestimmte Fragen reagiert als einer, der eine subjektiv wahre Aussage tätigt. Undeutsch sprach von körperlichen Äußerungen „intentionaler Gespanntheit und emotionaler Erregtheit“.49 Steller versteht die andersartig starken physiologischen Veränderungen als Indikator von Unterschieden psychischer „Angeregtheit“, die von der unterschiedlichen Bedeutung gezielter Fragen herrührt.50 Entscheidend sind die Art und Weise der jeweiligen Fragen. Dazu bedarf es einer geeigneten Fragetechnik, bei der gewährleistet ist, dass sich die Bedeutung der Reize in Abhängigkeit von tatsächlichem subjektiven Erlebnisbezug oder von tatsächlicher Täterschaft verändert.51

1. Das theoretische Fundament Erklären lassen sich diese Grundannahmen mit der sogenannten „Kampf- oder Flucht“-Reaktion („fight-or-flight-reaction“). Das bedeutet, dass eine Bedrohung – ob physischer oder psychischer Natur – eine Reihe körperlicher Reaktionen auslöst, die sich vom Normalzustand unterscheiden. Diese physiologischen Veränderungen können dann mit einem Polygrafen gemessen werden. Zu diesen gehören Erhöhungen des Hautleitwerts und des Blutdrucks sowie Verringerungen der Atmungsaktivität und der peripheren Durchblutung.52 Andere begründen die jeweiligen physiologischen Veränderungen anhand verschiedener psychologischer Prämissen. Zu diesen zählen die Angst vor Entdeckung oder Bestrafung, Unsicherheit oder Besorgnis, erhöhte Aufmerksamkeit, Orientierungsreaktionen, motivationale Prozesse und Konflikte – oder eine Kombination aus diesen.53 Selbst Vertreter der Psychophysiologie geben zu, dass keiner dieser theoretischen Ansätze für sich genommen eine umfassende Gül49 50

Undeutsch ZStW 87 (1975) S. 650 (651). Steller Aussagebeurteilung, S. 5. 51 Seiterle Hirnbild, S. 24; Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (133). 52 Vgl. Raskin/Kircher Credibility Assessment, S. 63 (65) mit Nachweisen; Undeutsch MschrKrim 62 (1979) S. 228 (230); kritisch aber National Research Council, S. 82; Nelson Polygraph 44 (2015) S. 28 (41): vor allem die Directed-Lie-Methode lasse sich so nicht erklären; zu dieser unten 4. Kapitel III 2 e) (S. 107–109). 53 Vgl. Delvo, S. 21 f.; Honts/Reavy Physiol Behav 143 (2015) S. 15 (16); Nelson Polygraph 44 (2015) S. 28 (41 f.); Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (133); Vrij/Ganis Credibility Assessment, S. 301 (313 f.); jeweils mit weiteren Nachweisen auch zur Kritik; zu kurz und ohne Nachweis Wagner, S. 27: „Furcht, beim Lügen erwischt zu werden“.

100

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

tigkeit beanspruchen kann.54 So kann auch ein Unschuldiger Angst haben – in seinem Fall vor einer unberechtigten Verurteilung. Die wissenschaftliche Beurteilung der Begutachtungspraxis zugrunde liegenden Theorie ist jedoch eine von der Bestimmung ihrer Genauigkeit und praktischen Nutzbarkeit getrennte Frage. Vielmehr sind all diese Aspekte als Teilkomponenten zu verstehen, bei denen emotionale, kognitive und motivationale Prozesse ineinandergreifen und sich gegenseitig verstärken können. Daher ist es möglich, eine Methode für ihren konkreten praktischen Zweck zu validieren, ohne die zugrunde liegende Theorie vollständig durchdrungen zu haben.55 Das mag unbefriedigend klingen.56 Doch ein vollständiges Durchdringen des theoretischen Fundaments ist kein Muss, um eine Methode als Beweismittel anzuerkennen. Ganz im Gegenteil: Mit Blick auf ihre Praktikabilität und speziell ihren Beweiswert sei erneut auf die Aussageanalyse verwiesen. Auch bei dieser konnten die theoretischen Annahmen der Undeutsch-Hypothese alles andere als hinreichend belegt werden. Die „alltägliche Erfahrung und [der] gesunde Menschenverstand“57 reichten aber schließlich aus, nicht nur den Bundesgerichtshof davon zu überzeugen, diese Methode zum tagtäglichen Einsatz im Strafverfahren zuzulassen (und das trotz überschaubarer Trefferquoten).

2. Direkte Methoden: Die Vergleichsfragenmethode Die in der Praxis übliche Fragetechnik ist die Vergleichsfragenmethode („Comparison Question Technique“), früher bekannt als Kontrollfragentechnik („Control Question Technique“). Sie gibt es in mehreren Variationen, jedoch mit gemeinsamen Merkmalen.58 Früher oder später wird der Proband direkt nach der Tatbegehung gefragt – zum Beispiel nach der Täterschaft oder der Falschbeschuldigung. Die unterschiedlichen Ausprägungen der Vergleichsfragenmethode werden daher allesamt als „direkte Methoden“ bezeichnet.

a) Gemeinsamkeiten Jede Variante der Vergleichsfragenmethode beginnt mit einem Vorgespräch – auch Vortestinterview genannt –, in dem zunächst das Einverständnis des Probanden eingeholt wird. Zudem werden grundlegende biografische und gesundheitliche Informationen sowie die persönlichen Daten erhoben. Der einschlägige Sachverhalt wird besprochen und der Proband zu seiner Version der Ereignisse 54

Raskin/Honts Handbook of Polygraph Testing, S. 1 (2); Rill Psychophysiologie, S. 87. Grubin The Cambridge Handbook of Forensic Psychology, S. 276 (278); Raskin/Kircher Credibility Assessment, S. 63 (66); Rill Psychophysiologie, S. 87; Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (133 f.). 56 Kritisch zum Beispiel Ben-Shakhar Handbook of Polygraph Testing, S. 103 (105–107). 57 Undeutsch Forensische Psychologie, S. 26 (126). 58 Überblick bei National Research Council, S. 254–257. 55

III. Den richtigen Reiz setzen

101

befragt. In der Regel soll er seine Version in freier Rede schildern – wie auch bei der aussagepsychologischen Begutachtung. Ziel des Vorgesprächs ist zuletzt, den Probanden „zum Reden“ zu bekommen, ihm etwaige Vorbehalte zu nehmen und eine Atmosphäre von professioneller Objektivität und Vertrauenswürdigkeit zu schaffen.59 Unabhängig davon, dass einer zwangsweisen polygrafischen Begutachtung beim Beschuldigten dessen Selbstbelastungsfreiheit und § 136a StPO entgegenstünden, kann die Untersuchung ohne Freiwilligkeit bereits methodisch nicht durchgeführt werden. Die Messungen würden bei geringstem tatsächlichem Widerstand unbrauchbar werden.60 Wie bei einer Röntgenaufnahme oder einem EKG muss der Proband auch bei einer polygrafischen Untersuchung ruhig sitzen, damit die Messung überhaupt durchgeführt werden kann.61 Im Vorgespräch erläutert der Gutachter zudem die Funktionsweise der Psychophysiologie einschließlich der Frage, wie und warum eine Person reagiert, wenn sie sich auf eine Täuschung einlässt oder wahrheitsgemäß antwortet. Um den Probanden mit dem Aufzeichnungsverfahren vertraut zu machen und ihn von der Funktionsfähigkeit des Polygrafen zu überzeugen, wird ein Probedurchlauf durchgeführt. Dies geschieht oft in Form eines „Zahlentests“, bei dem der Proband zunächst aufgefordert wird, eine Zahl zum Beispiel zwischen drei und sechs zu wählen, sich diese zu merken, sie aber im Probedurchlauf bewusst zu leugnen, indem er auf jede Frage nach den Zahlen eins bis sieben mit „Nein“ antwortet. Der Zahlentest dient einerseits dazu, Störungen auszuschließen, die die Auswertung der während der eigentlichen Begutachtung zu gewinnenden Reaktionskurven unmöglich oder unsicher machen würden. Zugleich wird dem Probanden dadurch die Zuverlässigkeit der Methode verdeutlicht, indem der Gutachter im Anschluss die richtige Zahl aufdeckt.62 Bei allen direkten Methoden werden die später gemessenen physiologischen Reaktionen auf zwei verschiedene Arten von Fragen miteinander verglichen: der tatrelevanten oder tatbezogenen („relevant question“) und der Vergleichsoder Kontrollfrage („comparison question“). Alle Fragen, die während des Vorgesprächs besprochen und formuliert werden, kann der Proband nur mit „Ja“ oder „Nein“ beantworten. Auf die genaue Antwort kommt es nicht an; entscheidend sind die physiologischen Reaktionen, welche unterschiedliche Grade innerer Erregtheit als Reaktion auf die gestellten Fragen verraten.63 59 Vgl. dazu Raskin/Honts Handbook of Polygraph Testing, S. 1 (2); Raskin/Kircher Credibility Assessment, S. 63 (70). 60 Siehe nur Delvo, S. 23; Eisenberg Beweisrecht, Rn. 695; Jayne Polygraph 19 (1990) S. 105 (106); Vrij Detecting Lies, S. 302. 61 Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (69). 62 Handler/Nelson Polygraph 38 (2009) S. 15 (16 f.); Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (614). 63 Handler/Nelson Polygraph 38 (2009) S. 15 (17); Schoreit StV 2004, 284 (ebd.).

102

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

Da jeder Proband – ob lügend oder nicht – auf die tatirrelevante Frage („irrelevant question“) „Ist heute Dienstag?“ weniger stark reagieren wird als auf die Frage „Haben Sie Ihrer Tochter Ihren Finger in die Scheide gesteckt?“,64 müssen die Vergleichsfragen ein ähnliches „Erregtheitsniveau“ aufweisen.65 Idealerweise soll die Vergleichsfrage strukturell etwas schwächer sein als die tatrelevante. Eine Vergleichsfrage, die genauso stark ist, könnte bei einem täuschenden Probanden, der beide Fragen als gleich bedrohlich empfindet, nämlich zu einem nicht eindeutigen, unentscheidbaren Ergebnis führen („inconclusive result“).66 Der Proband gilt als überführt und seine Aussage als bewusst wahrheitswidrig, wenn die erfassten Reaktionen auf die tatrelevanten Fragen im Durchschnitt stärker sind als auf die Vergleichsfragen. Im umgekehrten Fall, nämlich wenn die tatrelevanten Fragen im Vergleich schwächer ausfallen, gilt der Proband als glaubwürdig und seine Aussage als subjektiv wahr (zur konkreten Auswertung sogleich).67 Begründet wird dies damit, dass für denjenigen, der die relevanten Fragen wahrheitsgemäß verneinen kann, weil seine Aussage auf einem zumindest subjektiven Erlebnisbezug beruht, bei den Vergleichsfragen stärkere physiologische Reaktionen zu erwarten sind. Für den bewusst wahrheitswidrig aussagenden Probanden bleibt jedoch die Bedeutung der tatrelevanten Fragen aufgrund des konkreten Bezugs zum Tatvorwurf erhalten. Er wird stärker auf sie reagieren, wenn er sie bewusst wahrheitswidrig verneint, da ihm hier „die Pistole an die Brust gesetzt wird“ und er sich möglichst unauffällig verhalten muss.68 Grundsätzlich konzentriert sich ein Proband nämlich auf diejenigen Aspekte, die die größte Bedrohung für sein Wohlbefinden darstellen. Während für täuschende Probanden von den tatrelevanten Fragen die größte Bedrohung ausgeht, haben für Unschuldige die Vergleichsfragen diese Qualität. Die Vergleichsfragenmethode steht und fällt mit der Formulierung der jeweiligen Fragen – vor allem der Vergleichsfragen. Die tatrelevanten Fragen bereiten selten Probleme, da sie in einfachen und konkreten Worten formuliert werden können, die eine eindeutige Interpretation ihrer Bedeutung erlauben. Dabei sollten juristische Begriffe und Schlussfolgerungen jedoch vermieden werden.69 So sollte der Proband bei einem Vergewaltigungsvorwurf nicht ge64

Steller Polygraphie, S. 31 (39); siehe auch Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (64). 65 Das war die berechtigte Kritik an der ursprünglichen Fragentechnik, dem Relevant-Irrelevant-Test; dazu Raskin/Honts Handbook of Polygraph Testing, S. 1 (3–5); Vrij Detecting Lies, S. 296–298; Vrij/Ganis Credibility Assessment, S. 301 (311 f.). 66 Matte, S. 466; Undeutsch MschrKrim 62 (1979) S. 228 (230); näher zu den unentscheidbaren Klassifikationen sogleich unter 4. Kapitel III 2 c) (S. 105) und im 5. Kapitel III 3 (S. 128– 130). 67 Vgl. Ginton Psychology, Crime and Law 19 (2013) S. 577 (578). 68 Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (57). 69 Handler/Nelson Polygraph 38 (2009) S. 15 (17).

III. Den richtigen Reiz setzen

103

fragt werden, ob der Sex einvernehmlich war. Auch sollte niemals gefragt werden: „Haben Sie … vergewaltigt“ oder „Haben Sie … sexuell missbraucht?“. Diese Bezeichnungen sind ungeeignet, weil sie vom Probanden eine juristische Subsumption verlangen. Juristische Begriffe sollten stattdessen umschrieben werden: „Haben Sie … mit körperlicher Gewalt oder durch Drohung dazu gebracht, am fünften Juni Sex mit Ihnen zu haben?“70 – Die größere Herausforderung der direkten Methoden ist die Formulierung der Vergleichsfragen. Denn sie müssen ähnlich erregend und unangenehm, also ihrer Art nach mit dem in Frage stehenden Delikt vergleichbar sein.

b) Die Probable-Lie-Technik Die noch verbreitetste Variante der Vergleichsfragenmethode ist die ProbableLie-Technik (PLT). Bei ihr wird ein ähnliches Erregtheitsniveau erreicht durch die Formulierung von Vergleichsfragen, die darauf ausgelegt sind, dem Probanden eine „wahrscheinliche Lüge“ als Antwort zu entlocken. Die Vergleichsfragen beziehen sich auf sozial missbilligte Verhaltensweisen auf dem gleichen Normgebiet der aufzuklärenden Tat und sind daher dem einschlägigen Sachverhalt ähnlich. Sie sind allgemein gehalten, bewusst vage formuliert und decken lange Zeiträume in der Lebensgeschichte des Probanden ab.71 Die Vergleichsfragen werden so gewählt, dass der Proband – wenn er sie nach der Intention der Methode verneint – mit hoher Wahrscheinlichkeit lügen oder zumindest von Ungewissheit und Selbstzweifeln geplagt sein muss, ob seine Antwort der Wahrheit entspricht. Man fragt also entweder nach Normverstößen, von denen man weiß, dass sie der Proband tatsächlich begangen hat, oder stellt die Frage so, dass sie niemand guten Gewissens mit einem schlichten „Nein“ beantworten kann. Im Falle eines Diebstahlsvorwurfs wird als Beispiel für eine solche Vergleichsfrage genannt: „Haben Sie vor Ihrem 28. Geburtstag jemals eine Sache genommen, die Ihnen nicht gehört?“72 Bei einem Vergewaltigungsvorwurf könnte eine Vergleichsfrage lauten: „Haben Sie jemals ein ungewöhnliches sexuelles Verhalten gezeigt?“ Und bei einer mutmaßlichen Falschaussage: „Können Sie sich daran erinnern, jemals gelogen zu haben, um sich vor einer peinlichen Situation zu retten?“73 Damit soll erreicht werden, dass jeder Proband die Vergleichsfrage bewusst wahrheitswidrig verneint, und er soll dabei befürchten, dass eine Aufdeckung dieser Täuschung ihn als Täter überführt. Die Vergleichsfragen werden daher mit der Intention konstruiert, die emotionale Situation eines Täters bei Beant70 71

Raskin/Kircher Credibility Assessment, S. 63 (68). Honts/Reavy Physiol Behav 143 (2015) S. 15 (16); Raskin/Kircher Credibility Assessment, S. 63 (71); Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (138). 72 Eingehend Delvo, S. 23–41; Raskin/Kircher Credibility Assessment, S. 63 (69–78). 73 Beispiele aus dem umfangreichen Vergleichsfragenkatalog von Matte, S. 466–486.

104

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

wortung der direkten Frage nach der Tatbegehung zu simulieren.74 Eine Fragensequenz bei der Probable-Lie-Technik könnte wie folgt aussehen:75 1. Irrelevante Einleitungsfrage Glauben Sie mir, dass ich Ihnen nur die Fragen stellen werde, die wir besprochen haben? 2. Ungewertete relevante Frage Bezüglich der Anschuldigungen, dass Sie letzte Nacht einen Supermarkt überfallen haben, beabsichtigen Sie, alle Fragen wahrheitsgemäß zu beantworten? 3. Neutrale Frage Leben Sie in Deutschland? 4. Vergleichsfrage Haben Sie in den ersten 29 Jahren Ihres Lebens jemals etwas genommen, das nicht Ihnen gehörte? 5. Tatrelevante Frage Haben Sie gestern Abend den Supermarkt in der Hauptstraße überfallen? 6. Neutrale Frage Heißen Sie Franz? 7. Vergleichsfrage Haben Sie vor 2021 jemals etwas getan, das unehrlich oder illegal war? 8. Tatrelevante Frage Haben Sie letzte Nacht eine Waffe benutzt, um den Supermarkt auszurauben? 9. Neutrale Frage Haben Sie im Februar Geburtstag? 10. Vergleichsfrage Haben Sie vor Ihrem 29. Lebensjahr jemals gelogen, um sich aus Schwierigkeiten zu befreien oder um jemand anderem ein Problem zu bereiten? 11. Tatrelevante Frage Wissen Sie, wo das aus dem Supermarkt entnommene Geld jetzt ist? 12. Vergleichsfrage Haben Sie vor 2021 jemals jemanden bedroht, um zu bekommen, was sie wollten?

In der Regel besteht die Sequenz aus drei Einleitungsfragen, die nicht ausgewertet werden. Sie dienen dazu, den Effekt aufzufangen, dass der erste in einer Reihe dargebotenen Reize stets eine verstärkte Aufmerksamkeitszuwendung erfährt. Sodann folgen drei tatrelevante und vier Vergleichsfragen.76 Die neutralen Fragen ermöglichen es, während der Untersuchung immer wieder zu einem psychophysiologischen Grundzustand („baseline“) zurückzukehren, um Verzerrungen zu vermeiden, und gewährleisten, dass der Proband allen Fragen dieselbe Aufmerksamkeit schenkt.77 Die Fragen werden mit zeitlichem Abstand von mindestens 20 Sekunden gestellt, damit die physiologische Reaktion wieder abklingen kann, bevor die nächste gestellt wird. Die gesamte Fragesequenz wird mindestens dreimal durchlaufen. Die Stellung der jeweiligen Fragen innerhalb der Sequenz wird dabei variiert, um zu verhindern, dass der Proband antizipierende Reaktionen produziert.78 74 Steller/Dahle 75 Angelehnt an

Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (137). H. Offe/S. Offe MschrKrim 87 (2004) S. 86 (101 f.); Raskin/Kircher Credibility Assessment, S. 63 (73); siehe auch Honts/Reavy Physiol Behav 143 (2015) S. 15 (24 f.). 76 Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (615). 77 Handler/Nelson Polygraph 38 (2009) S. 15 (18). 78 Handler/Nelson Polygraph 38 (2009) S. 15 (21); Raskin/Honts Handbook of Polygraph

105

III. Den richtigen Reiz setzen

c) Das Numerische Scoring System Die Beurteilung der gewonnenen körperlichen Reaktionen im Anschluss an die Befragung erfolgt über ein bewährtes siebenstufiges Auswertungssystem – das Utah Numerical Scoring System. Jeweils für Atmung, elektrodermale Aktivität (Hautleitwert oder Hautwiderstand), Blutdruck (Kardiograf) und Puls (Fingerplethysmograf) wird für jede tatrelevante Frage eine Punktzahl von +3 bis –3 vergeben. Dabei vergleicht der Gutachter die Größe der Reaktion auf die tatbezogene mit der auf die beiden umklammernden Vergleichsfragen; die Reaktionen auf die irrelevanten und neutralen Fragen bleiben unberücksichtigt.79 Ist sie auf die tatrelevante Frage stärker, wird ein negativer Score zugewiesen; die Ziffer erhält ein Minus-Zeichen. Ein Plus wird vergeben, wenn die Reaktion auf die Vergleichsfrage stärker ist, und eine Null, wenn kein deutlicher Unterschied erkennbar ist. Die Größe der Scores variiert von „1“ für einen merklichen, über „2“ für einen starken bis hin zu „3“ für einen außerordentlich großen Unterschied. Dieser Prozess wird für jeden gemessenen Parameter wiederholt. Im Anschluss werden die Scores unter Berücksichtigung des Vorzeichens zu einem Gesamtwert summiert. Wird die Methode korrekt angewendet, sind drei verschiedene Ergebnisse möglich: Werte von +6 und höher sind Indikatoren für die wahrheitsgemäße Verneinung der tatrelevanten Fragen (die Aussage ist „glaubhaft“), Werte zwischen +5 und –5 erlauben keine sichere Schlussfolgerung (es liegt ein „unentscheidbares“ Ergebnis vor), und bei Werten von –6 und darunter ist davon auszugehen, dass die tatrelevanten Fragen wahrheitswidrig verneint wurden – die Aussage ist „nicht glaubhaft“.80 –5 „nicht glaubhaft“

+5 „unentscheidbar“

„glaubhaft“

d) Schwächen der Probable-Lie-Technik Ein oft geäußerter Kritikpunkt an der Probable-Lie-Variante ist, dass es nur schwer sei, standardisierte Fragen zu stellen, da die Vergleichsfragen von Fall zu Fall neu erstellt werden müssen.81 Wie Befürworter selbst einräumen, hängen Erfolg und Validität der Methode zudem weitgehend von den Fähigkeiten Testing, S. 1 (17 f.); Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (69). 79 Hinsichtlich der Beispielsfragensequenz auf S. 114 sind daher nur die Fragen 4, 5, 7, 8, 10, 11 und 12 für die Auswertung relevant; zum Ganzen Bell/Raskin/Honts/Kircher Polygraph 28 (1999) S. 1 (2–4); Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (615 f.); Raskin/Kircher Credibility Assessment, S. 63 (75–77). 80 Wie bereits dargelegt ist von einer Einteilung in „unglaubwürdig“ oder „glaubwürdig“ abzusehen; auch bei der polygrafengestützten Glaubhaftigkeitsbegutachtung geht es um die Beurteilung der Glaubhaftigkeit einer Aussage; vgl. auch Rill Psychophysiologie, S. 8. 81 Dahle Psychologische Rundschau 54 (2003) S. 103 (106); Wagner, S. 25.

106

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

des Gutachters ab.82 Dass der Erfolg – nicht nur zur Glaubhaftigkeitsbegutachtung – von der Erfahrung und der Professionalität ihrer Anwender abhängt, liegt auf der Hand.83 Ein Blick in das Handbuch von Matte und konkret auf dessen Vergleichsfragenkatalog zu fast jedem denkbaren Delikt zeigt zudem, dass eine Standardisierung zumindest in Ansätzen möglich ist.84 Der eigentliche „Haken“ der Probable-Lie-Technik ist ein anderer: Um die Bedrohlichkeit der Vergleichsfragen weiter zu erhöhen und zu erreichen, dass sowohl Schuldige als auch Unschuldige beide Arten von Fragen verneinen, wird dem Probanden während des Vorgesprächs suggeriert, dass eine bejahende Reaktion auch auf die Vergleichsfragen Rückschlüsse auf seine Täterschaft zulassen – obgleich gerade das Gegenteil der Fall ist.85 Mit anderen Worten werden die Vergleichsfragen dem Probanden gegenüber nicht als solche, sondern ebenfalls als grundsätzlich belastende Fragen vorgestellt.86 Raskin und Kircher führen dazu aus:87 „The manner of introducing and explaining the probable-lie questions is designed to pose a dilemma for the subject. It leads the subject to believe that admissions will cause the examiner to form the opinion that the subject is dishonest and is therefore guilty. This discourages admissions and maximizes the likelihood that the negative answer is untruthful. However, the manner of introducing and explaining the probable-lie questions also leads the subject to believe that deceptive answers will result in strong physiological reactions during the test and will cause the examiner to conclude that the subject was deceptive to the relevant issues concerning the robbery. In fact, the converse is true.“88

Der Proband soll also einerseits glauben, dass eine bejahende Antwort auf die Vergleichsfrage dazu führt, dass der Prüfer denkt, der Proband neige allgemein 82 Vgl. Honts/Reavy Physiol Behav 143 (2015) S. 15 (17); siehe auch Fiedler/Schmid/ Stahl Basic and Applied Social Psychology 24 (2002) S. 313 (316); Lykken Psychophysiology 15 (1978) S. 137 (138); Rill Psychophysiologie, S. 37; Vrij Detecting Lies, S. 315. 83 Vgl. auch Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (625); kritisch aber Rill/Vossel NStZ 1998, 481 (484 f.); Wagner, S. 25 f. 84 Siehe erneut Matte, S. 468–486, und die Beispielsfragen oben; wie hier Dettenborn FPR 2003, 559 (563); Mohnert Psychologie für Juristen § 5 Rn. 231. 85 Vgl. Raskin/Honts Handbook of Polygraph Testing, S. 1 (16); Steller Psychologie im Strafverfahren, S. 89 (94); kritisch daher Rill/Vossel NStZ 1998, 481 (482 f.); Vrij Detecting Lies, S. 313. 86 Steller Recht & Psychiatrie 36 (2018) S. 173 (175); ders. Gericht und Expertise, S. 173 (178 f.). 87 Raskin/Kircher Credibility Assessment, S. 63 (72). 88 „Die Art und Weise, wie die Fragen zur wahrscheinlichen Lüge eingeführt und erläutert werden, soll den Probanden in ein Dilemma bringen. So wird der Proband einerseits glauben, dass eine bejahende Antwort [auf die Vergleichsfragen] den Prüfer davon überzeugt, dass der Proband [generell] unehrlich und daher schuldig ist. Dies soll den Probanden davon abhalten, die [Vergleichsfragen] zu bejahen, und erhöht die Wahrscheinlichkeit, dass eine dann verneinende Antwort bewusst wahrheitswidrig ist. Die Art und Weise, wie die [Vergleichsfragen] eingeführt und erläutert werden, soll den Probanden aber auch glauben lassen, dass wahrheitswidrige Antworten zu starken physiologischen Reaktionen während der Begutachtung führen, die den Prüfer zu der Schlussfolgerung veranlassen, dass der Proband [auch] hinsichtlich der tatrelevanten Fragen zum Raub gelogen hat. In Wahrheit ist jedoch das Gegenteil der Fall.“

III. Den richtigen Reiz setzen

107

zu verwerflichem Verhalten und sei daher schuldig. Ziel dieser „Manipulation“ ist, den Probanden zu entmutigen, die Vergleichsfragen zu bejahen, und die Wahrscheinlichkeit zu erhöhen, dass die verneinende Antwort bewusst unwahr ist – der Proband also „wahrscheinlich lügt“. Ob der Proband aber tatsächlich lügt, geschweige denn um den wahren Sinn dieser Manipulation weiß, lässt sich selten mit Sicherheit feststellen.89 Ob darin eine Irreführung und Täuschung nach § 136a Absatz 1 Satz 1 StPO zu sehen ist, wird zwar unter anderem vom Bundesgerichtshof verneint und soll an anderer Stelle vertieft werden.90 Jedenfalls führen Putzke, Scheinfeld, Undeutsch und Klein dazu aus, dass dem Probanden lediglich erklärt wird, dass beide Arten von Fragen für die Diagnose – was zutrifft – „gleich wichtig“ sind. Die Vergleichsfragen unterschieden sich nicht von Fragen, wie sie jeder psychologische oder psychiatrische Sachverständige bei einem persönlichkeitspsychologischen oder aussagepsychologischen Gutachten stellen würde. Auch dort werde der Proband nicht darauf hingewiesen, welche Antwort auf welche Frage welche Bedeutung für das Ergebnis habe. „Von Manipulation kann [daher] keine Rede sein.“91 Auch Honts und Reavy weisen den Vorwurf und die Notwendigkeit einer solchen methodenimmanenten Täuschung zurück, obgleich manche unprofessionellen Gutachter – so die Autoren – auf eine solche unnötige Irreführung zurückgreifen.92 – Dennoch haftet der Probable-Lie-Technik die Tatsache negativ an, dass die Bedeutsamkeit der Vergleichsfragen seitens des Gutachters manipulativ erhöht oder verschwiegen werden muss; mag diese methodenimmanente Täuschung im Ergebnis auch rechtlich unerheblich sein.93

e) Die Directed-Lie-Technik Die nicht ganz unberechtigte Kritik an der Probable-Lie-Technik hat zur Weiterentwicklung der Vergleichsfragenmethode beigetragen. Das Erfordernis, auf den Probanden manipulativ einzuwirken, vermeidet die Variante der Directed-Lie-Technik (DLT), die vor allem in den U. S. A. immer öfter zum Einsatz kommt.94 Im deutschsprachigen Raum ist zu lesen von der „gerichteten LügenKontrollfragentechnik“ oder dem „direktiven Lügentest“.95 89

Vgl. Rill Psychophysiologie, S. 37; Vrij Detecting Lies, S. 314. BGHSt. 44, 308 (317 f.); siehe 6. Kapitel III 1 b) (S. 148 f.). Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (617 f.); siehe bereits Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (117); deutlich Undeutsch ZStW 87 (1975) S. 650 (657): „Bei allen anderen [Methoden], zu denen er sich bereit erklärt, weiß [der Proband] im voraus [sic] weniger, was auf ihn zukommt“. 92 Honts/Reavy Physiol Behav 143 (2015) S. 15 (24). 93 Zumindest „bedenklich“ auch für L. Schneider Nonverbale Zeugnisse, S. 157. 94 Korrespondenz mit Charles Honts, der nach eigenen Angeben seit 20 Jahren ausschließlich die DLT anwendet; siehe auch Bell/Kircher/Bernhardt Physiol Behav 94 (2008) S. 331 (332); Honts/Reavy Physiol Behav 143 (2015) S. 15 (16 f.); Rill Psychophysiologie, S. 37. 95 Vgl. Fiedler Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5 (11); Steller/ Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (142). 90 91

108

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

Bei dieser Variante wird der Proband zu Beginn der Begutachtung ausdrücklich dazu aufgefordert, bei den Vergleichsfragen zu lügen – daher auch „directed lie“. Anders als bei der Probable-Lie-Technik weiß der Gutachter also, dass der Proband tatsächlich und nicht nur wahrscheinlich lügt.96 Die Grundannahme der Directed-Lie-Technik ist, dass ein Unschuldiger bei einer Lüge auf die Vergleichsfrage erregter und stärker reagiert als auf die tatrelevante Frage, bei der er gerade nicht lügen muss und nichts zu befürchten hat. Für den Schuldigen, der zusätzlich die tatrelevanten Fragen bewusst wahrheitswidrig verneinen muss, bleibt aber jede direkte Frage nach der Tatbegehung bedrohlicher.97 Ein weiterer Vorteil ist, dass die Fragen im Gegensatz zur Probable-Lie-Variante nicht von Einzelfall zu Einzelfall neu formuliert werden müssen, so dass eine höhere Standardisierbarkeit und damit Objektivität gewährleistet werden kann.98 In unserer Korrespondenz nannte mir Charles Honts drei Vergleichsfragen, die er in fast all seinen Begutachtungen verwendet:99 1. Before 2021 have you ever told even one lie in your entire life? 2. Before 2021 did you ever do anything that was dishonest or illegal? 3. Before 2021 did you ever make a mistake?

Ins Deutsche übersetzt: 1. Haben Sie vor 2021 in Ihrem Leben schon einmal gelogen? 2. Haben Sie vor 2021 jemals etwas Unehrliches oder Illegales getan? 3. Haben Sie vor 2021 schon einmal einen Fehler gemacht?

Hinzu kommt, dass der Proband im Vorgespräch darauf hingewiesen wird, sich während des Messvorgangs bewusst zu machen, dass er bei den jeweiligen Vergleichsfragen lügt. So soll er sich etwa bei Beantwortung der Directed-Lie-Vergleichsfragen eine konkrete Situation vor Augen führen, in der er die angesprochenen Handlungen begangen hat – also zum Beispiel eine Situation, in der der Proband auch wirklich gelogen hat.100 Das Vorgespräch könnte in etwa wie folgt aussehen:101 Gutachter: Bevor wir mit der eigentlichen Untersuchung beginnen, gehen wir noch einmal die Fragen durch, denn wir wollen ja keine Überraschungen erleben. Proband: Okay. 96 97

Bell/Kircher/Bernhardt Physiol Behav 94 (2008) S. 331 (333). Honts/Raskin Journal of Police Science and Administration 16 (1988) S. 56 (57). 98 Vgl. Handler/Nelson Polygraph 38 (2009) S. 15 (26); Rill Psychophysiologie, S. 39; Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (143); Vrij Detecting Lies, S. 316. 99 Siehe auch Bell/Kircher/Bernhardt Physiol Behav 94 (2008) S. 331 (339); Honts/Reavy Physiol Behav 143 (2015) S. 15 (16, 25). 100 Vgl. Rill Psychophysiologie, S. 38 f. 101 Frei übersetzt nach Honts/Reavy Physiol Behav 143 (2015) S. 15 (25); Raskin/Honts Handbook of Polygraph Testing, S. 1 (23 f.).

III. Den richtigen Reiz setzen

109

Gutachter: Ich werde Ihnen die Fragen so stellen, wie sie auch in der Untersuchung vorkommen werden, und ich möchte, dass Sie sie so beantworten, wie Sie sie in der Untersuchung beantworten werden, okay? Proband: Okay. Gutachter: Die erste Gruppe von Fragen bezieht sich auf den Vorfall im Supermarkt. Die erste Frage lautet: Bezüglich der Anschuldigungen, dass Sie letzte Nacht einen Supermarkt überfallen haben, beabsichtigen Sie, jede Frage dazu wahrheitsgemäß zu beantworten? Proband: Ja. […] Gutachter: Gut. Die nächste Reihe von Fragen entspricht in etwa unserem Zahlentest. Es sind Fragen, bei denen ich möchte, dass Sie lügen. Genau wie vorher die Zahl Vier sind sie dazu da, um zu zeigen, dass Ihr Körper reagiert, wenn Sie lügen. Damit Sie die Fragen erkennen, bei denen Sie lügen sollen, beginnen sie alle mit den Worten „Vor 2021“. Wenn Sie also diese Worte hören, möchte ich, dass Sie lügen, okay? Proband: Okay. Gutachter: Haben Sie vor 2021 jemals jemanden angelogen, der Ihnen vertraute? Proband: Nein. […] Gutachter: Gut. Manche finden es hilfreich, an konkrete Situationen zu denken, in denen sie diese Dinge getan haben, wenn sie die Fragen beantworten. Sie wissen schon, zu schnelles Fahren auf dem Weg zur Arbeit, versehentlich ein Stoppschild überfahren, Ihre Mutter als Kind angelogen, was auch immer. Einfach etwas, das Ihnen in den Sinn kommt, okay?

Die Wichtigkeit dieser Anweisungen ergibt sich daraus, dass ansonsten bei nicht hinreichend starken physiologischen Reaktionen keine eindeutigen Ergebnisse erzielt werden können. Die Gefahr eines unentscheidbaren Ergebnisses dient als zusätzliche Motivation während des Begutachtungsprozesses. Auch hier ist der Proband in einem Dilemma, aber einem, über das er nicht getäuscht wird: Bei einem unschuldigen Probanden, der um seine Unschuld weiß und daher ein unentscheidbares Ergebnis befürchtet, das ihn nicht entlasten kann, wird so eine erhebliche Signalwirkung der Vergleichsfrage induziert, die geeignet ist, mit der tatrelevanten Frage zu konkurrieren. Beim schuldigen Probanden wird durch die Anweisung dagegen der Signalcharakter der tatrelevanten Fragen verstärkt, da sich der Schuldige bewusst ist, dass er auch bei den tatrelevanten Fragen lügen muss.102 Mit den Worten von Steller und Dahle: „Die fehlende Täuschungsmotivation bei der gerichteten Lügenfrage ersetzt die [DirectedLie-Technik] durch die induzierte Furcht vor einer nicht hinreichenden Reaktion auf die (verabredete) Lüge.“103

102 Vgl. Honts/Reavy Physiol Behav 143 (2015) S. 15 (16); Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (142 f.). 103 Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (143).

110

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

f) Anhang: Fragensequenz der Directed-Lie-Technik 1. Irrelevante Einleitungsfrage Glauben Sie mir, dass ich Ihnen nur die Fragen stellen werde, die wir besprochen haben? 2. Ungewertete relevante Frage Bezüglich der Anschuldigungen, dass Sie letzte Nacht einen Supermarkt überfallen haben, beabsichtigen Sie, alle Fragen wahrheitsgemäß zu beantworten? 3. Neutrale Frage Leben Sie in Deutschland? 4. Vergleichsfrage (DL) Haben Sie vor 2021 in Ihrem Leben schon einmal gelogen? 5. Tatrelevante Frage Haben Sie gestern Abend den Supermarkt in der Hauptstraße überfallen? 6. Tatrelevante Frage Haben Sie letzte Nacht eine Waffe benutzt, um den Supermarkt auszurauben? 7. Vergleichsfrage (DL) Haben Sie vor 2021 jemals etwas Unehrliches oder Illegales getan? 8. Tatrelevante Frage Haben Sie gestern Abend das Geld aus der Kasse des Supermarkts genommen? 9. Vergleichsfrage (DL) Haben Sie vor 2021 schon einmal einen Fehler gemacht? 10. Neutrale Frage Haben Sie im Februar Geburtstag?

Die Durchführung der Aufzeichnungen und ihre Auswertung verlaufen nach demselben Muster wie bei der Probable-Lie-Technik.104 Selbst Kritiker gestehen die Vorteile der Directed-Lie-Technik ein, halten die Grundannahmen dieser Variante aber (fälschlicherweise) nicht für hinreichend empirisch belegt.105

3. Exkurs: Zur Impraktikabilität der Tatwissenstechnik Abzugrenzen sind die Varianten der Vergleichsfragenmethode von der sogenannten Tatwissenstechnik („Guilty Knowledge“ oder „Concealed Information Test“). Hier werden dem Probanden tatrelevante Details dargeboten, die eine Aussage darüber ermöglichen sollen, ob er (täter-)spezifisches Wissen hat.106 Dieser Methode hat der Bundesgerichtshof zwar ausdrücklich nur für den Zeitpunkt der Hauptverhandlung eine Abfuhr erteilt.107 Unabhängig von ihrer grundsätzlich hohen Validität ist sie aber vor allem in Aussage-gegen-Aussage-Konstellationen wenig praktikabel. Nach der Tatwissenstechnik werden dem Probanden eine Reihe von Multiple-Choice-Fragen gestellt, die als Antwortmöglichkeiten jeweils eine tatbezo104

Bell/Kircher/Bernhardt Physiol Behav 94 (2008) S. 331 (ebd.). Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (96); siehe aber Lykken Tremor in the Blood, S. 140. 106 Ben-Shakhar/Elaad Handbook of Polygraph Testing, S. 87 (ebd.); Iacono/Patrick Clinical Assessment of Malingering and Deception, S. 361 (363). 107 BGHSt. 44, 308 (327 f.); siehe auch Amelung JR 1999, 382 (384); Mohnert Psychologie für Juristen § 5 Rn. 225. 105

III. Den richtigen Reiz setzen

111

gene, „richtige“ Antwortalternative (zum Beispiel ein Merkmal des zu untersuchenden Verbrechens) und mehrere „falsche“ Alternativen enthalten, die so gewählt werden, dass ein Unschuldiger sie nicht von der „richtigen“ unterscheiden kann. Da hier der Proband nicht direkt nach der Tatbegehung gefragt wird, bezeichnet man die Tatwissenstechnik als „indirekte Methode“.108 Sind die physiologischen Reaktionen des Probanden auf die richtige Antwortmöglichkeit konsistent größer als auf die falschen Alternativen, lässt sich in der Regel darauf schließen, dass er Kenntnisse über das Ereignis, also Tatwissen hat, was die Täterschaft zumindest nahe legt.109 Denn bei einem Täter führt die Konfrontation mit der entscheidenden Antwortmöglichkeit zu einer unwillkürlichen Wiedererkennung, deren physiologische Auswirkung mit dem Polygraf gemessen werden kann.110 Solange keine Informationen über das Ereignis durchgesickert sind, hängt die Wahrscheinlichkeit, dass ein unschuldiger Verdächtiger durchweg größere Reaktionen auf die tatbezogenen Alternativen zeigt, davon ab, wie viele Fragen ihm gestellt worden sind und wie viele Antwortmöglichkeiten es jeweils gab.111 So könnten etwa auf die Frage, welcher Gegenstand gestohlen wurde, folgende Antwortmöglichkeiten formuliert werden: a) Armband, b) Uhr, c) Ring, d) Kette und e) Geldbörse.112 Angenommen eine Uhr wurde gestohlen, müsste der Täter stärker auf die Antwortmöglichkeit „Uhr“ reagieren, da er weiß, was er gestohlen hat, während ein Unschuldiger auf alle Antwortalternativen in gleichem Maße reagieren müsste. Und zufällige Treffer lassen sich leicht ausschließen, indem man einfach mehrere solcher Fragen stellt.113 Da infolgedessen die Zuverlässigkeit positiver Ergebnisse sehr hoch ist, empfiehlt sich die Tatwissenstechnik – im Gegensatz zur Vergleichsfragenmethode – eher als Belastungs- denn als Entlastungsbeweis.114 Unabhängig davon, dass sich ein Proband kaum freiwillig einer Methode unterziehen wird, die allein zu seinen Lasten gewertet würde, kann die Tatwissenstechnik zudem höchstens zu Beginn der Ermittlungen sinnvoll eingesetzt werden.115 Nur zu 108 Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (612); Schüssler JR 2003, 188 (ebd.). 109 Doch Tatwissen allein ist nicht gleichzusetzen mit Tatbegehung oder einer wahrheitswidrigen Aussage, Ben-Shakhar/Elaad Handbook of Polygraph Testing, S. 87 (93). 110 Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (144). 111 Lykken Tremor in the Blood, S. 291. 112 Beispiel nach Steller Aussagebeurteilung, S. 11; eine fiktive und unterhaltsame Fragensequenz gerichtet an O. J. Simpson findet sich bei Lykken Tremor in the Blood, S. 298 f. 113 Fiedler Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5 (16 f.); Schüssler JR 2003, 188 (ebd.); Seiterle Hirnbild, S. 28. 114 Steller Aussagebeurteilung, S. 151; Tavor Gericht und Expertise, S. 153 (161); gemäß Undeutsch Psychologische Rundschau 54 (2003) S. 115 (118) erzielen Personen mit Tatwissen zu 35 Prozent ein negatives Ergebnis, so dass die Tatwissenstechnik keine zuverlässigen entlastenden Ergebnisse liefern kann. 115 Roxin/Schünemann § 25 Rn. 18; kritisch dazu Hamm NJW 1999, 922 (923): „Es bliebe

112

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

diesem Zeitpunkt sind Tatdetails noch nicht bekannt gegeben oder dem Probanden vorgehalten worden.116 In Aussage-gegen-Aussage-Konstellationen speziell mit sexualstrafrechtlichem Bezug dürfte der Einsatz der Tatwissenstechnik jedoch grundsätzlich ungeeignet sein:117 Zum einen wird der Beschuldigte meistens Kenntnis vom Tatgeschehen haben, da ihm die sexuelle Handlung entweder – spätestens mit Übermittlung der Anklageschrift (§ 201 StPO) – bereits vorgehalten wurde oder er diese gar nicht abstreiten wird und es vielmehr um die Frage der Einvernehmlichkeit geht. Zum anderen wird es bei Sexualstraftaten kaum möglich sein, mehrere Fragen zu formulieren mit jeweils vergleichbaren und in ihrem Belastungsgehalt für Nicht-Täter gleichwertigen Antwortalternativen.118

IV. Zum Vorwurf der Manipulierbarkeit: „Countermeasures“ Um ein entlastendes Ergebnis zu erzielen, müssen die Reaktionen auf die Vergleichsfragen im Vergleich zu den tatbezogenen Fragen stärker ausfallen. Ein über die Methodik der polygrafengestützten Glaubhaftigkeitsbegutachtung aufgeklärter Schuldiger könnte daher versucht sein, den Ausgang der Begutachtung zu seinen Gunsten zu manipulieren. So könnte er versuchen, seine Reaktionen auf die tatrelevanten Fragen zu unterdrücken oder die Reaktionen auf die Vergleichsfragen zu erhöhen. Während Ersteres unstreitig als unwahrscheinlich gilt,119 legen Laborstudien nahe, dass es möglich sei, Probanden Manipulationsmaßnahmen hinsichtlich der Vergleichsfragen anzutrainieren, um unentdeckt ein falsch-negatives Ergebnis zu erzielen.120 Auch der Bundesgerichtshof […] nur das Wagnis, den Mandanten blind (ohne Aktenkenntnis des Verteidigers) in den Tatwissenstest zu schicken […]. Ich kenne keinen seriösen Verteidiger, dem ich zutrauen würde, auch dem noch so eindringlich seine Unschuld beschwörenden Mandanten eine solche Strategie zu empfehlen“. 116 Steller Gericht und Expertise, S. 173 (177); so selbst zugestanden von Lykken Tremor in the Blood, S. 305–307. 117 So im Ergebnis BGHSt. 44, 308 (327 f.); siehe auch Fiedler Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5 (16); Frister ZStW 106 (1994) S. 303 (306); Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (612 f.); Seiterle Hirnbild, S. 64 f.: nur „eingeschränkte Einsatzmöglichkeit“. 118 Vgl. Ben-Shakhar/Elaad Handbook of Polygraph Testing, S. 87 (93); Honts The Detection of Deception in Forensic Contexts, S. 103 (105 f.); L. Schneider Nonverbale Zeugnisse, S. 154 f.; Steller/Dahle Psychologie der Zeugenaussage, S. 309 (322); für Österreich Wagner, S. 31. 119 Fiedler/Schmid/Stahl Basic and Applied Social Psychology 24 (2002) S. 313 (316); Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (176 f.). 120 Vgl. Ben-Shakhar Handbook of Polygraph Testing, S. 103 (114); Iacono/Patrick Clinical Assessment of Malingering and Deception, S. 361 (365); Schüssler Polygraphie, S. 135; eine Zusammenfassung der Laborstudien findet sich bei Handler/Honts/Goodson Polygraph 44 (2015) S. 129–139; anders aber das National Research Council, S. 4: „It is unknown whether a deceptive individual can produce responses that mimic the physiological responses

IV. Zum Vorwurf der Manipulierbarkeit: „Countermeasures“

113

berief sich auf sowohl physische als auch mentale Aktivitäten, wie das Beißen auf die Zunge oder das Lösen von Rechenaufgaben sowie psychologische Techniken zur Veränderung physiologischer Reaktionen auf die Vergleichsfragen.121 Aufgrund einer möglichen Manipulationsgefahr sei die polygrafengestützte Begutachtung daher generell unzulässig.122 Andere weisen die Gefahr, dass Schuldige die Begutachtungsergebnisse erfolgreich manipulieren könnten, allerdings zurück. Seiterle etwa hält die zwar nicht völlig auszuschließenden Manipulationsmöglichkeiten für „letztlich wohl vernachlässigbar“.123 Ein Grund ist, dass Manipulationen zumindest von erfahrenen und professionellen Gutachtern erkannt werden können.124 Dies gilt vor allem für motorische Aktivitäten wie die nicht sichtbare Kontraktion kleiner Muskelgruppen zum Beispiel der Bauch- und Fußmuskulatur sowie die Einnahme von Psychopharmaka.125 Jedenfalls führen motorische oder mentale Gegenmaßnahmen höchstens dazu, dass das Untersuchungsergebnis nicht auswertbar („inconclusive“) ist, so dass eine Entlastung nicht gelingen kann.126 Im Gegenteil besteht unter Umständen sogar die Gefahr, erst recht ein positives, belastendes Ergebnis zu erzielen.127 Honts fasst die Forschung zur Manipulation der polygrafengestützten Glaubhaftigkeitsbegutachtung wie folgt zusammen:128 „In summary, the now extensive scientific literature on countermeasures has not demonstrated any effective […] Countermeasures. Providing information about the nature of the CQT and about possible countermeasures does not allow deceptive subjects to beat the CQT. Specific Point Countermeasures following hands-on training enable some subjects to produce false negative outcomes. The laboratory research establishing these findings is likely to represent worst-case scenarios.“129 of a nondeceptive individual well enough to fool an examiner trained to look for behavioral and physiological signatures of countermeasures“; siehe auch dort auf S. 151. 121 BGHSt. 44, 308 (327). 122 Zustimmend Rill/Vossel NStZ 1998, 481 (485). 123 Seiterle StraFo 2014, 58 (61); ders. Hirnbild, S. 55; siehe auch Putzke/Scheinfeld/ Klein/Undeutsch ZStW 121 (2009) S. 607 (620 f.). 124 AG Bautzen, Urteil vom 26.10.2017 – 42 Ds 610 Js 411/15 = Recht & Psychologie 36 (2018) S. 184 (188); Dettenborn FPR 2003, 559 (564); Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler Glaubhaftigkeit, S. 238; Honts The Detection of Deception in Forensic Contexts, S. 103 (116–118); Tavor Gericht und Expertise, S. 153 (167). 125 Vgl. Schüssler Polygraphie, S. 132 f., 137. 126 Honts Credibility Assessment, S. 131 (139); Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (619); ausführlich Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (172–177), die zu dem Schluss kommen, Manipulationen seien in der Regel erkennbar oder führten allenfalls zur Nichtauswertbarkeit der Untersuchung. 127 Honts Credibility Assessment, S. 131 (138); Nelson Polygraph 44 (2015) S. 28 (46). 128 Honts The Detection of Deception in Forensic Contexts, S. 103 (117 f.). 129 „Zusammengefasst konnte die mittlerweile umfangreiche wissenschaftliche Literatur [hierzu] keine wirksamen […] Gegenmaßnahmen nachweisen. Das Bereitstellen von Informationen über die Vergleichsfragenmethode und über mögliche Gegenmaßnahmen ermöglicht es täuschenden Probanden nicht, die Vergleichsfragenmethode zu schlagen. Konkrete punktuelle Gegenmaßnahmen nach einem praktisches Training führen bei manchen Probanden zu falsch-

114

4. Kapitel: Die polygrafengestützte Glaubhaftigkeitsbegutachtung

Dass es unabhängig davon nicht auf die nur potenzielle, bislang nicht hinreichend nachgewiesene Gefahr einer erfolgreichen Manipulation ankommen darf, zeigt ein Vergleich mit den herkömmlichen Methoden der Glaubhaftigkeitsbeurteilung. Niemand käme auf die Idee, diese vollends zu untersagen, obwohl bei diesen ein – möglicherweise sogar größeres und folgenreicheres – Manipulationsrisiko besteht. Täter oder lügende Zeugen werden stets versuchen, glaubwürdig zu erscheinen – sei es gegenüber einem Richter oder einem Gutachter.130 So besteht mittlerweile unstreitig die Gefahr, dass Realkennzeichen im Rahmen der Aussageinhaltsanalyse antrainiert werden können, ohne dass dort eine solche Manipulation – anders als hier bei der polygrafengestützten Begutachtung – festgestellt werden kann. Dies hat die Rechtsprechung allerdings nicht bewogen, die Verwertung solcher (meist belastender) Indizien zu untersagen. Im Gegenteil scheint diese Gefahrenquelle bislang kaum beachtet worden zu sein. Die Zulassung des Polygrafen als Entlastungsindiz mit dem dann widersprüchlichen, nicht nachgewiesenen Argument potenzieller Manipulierbarkeit grundsätzlich abzulehnen, leuchtet daher wenig ein.131

negativen Ergebnissen. Jedoch zeigen die Laborstudien, die diese Erkenntnis belegen, wahrscheinlich Worst-Case-Szenarien.“ 130 Honts/Thurber/Handler Applied Cognitive Psychology Special Issue (2021) S. 1 (13); Momsen KriPoZ 2018, 142 (145 f.) spricht zu Recht von einem „strukturellen Manipulationsrisiko“. 131 Dass das Manipulationsrisiko steigt, sollten Probanden professionell gecoached und trainiert werden, liegt wie bei jeder anderen Methode auf der Hand, siehe nur Handler/Honts/ Goodson Polygraph 44 (2015) S. 129 (134); jedoch sei in diesem Zusammenhang an die Integrität und Professionalität der Gutachter erinnert, vgl. Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (620); Schüssler Polygraphie, S. 142; Seiterle Hirnbild, S. 57; Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (102).

5. Kapitel

„Zahlen lügen nicht“: warum der Polygraf kein völlig ungeeignetes Beweismittel ist I. Einführung Damit soll es zum theoretischen Teil sein Bewenden haben. Nun stellt sich die Frage, ob die polygrafengestützte Glaubhaftigkeitsbegutachtung gegenüber dem jetzigen Status quo einen Mehrwert erbringen kann. Wie bereits ausgeführt kann ein Beweismittel – egal welches – dann nicht völlig ungeeignet sein, wenn es nicht nutzlos ist. Und nutzlos wäre die polygrafengestützte Begutachtung nur dann, wenn ihrem Ergebnis gar kein Beweiswert zukäme. Einmal angenommen die polygrafengestützte Begutachtung – konkret die Vergleichsfragenmethode – soll in einem Verfahren zu Gunsten des Beschuldigten als Entlastungsbeweis herangezogen werden. Damit wird deutlich, zu was der Polygraf nicht verhelfen soll: der Entlastung eines Schuldigen. Um Letzteres so weit wie möglich zu vermeiden, kommt es für den Richter bei der Frage nach der praktischen Eignung der polygrafengestützten Glaubhaftigkeitsbegutachtung allein auf folgende Zahlen an: auf die Quote zutreffend entlasteter Unschuldiger (True Negative Rate = Spezifität) und die fälschlich entlasteter Schuldiger (False Negative Rate). Je höher erstere und niedriger letztere, desto geeigneter ist der Polygraf als Entlastungsindiz. Dieses Verhältnis sollte bekannt sein: Entscheidend ist wieder der Likelihood-Quotient, in dieser Konstellation der eines negativen Ergebnisses, und negativ deshalb, da der Polygraf in diesem Fall nicht eine Lüge offenbart – dann wäre das Ergebnis positiv:1 LRN =

P(nG|nW) Spezifität ≙ P(nG|W) 1 – Sensitivität

Die (Prozess-)Frage lautet auch hier nicht, wie viele Schuldige überführt oder wie viele Unschuldige entlastet werden (das beantworten die Trefferquoten), sondern wie viele „Entlastete“ wirklich unschuldig sind. Ergibt die Untersuchung ein negatives Ergebnis – meint also der Gutachter, der Proband sage 1 Bei der aussagepsychologischen Begutachtung ist es wie dargelegt genau umgekehrt; dort spricht man von einem positiven Ergebnis, wenn der Gutachter zu dem Schluss kommt, die Aussage ist subjektiv wahr; das mag zugegeben auf den ersten Blick Verwirrung stiften, ist aber allein der Methodik geschuldet.

116

5. Kapitel: „Zahlen lügen nicht“

die Wahrheit –, stellt sich die alles entscheidende Frage, in wie vielen Fällen diese Vermutung zutrifft. Bei einer strafprozessualen Anfangswahrscheinlichkeit von 50 Prozent lässt sich wie bei der aussagepsychologischen Begutachtung die Belastungswahrscheinlichkeit eines negativen Ergebnisses der polygrafengestützten Glaubhaftigkeitsbegutachtung berechnen, oder mit anderen Worten: der konkrete Beweiswert eines negativen Ergebnisses. Auf die Trefferquoten – Sensitivität und Spezifität – kommt es wieder nur für die Berechnung an.2 Allerdings werden wie bei der aussagepsychologischen auch bei der polygrafengestützten Glaubhaftigkeitsbegutachtung allein die Trefferquoten herangezogen, wenn die Validität und praktische Eignung diskutiert werden.3

II. Eine kurze Geschichte des ewigen psychophysiologischen Meinungsstreits Die Geschichte der akademischen Meinungsverschiedenheit über die Treffsicherheit der Vergleichsfragenmethode ist lang. Sie wurde und wird nach wie vor geprägt durch die Debatte zwischen Forschern der University of Utah und der University of Minnesota, die 1978 mit Publikationen in den Zeitschriften Psychophysiology und Psychological Bulletin begann. Die „Minnesota-Gruppe“ – begründet von David Lykken4 – steht den direkten Methoden geschlossen kritisch entgegen. Ihre prominentesten Vertreter heute sind William Iacono, Christopher Patrick und Gershon Ben-Shakhar.5 Jedoch lehnen die genannten Vertreter die psychophysiologische, polygrafengestützte Glaubhaftigkeitsbegutachtung nicht generell ab; sie befürworten die indirekten Methoden, also die Tatwissenstechnik.6

2 Rill/Vossel NStZ 1998, 481 (484) erkennen zwar, dass es um den praktischen Nutzen der Methode geht, lehnen aber einen Beweiswert selbst von über 95 Prozent ohne nähere Begründung ab. 3 Vgl. BGHSt. 44, 303 (323); Fiedler Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5 (24–27); Frister ZStW 106 (1994) S. 303 (308); Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (622–624); Steller Handbuch der Rechtspsychologie, S. 364 (370). 4 Lykken Psychophysiology 15 (1978) S. 137–142; ders. Psychological Bulletin 86 (1979) S. 47–53. 5 Siehe etwa Iacono/Patrick Clinical Assessment of Malingering and Deception, S. 361– 386; dies. The Handbook of Forensic Psychology, S. 613–658; Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86–98. 6 Siehe nur Lykken Tremor in the Blood, S. 281; näher zu der Impraktikabilität der Tatwissenstechnik im 4. Kapitel III 3 (S. 110–112).

II. Eine kurze Geschichte des ewigen psychophysiologischen Meinungsstreits 117

Die „Utah-Gruppe“ um David Raskin plädiert für eine praktische Anwendung der Vergleichsfragenmethode.7 So stellte Raskin bereits 1978 klar, dass es ihm um ihren praktischen Nutzen gehe:8 „Even if the rate of false positives is relatively high compared to false negatives, for practical application it is important to interpret that situation properly. When utilizing the outcome of a polygraph examination of a criminal suspect, the issue is not the rate of false positives and negatives, but it concerns the question of the level of confidence which can be placed in a deceptive or truthful outcome.“9

Es geht also auch den Befürwortern um den Beweiswert („the level of confidence which can be placed in a deceptive or truthful outcome“) und nicht allein um die Trefferquoten. Die Auffassung Raskins wird heute vor allem von Charles Honts und John Kircher geteilt.10 Die überschaubaren deutschen Stimmen haben sich weitgehend entweder der einen oder der anderen Gruppe angeschlossen. Als prominenteste Befürworter der Vergleichsfragenmethode gelten Udo Undeutsch, seine Schülerin Gisela Klein sowie Heinz und Susanne Offe.11 Undeutsch – immerhin der „Vater“ der Aussagepsychologie – sah vor allem aufgrund der Anwendungsschwächen der Aussageanalyse die Notwendigkeit, den Einsatz des Polygrafen zuzulassen. Für ihn waren die Vorteile, die der Polygraf zu bieten hat, ein „Glücksumstand“.12 Dass professionelle Aussagepsychologen wie Klaus Fiedler oder (mittlerweile) Max Steller sich der die Vergleichsfragenmethode ablehnenden Gruppe verbunden fühlen, ist deshalb wenig verwunderlich.13 Zu groß ist wohl die Angst, das eigene Geschäftsmodell ansonsten zu untergraben.14 7 Vgl. ursprünglich Raskin/Hare Psychophysiology 15 (1978) S. 126–136; Raskin Psychophysiology 15 (1978) S. 143–147. 8 Raskin Psychophysiology 15 (1978) S. 143 (145 f.). 9 „Selbst wenn die Quote der falsch-positiven im Vergleich zu den falsch-negativen Ergebnissen relativ hoch ist, ist es für die praktische Anwendung entscheidend, diese Ausgangslage richtig zu interpretieren. Bei der Verwertung des Ergebnisses einer polygrafengestützten [Glaubhaftigkeitsbegutachtung] eines Verdächtigen geht es nicht um die Quote der falsch-positiven oder falsch-negativen Ergebnisse, sondern um die Frage, welches Maß an Vertrauen in ein nicht-glaubhaftes oder glaubhaftes Ergebnis gesetzt werden kann.“ 10 Vgl. Raskin/Kircher Credibility Assessment, S. 63–129; Raskin/Honts Handbook of Polygraph Testing, S. 1–47; Honts/Thurber/Handler Applied Cognitive Psychology Special Issue (2021) S. 1–17. 11 Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45–126; Putzke/Schein-feld/Klein/Undeutsch ZStW 121 (2009) S. 607–644; H. Offe/S. Offe Praxis der Rechtspsychologie 11 (2001) S. 5–15. 12 Undeutsch/Klein Rechtspsychologie kontrovers, S. 67 (77 f.). 13 Fiedler/Schmid/Stahl Basic and Applied Social Psychology 24 (2002) S. 313–324; Steller Gericht und Expertise, S. 173–184; ders. Recht & Psychiatrie 36 (2018) S. 173–178; verwunderlich ist die ursprüngliche Euphorie des Aussagepsychologen zu Beginn seiner beruflichen Tätigkeit in seiner Habilitationsschrift von 1987. 14 Weniger vehement ablehnend Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (51): aufgrund der Rechtsprechung unzulässig, aber nicht unbrauchbar.

118

5. Kapitel: „Zahlen lügen nicht“

1. Das alte Problem der Repräsentativität von Laborstudien Während selbst Kritiker die Funktionsweise des Instruments und den Aufzeichnungsprozess nicht in Zweifel ziehen,15 beziehen sich die Meinungsverschiedenheiten vor allem auf die Validität. Zwar wird auch die polygrafengestützte Begutachtung als „komplexe diagnostische Prozedur“ verstanden, die sich einer testtheoretischen Analyse weitgehend entzieht.16 Doch wie bei der Aussageanalyse kommt es entscheidend auf die Validität an, wenn der praktische Nutzen ermittelt werden soll – zumal eine hohe Validität wiederum eine hinreichende Objektivität und Reliabilität impliziert. In der einschlägigen Literatur werden mit Verweis auf zahlreiche Labor- und Feldstudien durchschnittliche Trefferquoten von teilweise über 90 Prozent berichtet.17 Doch Anhänger der Minnesota-Gruppe lehnen die Ergebnisse von Laborstudien zur Abschätzung der Validität generell ab, da es ihnen an externer Validität mangele.18 Für Probanden stehe in einer derart künstlich geschaffenen Situation nicht viel auf dem Spiel. Die Folgen einer nicht bestandenen Begutachtung seien relativ belanglos und Unschuldige nicht durch die Angst vor einem falsch-positiven Ergebnis beunruhigt.19 Auf diesen zugegeben nicht ganz unberechtigten Einwand, auf den sich schließlich auch der Bundesgerichtshof berief,20 wurde bereits im Zusammenhang mit der experimentellen Forschung zur Aussagepsychologie eingegangen. Jedenfalls widerspricht eine derart kategorische Ablehnung von Laborstudien nicht nur dem heutigen wissenschaftlichen Forschungsverständnis.21 Denn immerhin berufen sich sowohl Befürworter der Aussagepsychologie als auch Anhänger der Minnesota-Gruppe hinsichtlich der Validität „ihrer“ direkten Methode, der Tatwissenstechnik, mangels brauchbarer Feldstudien vor allem auf: Laborstudien.22 15 Vgl. Dahle Psychologische Rundschau 54 (2003) S. 103 (105); Delvo, S. 54; Fiedler/ Schmid/Stahl Basic and Applied Social Psychology 24 (2002) S. 313 (315); Iacono/Patrick The Handbook of Forensic Psychology, S. 613 (614). 16 Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (161 f.). 17 National Research Council, S. xiii. 18 Iacono/Patrick The Handbook of Forensic Psychology, S. 613 (622). 19 Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (93 f.); Iacono/Patrick Clinical Assessment of Malingering and Deception, S. 361 (366); siehe auch National Research Council, S. 3, 120. 20 Vgl. BGHSt. 44, 308 (323) – nicht aber in seiner Grundsatzentscheidung zur aussagepsychologischen Glaubhaftigkeitsbegutachtung; Geipel Lügenerkennung, S. 58, weist zu Recht darauf hin, dass dieser Einwand „konsequenterweise dazu führen [müsste], dass dann die vom BGH unbeanstandete Aussageanalyse mittels der Realkennzeichenanalyse ebenfalls unanwendbar ist“. 21 Siehe erneut Anderson/Lindsay/Bushman Current Directions in Psychological Science 8 (1999) S. 3 (8 f.). 22 Zur Aussagepsychologie siehe 3. Kapitel V 1 b) (S. 65–68); zu den indirekten Methoden Ben-Shakhar/Elaad Handbook of Polygraph Testing, S. 87 (91 f.); dies. Journal of Applied

II. Eine kurze Geschichte des ewigen psychophysiologischen Meinungsstreits 119

Zur Glaubhaftigkeitsbegutachtung führten Hartwig und Bond 2014 eine Meta-Analyse durch unter anderem zur Frage der Verallgemeinerbarkeit von Laborstudien. Sie kamen zu dem Schluss, dass Laborstudien nicht per se abgelehnt werden können. Gerade fehlende Motivation und fehlende Angst vor dem Entdecktwerden wirkten sich bei Laborstudien nicht zwingend negativ aus.23 Kürzlich haben Honts, Thurber und Handler eine umfassende Meta-Analyse zur Vergleichsfragenmethode veröffentlicht, die dem analytischen Ansatz von Hartwig und Bond folgte. Die Autoren kamen zu dem Ergebnis, dass bei Laborstudien konkret zur polygrafengestützten Glaubhaftigkeitsbegutachtung keine Unterschiede hinsichtlich der Motivation statistisch nachweisbar sind – jedoch mit einer Einschränkung (Hervorhebungen des Verfassers):24 „However, our results do show that experiments without any explicit motivation underestimate the discriminative power of the [Comparison Question Technique]. The implication of our results with motivation suggest[s] that researchers who conduct [Comparison Question Technique] experiments should build in an explicit reward/punishment contingency, as experiments with such a contingency produce estimates that are closer to the effects sizes found in field settings although they appear to somewhat underestimate effect sizes in the field.“25

Somit sind Laborstudien nicht per se abzulehnen, sofern sie zumindest irgendeine Form von Belohnung oder Bestrafung integrieren. Weder Angst noch eine andere Art von Emotion sind jedoch Voraussetzung für die Funktionsfähigkeit der Vergleichsfragenmethode sowohl unter Labor- als auch Feldbedingungen.26 Auf diese durchaus vorhandenen Laborstudien werde ich sogleich näher eingehen.

2. Sind Feldstudien überhaupt geeignet? Jedenfalls waren sich ursprünglich beide Gruppen einig, dass Feldstudien am besten Aufschluss geben können über die Treffgenauigkeit und den praktischen Nutzen der Methode. Während anfängliche Feldstudien an dem bereits ausgeführten Problem eines nicht unabhängigen Außenkriteriums litten, liegen seit Psychology 88 (2003) S. 131 (134): immerhin und ausschließlich 80 Laborstudien; MacLaren Journal of Applied Psychology 86 (2001) S. 674 (677): ausschließlich 22 Laborstudien. 23 Hartwig/Bond Applied Cognitive Psychology 28 (2014) S. 661 (667 f.); zustimmend selbst Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (93). 24 Honts/Thurber/Handler Applied Cognitive Psychology Special Issue (2021) S. 1 (11). 25 „Unsere Ergebnisse zeigen jedoch, dass Laborstudien ohne konkrete Motivation die Unterscheidungskraft der Vergleichsfragenmethode unterschätzen. Die Schlussfolgerung unserer Ergebnisse zur Motivation legt nahe, dass Forscher, die Experimente mit der Vergleichsfragenmethode durchführen, eine explizite Belohnungs- oder Bestrafungskomponente einbauen sollten, da Experimente mit einer solchen Komponente zu Schätzwerten führen, die näher an den in Feldstudien gefundenen Effektgrößen liegen, auch wenn sie die Effektgrößen in der Praxis etwas zu unterschätzen scheinen.“ 26 Honts/Thurber/Handler Applied Cognitive Psychology Special Issue (2021) S. 1 (14); siehe auch American Polygraph Association Polygraph 40 (2011) S. 194 (197).

120

5. Kapitel: „Zahlen lügen nicht“

Ende der 1980er Studien vor, die eine höhere Qualität aufweisen und dennoch weitgehend hohe Trefferquoten ergeben.27 Diese waren und sind speziell darauf ausgelegt, den Anforderungen des Lykken-Lagers zu genügen. In der Folge lehnte die Minnesota-Gruppe Feldstudien aber per se ab. Sie vertritt nun die Position, dass valide Forschung zur Vergleichsfragenmethode generell undurchführbar sei. Als Argument dient ein Gedankenexperiment von Iacono aus dem Jahr 1991, auf das sich Iacono und Ben-Shakhar erst 2019 wieder berufen haben.28 Dabei handelt es sich um ein hypothetisches Beispiel, das zeigen soll, dass selbst wenn die Vergleichsfragenmethode eine Treffsicherheit von lediglich 50 Prozent hätte, der Bruchteil der geständnisverifizierten Untersuchungen, die Teil einer Feldstudie werden würden, dennoch eine hohe Scheingenauigkeit ausweisen würde. Dies ergebe sich daraus, dass bei den ausgewählten und ausgewerteten Gutachten der ursprüngliche Auswerter immer ein korrektes Ergebnis erzielt hätte, da seine fehlerhaften Untersuchungen gar nicht mitaufgenommen werden würden. Eine solche Studie wäre mangelhaft und nicht repräsentativ.29 Tabelle 6:

Einzeluntersuchung (N = 400) Fehlerhaft (N = 200)

Korrekt (N = 200)

False Positive False (N = 100) egative N (N = 100) Objektive Wahrheit Resultat Polygraf Geständnis möglich? Für Studie erheblich? Anzahl der Untersuchungsfehler Anzahl fehlerhafter Untersuchungen in Studie wiedergegeben Anzahl korrekter Untersuchungen in Studie wiedergegeben

Unschuldig Schuldig Durchgefallen Bestanden Nein Nein Nein Nein 100 100

True egative N (N = 100)

True Positive (N = 100)

Unschuldig Schuldig Bestanden Durchgefallen Nein Ja Nein Ja 0 0

0

0

0

0

0

0

0

Bis zu 100

27 Übersicht bei Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (169) und meine Übersicht unten 5. Kapitel IV 4 (S. 136 f.). 28 Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (89 f.); ursprünglich Iacono Advances in psychophysiology, S. 201 (202 f.); siehe auch Fiedler/Schmid/Stahl Basic and Applied Social Psychology 24 (2002) S. 313 (317). 29 Dazu auch Fiedler Psychologische Rundschau 54 (2003) S. 112 (113 f.): „StichprobenArtefakt“.

II. Eine kurze Geschichte des ewigen psychophysiologischen Meinungsstreits 121

Tabelle 6 zeigt die hypothetische Situation, in der die Vergleichsfragenmethode eine lediglich zufällige Treffsicherheit hat. Die Einzeluntersuchungen in der linken Tabellenhälfte – die 200 falsch-positiven und falsch-negativen Ergebnisse – würden laut Iacono niemals in eine Feldstudie einbezogen werden, da von den Unschuldigen, die durchfallen (false positives), nicht erwartet werden kann, dass sie ein falsches Geständnis ablegen, und die Schuldigen, die „bestanden“ haben (false negatives), kaum aufgefordert werden würden zu gestehen, geschweige denn ein Geständnis freiwillig ablegen würden. Von den 100 zutreffend als unschuldig eingestuften Personen (true negatives) würde keine berücksichtigt werden, weil es keinen Grund für sie gebe zu gestehen. Selbst bei den 100 zutreffend überführten Verdächtigen (true positives) gebe es keine Garantie, dass alle ein Geständnis ablegten. Obwohl tatsächlich 200 von 400 Gutachten fehlerhaft seien, fände sich keines von ihnen in der Feldstudie wieder. Und auch von den 200 korrekten Untersuchungen komme nur ein Bruchteil für eine Studie in Betracht, da es ausschließlich darauf ankomme, wie viele Geständnisse eingeholt werden könnten. Unabhängig davon, dass dieses hypothetische Gedankenexperiment auf grundsätzliche Kritik gestoßen ist,30 unterstreicht es lediglich das an anderer Stelle bereits behandelte Problem, wenn bei einer Feldstudie ausschließlich ein Geständnis als Außenkriterium herangezogen wird. Jedenfalls lässt es außer Acht, dass nicht nur Geständnisse der begutachteten Personen herangezogen werden können, sondern auch solche Unbeteiligter. Auf Letztere wird in Feldstudien teilweise zurückgegriffen, um das tatsächliche Vorhandensein einer subjektiv wahren Aussage und die tatsächliche Unschuld des Probanden nachzuweisen. Undeutsch sprach Geständnissen daher „nach beiden Seiten“ „einen recht hohen Grad an Sicherheit“ zu.31 Auch der Bundesgerichtshof räumte ein, dass Geständnisse zumindest eine gewisse Wahrscheinlichkeit für die Bestimmung der objektiven Wahrheit bieten können.32 Unabhängig davon wurde das „Geständnis-Problem“ mittlerweile in mehreren Feldstudien sogar vollständig umgangen, die der Bundesgerichtshof allerdings nicht berücksichtigt hatte oder bislang nicht berücksichtigen konnte (zu diesen sogleich). Dass der Meinungsstreit teils unseriöse Züge annimmt und die Fronten sich wohl unumkehrbar verhärtet haben, zeigen folgende „Argumente“: Manche der Lykken-Gruppe lehnen die Ergebnisse der Studien ab, da sie in Zeitschriften erschienen sind, die nach ihrer Auffassung nicht gut genug seien.33 Und selbst wenn das Journal grundsätzlich wissenschaftlich angesehen sei, finden 30

Zu dieser Honts/Thurber Polygraph & Forensic Credibility Assessment 48 (2019) S. 76 (78–83). 31 Undeutsch MschrKrim 62 (1979) S. 228 (236). 32 BGHSt. 44, 308 (325). 33 Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (89); siehe auch National Research Council, S. 3, 120.

122

5. Kapitel: „Zahlen lügen nicht“

sich andere Gründe und Vorwürfe. So „vermutete“ Lykken sogar Vetternwirtschaft bei der Publikation einer Feldstudie von Honts im Journal of General Psychology.34 Andere halten zum Beispiel die Veröffentlichung der Feldstudie von Mangan, Armitage und Adams für ein „Versagen“ des Peer-Review-Verfahrens – obgleich die Kritik im selben Band derselben Zeitschrift erschien.35 Iacono und Ben-Shakhar wollen eine Feldstudie von Mao, Liang und Hu – das chinesische Original wurde in der Physiology & Behavior auf Englisch 2015 erneut veröffentlicht36 – mangels Leserfreundlichkeit nicht anerkennen.37 Dass solche Unterstellungen bisweilen als beleidigend, arrogant und polemisch empfunden werden, überrascht nicht.38 Die Qualität der hier zitierten Journals und Zeitschriften sowie die Kompetenz der Autorenschaft sollen im Folgenden nicht infrage gestellt werden. Dennoch werden und können nicht alle publizierten Studien wiedergegeben und analysiert werden – teils aufgrund konstruktiver Kritik und um den hiesigen Rahmen nicht zu sprengen. Die vorhandene Fülle an Studien zur polygrafengestützten Begutachtung belegt aber zumindest eines: die Psychophysiologie wird wissenschaftlich um einiges intensiver untersucht als ihr aussagepsychologisches Pendant.

III. Trefferquoten einschlägiger Feldstudien und der Beweiswert des Polygrafen 1. Die Feldstudie des Bundesgerichtshofs Trotz dieser Studienvielfalt ziehen Gegner der polygrafengestützten Glaubhaftigkeitsbegutachtung – zumindest Gegner der Vergleichsfragenmethode – meist allein die von Patrick und Iacono 1991 durchgeführte Feldstudie heran, die für sie als eine der hochwertigsten und repräsentativsten gilt.39 Von ursprüng34

Lykken Tremor in the Blood, S. 134 f.; gemeint war die Studie von Honts The Journal of General Psychology 123 (1996) S. 309–324. 35 Verschuere/Meijer/Merckelbach Physiol Behav 95 (2008) S. 27 (28); siehe zudem Iacono/Patrick Clinical Assessment of Malingering and Deception, S. 361 (368); zur Studie Mangan/Armitage/Adams Physiol Behav 95 (2008) S. 17–23. 36 Mao/Liang/Hu Physiol Behav 140 (2015) S. 104–110; das Englisch ist tatsächlich nicht frei von Fehlern; mit etwas Geduld lassen sich die Studie und die Berechnungen aber durchaus verstehen. 37 Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (93); zu Recht dagegen Ginton Journal of Investigative Psychology and Offender Profiling 17 (2020) S. 296 (306). 38 Honts/Thurber Polygraph & Forensic Credibility Assessment 48 (2019) S. 76 (77); Vehrs Praxis der Rechtspsychologie 11 (2001) S. 16 (23). 39 Patrick/Iacono Journal of Applied Psychology 76 (1991) S. 229–238; vgl. nur Lykken Integrative Physiological and Behavioral Science 26 (1991) S. 214 (216); Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (90); Iacono/Patrick Clinical Assessment of Malingering and Deception, S. 361 (366); Vrij Detecting Lies, S. 327 f.

123

III. Trefferquoten einschlägiger Feldstudien

lich 402 polygrafengestützten Gutachten wurden 276 ausgewertet. Von diesen konnten wiederum 98 mit „maximaler Sicherheit“ anhand eines unabhängigen Außenkriteriums verifiziert werden.40 In der Studie wurden sodann die Trefferquoten der ursprünglichen Untersucher mit den von neun unabhängigen, mit der Methode vertrauten Auswertern verglichen („mean blind rescores“). Unter Ausschluss der nicht eindeutigen, unentscheidbaren Ergebnisse („inconclusives“) lag die Trefferquote bei schuldigen bei 98 Prozent, bei unschuldigen Probanden nur bei 55 Prozent. Auf diese Studie berief sich unter anderem Fiedler in seinem Gutachten für den Bundesgerichtshof, um seine ablehnende Haltung gegenüber der Vergleichsfragenmethode zu begründen.41 Tabelle 7: Patrick/Iacono Journal of Applied Psychology 76 (1991) S. 229 (234 f.) – Auswertung unabhängiger Auswerter: schuldig (N = 49)

unschuldig (N = 20)

Beweiswert

positiv (unglaubwürdig)

48

9

68,5 %

negativ (glaubwürdig)

1

11

96,5 %

98 %

55 %

Ergebnis

Trefferquote

Status

Doch auch hier kommt es nicht nur auf die Trefferquoten an, sondern wieder auf den konkreten Beweiswert. Da der Bundesgerichtshof sich vor allem auf das Gutachten von Fiedler berief, der wiederum die besagte Studie als Negativbeweis angeführt hatte, ist der Bundesgerichtshof nicht nur wie Dettenborn meint, „dem Gutachter Fiedler aufgesessen“.42 Vielmehr hatten beide – der Bundesgerichtshof und Fiedler – die Studie falsch beziehungsweise unvollständig gelesen. Denn geht es um die Frage nach dem „indiziellen Beweiswert“ einer Methode,43 um ihren praktischen Nutzen, liegt die Antwort eben nicht allein bei den Trefferquoten.44

40 Patrick/Iacono Journal of Applied Psychology 76 (1991) S. 229 (231 a. E.): „all cases verified with maximum certainty, that is, all independently verified cases plus those examinerverified cases that met criteria for maximum certainty“ (Hervorhebungen des Verfassers). 41 Fiedler Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5 (27). 42 Dettenborn FPR 2003, 559 (561); kritisch auch Putzke ZJS 2011, 557 (561); Vehrs Praxis der Rechtspsychologie 11 (2001) S. 16 (20): „Bedauerlicherweise hat sich der BGH hier die Auffassung eines Gutachters zu eigen gemacht, die ansonsten von niemandem geteilt wird“. 43 Vgl. BGHSt. 44, 308 (322). 44 Dazu ausführlich im 3. Kapitel V 2 (S. 68–70); das verkennen auch Rill/Vossel NStZ 1998, 481 (484).

124

5. Kapitel: „Zahlen lügen nicht“

Legt man diese „maximal sicheren“ Trefferquoten von Patrick und Iacono zugrunde, ist den Autoren zwar dahingehend zuzustimmen, dass die polygrafengestützte Begutachtung ein hohes Risiko falsch-positiver Ergebnisse birgt. Das ist letztendlich der Methodik geschuldet und der von Befürwortern nicht bestrittenen Tatsache, dass es kein spezifisches Lügenmuster gibt.45 Da auch ein Unschuldiger stärker auf eine tatrelevante Frage reagieren kann, etwa aus Angst vor einer Falschverurteilung, werden sich die falsch-positiven Befunde erwartungsgemäß häufen. Eine Trefferquote bei Unschuldigen von 55 Prozent liegt zwar unwesentlich über dem Zufallswert, sagt aber wiederum nichts aus über den diagnostischen Nutzen der polygrafengestützten Begutachtung insgesamt. Die auf die False Positive Rate versteifte Kritik lässt außer Betracht, dass andererseits nur wenige bewusst wahrheitswidrige Aussagen fälschlicherweise als glaubhaft klassifiziert werden.46 Daraus ergibt sich – wie die besagte Feldstudie belegt – eine nur geringe False Negative Rate bei gleichzeitig hoher Sensitivität. Erzielt ein Proband also ein negatives Ergebnis, spricht viel dafür, dass seine Aussage auch tatsächlich subjektiv wahr ist. Mit anderen Worten: Je höher die Sensitivität, desto besser eignet sich die Methode als Entlastungsindiz. Entscheidend ist auch hier der konkrete Beweiswert dieses negativen Ergebnisses, nämlich wie hoch die Wahrscheinlichkeit ist, dass der Proband die Wahrheit sagt unter der Bedingung, dass ein negatives Ergebnis vorliegt – die Glaubhaftigkeit der Aussage also zu Recht bejaht wird. Selbst (oder gerade) unter diesen Voraussetzungen ergibt sich ein Likelihood-Quotient eines negativen Ergebnisses von LRN = 27,5 und somit ein Beweiswert eines negativen Ergebnisses von 96,5 Prozent.47 Für den Fall, dass der Beschuldigte ein solches vorlegen kann, würde ein Richter, wenn er das negative Gutachtenergebnis übernimmt, den Beschuldigten zu 96,5 Prozent zu Recht freisprechen. Einem solchen Resultat jeglichen indiziellen Beweiswert abzusprechen, ist daher zumindest begründungsbedürftig. In meiner Korrespondenz mit Charles Honts wies mich dieser darauf hin, auch den Beweiswert eines positiven Ergebnisses nicht zu unterschätzen. Und tatsächlich: Legt man die Zahlen von Patrick und Iacono und damit einen Likelihood-Quotienten von LRP = 2,18 zugrunde, liegt dieser immerhin bei 68,5 Prozent. Das heißt: In mehr als zwei Drittel aller Fälle, in denen der Gutachter mithilfe des Polygrafen zu dem Ergebnis kommt, die Aussage sei bewusst wahrheitswidrig, stimmt dieses mit der Realität überein. Angenommen man würde den Beschuldigten untersuchen und käme zu einem positiven, ihn also belastenden Ergebnis, hieße das aber, dass dieses Ergebnis in über 30 Prozent der Fälle falsch ist. Ein mit dem Zweifelssatz und der Unschuldsvermutung 45 46

Siehe 4. Kapitel II 2 (S. 94 f.). Siehe aber Iacono Handbook of Psychophysiology, S. 565 (568); Rill/Vossel NStZ 1998, 481 (484). 47 Zur Berechnung siehe 3. Kapitel VI 5 (S. 81–85).

125

III. Trefferquoten einschlägiger Feldstudien

schwer zu vereinbarendes Ergebnis, sollte der Richter seine Verurteilung ausschließlich auf diesen Wert stützen. Begutachtet man jedoch den Belastungszeugen und erzielt dieser ein positives Ergebnis, ist die prozessuale Ausgangslage eine andere: In 68,5 Prozent der Fälle spricht dieses Ergebnis dann für eine bewusst wahrheitswidrige Falschbelastung. Einen „indiziellen Beweiswert“ kann man somit weder dem einen noch dem anderen Fall absprechen – vorausgesetzt man liest die Zahlen richtig.

2. Ein zweites Baumdiagramm Veranschaulichen lässt sich der jeweilige Beweiswert wieder anhand eines Baumdiagramms: 1.000 Aussagen 50 %

50%

500 subjektiv wahr 55 % 275 zutreffend

500 erfunden 45 %

225 falsch

98% 490 zutreffend

2% 10 falsch

490/715 = 68,5 % 275/285 = 96,5%

Hier gehen wir entsprechend der strafprozessualen Anfangswahrscheinlichkeit von jeweils 500 subjektiv wahren (links) und bewusst wahrheitswidrigen Aussagen (rechts) aus. Nach den Trefferquoten gemäß Patrick und Iacono werden subjektiv wahre zu 55 (Spezifität oder True Negative Rate), bewusst wahrheitswidrige Aussagen zu 98 Prozent (Sensitivität oder True Positive Rate) als solche klassifiziert. Von den 500 tatsächlich subjektiv wahren Aussagen werden somit 275 zutreffend als solche erkannt. Bei den bewusst wahrheitswidrigen Aussagen werden zehn fälschlicherweise als glaubhaft eingestuft: eine False Negative Rate von zwei Prozent. Da von den insgesamt 285 Aussagen, die als glaubhaft eingestuft werden, 275 richtig erkannt worden sind, liegt der Beweiswert eines negativen Ergebnisses bei 96,5 Prozent: 275/285. Entsprechend liegt der Beweiswert eines positiven Ergebnisses („die Aussage ist nicht glaubhaft“) bei etwa 68,5 Prozent: 490/715.

126

5. Kapitel: „Zahlen lügen nicht“

3. Vom Bundesgerichtshof nicht berücksichtigte „high quality field studies“ Die Studie von Patrick und Iacono ist nicht die einzige, die den praktischen Nutzen der polygrafengestützten Glaubhaftigkeitsbegutachtung anhand von realen Fällen belegt. Dass die polygrafengestützte Begutachtung sowohl in die eine wie in die andere Richtung einen nicht zu unterschätzenden Beweiswert hat, zeigt ein Blick auf die Übersicht bei Honts und Schweinle zu insgesamt fünf Studien, die die Mindestvoraussetzungen aussagekräftiger Feldstudien zu polygrafengestützten Glaubhaftigkeitsbegutachtungen erfüllen: sogenannte high quality field studies.48 In diesen Studien – darunter auch die von Patrick und Iacono – wurde der Wirklichkeitsstatus anhand strenger Außenkriterien definiert. „Schuldig“ – oder besser: „bewusst wahrheitswidrig“ – wurde definiert durch ein vollumfängliches Geständnis, das während des gesamten Verfahrens weder eingeschränkt noch widerrufen worden ist und das durch nachträglich gewonnene eindeutige Sachbeweise bestätigt worden ist.49 Die Definition für „Unschuld“ beziehungsweise „subjektiv wahr“ fordert: Der Beschuldigte hat ständig und uneingeschränkt bestritten, die Straftat begangen zu haben, ein anderer hat später gestanden, und dieses Geständnis wurde durch eindeutige Sachbeweise bestätigt.50 Die physiologischen Messwerte wurden jeweils nachträglich durch unabhängige und mit der Auswertungstechnik vertraute Personen durchgeführt. Vier dieser fünf optimierten Feldstudien wurden vor der Entscheidung des Bundesgerichtshofs 1998 nicht nur durchgeführt, sondern auch veröffentlicht; sie blieben allerdings sowohl im Urteil als auch in den Gutachten unerwähnt.51 Bei der Studie von Honts und Raskin (1988) wurde sowohl die Probable-LieTechnik als auch die Directed-Lie-Technik untersucht; anders als bei der Übersicht von Honts und Schweinle sind hier beide Resultate wiedergegeben. Eine eigene Durchsicht der fünf Feldstudien ergab für die Studie von Raskin et al. (1998) andere Werte – möglicherweise lag ein Fehler vor bei der ursprünglichen Übertragung in die Übersicht.52 Die korrigierten Zahlen sind kursiv gesetzt. 48 Vgl. Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (168 f.); zuvor Honts The Detection of Deception in Forensic Contexts, S. 103 (111); siehe auch Undeutsch Psychologische Rundschau 54 (2003) S. 115 (116). 49 So konnte das oben genannte „Geständnisproblem“ weitgehend umgangen werden; Honts The Detection of Deception in Forensic Contexts, S. 103 (110): „Confessions substantiated by physical evidence are presently the best criterion available.“ 50 Undeutsch Psychologische Rundschau 54 (2003) S. 115 (116). 51 Auf diese Studien berufen sich auch Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (624) mit Verweis auf Raskin/Honts Handbook of Polygraph Testing, S. 1 (32); jedoch handelt es sich (anders als die Autoren angeben) nicht um Studien nach der BGH-Entscheidung. 52 Siehe Raskin/Kircher/Honts/Horowitz A Study of the Validity of Polygraph Examinations in Criminal Investigation, S. 29 f.; wiederveröffentlicht in Polygraph & Forensic Credibility Assessment 48 (2019) S. 10 (22 f.).

127

III. Trefferquoten einschlägiger Feldstudien

Tabelle 8: Trefferquoten von unabhängigen Auswertern hochwertiger Feldstudien (mit und ohne unentscheidbaren Klassifikationen) Studie

Unschuldig n

% richtig % falsch % unentsch.

% korrekt

6

83

0

17

100

13 13 15

62 85 93

15 0 7

23 15 0

80 100 93

37 26 26

30 61 52

24 8 9

46 31 39

55 89 87,5

Durchschnitt

69

9

22

86,2

Korrigierter Durchschnitt

67,5

9,2

23,3

85,9

Honts

(1996)53 (PLT)54

Honts/Raskin (1988) Honts/Raskin (1988) (DLT) Mangan/Armitage/Adams (2008)55 Patrick/Iacono (1991)56 Raskin et al. (1988)57 Raskin et al. (1988)58

Schuldig n

% richtig % falsch % unentsch.

% korrekt

Honts (1996)

7

100

0

0

100

Honts/Raskin (1988) (PLT) Honts/Raskin (1988) (DLT) Mangan/Armitage/Adams (2008) Patrick/Iacono (1991) Raskin et al. (1988) Raskin et al. (1988)

12 12 15

92 92 100

0 8 0

8 0 0

100 92 100

52 37 37

92 73 65

2 0 4

6 27 31

98 100 92

Durchschnitt

91,5

1,7

6,8

98,3

Korrigierter Durchschnitt

90,2

2,3

7,5

97

53 Honts The Journal of General Psychology 123 (1996) S. 309 (320); die Stichprobe wurde durch Geständnisse und Sachbeweise bestätigt. 54 Honts/Raskin Journal of Police Science and Administration 16 (1988) S. 56 (59 f.); Tabelle 8 zeigt sowohl die Trefferquoten der „klassischen“ Vergleichsfragenmethode (der Probable-Lie-Technik) als auch die der ebenfalls überprüften Directed-Lie-Technik. 55 Mangan/Armitage/Adams Physiol Behav 95 (2008) S. 17 (23); als Außenkriterium dienten allerdings (soweit ersichtlich) allein Geständnisse (S. 21); kritisch daher Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (90); Verschuere/Meijer/Merckelbach Physiol Behav 95 (2008) S. 27 (28). 56 Patrick/Iacono Journal of Applied Psychology 76 (1991) S. 229 (234 f.). 57 Zitiert nach Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (169). 58 Die Ergebnisse stammen aus einer unabhängigen Auswertung der anhand eines unabhängigen Außenkriteriums verifizierten Fälle („results from an independent evaluation of pure verification cases“); zu der Auswahl der Stichprobe siehe die Originalstudie Raskin/Kircher/Honts/Horowitz, S. 13–16.

128

5. Kapitel: „Zahlen lügen nicht“

Legt man letztere zugrunde, ergeben sich nach diesen optimierten Feldstudien zwar keine perfekten, aber immerhin deutlich überzufällige Trefferquoten von 90,2 für positive und 67,5 Prozent für negative Untersuchungsergebnisse, die jeweils von unabhängigen Auswertern erzielt wurden. Bei dieser Lesart werden zudem die unentscheidbaren Fälle als Fehler gewertet, so dass die Trefferquoten weiter nach unten korrigiert werden. Unter anderem Honts hält einen solchen Maßstab aus zwei Gründen für zu streng: Zwar entspreche ein solches Vorgehen wissenschaftlicher Praxis, da so jegliche Subjektivität des Auswerters ausgeschlossen und Objektivität garantiert werden könne. Jedoch sage nicht der unabhängige, sondern der ursprüngliche Gutachter im Gerichtsverfahren aus. Die Trefferquoten der unabhängigen Auswerter hätten somit nicht die für die Praxis erforderliche, gleiche Aussagekraft wie die im Ergebnis sogar höheren ursprünglichen Trefferquoten.59 Dass die ursprünglichen Gutachter jeweils höhere Trefferquoten erzielen konnten, ist zwar zutreffend, soll aber an dieser Stelle nicht weiter vertieft werden. Das Heranziehen nur unabhängig erzielter Trefferquoten garantiert jedenfalls ein höheres Maß an Objektivität und begegnet dem von Kritikern oft erhobenen Einwand einer möglichen subjektiven Kontamination („confirmation bias“).60 Die zusätzliche Kritik daran, auch unentscheidbare Fälle als Fehler zu werten, lässt sich allerdings hören. So entspricht es einerseits kunstgerechter wissenschaftlicher Forschung, unentscheidbare Resultate zu eliminieren, was selbst Kritiker der Vergleichsfragenmethode eingestehen.61 Die Fälle, in denen nach der polygrafengestützten Untersuchung keine Entscheidung über den subjektiven Wahrheitsgehalt einer Aussage getroffen werden kann, sind nämlich weder richtig noch falsch.62 Zum anderen spiegelt ein solches Vorgehen den Sinn und Zweck einer solchen Kategorie bei der polygrafengestützten Glaubhaftigkeitsbegutachtung. Das numerische Auswertungssystem sieht einen unentscheidbaren Bereich („inconclusive zone“) wie oben ausgeführt ausdrücklich vor. Dadurch soll gerade die Fehleranfälligkeit sowohl in die eine als auch in die andere Richtung reduziert werden. Nur wenn die numerische Auswertung außerhalb dieses „neutralen“ Bereichs liegt, darf das Ergebnis überhaupt gewertet werden. Die inconclusive zone dient daher als Art methodenimmanenter Puffer, der einer Fehlerquote gerade vorbeugen soll.63 Das betont Matte mehr als einmal in 59 Honts The Detection of Deception in Forensic Contexts, S. 103 (112); siehe auch Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (622); Raskin/Kircher Credibility Assessment, S. 63 (83). 60 Vgl. etwa Ben-Shakhar Handbook of Polygraph Testing, S. 103 (111); Iacono Handbook of Psychophysiology, S. 565 (572). 61 Vgl. nur Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (92). 62 Delvo, S. 38; Undeutsch Psychologische Rundschau 54 (2003) S. 115 (116); Honts The Detection of Deception in Forensic Contexts, S. 103 (123) bringt es auf den Punkt: unentscheidbare Fälle sind gar kein Ergebnis. 63 Vgl. Ginton Psychology, Crime and Law 19 (2013) S. 577 (582); Matte, S. 120, 196.

III. Trefferquoten einschlägiger Feldstudien

129

seinem 773 Seiten umfassenden Handbuch zur polygrafengestützten Glaubhaftigkeitsbegutachtung (Hervorhebungen des Verfassers): „This scoring system provides the most objective and accurate analysis of the physiological data recorded on polygraph charts, and the required minimum score threshold provides an inconclusive safeguard against false positives and negatives.“64 Und auf den Punkt gebracht auf Seite 120: „It is the use of the inconclusive range that gives the field examiner the opportunity to be fair and safe, and say ‚I don’t know.‘“65 Somit kann von keinem Fehler gesprochen werden, wenn das Auswertungsergebnis innerhalb dieses Bereichs liegt. Ein unentscheidbares Resultat etwa bei der Begutachtung des Beschuldigten darf weder zu seinen Lasten66 noch – was manche Autoren annehmen – zu seinen Gunsten gewertet werden.67 Denn es trifft schlicht keine Aussage zu dem subjektiven Wahrheitsgehalt der Aussage oder zur Schuld des Probanden. Es ist lediglich die methodische Grenze der polygrafengestützten Begutachtung erreicht – vergleichbar etwa mit der Situation bei der aussagepsychologischen Begutachtung, dass kein ausreichendes Aussagematerial vorliegt. Auch wenn die Trefferquoten dadurch erhöht werden, kann nicht von einer „künstlichen Inflation“ die Rede sein. Der unentscheidbare Bereich ist vielmehr Teil einer konservativen Auswertung, die voreilige Schlüsse verhindern soll, jedenfalls solange die aufgezeichneten Informationen nicht eindeutig sind.68 Ein solches Vorgehen hat logischerweise die Folge, dass ein höher definierter Schwellenwert zu mehr unentscheidbaren Klassifikationen führt – allerdings zu Gunsten einer geringeren Gefahr einer fehlerhaften Zuordnung und damit einer höheren Zuverlässigkeit.69 Und unabhängig davon, dass ein solcher Schwellenwert für und nicht gegen die Praktikabilität der Methode spricht, geben selbst Kritiker zu, dass der Anteil unentscheidbarer Klassifikationen im Durchschnitt verhältnismäßig gering ist.70 Lässt man die unentscheidbaren Fälle nun außen vor, ergeben sich anhand der optimierten Feldstudien durchschnittliche Tref64

Matte, S. 291 f.: „Dieses Auswertungssystem bietet die objektivste und genaueste Analyse der physiologischen Daten, die der Polygraf aufzeichnet; und die erforderliche Mindestpunktzahl bietet einen Unentscheidbar-Schutz vor falsch-positiven und falsch-negativen Ergebnissen.“ 65 „Das Verwenden des unentscheidbaren Bereichs erlaubt dem Gutachter in der Praxis, fair und sicher zu sein und zu sagen: ‚Ich weiß es nicht‘.“ 66 Anderer Ansicht, aber wieder ohne nähere Begründung Rill/Vossel NStZ 1998, 481 (485). 67 So aber Bonpasse Polygraph 42 (2013) S. 112 (113); MacLaren Journal of Applied Psychology 86 (2001) S. 674 (677). 68 Ginton Psychology, Crime and Law 19 (2013) S. 577 (587); Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (164 f.) halten den Streit darüber, ob unentscheidbare Klassifikationen einzubeziehen seien, daher zu Recht für „müßig“. 69 Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (151). 70 Iacono/Patrick The Handbook of Forensic Psychology, S. 613 (618): „about 10 % of CQTs end with inconclusive outcomes.“

130

5. Kapitel: „Zahlen lügen nicht“

ferquoten der unabhängigen Auswerter von 97 und 85,9 Prozent (siehe jeweils die rechte, grauhinterlegte Spalte in Tabelle 8).71 – Der Vollständigkeit halber sei angemerkt, dass sich diese Werte weitgehend mit denen anderer Feldstudien decken, obgleich sie nicht als high-quality field studies anerkannt sind. So kam zum Beispiel Matte bei seiner Analyse weiterer Feldstudien, bei denen die Messungen von unabhängigen Auswertern vorgenommen wurden, zu durchschnittlichen Trefferquoten von 93 und 83 Prozent.72

IV. Neue Forschung zur Vergleichsfragenmethode 1. Die Review des National Research Councils Dieses Ergebnis deckt sich weitgehend mit dem des National Research Councils, bestehend aus 14 führenden amerikanischen Wissenschaftlern ohne psychophysiologischen Hintergrund. Die „Systematic Review“ des National Research Councils 2003 – und somit nach BGHSt. 44, 308 – gilt als eine der umfassendsten Analysen der psychophysiologischen, polygrafengestützten Glaubhaftigkeitsbegutachtung.73 Sie wurde ursprünglich in Auftrag gegeben, um den Einsatz des Polygrafen im arbeitsrechtlichen Zusammenhang bei staatlichen Einstellungen zu bewerten („government employment screenings“). Da das Komitee dazu kaum Forschung fand, richtete es seinen Blick auf den Polygrafen im strafrechtlichen Kontext („specific incidents“). Von ursprünglich 194 Studien wertete das National Research Council insgesamt sechs Feld- und 37 Laborstudien zur Vergleichsfragenmethode aus, die die zuvor festgelegten wissenschaftlichen Mindeststandards erfüllten – zum Beispiel ein weitgehend unabhängiges Außenkriterium vorweisen konnten (Hervorhebungen des Verfassers):74 „The polygraph studies that met our criteria for consideration do not generally reach the high levels of research quality desired in science. Only 57 of the 194 studies (30 percent) that we examined both met minimal standards of scientific adequacy and presented useful data for quantifying criterion validity.“75

71

5. Kapitel III 3 (S. 127). Matte, S. 139. 73 Vgl. Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (87). 74 National Research Council, S. 107 f., 340 f.; die Stichprobe enthielt auch Studien zur Tatwissenstechnik, S. 341; ausführlich zur Auswahl der Stichprobe, S. 325–333. 75 „Die Polygrafen-Studien, die unseren Kriterien entsprachen, erreichen im Allgemeinen nicht das hohe Niveau der in der Wissenschaft angestrebten Forschungsqualität. Nur 57 der 194 von uns untersuchten Studien (30 Prozent) erfüllten die Mindestanforderungen wissenschaftlicher Qualität und lieferten nützliche Daten zur Quantifizierung der Kriteriumsvalidität.“ 72

IV. Neue Forschung zur Vergleichsfragenmethode

131

In der Sekundärliteratur ist oft von sieben Feldstudien zur Vergleichsfragenmethode zu lesen.76 Die Feldstudie von Suzuki et al. betraf jedoch eine Unterart der Tatwissenstechnik (sogenannter Peak-of-Tension-Test), die unter anderem in Japan zum Einsatz kommt.77 Das National Research Council gab die Genauigkeit der Vergleichsfragenmethode weder in Prozentzahlen an, noch unterschied es zwischen Sensitivität und Spezifität. Ermittelt wurde eine Art Gesamtgenauigkeitsrate anhand einer sogenannten ROC-Kurve. Die in der Review angegebene Zahl 0,89 ist der Median der Fläche unter der ROC-Kurve für die sieben Feldstudien und keine Genauigkeitsrate.78 Selbst das National Research Council warnte daher von einer vorschnellen Verwendung der Werte als Zuverlässigkeitsindikator.79 Ohne hier näher auf die Berechnungsmethode einzugehen, schlussfolgerte das National Research Council, dass – zumindest im strafrechtlichen Kontext – bewusst wahrheitswidrige von subjektiv wahren Aussagen mit überzufälligen, wenn auch nicht perfekten Trefferquoten unterschieden werden können.80 Das Ergebnis im Wortlaut (Hervorhebungen des Verfassers):81 „Notwithstanding the limitations of the quality of the empirical research and the limited ability to generalize to real-world settings, we conclude that in populations of examinees such as those represented in the polygraph research literature, untrained in countermeasures, specific-incident polygraph tests can discriminate lying from truth telling at rates well above chance, though well below perfection. Because the studies of acceptable quality all focus on specific incidents, generalization from them to uses for screening is not justified. Because actual screening applications involve considerably more ambiguity for the examinee and in determining truth than arises in specific-incident studies, polygraph accuracy for screening purposes is almost certainly lower than what can be achieved by specific-incident polygraph tests in the field.“82 76 77

Vgl. nur Honts The Detection of Deception in Forensic Contexts, S. 103 (112). Suzuki/Ohnishi/Matsuno/Arasuna Polygraph 8 (1979) S. 242–252; zum Peak-of-Tension-Test Rill Psychophysiologie, S. 48; National Research Council, S. 258; Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (146). 78 Vgl. National Research Council, S. 125; kritisch zur Aussagekraft der Review daher American Polygraph Association Polygraph 40 (2011) S. 194 (205); Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (162); Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (88). 79 National Research Council, S. 148; nach Honts/Thurber Polygraph & Forensic Credibility Assessment 48 (2019) S. 76 (77) gilt ein Wert zwischen 0,80 und 0,90 als gut, einer über 0,90 als exzellent. 80 National Research Council, S. 4, 214; so in ihrem Fazit auch Meijer/Verschuere Finding the truth in the courtroom, S. 209 (214): „[Even] though the exact accuracy remains unknown, the CQT performs above chance level, meaning its outcome contains diagnostic information about deception“ (Hervorhebungen des Verfassers). 81 National Research Council, S. 4. 82 „Ungeachtet der eingeschränkten Qualität der empirischen Forschung und der begrenzten Möglichkeit, diese allgemein auf reale Situationen zu übertragen, kommen wir zu dem Schluss, dass in Populationen von Probanden, wie sie in der Forschungsliteratur zum Polygrafen vertreten sind und die nicht in Gegenmaßnahmen geschult sind, polygrafengestützte

132

5. Kapitel: „Zahlen lügen nicht“

Perfekt ist die polygrafengestützte Glaubhaftigkeitsbegutachtung nicht. Das hat das National Research Council eindeutig festgestellt, was dazu führte, dass sich sowohl Gegner als auch Befürworter der Vergleichsfragenmethode auf die Review beriefen.83 Perfektion zu verlangen, würde die Anforderungen an den praktischen Nutzen einer Methode, an den „indiziellen Beweiswert“ aber überspannen. Weder behaupten Befürworter, die polygrafengestützte Begutachtung liege immer richtig, noch bedarf es grundsätzlich und konkret bei anderen Methoden zur Glaubhaftigkeitsbestimmung eines solchen Maßstabes. Jedenfalls zur Bestimmung des Beweiswerts genügen überzufällige Trefferquoten. Eine Indizwirkung lässt sich zumindest dann nicht (mehr) abstreiten. Im Anschluss an den Bericht des National Research Councils führte auch die American Polygraph Association 2011 eine Studie über die wissenschaftlichen Grundlagen der Psychophysiologie durch. Sie umfasste 45 Experimente und Umfragen, die in 38 verschiedenen Feld- und Laborstudien veröffentlicht wurden, einschließlich der Ergebnisse von 295 Gutachtern mit insgesamt 11.737 Auswertungen.84 Vierzehn verschiedene Polygrafen-Techniken – sowohl direkte als auch indirekte Methoden – konnten anhand mehrerer Studien, die die qualitativen und quantitativen Anforderungen der Meta-Analyse erfüllten – weitgehend bestätigt werden (Hervorhebungen des Verfassers):85 „The present evidence supports an argument that [Psychophysiological Detection of Deception] testing can provide both test sensitivity to deception and test specificity to truthtelling at rates that are significantly greater than chance when conducted and interpreted with the assumptions of criterion independence as well as non-independence among the test questions. Evidence shows that all [Psychophysiological Detection of Deception] techniques included in the meta-analysis provide test sensitivity at rates that are significantly greater than chance. However, the present evidence is insufficient to support that every […] technique is capable of providing test specificity to truth-telling at rates that are significantly greater than chance.“86 Verfahren in bestimmten Fällen durchaus Lügen von der Wahrheit unterscheiden können, und zwar mit Trefferquoten, die weit über dem Zufall liegen, auch wenn sie bei Weitem nicht perfekt sind. Da die qualitativen Studien alle Vorfälle [mit strafrechtlichem Kontext] betreffen, ist eine Verallgemeinerung auf Screening-Anwendungen nicht gerechtfertigt. Da Screening-Anwendungen für den Probanden und bei der Wahrheitsfindung mit wesentlich mehr Unklarheiten verbunden sind als bei Studien zu Vorfällen [mit strafrechtlichem Kontext], ist die Genauigkeit von Polygrafen für Screening-Zwecke mit ziemlicher Sicherheit geringer als das, was bei polygrafengestützten Verfahren bei Vorfällen [mit strafrechtlichem Kontext] in der Praxis erreicht werden kann.“ 83 Vgl. Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (88); Honts The Detection of Deception in Forensic Contexts, S. 103 (110); Nelson Polygraph 44 (2015) S. 28 (42). 84 American Polygraph Association Polygraph 40 (2011) S. 194 (199). 85 American Polygraph Association Polygraph 40 (2011) S. 194 (201, 259). 86 „Die vorliegenden Daten bestätigen, dass die Methode der psychophysiologischen Glaubhaftigkeitsbegutachtung sowohl die Sensitivität […] als auch die Spezifität […] der Methode anhand von Trefferquoten nachweisen kann, die deutlich über dem Zufall liegen, vorausgesetzt die Methode wurde unter den Annahmen der Kriterienunabhängigkeit und der

IV. Neue Forschung zur Vergleichsfragenmethode

133

Konkret bei der Probable-Lie-Technik wertete die American Polygraph Association sieben Studien aus und kam unter Ausschluss der unentscheidbaren Klassifikationen zu Trefferquoten von 94,4 und 91,6 Prozent.87 Zur DirectedLie-Technik lagen der American Polygraph Association die bereits angesprochene Feldstudie von Honts und Raskin sowie die Laborstudie von Horowitz et al. vor mit einer durchschnittlichen Trefferquote von 90 Prozent.88

2. Ein algebraischer Ansatz Den hochwertigen Feldstudien einerseits und den vom National Research Council und der American Polygraph Association herangezogenen Studien andererseits haftet jedoch weiterhin das Problem eines nicht (ganz) unabhängigen Außenkriteriums an. Wenn auch die Feldstudien zum Beispiel von Blackwell (1998), Jayne (1990) oder von Matte und Reuss (1989) die Mindestvoraussetzungen des National Research Councils erfüllten und jeweils hohe Trefferquoten vorweisen konnten,89 berücksichtigen sie ebenfalls unter anderem ein Geständnis als Außenkriterium.90 Das Zwischenfazit des National Research Councils daher:91 „Although we excluded studies that lack independent evidence of truth, field study procedures still tend to overestimate the accuracy of the polygraph.“92 Avital Ginton verfolgt daher einen Ansatz, der die Notwendigkeit eines studienexternen Außenkriteriums, also eines Geständnisses oder anderer Beweise, eliminiert – mit entsprechendem Aufwand. Von ursprünglich 250 bezog Ginton 64 gepaarte Polygrafenuntersuchungen ein, also insgesamt 128 Einzelbegutachtungen, bei denen jeweils zwei Probanden widersprechende Aussagen machten und ausgeschlossen werden konnte, dass eine zum Beispiel auf false memories beruhte. Es lagen folglich 64 Aussage-gegen-Aussage-Konstellationen vor, bei denen beide Aussagepersonen unabhängig voneinander psychophysiologisch mit Hilfe eines Polygrafen begutachtet worden waren. Die StichNicht-Unabhängigkeit der Testfragen durchgeführt und ausgewertet. Es konnte nachgewiesen werden, dass alle in der Meta-Analyse einbezogenen psychophysiologische Glaubhaftigkeitsverfahren eine Sensitivität aufweisen, die deutlich über dem Zufall liegt. Allerdings reicht dieser Nachweis nicht aus, um zu belegen, dass jedes […] Verfahren eine Spezifität für die Wahrheitsfindung mit Quoten liefern kann, die deutlich über dem Zufall liegt.“ 87 American Polygraph Association Polygraph 40 (2011) S. 194 (240). 88 American Polygraph Association Polygraph 40 (2011) S. 194 (229). 89 Siehe die Übersichten bei National Research Council, S. 335–338, und bei American Polygraph Association Polygraph 40 (2011) S. 194 (261–268). 90 Vgl. jeweils konkret zu den Außenkriterien und den Trefferquoten Blackwell, S. 6, 10; Jayne Polygraph 19 (1990) S. 105 (106, 109); Matte/Reuss Polygraph 18 (1989) S. 187 (192 f.). 91 National Research Council, S. 114. 92 „Obwohl wir Studien ausgeschlossen haben, bei denen unabhängige Beweise für den [subjektiven] Wahrheitsgehalt [der Aussagen] fehlten, neigen Feldstudien nach wie vor dazu, die Genauigkeit des Polygrafen zu überschätzen.“

134

5. Kapitel: „Zahlen lügen nicht“

probe umfasste unter anderem Sexualdelikte, Diebstähle und Fälle von Betrug oder Polizeigewalt.93 Die Aktenanalyse ergab, dass je Paar nur eine Person die Wahrheit gesagt haben konnte – welche war allerdings nicht bekannt. Ein Beispiel: In einem Fall von Fahrerflucht wurde das Fahrzeug zwar gefunden, und Augenzeugen gaben an, dass sich zum Zeitpunkt des Unfalls lediglich zwei Personen im Auto befunden hatten, und zwar Fahrer und Beifahrer. Einer der beiden musste also den Unfall versucht haben und somit der Täter sein. Der Halter wurde schließlich ausfindig gemacht und gestand sogar, in dem Unfallfahrzeug gewesen zu sein, bestritt jedoch, der Fahrer gewesen zu sein. Nach seiner Darstellung habe sein Freund das Auto gefahren. Dieser gab zwar wieder zu, im Auto gewesen zu sein, bestand aber darauf, dass der Halter gefahren war. Ginton wertete sodann die 64 Aussage-gegen-Aussage-Konstellationen aus. Im Idealfall sollten je ein positives und ein negatives Ergebnis vorliegen: das positive bei dem lügenden und damit schuldigen Probanden, das negative bei dem unschuldigen Probanden. Ginton ging jedoch zu Recht davon aus, dass der Polygraf nicht unfehlbar sei. So stellte er seiner Berechnung einerseits die Annahme voran, dass die beiden entgegengesetzten Ergebnisse („opposite outcomes“) ebenso falsch sein könnten – nämlich falsch-positiv und falsch-negativ. Andererseits könnten bei manchen der Paare auch zwei gleiche Ergebnisse vorliegen, also entweder zwei negative oder zwei positive Ergebnisse („similar outcomes“). Bei den Paaren mit gleichem Ergebnis sei eines der Ergebnisse zwar zutreffend; welches lasse sich aber nicht ohne Weiteres bestimmen. Die Stichprobe brachte schließlich 44 Paare mit entgegengesetzten und 20 Paare mit gleichen Ergebnissen hervor – davon zehn mit zwei positiven und zehn mit zwei negativen Ergebnissen. Da sowohl der Anteil der Paare mit gleichem Ergebnis („proportion of pairs with similar outcomes“) als auch der Anteil der Paare mit entgegengesetztem Ergebnis („proportion of pairs with opposite outcomes“) die Treffgenauigkeit des Verfahrens insgesamt beeinflussen, ergab eine algebraische Formel eine Trefferquote der Vergleichsfragenmethode bei Schuldigen sowie bei Unschuldigen von jeweils 80 Prozent.94 Das Entscheidende an Gintons Ansatz ist, dass er die Einwände der Lykken-Gruppe sowie des National Research Councils nicht nur berücksichtigt, sondern im Ergebnis entkräftet.95 So kam es bei dieser Feldstudie auf etwaige 93 Auch zum Folgenden Ginton Psychology, Crime and Law 19 (2013) S. 577 (581 f.); kritisch Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (91–93); zur Gegenkritik Ginton Journal of Investigative Psychology and Offender Profiling 17 (2020) S. 296 (300–307). 94 Zur Berechnung im Detail Ginton Psychology, Crime and Law 19 (2013) S. 577 (583– 585 und 592 f.). 95 Vgl. nur Lykken Integrative Physiological and Behavioral Science 26 (1991) S. 214 (217); Ben-Shakhar Handbook of Polygraph Testing, S. 103 (115 f.); Iacono Handbook of Psychophysiology, S. 565 (569); National Research Council, S. 113–115.

IV. Neue Forschung zur Vergleichsfragenmethode

135

Geständnisse nicht an.96 Während die Gegner der Methode meinen, die False Negative Rate werde unterschätzt und es könnten keine aussagekräftigen Ergebnisse erzielt werden, da das Geständniskriterium nicht unabhängig vom Untersuchungsergebnis sei, widerlegt sie Ginton und bestätigt im Umkehrschluss die in anderen Feld- und Laborstudien erzielten Trefferquoten, wenn auch nicht in ganz so hohen Prozentbereichen.97 – 2015 wiederholten Mao, Liang und Hu die algebraische Methode von Ginton und konnten ähnliche Trefferquoten erzielen: 83,6 und 82,2 Prozent.98

3. Was Wiederaufnahmeverfahren mit dem Polygrafen zu tun haben Wieder einen alternativen Ansatz verfolgt Morrison Bonpasse, auf den unter anderem das Amtsgericht Bautzen in seiner Entscheidung 2017 abgestellt hatte.99 Bonpasse bedient sich eines anderen Außenkriteriums, und zwar eines erfolgreichen Wiederaufnahmeverfahrens („wrongful conviction exoneration“).100 Bonpasse untersuchte die Fallakten des National Registry of Exonerations, das 1989 von der University of Michigan und der Northwestern University Law School gegründet wurde. In 215 erfolgreichen Wiederaufnahmeverfahren war ein Polygraf zum Einsatz gekommen. In den 215 Verfahren wurden 147 später Freigesprochene psychophysiologisch begutachtet. Bei den übrigen Fällen handelte es sich um andere Personen wie Zeugen und Informanten. 93 der 147 später Freigesprochenen – 63 Prozent – erzielten ein entlastendes, 23 ein falschpositives Ergebnis (16 Prozent), und bei 31 (21 Prozent) war das Ergebnis der Begutachtung unentscheidbar.101 Abzüglich der unentscheidbaren Klassifikationen lag die Spezifität, also die Trefferquote bei Unschuldigen, bei 80 Prozent. Jedoch bezieht Bonpasse polygrafengestützte Begutachtungen sowohl vor als auch nach der Verurteilung ein. Von den 147 Freigesprochenen wurden allerdings nur 98 vor dem Verfahren untersucht. Die Übrigen wurden erst nachträglich untersucht – eine ganz andere psychische Ausgangssituation. Ohne die 31 unentscheidbaren Fälle lag bei den vor der Verhandlung untersuchten Beschuldigten die Spezifität bei 65,6 Prozent (44 negative und 23 positive Klassifikationen). Bei den anderen Probanden, die vor dem Verfahren zu Gunsten des Angeklagten ausgesagt hatten, lag die Trefferquote bei 80 Prozent (24 negative, 96 Ausdrücklich Ginton Journal of Investigative Psychology and Offender Profiling 17 (2020) S. 296 (300). 97 So auch Honts/Thurber/Handler Applied Cognitive Psychology Special Issue (2021) S. 1 (12); Raskin/Kircher Credibility Assessment, S. 63 (82 f.). 98 Mao/Liang/Hu Physiol Behav 140 (2015) S. 104 (108). 99 AG Bautzen, Urteil vom 26.10.2017 – 42 Ds 610 Js 411/15 = Recht & Psychologie 36 (2018) S. 184 (187). 100 Bonpasse Polygraph 42 (2013) S. 112–127. 101 Auch zum Folgenden Bonpasse Polygraph 42 (2013) S. 112 (113).

136

5. Kapitel: „Zahlen lügen nicht“

sechs positive und 17 unentscheidbare Klassifikationen). In der Summe wurden insgesamt 145 Personen vor dem Verfahren untersucht. Ohne zwischen Beschuldigten und anderen zu unterscheiden, ergab die Studie von Bonpasse folgende Zahlen: 68 erzielten ein entlastendes, 48 ein unentscheidbares und 29 ein belastendes Ergebnis. Einschließlich der unentscheidbaren Klassifikationen lag die Spezifität bei 47 Prozent, abzüglich der inconclusives bei 70 Prozent. – Bonpasse aktualisierte 2015 seine Studie diesmal mit insgesamt 281 Verfahren – mit Trefferquoten bei insgesamt 180 vor dem Verfahren Untersuchten von 51,7 Prozent einschließlich und 71,5 Prozent abzüglich der unentscheidbaren Klassifikationen.102

4. Hochwertige Feldstudien auf einen Blick Tabelle 9: Trefferquoten hier berücksichtigter Feldstudien (mit und ohne unentscheidbaren Klassifikationen) Studie

Erfunden (2015)103

Bonpasse Ginton (2013)104 Honts (1996)105 Honts/Raskin (1988) (PLT)106 Honts/Raskin (1988) (DLT) Mao/Liang/Hu (2015)107 Mangan/Armitage/Adams (2008)108 Patrick/Iacono (1991)109 Raskin et al. (1988)110 Durchschnitt

102

n

% richtig % falsch % unentsch. % korrekt

– 64 7 12 12 148 15 52 37

– 80 100 92 92 83,6 100 92 65

– 20 0 0 8 16,4 0 2 4

– – 0 8 0 – 0 6 31

– 80 100 100 92 83,6 100 98 92

88,1

6,3

5,6

93,2

Bonpasse (2015) S. 1 f. vor dem Verfahren begutachtete Probanden (Beschuldigte und andere), Bonpasse Polygraph 42 (2013) S. 112 (113); Tabelle 9 zeigt die Trefferquoten der 2015 aktualisierten Studie, Bonpasse (2015) S. 1 f. 104 Ginton Psychology, Crime and Law 19 (2013) S. 577 (585 f.). 105 Honts The Journal of General Psychology 123 (1996) S. 309 (320). 106 Honts/Raskin Journal of Police Science and Administration 16 (1988) S. 56 (59 f.); Tabelle 9 enthält Trefferquoten sowohl der PLT als auch der DLT. 107 Mao/Liang/Hu Physiol Behav 140 (2015) S. 104 (108). 108 Mangan/Armitage/Adams Physiol Behav 95 (2008) S. 17 (23). 109 Patrick/Iacono Journal of Applied Psychology 76 (1991) S. 229 (234 f.). 110 Raskin/Kircher/Honts/Horowitz A Study of the Validity of Polygraph Examinations in Criminal Investigation, S. 30; siehe auch Raskin/Kircher/Honts/Horowitz Polygraph & Forensic Credibility Assessment 48 (2019) S. 10 (22 f.). 103 Ausschließlich

137

V. Eine Auswahl von Laborstudien

Studie

Subjektiv wahr

Bonpasse (2015) Ginton (2013) Honts (1996) Honts/Raskin (1988) (PLT) Honts/Raskin (1988) (DLT) Mao/Liang/Hu (2015) Mangan/Armitage/Adams (2008) Patrick/Iacono (1991) Raskin et al. (1988) Durchschnitt

n

% richtig % falsch % unentsch. % korrekt

180 64 6 13 13 148 15 37 26

51,7 80 83 62 85 82,2 93 30 52

20,5 20 0 15 0 17,8 7 24 9

27,8 – 17 23 15 – 0 46 39

71,5 80 100 80 100 82,2 93 55 87,5

68,8

12,6

18,6

83,2

V. Eine Auswahl von Laborstudien Zwar existieren deutlich mehr hochwertige Feldstudien zur polygrafengestützten als zur aussagepsychologischen Glaubhaftigkeitsbegutachtung, so dass grundsätzlich von einer höheren Repräsentativität ausgegangen werden kann. Auch wenn sich das Argument fehlender Lebens- und Praxisnähe bei Laborstudien nicht vollständig entkräften lässt, möchte ich dennoch auf ein paar experimentelle Studien eingehen. Angemerkt sei, dass selbst Gegner Laborstudien nicht kategorisch ablehnen. Iacono und Ben-Shakhar etwa befürworten „more ecologically valid lab studies“.111 Realitätsnäher seien zum Beispiel die Laborstudien von Raskin und Hare (1978), Patrick und Iacono (1989) oder Ginton et al. (1982).112 Während bei den ersten beiden – ethisch betrachtet zwar etwas fragwürdig – Gefängnisinsassen begutachtet wurden, denen 20 Dollar im Falle eines wahrheitsgemäßen Resultats geboten wurden, wurden bei der Laborstudie von Ginton et al. Polizeibeamte untersucht, denen vorgespiegelt wurde, dass ihre berufliche Laufbahn von dem Ergebnis der Begutachtung abhinge. Letztere Studie weist jedoch eine nur überschaubare Stichprobe auf von nur insgesamt 15 begutachteten Beamten. Wahrscheinlich aus diesem Grund wurde sie nicht vom National Research Council berücksichtigt; die anderen beiden erfüllten jedoch die Mindestvoraussetzungen.113

111

Vgl. Ben-Shakhar Handbook of Polygraph Testing, S. 103 (115 f.); Iacono/Ben-Shakhar Law and Human Behavior 43 (2019) S. 86 (94 f.). 112 Raskin/Hare Psychophysiology 15 (1978) S. 126–136; Patrick/Iacono Journal of Applied Psychology 74 (1989) S. 347–355; Ginton/Daie/Elaad/Ben-Shakhar Journal of Applied Psychology 67 (1982) S. 131–137. 113 Durchschnittlich 48 Probanden, National Research Council, S. 122.

138

5. Kapitel: „Zahlen lügen nicht“

Darüber hinaus berücksichtigte das National Research Council unter anderem die Laborstudien von Driscoll et al., Kircher und Raskin, Podlesny und Raskin sowie von Podlesny und Truslow.114 Da Befürworter der Methode diese Laborstudien ebenfalls als hochwertig bezeichnen, erlaube ich mir, sie im Folgenden wiederzugeben. Honts und Schweinle ziehen zudem die deutsche Laborstudie von Heinz und Susanne Offe aus dem Jahr 2007 heran; auch sie soll der Vollständigkeit halber angeführt werden.115 Zur Directed-Lie-Technik existieren zugegeben wenige Studien. Eine erste Laborstudie führten Horowitz et al. 1997 durch;116 die Studie wurde zwar von ihrem Co-Autor Honts als hochwertig bezeichnet und von der American Polygraph Association berücksichtigt, jedoch nicht vom National Research Council aufgelistet.117 Bell, Kircher und Bernhardt führten 2008 eine umfangreiche Studie zum DLT durch mit erhöhten Anreizen für die Teilnehmenden (Tabelle 10).118

VI. Zwischenergebnis: Alles andere als „völlig ungeeignet“ Trotz der methodischen Unterschiede stimmen die Ergebnisse qualitativ hochwertiger Feld- und praxisnäherer Laborstudien weitgehend überein. Zuzugeben ist, dass auch die Glaubhaftigkeitsbegutachtung mittels eines Polygrafen keine perfekten Trefferquoten erzielen kann. Weder einem positiven noch einem negativen Ergebnis kann ein 100-prozentiger Beweiswert zugesprochen werden. Während Schuldige mit meist über 90-prozentiger Wahrscheinlichkeit als solche entlarvt werden, ist die Trefferquote bei Unschuldigen geringer. Damit ist die Quote falsch-positiver höher als die falsch-negativer Ergebnisse. Mit anderen Worten: Die Aussagen Unschuldiger werden öfter fälschlicherweise als bewusst wahrheitswidrig deklariert als im umgekehrten Fall. Die Kritik, es bestünde die Gefahr einer falschen Belastung, kann daher nicht per se zurückgewiesen werden.119

114

Siehe National Research Council, S. 335–338. H. Offe/S. Offe Law and Human Behavior 31 (2007) S. 291–303; vgl. Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (167); siehe auch die weitgehend übereinstimmenden Trefferquoten der Vorstudie H. Offe/S. Offe MschrKrim 87 (2004) S. 86 (92 f.). 116 Horowitz/Kircher/Honts/Raskin Psychophysiology 34 (1997) S. 108–115; siehe auch Raskin/Honts Handbook of Polygraph Testing, S. 1 (25); kritisch Lykken Tremor in the Blood, S. 139. 117 Vgl. American Polygraph Association Polygraph 40 (2011) S. 194 (229); Honts The Detection of Deception in Forensic Contexts, S. 103 (109). 118 Bell/Kircher/Bernhardt Physiol Behav 94 (2008) S. 331–340. 119 Vgl. nur Rill/Vossel NStZ 1998, 481 (484). 115

139

VI. Zwischenergebnis: Alles andere als „völlig ungeeignet“

Tabelle 10: Trefferquoten realitätsnaher („more ecologically valid“) Laborstudien (mit und ohne unentscheidbare Klassifikationen) Studie

Erfunden (DLT)120

Bell et al. (2008) Driscoll et al. (1987)121 Ginton et al. (1982)122 Horowitz et al. (1997) (DLT)123 Kircher/Raskin (1988)124 H. Offe/S. Offe (2007)125 Patrick/Iacono (1989)126 Podlesny/Raskin (1978)127 Podlesny/Truslow (1993)128 Raskin/Hare (1978)129

n

% richtig % falsch % unentsch.

% korrekt

30 20 2 15 50 18 24 20 72 24

90 90 100 73 88 89 92 70 69 87,5

7 0 0 14 6 11 8 15 13 0

3 10 0 13 6 0 0 15 18 12,5

93 100 100 84 93,6 89 92 82,4 84,7 100

84,85

7,4

7,75

91,87

Durchschnitt Studie Bell et al. (2008) (DLT) Driscoll et al. (1987) Ginton et al. (1982) Horowitz et al. (1997) (DLT) Kircher/Raskin (1988) H. Offe/S. Offe (2007) Patrick/Iacono (1989) Podlesny/Raskin (1978) Podlesny/Truslow (1993) Raskin/Hare (1978) Durchschnitt 120

Subjektiv wahr n

% richtig % falsch % unentsch.

% korrekt

30 20 13 15 50 15 24 20 24 24

80 90 85 87 86 93 58 90 75 87,5

13 0 15 13 6 7 42 5 4 8

7 10 0 0 8 0 0 5 21 4

86 100 85 87 93,4 93 58 94,7 94,7 91

83,15

11,3

5,5

88,28

Bell/Kircher/Bernhardt Physiol Behav 94 (2008) S. 331 (337). Zitiert nach American Polygraph Association Polygraph 40 (2011) S. 194 (269 f.); Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (167). 122 Ginton/Daie/Elaad/Ben-Shakhar Journal of Applied Psychology 67 (1982) S. 131 (134). 123 Horowitz/Kircher/Honts/Raskin Psychophysiology 34 (1997) S. 108 (112); Honts/ Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (167) geben in ihrer Übersicht lediglich die Trefferquoten zur „herkömmlichen“ Probable-Lie-Technik wieder. 124 Kircher/Raskin Journal of Applied Psychology 73 (1988) S. 291 (297). 125 H. Offe/S. Offe Law and Human Behavior 31 (2007) S. 291 (296); nur Probanden mit Vorgespräch de lege artis (Gruppen 1 und 2). 126 „Decisions based on original numerical scores for psychopath and non-psychopath subjects“, Patrick/Iacono Journal of Applied Psychology 74 (1989) S. 347 (350); Trefferquoten nach numerischer Auswertung der psychopathischen und nicht-psychopathischen Probanden; Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (167) geben fälschlicherweise höhere Trefferquoten bei den subjektiv wahren Aussagen an. 127 Zitiert nach Honts/Schweinle Applied Psychophysiology & Biofeedback 34 (2009) S. 161 (167). 128 Podlesny/Truslow Journal of Applied Psychology 78 (1993) S. 788 (792). 129 Raskin/Hare Psychophysiology 15 (1978) S. 126 (130). 121

140

5. Kapitel: „Zahlen lügen nicht“

Daraus ergibt sich allerdings keine „völlige Ungeeignetheit“ im Sinne des § 244 Absatz 3 Satz 3 Nummer 4 StPO.130 Unabhängig davon, dass ein solch utopischer Maßstab auch an anderer Stelle nicht vom Bundesgerichtshof verlangt wird – prominent etwa bei der aussagepsychologischen Begutachtung –, entspricht die Tendenz zu falsch-negativen Ergebnissen geradezu den Grundannahmen der direkten Methoden. Dass ein Unschuldiger ebenfalls stark auf eine tatrelevante Frage wie „Haben Sie Ihrer Tochter …?“ reagieren wird, ist selbsterklärend. Immerhin geht es um einen schweren Vorwurf, um die eigene Tochter und für den Probanden gegebenenfalls um mehrere Jahre Gefängnis. Die Kunst und Herausforderung zugleich sind das Finden und Formulieren von passenden Vergleichsfragen; ein Unterfangen, das aufgrund der Methodik nicht immer funktionieren kann. Ist die Vergleichsfrage zu schwach, wird auch ein Unschuldiger stärker auf die tatrelevante Frage reagieren mit der Konsequenz eines falsch-positiven Ergebnisses.131 Die Trefferquoten der zitierten Studien geben damit nur wieder, was der Methode ohnehin als „Schwäche“ anhaftet. Davon zwingend abgegrenzt werden muss die für die Geeignetheit im Sinne des § 244 Absatz 3 Satz 3 Nummer 4 StPO entscheidende Frage nach dem konkreten Indiz- oder Beweiswert. Selbst unter Berücksichtigung der Trefferquoten der Feldstudie von Patrick und Iacono ergibt sich ein Beweiswert eines negativen Ergebnisses von 96,5 und ein Beweiswert eines positiven Ergebnisses von 68,5 Prozent. Legt man die Durchschnittswerte aller hier zitierten Feldstudien zugrunde – ungefähr 93 Prozent korrekte positive und 83 Prozent korrekte negative Ergebnisse132 – ergeben sich anhand der Bayes-Regel ein Beweiswert eines positiven (belastenden) Ergebnisses von etwa 85 Prozent und eines negativen (entlastenden) Ergebnisses von 92 Prozent. Das heißt: Kann zum Beispiel ein Beschuldigter ein negatives Gutachtenergebnis vorweisen, ist er in mehr als neun aus zehn Fällen auch tatsächlich unschuldig. Ein deutlich zufriedenstellenderes Ergebnis als eine Verurteilung auf die „professionelle Intuition“ zu stützen (50 Prozent) oder auf ein positives Ergebnis bei der aussagepsychologischen Begutachtung des Belastungszeugen (68 Prozent). Selbstverständlich kann daraus nicht auf die Treffsicherheit im Einzelfall geschlossen werden. Dies zu verlangen, wie es offenbar der Bundesgerichtshof oder Steller tun,133 hieße wieder im Umkehrschluss, dass nur perfekte Methoden als Beweismittel zugelassen werden könnten. Doch bei keinem Verfahren, 130 Anders offenbar BVerfG 1981, 446 (447), der die Treffsicherheit des „Lügendetektors“ einerseits auf etwa 90 Prozent schätzt, dem Ergebnis andererseits „wenn überhaupt“ nur eine „geringe Aussagekraft“ beimisst. 131 Vgl. Steller Recht & Psychiatrie 36 (2018) S. 173 (175 f.). 132 Siehe Tabelle 9 in diesem Kapitel V (S. 136 f.). 133 Steller Recht & Psychiatrie 36 (2018) S. 173 (177); dass auch die Aussagepsychologie trotz überzufälligen Beweiswerts keine Einzelfallgarantie gewährt, wird in dem Beitrag allerdings unterschlagen.

VI. Zwischenergebnis: Alles andere als „völlig ungeeignet“

141

das weniger als 100 Prozent Sicherheit bietet, kann festgestellt werden, ob das richtige Ergebnis auch im konkreten Einzelfall erzielt wird. Das gilt für die polygrafengestützte wie die aussagepsychologische Glaubhaftigkeitsbegutachtung gleichermaßen – sowie für fast alle anderen Beweismittel und Indizien.134 Der Beweis- und damit Mehrwert einer Methode bestimmt sich zudem nicht danach, ob im Einzelfall Fehlentscheidungen möglich sind oder nicht, sondern ob die Fehlerquote möglichst geringgehalten werden kann.135

134 Dieses von Faigman/Monahan/Slobogin als Group to Individual (G2i) Inference bezeichnete Grundproblem der Beweisführung ist letztlich jeder wissenschaftlichen Methode immanent, die ihre Validität im Feld oder Labor anhand von Gruppen erprobt, The University of Chicago Law Review 81 (2014) S. 417 (420 f., 424); siehe auch Mokros Figurationen von Unsicherheit, S. 241 (247–250). 135 So auch H. Offe/S. Offe Praxis der Rechtspsychologie 11 (2001) S. 5 (12); Seiterle Hirnbild, S. 54; deutlich Köhnken/Gallwitz Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, S. 17 (ebd.): „Eigentlich ist diese Feststellung trivial, denn bekanntlich kann keine Diagnostik völlig frei von Fehlern sein“.

6. Kapitel

Der Polygraf im Strafverfahren I. Einführung Die vorigen Ausführungen haben gezeigt, dass der Polygraf und konkret die Vergleichsfragenmethode eines nicht sind: ungeeignet, einen Indizwert für die Glaubhaftigkeit einer Aussage zu erbringen. Zwar findet sich auch in der jüngeren Literatur nach wie vor Beifall hinsichtlich des Verdikts des Bundesgerichtshofs, die polygrafengestützte Glaubhaftigkeitsbegutachtung sei als Beweismittel völlig ungeeignet – allerdings ohne Auswertung der einschlägigen Studien.1 Selbst die „konservativsten“ Studien belegen, dass die polygrafengestützte Glaubhaftigkeitsbegutachtung weit überzufällige Trefferquoten vorweisen kann. Mag sie auch nicht perfekt sein – was keine Methode und kein Beweis ist –,2 ist der Wert dieses Indizes nicht unerheblich. Nutzlos – so die verkürzte Definition der völligen Ungeeignetheit im Sinne des § 244 Absatz 3 Satz 2 StPO – kann ein polygrafengestütztes Gutachten als Indiz in einem Strafverfahren also nicht sein. An dieser Stelle sei nochmals an das Fazit des National Research Councils erinnert:3 „[We] conclude that in populations of examinees such as those represented in the polygraph research literature, untrained in countermeasures, specific-incident polygraph tests can discriminate lying from truth telling at rates well above chance, though well below perfection.“4

1 Vgl. Drohsel StV 2018, 827 (829); Eisenberg Beweisrecht, Rn. 694; Julius HK-StPO § 244 Rn. 46; Nestler JA 2017, 10 (16); Rodenbeck StV 2020, 479 (480 f.); jedoch mit teilweise irreführenden Verweisen auf die Kommentarliteratur, die diesbezüglich lediglich die Rechtsprechung wiedergibt, vgl. nur Diemer KK § 136a Rn. 34; Monka BeckOK-StPO § 136a Rn. 27: „nach Ansicht der Bundesrichter“; deutlich Rogall SK-StPO § 136a Rn. 91: „Bei genauerem Hinsehen stellen sich indessen Zweifel ein.“ 2 Nicht einmal die Nachweisführung über Gentests oder Blutproben, vgl. nur Risse NJW 2020, 2383 (2385); zu weiteren nicht perfekten, aber alltäglichen Methoden der Beweisgewinnung Artkämper Kriminalistik 2009, 349 (355). 3 National Research Council, S. 4. 4 „Unser Ergebnis ist, dass bei Probanden – wie sie in der Literatur zum Polygrafen vertreten sind –, die nicht in Gegenmaßnahmen geschult sind, [polygrafische Glaubhaftigkeitsbegutachtungen] Lügen von wahren Aussagen anhand von Quoten unterscheiden können, die weit über dem Zufall liegen, obgleich sie bei weitem nicht perfekt sind.“

144

6. Kapitel: Der Polygraf im Strafverfahren

Auf einem anderen Blatt steht, ob gegen eine Verwendung eines Polygrafen im Strafverfahren sonstige rechtliche Bedenken bestehen. Gemäß Frister etwa kann sich ein „prinzipielles Verbot des Lügendetektors […] nur aus normativen Erwägungen ergeben“.5 1998 beantwortete der Bundesgerichtshof diese Frage bei einer Verwendung jedenfalls zu Gunsten des Beschuldigten mit einem deutlichen Nein. Da die Begründung des Bundesgerichtshofs, die polygrafengestützte Begutachtung sei als Beweismittel ungeeignet, nicht (mehr) tragfähig ist, stünde dem Einsatz des Polygrafen im Strafverfahren zumindest nach der Rechtsprechung nichts mehr im Wege. Jedoch ist diese Rechtsprechung auch was dies betrifft nicht unumstritten, und die folgenden Seiten widmen sich diesen nach wie vor vorgebrachten rechtlichen Einwänden.

II. Freiwilligkeit ist und bleibt „zwingend“ In seiner ersten Polygrafen-Entscheidung im Jahr 1954 hatte der Bundesgerichtshof noch vertreten, dass eine Verwendung die durch Artikel 1 Absatz 1 GG und § 136a StPO geschützte Freiheit der Willensentschließung und -betätigung des Beschuldigten verletzt, und das ohne Rücksicht auf dessen Einwilligung.6 Angemerkt sei, dass bei diesem Verfahren die Staatsanwaltschaft den Einsatz eines „Lügendetektors“ beantragt hatte, und zwar zur Überführung des Angeklagten.7 Richtig ist, dass ein belastendes Ergebnis nicht verwertbar ist, wenn der Beschuldigte begutachtet wird – wenn auch aus anderen Gründen (siehe sogleich). Daraus lässt sich jedoch nicht generell auf die Unzulässigkeit der polygrafengestützten Glaubhaftigkeitsbegutachtung schließen. 1998 gab der Bundesgerichtshof diesen Einwand und seine frühere Rechtsprechung daher ausdrücklich auf für den Fall, dass sich der Beschuldigte mit der Begutachtung einverstanden erklärt. Soweit sie freiwillig erfolge, bestehe kein Unterschied zu anderen Begutachtungsmethoden oder der schlichten Beobachtung von körperlichen Reaktionen einer zu vernehmenden Person.8 Insofern ist der neueren Entscheidung beizupflichten: Eine polygrafengestützte Begutachtung gegen den Willen des Probanden – ob Beschuldigter oder Zeuge – zu diskutieren, verkennt, dass sie bereits methodisch das Einverständnis zwingend voraussetzt. Nur wenn sich der Proband freiwillig auf die Begutachtung einlässt, kann der Polygraf sinnvollerweise zum Einsatz kommen und körperliche Reaktionen messen, die der Gutachter in einem Folgeschritt interpretiert. Eine (unmittelbar) zwangsweise Verwendung scheitert bereits an 5

Frister ZStW 106 (1994) S. 303 (313). BGHSt. 5, 332 (333). 7 Vgl. BGHSt. 5, 332 (338); Schwabe NJW 1979, 576 (578): ein „wenig glücklicher Zufall“. 8 BGHSt. 44, 308 (315); vgl. auch Momsen KriPoZ 2018, 142 (144). 6

III. Die Begutachtung des Beschuldigten

145

den methodischen Anwendungsvoraussetzungen und soll im Folgenden nicht näher diskutiert werden.9 Davon abzugrenzen ist die Frage, ob ein Richter Schlüsse aus einer verweigerten Begutachtung ziehen darf. Die Antwort hängt davon ab, wer begutachtet werden soll. Eine Verwertung zu Lasten des sich weigernden Beschuldigten verstößt gegen dessen Selbstbelastungsfreiheit, so dass ein Verwertungsverbot vorliegt (dazu gleich ausführlich). Beim Zeugen gestaltet sich die Antwort schwieriger: Hier hilft im Ergebnis ein Vergleich mit der Situation, in der der Belastungszeuge seine Aussage oder eine aussagepsychologische Begutachtung verweigert. Zudem stellt sich die Folgefrage, welches Ergebnis verwertet werden darf. Darf nur ein entlastendes Ergebnis berücksichtigt werden, oder wäre ein belastendes Ergebnis ebenso verwertbar, wie es dem Bundesgerichtshof 1954 vorgelegen hatte? Genau genommen hatte der Bundesgerichtshof 1998 diesbezüglich keine Rechtsbedenken geäußert, und zwar unabhängig davon, ob das Ergebnis nur zu Gunsten des Probanden oder gleichermaßen zu dessen Lasten verwertet werden soll.10 Doch auch hier kommt es wieder darauf an, welche Prozessrolle der Proband innehat. Aus diesem Grund wird zunächst die Situation beleuchtet, in der der Beschuldigte psychophysiologisch begutachtet wird. Im Anschluss geht es um die Begutachtung auch des Belastungszeugen.

III. Die Begutachtung des Beschuldigten 1. Kein Verstoß gegen § 136a StPO Obwohl der Bundesgerichtshof 1998 einen Verstoß gegen § 136a Absatz 1 StPO verneinte, führen manche Stimmen nach wie vor die Norm ins Feld, um eine Zulassung der polygrafengestützten Begutachtung zu unterbinden.11 Sie enthält das ausdrückliche Verbot, die „Freiheit der Willensentschließung und der Willensbetätigung des Beschuldigten“ durch bestimmte Vernehmungsmethoden zu beeinträchtigen – gemäß § 136a Absatz 3 StPO selbst dann, wenn der Beschuldigte seine Einwilligung erteilt. 9 Wie hier Eisenberg Beweisrecht, Rn. 695: praktisch nur deklaratorische Bedeutung; Momsen KriPoZ 2018, 142 (144); Nestler JA 2017, 10 (15); deutlich Schwabe NJW 1979, 576 (577): „die Vorstellung, daß ein Widerstrebender auf einen Stuhl geschnallt und trotz andauernder Gegenwehr und Geschrei mit einem Gerät auf Wahrheit oder Lüge abgehorcht wird, sollte sich selbst ad absurdum führen“. 10 Allerdings ohne nähere Begründung BGHSt. 44, 308 (315). 11 Drohsel StV 2018, 827 (829); für Österreich (§ 164 Absatz 4 öStPO) Wagner, S. 64 f.; noch vor BGHSt. 44, 308: Frister ZStW 106 (1994) S. 303 (313–322); Peters ZStW 87 (1975) S. 663 (676 f.).

146

6. Kapitel: Der Polygraf im Strafverfahren

Die erste Frage, die sich an dieser Stelle stellt, ist, ob § 136a StPO überhaupt anwendbar ist, da der Beschuldigte durch einen Sachverständigen begutachtet wird und nicht von einer in § 136a StPO (in Verbindung mit § 163a StPO) genannten Person. Sie kann mit Verweis auf die herrschende Meinung bejaht werden, die § 136a StPO auf Sachverständige jedenfalls analog anwendet.12 Dieser Auffassung ist zuzustimmen, da ansonsten die Gefahr besteht, dass Gerichte oder Staatsanwaltschaften sich Sachverständigen bedienen, um die Verbote des § 136a StPO zu umgehen. Nach anderer Ansicht soll der Sachverständige zwar nicht unmittelbarer Normadressat des § 136a StPO sein. Richtern, Staatsanwälten und Polizeibeamten werde das Verhalten des Sachverständigen jedoch zugerechnet, so dass durch „verpönte Methoden“ gewonnene Erkenntnisse in der Konsequenz nicht verwertet werden dürfen.13 Ausdrücklich auch der Bundesgerichtshof: „Der Sachverständige ist Gehilfe des Gerichts. Was dem Richter verwehrt ist, das ist auch dem Richtergehilfen verboten.“14 Da beide Auffassungen zum selben Ergebnis kommen, soll es hier nicht weiter auf die dogmatische Einordnung ankommen.

a) Kein körperlicher Eingriff, keine körperliche Untersuchung, sondern Sachverständigenbeweis Unabhängig davon muss es sich bei einer polygrafengestützten Begutachtung überhaupt um eine solche „verpönte Methode“ handeln. Heute weitgehend unbestritten ist, dass die polygrafengestützte Glaubhaftigkeitsbegutachtung kein körperlicher Eingriff ist im Sinne von § 136a Absatz 1 und § 81a Absatz 1 Satz 2 StPO.15 Nach herrschender Meinung liegt ein solcher erst vor, wenn sich die Maßnahme auf die Veränderung der körperlichen Konstitution richtet.16 Dazu muss folglich in das haut- und muskelumschlossene Körperinnere eingegriffen werden.17 Bei einer völlig schmerzlosen Verwendung rein non-invasiver Oberflächenelektroden liegt ein körperlicher Eingriff daher nicht vor. 12 Vgl. nur Gleß LR § 136a Rn. 8 mit dem Hinweis, dass die Norm gerade wegen eines Falles eingeführt wurde, in dem Sachverständige mit Hilfe von Injektionen den Beschuldigten zur Aussage gebracht hatten; Roxin/Schünemann § 25 Rn. 17; Schmitt Meyer-Goßner/Schmitt § 136a Rn. 2; Seiterle Hirnbild, S. 115 f. 13 Fincke ZStW 86 (1974) S. 656 (659 f.); Rogall SK-StPO § 136a Rn. 8; Schüssler Polygraphie, S. 70; Würtenberger JZ 1951, 772 (774); nicht anzuwenden sei § 136a StPO jedoch auf privat veranlasste, unabhängige Sachverständige, vgl. Eisenberg Beweisrecht, Rn. 701; Rogall SK-StPO § 136a Rn. 94. 14 BGHSt. 11, 211 (212). 15 Vgl. Eisenberg Beweisrecht, Rn. 648; Frister ZStW 106 (1994) S. 303 (314); Petry, S. 174; Prittwitz MDR 1982, 886 (890); Gleß LR § 136a Rn. 28; Rogall SK-StPO § 136a Rn. 48; früher anderer Ansicht Peters ZStW 87 (1975) S. 663 (677); Sarstedt LR22 (1971) § 136a Anm. 4 c (S. 864). 16 Diemer KK § 136a Rn. 14; Schmitt Meyer-Goßner/Schmitt § 136a Rn. 9. 17 Bosch SSW-StPO § 81a Rn. 6.

III. Die Begutachtung des Beschuldigten

147

Vereinzelt wird vertreten, die polygrafengestützte Begutachtung sei „nur“ eine einfache körperliche Untersuchung im Sinne des § 81a Absatz 1 Satz 1 StPO.18 Obgleich eine solche Einordnung nach dem Wortlaut sogar eine zwangsweise Begutachtung gestatten würde, ist diese Ansicht ebenso abzulehnen. Sie verkennt, dass durch die polygrafengestützte wie auch die aussagepsychologische Begutachtung ausschließlich Rückschlüsse auf die Glaubhaftigkeit einer Aussage ermöglicht werden. Solche Maßnahmen werden jedoch nicht vom Untersuchungszweck des § 81a oder des § 81c StPO erfasst. Diese Vorschriften gestatten die Feststellung der äußeren körperlichen Beschaffenheit – zum Beispiel anhand von Spuren –, jedoch nicht die Erhebung psychischer Vorgänge, selbst wenn sie sich physisch manifestieren.19 Weder die aussagepsychologische noch die psychophysiologische Begutachtung lassen den unmittelbaren Schluss auf die Wahrheit zu. Beide Methoden dienen lediglich der Gewinnung eines weiteren Indizes für die Wahrheitsfindung. Zutreffend führte Prittwitz dazu bereits 1982 aus:20 „Die Zusammenstellung der Argumente zur Einordnung des Polygraphentests unter die §§ 81a, 136a StPO kann als schönes Beispiel ergebnisorientierter juristischer Auslegungs- und Argumentationskunst dienen: die Gegner des Polygraphen betrachten ihn nicht als körperliche Untersuchung, wohl die ‚legitimierende‘ Wirkung des § 81a befürchtend, haben aber keine Schwierigkeit, ihn gleichwohl als körperlichen Eingriff zu bezeichnen, offensichtlich das Verdikt des § 136a im Auge.“

Die Lösung findet sich an anderer, bereits angesprochener Stelle: Der Polygraf – konkret die Vergleichsfragenmethode – ist eine Methode der Glaubhaftigkeitsbegutachtung, deren sich ein Sachverständiger bedient. Sie fällt allein unter den in den §§ 72 ff. StPO geregelten Sachverständigenbeweis.21 Zugegeben sind weder die aussagepsychologische noch die polygrafengestützte Begutachtung gesetzlich normiert.22 Doch das ist so gut wie keines der „Werkzeuge“, deren sich Sachverständige nach ihrem Ermessen bedienen. Das heißt auch nicht, dass solche Methoden uneingeschränkt eingesetzt werden können. Aus der Nichtanwendbarkeit von § 81a und § 81c StPO ergibt sich vielmehr, dass 18 Prittwitz MDR 1982, 886 (890); siehe auch Seiterle Hirnbild, S. 159, 163, und Trück MK-StPO § 81a Rn. 9, die aber im Ergebnis eine Anwendung ablehnen aufgrund der zwingend erforderlichen freiwilligen Mitwirkung des Probanden. 19 Ausdrücklich BGHSt. 5, 332 (336); Krause LR § 81a Rn. 58 und § 81c Rn. 8; Rogall SK-StPO § 136a Rn. 92; siehe bereits Würtenberger JZ 1951, 772 (774); im Ergebnis auch Peters ZStW 87 (1975) S. 663 (675), der eine polygrafengestützte Begutachtung aber gerade deshalb für unzulässig hält, da sie in der Strafprozessordnung nicht ausdrücklich vorgesehen ist (671); das ist die aussagepsychologische Begutachtung aber auch nicht. 20 Prittwitz MDR 1982, 886 (890). 21 Siehe hier 4. Kapitel II 3 (S. 96–98) und Rogall SK-StPO § 136a Rn. 92; so auch schon Achenbach NStZ 1984, 350 (351); Prittwitz MDR 1982, 886 (889). 22 Kritisch Rogall SK-StPO § 136a Rn. 92, der ohne nähere Begründung eine gesetzliche Grundlage für den Polygrafen fordert – nicht aber für die aussagepsychologische Begutachtung; im Ergebnis wie hier Seiterle Hirnbild, S. 165 f.

148

6. Kapitel: Der Polygraf im Strafverfahren

Glaubhaftigkeitsbegutachtungen jeglicher Art nur dann zulässig sind, sofern der Proband (ob Beschuldigter oder Zeuge) einwilligt.23 – Letztendlich kommt es auf die Einordnung unter § 81a Absatz 1 Satz 1 und § 81c Absatz 1 StPO nicht an: Weder eine Duldungspflicht noch Zwang stehen mit der Methode im Einklang, die ein Einverständnis und eine Kooperationsbereitschaft des Probanden voraussetzt.

b) Keine Täuschung im Sinne von § 136a Absatz 1 Satz 1 StPO Auch unter rechtlichen Gesichtspunkten kritisiert werden die bei der ProbableLie-Technik zum Teil falsche und bewusst suggestive Informationen über die Funktionsweise der Untersuchung und Bedeutung der Vergleichsfragen während des Vorgesprächs.24 Eine Täuschung komme in Betracht, da dem Probanden anhand eines Zahlen- oder Kartentests „vorgespiegelt“ werde, der Polygraf könne jeden Täuschungsversuch erkennen. Zudem solle der Proband durch die Art und Weise, wie die Vergleichsfragen im Vorgespräch erarbeitet werden, in ein Dilemma geraten. Einerseits solle er glauben, eine bejahende Antwort auch auf die Vergleichsfragen führe dazu, dass der Gutachter denke, der Proband neige allgemein zu verwerflichem Verhalten und sei deshalb schuldig. Ziel dieser Manipulation sei, den Probanden zu entmutigen, die Vergleichsfragen wahrheitsgemäß zu bejahen, und die Wahrscheinlichkeit zu erhöhen, dass die verneinende Antwort unwahr sei. Andererseits solle der Proband glauben, dass auch unwahre, verneinende Antworten auf die Vergleichsfragen zu starken physiologischen Reaktionen führten und Rückschlüsse auf seine Schuld erlaubten, obwohl das Gegenteil der Fall sei.25 Der Bundesgerichtshof verneinte eine Täuschung im Sinne des § 136a Absatz 1 Satz 1 StPO jedenfalls im Hinblick auf den Zahlen- und Kartentest.26 Hier ist bereits zweifelhaft, worin die Täuschung des Probanden liegen soll. Ein „gezinkter“ Karten- oder Zahlentest, wie teils von Gegnern der Methode behauptet,27 kommt zumindest in Deutschland nicht zum Einsatz.28 Und auch 23 Wie hier Brauer HK-StPO § 81a Rn. 7; für die aussagepsychologische Begutachtung BGHSt. 13, 394 (398); 36, 217 (219); Hadamitzky KK § 81c Rn. 9; Schmitt Meyer-Goßner/ Schmitt § 81c Rn. 7; Trück MK-StPO § 81c Rn. 55 (und für eine Zeugenbelehrungspflicht analog §§ 81c Absatz 3 Satz 2, 52 Absatz 3 Satz 1 StPO). 24 Vgl. nur Eisenberg Beweisrecht, Rn. 698; kritisch auch L. Schneider Nonverbale Zeugnisse, S. 155, der sich aber unter anderem aus diesem Grund dafür ausspricht, nur ein entlastendes Ergebnis zu verwerten, S. 158 f.; in diesem Sinne auch Delvo, S. 12 und passim. 25 Vgl. 4. Kapitel III 2 d) (S. 106 f.). 26 BGHSt. 44, 308 (318). 27 Frister ZStW 106 (1994) S. 303 (308); Rill Psychophysiologie, S. 17 (aber S. 36: „was nicht zwingend erforderlich ist und zumindest in Deutschland wohl auch kaum praktiziert wird“); Wagner, S. 24. 28 So auch BGHSt. 44, 308 (318); Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (193) (Antwort auf Frage 5); Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (112) (Antwort auf Frage 5).

III. Die Begutachtung des Beschuldigten

149

für den angloamerikanischen Raum gilt ein solcher Trick weder für erforderlich noch für kunstgerecht.29 Zu dem zweiten Vorwurf, das „Dilemma“ des Probanden, hatte sich der Bundesgerichtshof, der einen Verstoß gegen § 136a StPO wohlgemerkt insgesamt verneint hatte, nicht ausdrücklich geäußert. Da das Täuschungsmerkmal des § 136a Absatz 1 Satz 1 StPO nach herrschender Meinung restriktiv auszulegen ist – man denke nur an den Einsatz verdeckter Ermittler oder die „Hörfalle“ –, ist eine geringfügige Irreführung wie hier unbeachtlich.30 Zudem bleibt die Aussagefreiheit, die § 136a Absatz 1 StPO schützen soll, erhalten.31 Dem Probanden steht es frei, die Begutachtung zu verweigern oder jederzeit abzubrechen. – Unabhängig davon kommt die Directed-Lie-Technik vollends ohne Irreführung aus.

c) § 136a StPO analog: „Einblick in die Seele des Beschuldigten“? Vornehmlich Frister sprach sich dafür aus, § 136a Absatz 1 StPO dennoch bei der polygrafengestützten Begutachtung anzuwenden. Anders als bei der (fragwürdigen, aber) für Frister zulässigen Berücksichtigung anderer physiologischer Ausdruckserscheinungen wie Zittern und Erröten werde bei der polygrafengestützten Begutachtung – er verwendet den Begriff „Lügendetektor“ – die „willentliche Kontrolle über die Offenbarung des eigenen Wissens in ganz anderer und ungleich stärkerer Weise eingeschränkt als bei der normalen, in der Struktur menschlicher Kommunikation angelegten Berücksichtigung des offenen Ausdrucksverhaltens“.32 Da es um die Begutachtung der Aussage gehe, bei der auf das Wissen des Probanden zurückgegriffen werde, unterliege auch der „Lügendetektor“ den gesetzlichen Regeln über die Vernehmung und damit § 136a StPO:33 „Das Wissen des Beschuldigten darf grundsätzlich nur durch eine seine Verfügungsbefugnis wahrende Vernehmung und nicht durch einen seiner Willenskontrolle nicht un29

Honts/Reavy Physiol Behav 143 (2015) S. 15 (24). So selbst Frister ZStW 106 (1994) S. 303 (312); Nestler JA 2017, 10 (16); anderer Ansicht für Österreich Wagner, S. 87, da allerdings die restriktive Interpretation des § 136a Absatz 1 StPO nicht auf § 164 Absatz 4 Satz 3 öStPO übertragen werden könne; für die herrschende Meinung BGHSt. 42, 139 (149) (Großer Senat); Gleß LR § 136a Rn. 39 f.; Schmitt Meyer-Goßner/Schmitt § 136a Rn. 12; weitgehender Nowrousian NStZ 2015, 625 (627): „Verfahrensgrundsätze, die die aktive Täuschung als solche verbieten, gibt es schlicht nicht“; T. Walter Strafprozessrecht, Rn. 168 f. 31 Vgl. Diemer KK § 136a Rn. 19; Rogall SK-StPO § 136a Rn. 57; Roxin/Schünemann § 25 Rn. 24. 32 Frister ZStW 106 (1994) S. 303 (322); so auch Wagner, S. 83 f., und bereits Peters ZStW 87 (1975) S. 663 (669); Prittwitz MDR 1982, 886 (893) lehnt unter dem „Gesichtspunkt der Freiheit der Willensentschließung und -betätigung […] eine Differenzierung danach [ab], ob die unbewußten Äußerungen von einem Menschen wahrgenommen oder von einem Gerät aufgezeigt werden“. 33 Frister ZStW 106 (1994) S. 303 (319 f.). 30

150

6. Kapitel: Der Polygraf im Strafverfahren

terworfenen Sachbeweis festgestellt werden. Für die Einordnung des Lügendetektors bedeutet dies, daß er nicht als ohne Willenskontrolle zulässiger Sachbeweis, sondern als die Willenskontrolle des Beschuldigten umgehende Vernehmungsmethode zu qualifizieren ist. Die Auswertung der aufgezeichneten physiologischen Reaktionen bezweckt bei der direkten nicht anders als bei der indirekten Methode stets den unkontrollierten Zugriff auf Wissen des Beschuldigten, es geht darum, sich ohne den Filter einer willentlichen Kontrolle Einblick in dieses Wissen zu verschaffen und sich bei der Aufklärung der Tat zunutze zu machen.“

Dem ist grundsätzlich nichts hinzuzufügen. Dass eine Vernehmung – wohlgemerkt durch den Sachverständigen – vorliegt, wird soweit ersichtlich nicht angezweifelt. Und die Belehrung über die Rechte und die Aussagefreiheit des Probanden ist Bestandteil des ausführlichen Vorgesprächs. Damit ist aber nur gesagt, dass § 136a StPO prinzipiell und – wie gezeigt – bei Vernehmungen von Sachverständigen anwendbar ist, allerdings nicht, ob auch eine verbotene Vernehmungsmethode vorliegt.34 Denn allein dann lässt sich „das Verdikt des § 136a“35 aussprechen. Ohne Zwang und Täuschung – so auch Frister – geht es im Kern um eine analoge Anwendung der Norm, und dass die Aufzählung in § 136a Absatz 1 StPO nicht abschließend ist, entspricht der herrschenden Meinung.36 Eine Analogie fordert aber in jedem Fall eine Vergleichbarkeit mit den geschriebenen „verpönten“ Vernehmungsmethoden. Eine bejahende Antwort lieferte der Bundesgerichtshof noch 1954: Es sei der „Einblick in die Seele des Beschuldigten und ihre unbewussten Regungen“, der die Freiheit der Willensentschließung und -betätigung im Sinne des § 136a StPO verletze. „Zur Erhaltung und Entwicklung der Persönlichkeit gehört ein lebensnotwendiger und unverzichtbarer seelischer Eigenraum, der auch im Strafverfahren unangetastet bleiben muß“.37 Richtig an dieser Begründung ist zunächst, dass das Instrument Polygraf unwillkürliche, vom vegetativen Nervensystem gesteuerte, körperliche Reaktionen misst; das ist gerade ausschlaggebend für die Psychophysiologie. Unabhängig davon, dass sich Gerichte nach wie vor von rein physischen und unwillkürlichen Reaktionen leiten lassen, obgleich diese erwiesenermaßen keine Auskunft über die Glaubhaftigkeit geben können, ist der Messvorgang bei der polygrafengestützten Glaubhaftigkeitsbegutachtung lediglich ein Bestandteil des gesamten Begutachtungsprozesses, über den der Proband im Vorgespräch aufgeklärt wird.38 Einen „Einblick in die Seele des Beschuldigten“ verrät der Polygraf aber 34

So auch Seiterle Hirnbild, S. 122 f. in Fn. 106. Prittwitz MDR 1982, 886 (890). BGHSt. 5, 332 (334 f.); Rogall SK-StPO § 136a Rn. 93 (entsprechende Anwendung); siehe bereits Würtenberger JZ 1951, 772 (773); für die herrschende Meinung Roxin/Schünemann § 25 Rn. 18; Schmitt Meyer-Goßner/Schmitt § 136a Rn. 6; T. Walter Strafprozessrecht, Rn. 164. 37 BGHSt. 5, 332 (335). 38 Auf diesen Widerspruch wies bereits Undeutsch ZStW 87 (1975) S. 650 (658 f.) hin; 35 36

III. Die Begutachtung des Beschuldigten

151

nicht. Mangels einer „specific lie response“ gewähren die gemessenen Körperreaktionen gerade keinen unmittelbaren Rückschluss auf die Glaubhaftigkeit.39 Jede andere Auffassung überschätzt und „mystifiziert“ den Polygrafen und die polygrafengestützte Glaubhaftigkeitsbegutachtung.40 Unabhängig davon, dass offenkundiges Ziel einer jeden Vernehmung oder Begutachtung ist, auf das Wissen des Probanden zuzugreifen, kommt es hier primär auf die Interpretation der gemessenen körperlichen Reaktionen an. Erst durch diesen Folgeschritt seitens des Sachverständigen kann auf die Glaubhaftigkeit geschlossen werden. Dass Frister oder der Bundesgerichtshof noch 1954 – wie unschwer am Leitsatz zu erkennen – den Polygrafen für einen „Lügendetektor“ halten, Funktionsweise und Methodik also missverstehen, lässt die hier entscheidende Frage unbeantwortet, ob die polygrafengestützte Glaubhaftigkeitsbegutachtung insgesamt eine verbotene Vernehmungsmethode im Sinne des § 136a StPO ist.41 Mit Seiterle entscheidend ist für eine analoge Anwendung des § 136a StPO, ob der Verlust an Willenskontrolle so schwer wiegt, dass die polygrafengestützte Glaubhaftigkeitsbegutachtung mit der ausdrücklich verbotenen Hypnose oder der Narkoanalyse, für die § 136a StPO analog gilt, gleichgesetzt werden kann: „Denn nur bei diesen beiden Verfahren ist der Verlust von Willenskontrolle das charakteristische Merkmal, während bei den anderen in § 136a Absatz 1 StPO genannten Vernehmungsmethoden die willentliche Steuerung nicht aufgehoben ist, sondern die ‚Wehrlosigkeit und das Ausgeliefertsein des in staatlicher Gewalt befindlichen Individuums‘ auf anderem Wege ‚erreicht‘ wird“.42

Mit deutlichen Worten lehnte der Bundesgerichtshof 1998 eine solche Gleichsetzung ab:43 siehe auch Hamm NJW 1999, 922 (ebd.); Mohnert Psychologie für Juristen § 5 Rn. 229 a. E.; zur Unbrauchbarkeit rein physischer Reaktionen siehe 1. Kapitel IV (S. 10). 39 Amelung JR 1999, 382 (383); so auch Wagner, S. 122. 40 Achenbach NStZ 1984, 350 (f.). 41 Erwähnenswert ist noch die (nur konsequente) Folgeüberlegung Fristers: werde mittels anderer psychologischer Methoden gleichfalls auf das Wissen des Beschuldigten zugegriffen, zum Beispiel die Glaubhaftigkeit seiner Einlassung überprüft, müsse auch eine solche „psychologische Explorationen als Vernehmungsmethode qualifiziert werden; aber bei einer solchen Zielsetzung ist eben auch zu bestreiten, daß sie mit der Regelung des § 136a StPO zu vereinbaren sind“, ZStW 106 (1994) S. 303 (321); wer Frister Recht gibt, muss auch die aussagepsychologische Glaubhaftigkeitsbegutachtung verbieten – und aufgrund des Verweises bei § 69 Absatz 3 StPO auch beim Zeugen; da dies offenkundig nicht der Praxis entspricht, verbietet sich aber ein beschuldigtenfeindliches „Herauspicken“ im Sinne von „Aussageanalyse ja“ und „Polygraf nein“. 42 Seiterle Hirnbild, S. 119; siehe auch Schmitt Meyer-Goßner/Schmitt § 136a Rn. 6: es bedarf einer Gesamtbewertung, die sich an dem Maß der Beeinträchtigung der Willensfreiheit durch die ausdrücklich genannten Verbote zu orientieren hat; zum nicht unumstrittenen Verbot von Hypnose und Narkoanalyse Eisenberg Beweisrecht, Rn. 678 f.; T. Walter Strafprozessrecht, Rn. 179; siehe für eine Anwendung von Hypnose beim Zeugen bereits Less DRZ 1950, 322 (ebd.). 43 BGHSt. 44, 308 (318); zustimmend Momsen KriPoZ 2018, 142 (148): keine vergleich-

152

6. Kapitel: Der Polygraf im Strafverfahren

„[Die] Voraussetzungen für eine entsprechende Anwendung der Vorschrift liegen nicht vor, wenn der Beschuldigte einer Untersuchung mittels des Polygraphen zustimmt, weil es dann an der für eine Analogie erforderlichen Vergleichbarkeit der Fallgestaltungen fehlt. Der Einsatz eines Polygraphen erreicht nach Auffassung des Senats nicht den Schweregrad der vom Gesetz verbotenen Vernehmungsmethoden. Dies zeigt etwa ein Vergleich mit der untersagten Hypnose, durch die gerade unter Ausschaltung des Willens eine Einengung des Bewußtseins auf die von dem Hypnotisierenden gewünschte Vorstellungsrichtung erreicht werden soll. Ebenso verhält es sich bei der Narkoanalyse, auf die § 136a StPO analog angewendet wird. Bei dieser wird der Beschuldigte durch Verabreichung betäubender oder einschläfernder Mittel, welche die Fähigkeit zur gelenkten Willensbetätigung wenigstens beeinträchtigen, in einen Zustand erhöhter Mitteilungsbereitschaft versetzt.“

Dem ist zuzustimmen. Es entspricht nur Sinn und Zweck der psychophysiologischen Methodik, dass der Proband keinen willkürlichen Einfluss auf die körperlichen Reaktionen während seiner Aussage hat. Doch der Gutachter wirkt – anders als zum Beispiel bei der Hypnose und Narkoanalyse – nicht auf die Willensentschließung und entsprechende Willensbetätigung ein. Mithilfe des Polygrafen werden ausschließlich die körperlichen Reaktionen gemessen, die der Proband ohnehin zeigt, sobald er sich freiwillig entscheidet, auszusagen. Seine Reaktionen werden im Rahmen der polygrafengestützten Begutachtung lediglich sichtbarer gemacht – wie mithilfe eines Vergrößerungsglases.44 Und da der Proband die Begutachtung verweigern oder jederzeit unterbrechen kann, bleibt er stets Herr über das „Ob“ und „Wie“ seiner Aussage.45 Wehrlos und ausgeliefert ist er zu keinem Zeitpunkt – zumindest nicht mehr als bei anderen Vernehmungs- oder Begutachtungsmethoden, bei denen der Proband ebenso wenig jeden einzelnen Schritt des Gutachters, jede einzelne Frage der Vernehmungsperson – oder deren zweifelhafte Interpretation rein physischer Reaktionen – kontrolliert.

2. Keine verfassungsrechtlichen Bedenken Obwohl der Bundesgerichtshof 1998 eine Verletzung der Menschenwürde jedenfalls für den Fall einer freiwilligen Begutachtung ausdrücklich verneint hatte,46 warnt etwa Nestler davor, dass „wieder der Vorwurf einer Verletzung der Menschenwürde sowie der Freiheit der Willensentschließung und -betätigung bare Willensbeeinträchtigung; Seiterle Hirnbild, S. 121; früher anderer Ansicht (ohne nähere Begründung) Würtenberger JZ 1951, 772 (773). 44 Siehe bereits Undeutsch ZStW 87 (1975) S. 650 (659). 45 Rogall SK-StPO § 136a Rn. 36, der zutreffend darauf hinweist, dass die konkrete Verfahrenssituation das Aussageverhalten des Beschuldigten durchaus beeinflusst; die Beeinträchtigung der Willensfreiheit muss für § 136a StPO daher von einiger Erheblichkeit sein; so auch Ahlbrecht HK-StPO § 136a Rn. 20; Diemer KK § 136a Rn. 8 („Erheblichkeitsschwelle“); Gleß LR § 136a Rn. 18; Schüssler Polygraphie, S. 72. 46 BGHSt. 44, 308 (315).

III. Die Begutachtung des Beschuldigten

153

im Raum“ stehe, sobald man den Einsatz eines Polygrafen gestatte.47 Drohsel sieht in einer polygrafengestützten Begutachtung sogar (nach wie vor) einen Verstoß gegen Artikel 1 Absatz 1 GG und das aus Artikel 1 in Verbindung mit Artikel 2 Absatz 1 GG abgeleitete allgemeine Persönlichkeitsrecht. Der Beschuldigte müsse Prozesssubjekt bleiben und dürfe nicht zum bloßen Objekt degradiert werden. Daran ändere auch das „vermeintliche Einverständnis“ des Beschuldigten nichts. Die Begründung: Ein Angeklagter, der eine Freiheitsstrafe zu befürchten habe, könne schlicht nicht frei wählen.48 In diesem Sinne hatte bereits 1981 der Vorprüfungsausschuss des Bundesverfassungsgerichts entschieden:49 „Eine derartige ‚Durchleuchtung‘ der Person, welche die Aussage als deren ureigenste Leistung entwertet und den Untersuchten zu einem bloßen Anhängsel eines Apparates werden läßt, greift in unzulässiger Weise in das durch Artikel 2 Absatz 1 in Verbindung mit Artikel 1 Absatz 1 GG geschützte Persönlichkeitsrecht des Betroffenen ein, das der Wahrheitserforschung im Strafverfahren Grenzen setzt […]. An der Unzulässigkeit einer derartigen Beweiserhebung ändert auch die Einwilligung […] nichts. Selbst wenn man es als erlaubt ansehen wollte, dem [Probanden] die Dispositionsmacht über die in Frage stehenden Rechte einzuräumen, schiede hier eine wirksame Einwilligung aus. Eines Schutzes gegen staatliche Eingriffe bedarf nur derjenige nicht, der wählen kann. Diese Freiheit hat der von empfindlicher Freiheitsstrafe bedrohte Angeklagte tatsächlich nicht, dem sich die Untersuchung durch den ‚Lügendetektor‘ als eine günstige Gelegenheit darstellen muß, die er nicht ausschlagen darf.“

Diese Argumentation erinnert an die des Bundesgerichtshofs von 1954, nach der der zustimmende Angeklagte sozusagen vor sich selbst geschützt werden müsse, andernfalls dessen Menschenwürde verletzt sei.50 – Unabhängig davon, dass sich das Bundesverfassungsgericht 1997 und der Bundesgerichtshof 1998 von ihren ursprünglichen Entscheidungen distanziert haben,51 stellt sich die 47 Nestler JA 2017, 10 (16); siehe auch Rogall SK-StPO § 136a Rn. 91 und bereits Peters ZStW 87 (1975) S. 663 (672); nach Putzke ZJS 2011, 557 (562) kann man einer solchen Sichtweise nur mit Kopfschütteln begegnen. 48 Drohsel StV 2018, 827 (829); jeweils knapp Di Fabio Maunz/Dürig Artikel 2 Absatz 1 Rn. 155; Eisenberg Beweisrecht, Rn. 697; auch Achenbach NStZ 1984, 350 (351) – auf den unter anderem Drohsel und Eisenberg verweisen – sah zwar den „berechtigte[n] Kern der Bedenken“ in der „Mechanisierung, der Zwischenschaltung der Maschine als solcher, die den davon Betroffenen zum Inquisiten, zum Objekt in einem apparativen Vorgang macht“; dieses Problem bestehe aber gerade nicht, wenn der Beschuldigte die Begutachtung wünsche (352); so auch BGHSt. 44, 308 (317): im Falle des Einverständnisses bleibt die Subjektstellung unangetastet. 49 BVerfG NStZ 1981, 446 (447); der Verweis auf Peters ZStW 87 (1975) S. 663 (676) a. a. O. ist jedoch irreführend, da Peters gerade nicht auf denjenigen abstellt, der sich begutachten lassen will, sondern auf den „strafprozessualen Gesamtzusammenhang“, also den mittelbaren Druck auf andere Beschuldigte; dazu ausführlich in diesem Kapitel III 3 (S. 157–161). 50 Vgl. BGHSt. 5, 332 (333); hier wird deutlich, dass sich die Argumente mit denen zu § 136a StPO analog teilweise überschneiden. 51 BVerfG StraFo 1998, 16 (ebd.); BGHSt. 44, 308 (315).

154

6. Kapitel: Der Polygraf im Strafverfahren

Frage, wann einem Beschuldigten denn wieder das Recht einzuräumen sei, Entscheidungen frei zu treffen. Wenn nur eine Geldstrafe droht? Erst nach einem Freispruch? Jedenfalls ist es anmaßend, einem Angeklagten in einer ohnehin belastenden Situation unter Berufung auf dessen Menschenwürde und allgemeines Persönlichkeitsrecht das Recht und den Wunsch zu versagen, zu Verteidigungsmitteln zu greifen.52 Einerseits wird auf den Schutz des Angeklagten (vor sich selbst) verwiesen, um ihm ein (entlastendes) polygrafengestütztes Gutachten zu verwehren, andererseits soll er eine unter Umständen unbegründete und materiell rechtswidrige Freiheitsstrafe wehrlos in Kauf nehmen. Man denke an eine vergleichbare Situation, in der eine entlastende Zeugenaussage „zum Schutz des Beschuldigten“ abgewiesen wird mit dem Argument, der Zeuge könne ja Einzelheiten aus dem Intimbereich des Beschuldigten preisgeben.53 Diese „zynische“ und „beschämende“ Argumentation hat einen bedenklichen und, wie ich meine, heuchlerischen Beigeschmack, da ausgerechnet dann die Menschenwürde des Beschuldigten ins Feld geführt wird, wenn es um eine zur Entlastung bestimmte und geeignete Methode geht, die Menschenwürde bei belastenden Maßnahmen aber unberücksichtigt bleibt.54 Welchen „Eingriff“ ein Beschuldigter als menschenunwürdiger empfindet – ein polygrafengestütztes Gutachten zu seinen Gunsten einerseits, Telekommunikationsüberwachung, Untersuchungshaft oder ein mehrjähriger Freiheitsentzug andererseits –, bedarf wohl kaum eines empirischen Nachweises. In diesem Zusammenhang machte Amelung auf einen weiteren Widerspruch aufmerksam, und zwar auf „eine ganze Reihe von Einwilligungen oder ähnlichen Zustimmungserklärungen“ im Strafverfahren, „die wirksam sind, obgleich sie nicht völlig frei von staatlichem Zwang erfolgen“.55 Neben den einwilligungsbedürftigen Weisungen gemäß § 56c Absatz 3 StGB, die sogar mit einem körperlichen Eingriff einhergehen können (Nummer 1),56 um eine Straf52 Wie hier Amelung JR 1999, 382 (384): es sei ein „Hohn“, wenn ein Unschuldiger im Gefängnis sitzen muss, ihm aber zuvor „unter Berufung auf den Schutz seiner Menschenwürde die Führung eines Entlastungsbeweises versagt würde“; (selbst) Frister ZStW 106 (1994) S. 303 (324); Gleß LR § 136a Rn. 64; Rogall SK-StPO § 136a Rn. 93: es bedarf keiner „paternalistischen Fürsorge“. 53 Schwabe NJW 1982, 367 (ebd.). 54 Vgl. Hamm NJW 1999, 922 (ebd.); Prittwitz MDR 1982, 886 (892); Schwabe NJW 1979, 576 (578); siehe auch Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (629); deutlich Meyer-Mews NJW 2000, 916 (917): es herrsche eine In dubio contra reo-Mentalität [sic]. 55 Amelung NStZ 1982, 38 (ebd.); siehe auch ders. JR 1999, 382 (384): „halbfreiwillige ‚eingriffsmildernde‘ oder ‚eingriffsverhindernde‘ Einwilligungen, die unsere Rechtsordnung […] anerkennt, um unverhältnismäßige oder (materiell) unrechtmäßige Beeinträchtigungen […] zu vermeiden“; Seiterle Hirnbild, S. 172: „eingriffsverhindernde Einwilligung“ (Hervorhebung des Verfassers). 56 Zum Beispiel Blutentnahmen, Medikamentengabe, Strahlentherapie oder psychotherapeutische Behandlungen, Bußmann Matt/Renzikowski § 56c Rn. 16 f.; Groß/Kett-Straub MK-

III. Die Begutachtung des Beschuldigten

155

aussetzung zur Bewährung zu ermöglichen und (wie hier) die Vollstreckung einer Freiheitsstrafe zu unterbinden, verweist Amelung auf § 3 Absatz 2 des Kastrationsgesetzes.57 § 3 Absatz 2 KastrG lässt die Wirksamkeit der Einwilligung ausdrücklich unberührt, auch wenn der Einwilligende auf richterliche Anordnung untergebracht ist und diese von Sexualstraftätern in der Regel nur erteilt wird, um der weiteren Vollstreckung einer Freiheitsstrafe oder anderen freiheitsentziehenden Straf- und Sicherungsmaßnahmen zu entgehen.58 In die eigene „Entmannung“ – ansonsten sogar eine schwere Körperverletzung nach § 226 Absatz 1 Nummer 1, Absatz 2 StGB – einzuwilligen, um strafrechtliche Konsequenzen abzumildern, ist gesetzlich gestattet und offenbar im Einklang mit dem „Menschenbild der Verfassung“.59 Einen Entlastungsbeweis zu beantragen – wohlgemerkt ohne einen schwerwiegenden körperlichen Eingriff erdulden zu müssen –, um etwa den erheblichen Grundrechtseingriff einer Freiheitsentziehung zu verhindern, soll aber menschenunwürdig sein und gegen das allgemeine Persönlichkeitsrecht verstoßen. Ohne auf diese fragwürdige Differenzierung weiter eingehen zu wollen, hinkt der Verweis auf die Menschenwürde und das allgemeine Persönlichkeitsrecht bereits aus anderem Grund: Artikel 1 Absatz 1 GG dient nicht der Einschränkung der Freiheit, über sich selbst zu verfügen, sondern dem Schutz des Einzelnen, gerade das tun zu dürfen.60 „Artikel 1 Absatz 1 GG schützt die Würde des Menschen, wie er sich in seiner Individualität selbst begreift und seiner selbst bewußt wird. Hierzu gehört, daß der Mensch über sich selbst verfügen und sein Schicksal eigenverantwortlich gestalten kann.“61 Unmissverständliche Worte fand das Bundesverfassungsgericht 2020 in seinem Urteil zur Verfassungswidrigkeit des § 217 StGB (Hervorhebungen des Verfassers):62 „Von der Vorstellung ausgehend, dass der Mensch in Freiheit sich selbst bestimmt und entfaltet, umfasst die Garantie der Menschenwürde insbesondere die Wahrung personaler Individualität, Identität und Integrität. Damit ist ein sozialer Wert- und Achtungsanspruch verbunden, der es verbietet, den Menschen zum ‚bloßen Objekt‘ staatlichen Handelns zu machen oder ihn einer Behandlung auszusetzen, die seine Subjektqualität prinzipiell in Frage stellt. Die unverlierbare Würde des Menschen als Person besteht hiernach darin, dass er stets als selbstverantwortliche Persönlichkeit anerkannt bleibt.“ StGB § 56c Rn. 31 halten sogar Elektroschockbehandlungen für grundsätzlich einwilligungsfähig. 57 Amelung NStZ 1982, 38 (f.); zustimmend Gerhold ZIS 2020, 431 (435 f.); Prittwitz MDR 1982, 886 (888); Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (631 f.); L. Schneider Nonverbale Zeugnisse, S. 143 f.; Schüssler Polygraphie, S. 63. 58 So ausdrücklich BGHSt. 19, 201 (206); siehe auch Golbs § 3 Rn. 12. 59 Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (631). 60 Vgl. BGHSt. 44, 308 (317); zustimmend Amelung JR 1999, 382 (384). 61 BVerfGE 49, 286 (298); wie hier bereits Amelung NStZ 1982, 38 (ebd.); L. Schneider Nonverbale Zeugnisse, S. 141 f. 62 BVerfGE 153, 182 (260 f.).

156

6. Kapitel: Der Polygraf im Strafverfahren

Die Subjektqualität des Beschuldigten stellt jedoch infrage, wer ihm mit Verweis auf die bestehende psychisch-belastende Prozesssituation eine selbstbestimmte Entscheidung verwehrt, sich psychophysiologisch begutachten zu lassen. Die Kehrseite dieses vermeintlich beschuldigtenfreundlichen Verbots ist nämlich, dem Beschuldigten sein Recht auszuschlagen sich zu verteidigen: „Wer dem Beschuldigten verbietet, ein Beweismittel in das Verfahren einzuführen, legt ihm zugleich die Pflicht zur Unterlassung dieser Beweisführung auf (sowie die Pflicht zur Hinnahme der Konsequenzen).“63 Genau das beschränkt und beeinträchtigt aber die Willensfreiheit des Beschuldigten im Sinne des § 136a StPO. Erst dadurch würde der Betroffene zum bloßen Objekt degradiert und gleichsam entmündigt, nur um ihn angeblich vor einer solchen Objektivierung zu schützen.64 Drohsel und andere, die nach wie vor der Argumentation des Bundesgerichtshofs von 1954 folgen, drängen den Beschuldigten somit „in Lebensformen […], die in unauflösbarem Widerspruch zum eigenen Selbstbild und Selbstverständnis stehen“.65 Das entspricht aber nicht, sondern widerspricht dem in der Würde des Menschen wurzelnden Gedanken autonomer Selbstbestimmung. Der Verweis auf Artikel 1 GG versagt endgültig, sobald man einen Schritt weitergeht und zwischen einem den Angeklagten belastenden und einem ihn entlastenden Ergebnis unterscheidet. Inwiefern es die Menschenwürde oder das allgemeine Persönlichkeitsrecht des Angeklagten verletzen sollte, wenn nur Letzteres, nämlich als Unschuldnachweis, verwertet wird, kann nicht plausibel begründet werden. Mit den Worten von Schwabe: „Denn die Alternative [ist] schlicht und einfach, jemanden ins Gefängnis zu stecken, weil man die angeblich menschenunwürdige Vorbedingung eines Freispruchs ignoriert – ein schlechthin absurdes Ergebnis“.66 Will man an dem „Menschenwürde-Argument“ festhalten, so greift es bei der polygrafengestützten Begutachtung des Beschuldigten höchstens und allein im Falle eines positiven, ihn belastenden Ergebnisses. Bei einem negativen, den Beschuldigten entlastenden Ergebnis – mit einem deutlich überzufälligen Beweiswert von etwa 90 Prozent – weckt es nur den rechtsstaatlich bedenklichen Verdacht, dass man eine plausible Entlastung um jeden Preis verhindern will.

63 Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (629 f.); Schüssler Polygraphie, S. 53: so wird der Beschuldigte „erst recht zum rein passiven Objekt des Verfahrens“. 64 Seiterle Hirnbild, S. 140 f. 65 BVerfGE 153, 182 (261). 66 Schwabe NJW 1979, 576 (578).

III. Die Begutachtung des Beschuldigten

157

3. „Richter sind auch nur Menschen“ oder: unzulässig aufgrund des „strafprozessualen Gesamtzusammenhangs“? Wohl aufgrund der evidenten Schwächen der eben genannten rechtlichen Einwände bedienen sich Gegner der polygrafengestützten Begutachtung eines weiteren Arguments: Andere zukünftige, noch unbekannte Beschuldigte könnten sich unter Druck gesetzt fühlen, sich psychophysiologisch begutachten zu lassen, sollte der Polygraf zugelassen werden. Dieses Argument korreliert augenscheinlich mit dem immer breiteren Zugeständnis, dass mittels eines Polygrafen nicht nur zufällige Ergebnisse erzielt werden können, die polygrafengestützte Begutachtung also nicht so ungeeignet ist, wie der Bundesgerichtshof meint. Eine solche „mittelbare“, „moralische“ oder „indirekte“ Drucksituation verstoße gegen den Nemo-tenetur-Grundsatz.67 Auf die für Gleß68 kaum überschaubaren Konsequenzen wies Peters bereits 1975 hin (Hervorhebungen des Verfassers):69 „Die Frage der Zulässigkeit einer Maßnahme kann nicht nur vom einzelnen Betroffenen her beantwortet werden. Vielmehr muß der strafprozessuale Gesamtzusammenhang berücksichtigt werden. Dabei ist die Frage zu stellen, inwieweit diejenigen, die sich dem Test nicht unterziehen wollen, sich noch frei gegen ihn entscheiden können. Das Sichentziehen bedeutet nur allzu leicht ein Indiz für die Schuld. Wenn es richtig ist, daß die Weigerung, sich der Untersuchung zu unterziehen, mit wenigen Ausnahmen nur bei Schuldigen vorkommt, so ist die Freiheit der Entscheidung von vornherein begrenzt. Damit wird ein grundlegender Satz des Strafprozesses, daß sich niemand zur Sache zu äußern brauche, im Kern angetastet.“

Der Bundesgerichtshof wies 1998 diesen Einwand ab mit einem knappen, wenn auch zutreffenden Verweis auf das Schweigerecht:70 „Die Überlegung, jeder, der einen mittels eines Polygraphen durchgeführten Test zu seiner Entlastung nicht von sich aus beantrage oder diesen gar ausdrücklich ablehne, habe etwas zu verbergen, rechtfertigt die Anwendung des § 136a Absatz 1 Satz 2 StPO unter dem Gesichtspunkt des (mittelbaren) unzulässigen Zwanges ebenfalls nicht. Denn ein derartiges Verhalten dürfte vom Gericht ebensowenig zu Lasten des Beschuldigten berücksichtigt werden wie dessen Entscheidung, sich zu den gegen ihn erhobenen Vorwürfen zu äußern oder zu schweigen.“

67 Siehe etwa Diemer KK § 136a Rn. 34; Di Fabio Maunz/Dürig Artikel 2 Absatz 1 Rn. 155; Drohsel StV 2018, 827 (829); Eisenberg Beweisrecht, Rn. 699; Wagner, S. 90; früher Frister ZStW 106 (1994) S. 303 (324 f.), für den im Rahmen von § 136a StPO „allein [diese] Überlegung“ rechtfertigen könne, dem Beschuldigten die Dispositionsbefugnis zu entziehen. 68 Gleß LR § 136a Rn. 64. 69 Peters ZStW 87 (1975) S. 663 (676); (knapp) bereits Würtenberger JZ 1951, 772 (774). 70 BGHSt. 44, 308 (318).

158

6. Kapitel: Der Polygraf im Strafverfahren

a) Mehr Begründungsaufwand ist kein Gegenargument Die Gegenauffassung leidet an mehreren Fehlannahmen. Einerseits überschätzt sie den Beweiswert eines negativen, entlastenden Ergebnisses. Mag er auch noch so hoch sein, perfekt ist er nicht. Selbst wenn sich ein Beschuldigter für eine Begutachtung entscheidet und ein entlastendes Ergebnis erzielt, besteht nämlich ein (wenn auch geringes) Restrisiko, dass das Ergebnis falsch und der Beschuldigte schuldig ist. Dies ändert nichts an der grundsätzlich gegebenen Geeignetheit der polygrafengestützten Glaubhaftigkeitsbegutachtung im Sinne des § 244 Absatz 3 Satz 3 Nummer 4 StPO. Das Restrisiko eines falsch-negativen Ergebnisses erhöht lediglich den Begründungsaufwand im Rahmen der richterlichen Beweiswürdigung. Mit anderen Worten: Ein Automatismus im Sinne von „negatives Ergebnis ist gleich Unschuld“ – wie auch „positives Ergebnis ist gleich schuldig“ – verstößt gegen die Grundsätze der Beweiswürdigung. Mit Putzke ist das jedoch der Preis, den zu zahlen es lohnt, um Verfahren fairer und Urteile gerechter zu machen.71

b) Nemo tenetur heißt auch, sich äußern zu dürfen Zweitens käme niemand ernsthaft auf die Idee, einem Beschuldigten zu untersagen, sich einzulassen, wenn er dies denn wünscht, mit der Begründung, irgendein anderer Beschuldigter könnte sich möglicherweise aus diesem Grund irgendwann unter Druck gesetzt fühlen, gegen seinen Willen auszusagen. Denn Letzterer hat wie jeder Beschuldigte das Recht, sich nicht selbst zu belasten: Nemo tenetur se ipsum accusare. Die Entscheidung, ob er sich dennoch einlässt, steht ihm frei – unabhängig davon, ob sich ein anderer Angeklagter in dessen Verfahren geäußert hat oder nicht.72 Was beim Schweigerecht Konsens ist, kann nicht anders beurteilt werden bei dem Entschluss, sich psychophysiologisch begutachten zu lassen oder nicht. Aus Sicht des begutachtungswilligen Beschuldigten lässt sich knapp sagen, dass es ihn wohl kaum interessiert, ob sich ein anderer durch seine Aussage „moralisch“ unter Druck gesetzt fühle. Mit dieser Argumentation müsste etwa bei Verfahren mit mehreren Angeklagten „vorsichtshalber“ allen Mitbeschuldigten verboten werden, sich zu äußern. Oder besser: Zum „Wohle Dritter“ formuliert man das Schweigerecht gleich um in eine allgemeine Schweigepflicht. Ein mit dem Selbstbestimmungsrecht und der Subjektstellung des Beschuldigten nicht vereinbarer Gedanke, den – wieder auf die polygrafengestützte Begutachtung übertragen – Schwabe als geradezu „zynische Devise“ bezeichnet, die von „reinem Hohn nicht weit entfernt“ und „rechtsstaatswidrig“ sei.73 Schließlich folgt 71 72

Putzke ZJS 2011, 557 (562). Vgl. auch Klimke NStZ 1981, 433 (ebd.); L. Schneider Nonverbale Zeugnisse, S. 144. 73 Schwabe NJW 1979, 576 (579 f.); zustimmend Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (636).

III. Die Begutachtung des Beschuldigten

159

aus dem Nemo tenetur-Grundsatz die Freiheit jedes einzelnen Beschuldigten, selbst darüber zu befinden, ob und auf welche Art und Weise er an der Sachverhaltsaufklärung mitwirken will – oder eben nicht.74

c) Das menschliche Problem, wenn der Beschuldigte schweigt Doch auch der Blick in die Zukunft auf die „anderen Gruppen“75 vermag nicht zu überzeugen. Ihre Sorge – so der „paternalistische“ Ansatz der Gegner der polygrafengestützten Begutachtung – sei vor allem, dass wenn ein Beschuldigter eine Begutachtung verweigere, der Richter aus dieser Weigerung negative Schlüsse ziehe. Ein so erfolgversprechendes Beweismittel auszuschlagen, sei mehr als verdächtig und hinterlasse einen „negativen Eindruck“.76 Und um den hohen Beweiswert wissend wäre ein Richter geneigt, die Weigerung „bewusst oder unbewusst, offen oder unausgesprochen“ als Schuldindiz zu werten.77 Nun sind Richter nur Menschen, und es ist mehr als menschlich, inneren Überzeugungen, Vorbehalten und Verdächtigungen nachzugeben.78 Dennoch wäre diese Argumentation, folgte man ihr, ein Armutszeugnis für die deutsche (und österreichische) Justiz. Denn der Richter als neutraler Dritter muss sich frei machen von derartigen subjektiven Vorannahmen, um keine berechtigte Besorgnis der Befangenheit zu begründen.79 So entspricht es gefestigter Rechtsprechung, dass der Verzicht des Angeklagten auf Beweismittel nicht zu dessen Nachteil gewertet werden darf – unabhängig davon wie „hoffnungslos“ die Situation erscheint. Der Beschuldigte darf nicht nur schweigen, sondern ebenso auf den Antritt eines Entlastungsbeweises verzichten, ohne befürchten zu müssen, dass dieses Verhalten zu seinem Nachteil verwertet wird.80 Dass dies nicht immer einfach ist, ist kein Argument, Beschuldigten einen möglichen Entlastungsbeweis von Anfang an zu nehmen, zumal dies suggeriert, dass Richter ge74

BGHSt. 42, 139 (152) (Großer Senat). Wagner, S. 96. Wagner, S. 96 f.; in Österreich ist die Verwertung des Schweigens des Angeklagten zu dessen Lasten gängige Rechtsprechung, S. 97 mit Rechtsprechungsnachweis. 77 Eisenberg Beweisrecht, Rn. 699, der jedoch in Rn. 899–900 ausführlich zur Selbstbelastungsfreiheit Stellung nimmt: „aus dem Schweigen des Angeklagten [ließe sich] schwerlich ein Schluss auf die Schuld ziehen, denn die Gründe können vielschichtig sein“; nichts anderes darf aber für eine verweigerte Begutachtung gelten. 78 So auch Seiterle Hirnbild, S. 180 f., nach dem zumindest der „gesunde Menschenverstand“ Schweigen oder eine verweigerte Begutachtung als Schuldeingeständnis interpretiert. 79 Siehe auch Amelung JR 1999, 382 (385). 80 Siehe nur BGHSt. 41, 153 (154 f.); 49, 56 (58 f.); BGHR StPO § 261 Überzeugungsbildung 8; Eschelbach BeckOK-StPO § 261 Rn. 19 (trotz faktischer „Suggestivwirkung“); Ott KK § 261 Rn. 161; anders noch BGHSt. 20, 298 (300 f.) ausschließlich für den Fall, dass sich der Angeklagte konkret auf den Inhalt eines in anderer Sache geführten Gesprächs mit seinem Rechtsanwalt berufen und dabei eine Einlassung abgegeben hatte, die nur von dem Rechtsanwalt bestätigt oder widerlegt hätte werden können, der Angeklagte aber den Rechtsanwalt nicht von seiner Schweigepflicht entband; siehe in ausdrücklicher Abgrenzung aber BGHSt. 45, 367 (369 f.). 75 76

160

6. Kapitel: Der Polygraf im Strafverfahren

nerell unfähig seien, eine solche Differenzierung zu treffen. Wer es nicht kann, ist schlicht ungeeignet, das Richteramt auszuüben. Verallgemeinern lässt sich das jedoch nicht.81 Ansonsten wäre jedes Verwertungsverbot obsolet.82 Damit ist das Ergebnis gefunden: Genauso wie ein Richter keine negativen Schlüsse aus dem Schweigen eines Angeklagten (inklusive dessen Mimik und Gestik) ziehen darf, mag die Beweislage auch noch so erdrückend sein,83 muss es ihm untersagt sein, eine verweigerte Begutachtung negativ zu werten.84 Für eine Weigerung kann es wie beim Schweigen mehrere Gründe geben – ungeachtet der Schuld oder Unschuld des Beschuldigten.85 Nicht zuletzt ist an den Rat des Verteidigers an seinen Mandanten zu denken, sich nicht zur Sache zu äußern.86 Für den Richter ist und bleibt die Motivation des Angeklagten, sich nicht zu äußern oder begutachten zu lassen, aber unergründbar. So wie das Schweigen beim Schweigenden darf auch die Weigerung nicht gegen den Sich-Weigernden verwertet werden. Ein mittelbarer Druck auf den hypothetisch gedachten anderen Beschuldigten ist somit unbegründet, da er keine negativen Konsequenzen seiner Untätigkeit zu befürchten hat. Vielmehr muss sich das Gericht wie auch beim schweigenden oder ansonsten untätigen Beschuldigten bemühen, den Sachverhalt von Amts wegen, das heißt ohne dessen Mitwirkung aufzuklären.87 Andernfalls wäre – um Peters zumindest inso81

lage.

In diese Richtung aber Seiterle Hirnbild, S. 182–184, jedenfalls bei belastender Beweis-

82 Ähnlich bereits Prittwitz MDR 1982, 886 (894); anderer Ansicht Frister ZStW 106 (1994) S. 303 (325 f.): ein Richter würde sich einer Berücksichtigung ungeachtet eines Verwertungsverbots nicht vollständig entziehen, und auch das Schweigen des Beschuldigten werde oft unbewusst als Indiz für die Schuld gewertet; Seiterle Hirnbild, S. 229 f.: auch ein Verwertungsverbot könne die „alltägliche Schuldvermutung“ nicht in ausreichendem Maß verhindern. 83 Siehe nur BVerfGE 56, 37 (43); BGHSt. 42, 139 (151 f.) (Großer Senat); Petry, S. 41 f.; Roxin/Schünemann § 25 Rn. 31 f.; Sander LR § 261 Rn. 121; Schmitt Meyer-Goßner/Schmitt § 261 Rn. 16; T. Walter Strafprozessrecht, Rn. 139, 144. 84 Wie hier Achenbach NStZ 1984, 350 (351); Amelung NStZ 1982, 38 (39): „natürlich ein Verwertungsverbot“; Klimke NStZ 1981, 433 (ebd.); Schüssler Polygraphie, S. 64; Undeutsch ZStW 87 (1975) S. 650 (657 f.); auch Nestler JA 2017, 10 (15 in Fn. 111) hält ein „negatives“ (sie meint ein positives) Ergebnis zu Lasten des Angeklagten für nicht verwertbar; da eine „polygraphische Untersuchung“ nur bei „erdrückender“ Beweislage in Betracht komme, bedeute ein solches Ergebnis „faktisch“ eine Verurteilung; das mag der Rechtspraxis entsprechen, lässt aber das eigentliche Problem unberücksichtigt, dass Stand heute eine solche „erdrückende“ Beweislage in Aussage-gegen-Aussage-Konstellationen mangels überzeugenden Nachweises der Glaubhaftigkeit kaum existiert. 85 Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (634 f.); siehe zum Schweigen nur Eisenberg Beweisrecht, Rn. 900; Sander LR § 261 Rn. 119. 86 Seiterle Hirnbild, S. 181. 87 Vgl. Ott KK § 261 Rn. 162; Sander LR § 261 Rn. 120; dies ergibt sich gemäß Petry, S. 41, bereits daraus, dass nach § 261 StPO die gerichtliche Überzeugung „aus dem Inbegriff der Verhandlung“ gewonnen werden muss, was beim Nicht-Gebrauchmachen eines prozessualen Rechts ausgeschlossen ist.

III. Die Begutachtung des Beschuldigten

161

fern Recht zu geben – „ein grundlegender Satz des Strafprozesses, daß sich niemand zur Sache zu äußern brauche, im Kern angetastet“.88 Die Gefahr, dass sich Richter dennoch unbewusst oder insgeheim – und damit rechtswidrig – von ihren Eindrücken leiten lassen, kann niemals vollends von der Hand gewiesen werden. Es wäre tatsächlich „naiv“89 anzunehmen, dass es keinen einzigen befangenen Richter gebe, der sich über Verwertungsverbote hinwegsetzt. Doch ist dies kein rechtliches Argument, sondern ein menschliches, das dem Strafverfahren (leider) stets immanent ist. Momsen weist zu Recht darauf hin, dass es psychologisch gesehen schwer bleibt, belastende Ergebnisse zu ignorieren oder eine Weigerung nicht zu hinterfragen.90 Richtern generell die Fähigkeit abzusprechen, Verwertungsverbote zu befolgen, wie Frister und Seiterle es zumindest andeuten,91 geht allerdings zu weit. Ansonsten findet man sich schnell im „Reich der Spekulation“ über psychologische Vorgänge richterlicher Entscheidungsfindung.92

4. Warum nur ein entlastendes Ergebnis verwertbar ist Sowohl die verfassungsrechtlichen Bedenken als auch die Sorge um einen mittelbaren Druck aufgrund der Gefahr einer faktischen richterlichen Voreingenommenheit lassen sich weiter entkräften, wenn man die rechtliche Zulässigkeit der polygrafengestützten Begutachtung des Beschuldigten an deren Ausgang knüpft. Weder lassen sich das allgemeine Persönlichkeitsrecht und die Menschenwürde als Gegenargumente hören, noch kann sich ein zukünftiger Beschuldigter unter Druck gesetzt fühlen, wenn ausschließlich ein entlastendes Ergebnis bei dessen Begutachtung berücksichtigt wird. Ein solches Verwertungsverbot trägt zudem dem ohnehin niedrigeren Beweiswert positiver Ergebnisse Rechnung, der oft als Grund gegen eine Zulassung der polygrafengestützten Begutachtung insgesamt herangezogen wird: Zu groß sei das Risiko einer Falschbelastung.93 Die Gefahr, dass ein Unschuldiger zu Unrecht belastet wird – zum Beispiel weil er aufgrund verständlicher Aufregung darüber, falsch beschuldigt worden zu sein, ein positives Ergebnis erzielt –, wird so auf ein Minimum reduziert.94 88

Peters ZStW 87 (1975) S. 663 (676). Frister ZStW 106 (1994) S. 303 (325). Momsen KriPoZ 2018, 142 (149). 91 Vgl. Frister ZStW 106 (1994) S. 303 (325 f.); Seiterle Hirnbild, S. 188; relativierend auf S. 203 f. mit dem insofern überzeugenden Argument, dass Richter unter Umständen sogar DNA- oder Fingerspuren zu ignorieren haben, und zwar nach einer entsprechenden Untersuchung. 92 Vgl. Seiterle Hirnbild, S. 206. 93 Siehe nur Rill/Vossel NStZ 1998, 481 (484, 486). 94 Wie hier Amelung NStZ 1982, 38 (40); Delvo, S. 216, 376; Meyer-Mews NJW 2000, 916 (917); Momsen KriPoZ 2018, 142 (149); Steller Aussagebeurteilung, S. 151; für eine Zu89 90

162

6. Kapitel: Der Polygraf im Strafverfahren

Eine solche Meistbegünstigungslösung mag auf den ersten Blick sogar zu beschuldigtenfreundlich klingen, ist aber zwingend geboten in einem Rechtssystem, das den Grundsatz ernst nimmt, „lieber zehn Schuldige laufen zu lassen, als einen Unschuldigen zu verurteilen“.95 Ein solcher Ansatz ist lediglich logische Folge der umfassend zu respektierenden Selbstbelastungsfreiheit und des In-dubio-Grundsatzes.

a) Alibi-Rechtsprechung „analog“ Absichern lässt sich die Meistbegünstigungslösung, indem man ein positives Ergebnis beim Beschuldigten behandelt wie die herrschende Meinung einen misslungenen Alibibeweis – und zwar als Nullum.96 Wenn selbst das Scheitern eines Alibibeweises – weil objektiv widerlegt oder nachweislich erlogen – für sich allein und ohne Rücksicht auf Gründe kein Indiz für die Täterschaft liefert, muss dies erst recht für ein positives Ergebnis einer polygrafengestützten Begutachtung gelten. Bei einem misslungenen Alibibeweis so wie bei jeder für das Gericht erwiesenen Lüge des Angeklagten spricht für diesen, dass auch ein Unschuldiger versucht sein kann, sich vor Gericht mit einer Lüge zu helfen, um seine Aussichten zu verbessern.97 Mit anderen Worten wird dem Beschuldigten sogar unterstellt, gelogen zu haben, das Gericht wertet dies aber in dubio pro reo dennoch nicht als Schuldindiz. Bei einem positiven Ergebnis kann bereits nicht ohne Weiteres angenommen werden, der Beschuldigte habe während der Begutachtung bewusst wahrheitswidrig ausgesagt. Vielmehr kann ein positives Ergebnis zum Beispiel auch darauf zurückzuführen sein, dass der tatsächlich unschuldige Proband aus anderen Gründen stärkere Reaktionen auf die tatbezogenen Fragen gezeigt hat. Dies belegen immerhin die niedrigeren Trefferquoten bei Unschuldigen. Für den Angeklagten und ein Verwertungsverbot bezüglich eines positiven Ergebnisses sprechen daher zweierlei: erstens die Annahme eines falsch-positiven Resultats und zweitens der Grundsatz, dass selbst eine erwiesene Lüge noch kein tragfähiges Indiz für die Täterschaft ist. Ein „gescheiterter“ Entlastungsbeweis mittels eines Polygrafen hat daher in jedem Fall unberücksichtigt zu bleiben. lassung sowohl für als auch gegen den Beschuldigten Klimke NStZ 1981, 433 (ebd.); Seiterle Hirnbild, S. 247 f. 95 Amelung JR 1999, 382 (385 in Fn. 25). 96 Wie hier T. Walter Strafprozessrecht, Rn. 188; zur herrschenden Meinung BGHSt. 41, 153 (154 f.); Dahs/Müssig MAH Strafverteidigung § 12 Rn. 360; Miebach MK-StPO § 261 Rn. 181; Sander LR § 261 Rn. 98, 194. 97 BGHSt. 41, 153 (156); BGH NStZ-RR, 2020, 286 (ebd.); StV 2019, 519 (520); Sander LR § 261 Rn. 116; Schmitt Meyer-Goßner/Schmitt § 261 Rn. 25; T. Walter Strafprozessrecht, Rn. 140; dies gilt selbst bei einem Fluchtversuch des Beschuldigten, BGH NStZ 2008, 303 (ebd.); Eschelbach BeckOK-StPO § 261 Rn. 20: ein solcher ist „ohne Aussagekraft“.

III. Die Begutachtung des Beschuldigten

163

Nun lässt sich erneut einwenden, dass sich auch mit dieser Lösung nicht vermeiden lässt, dass das ein oder andere auf der Richterbank sitzende schwarze Schaf ein solches Verwertungsverbot ignoriert.98 So liegt nahe, dass ein Richter trotz doppelter Anwendung des Zweifelssatzes ein positives Ergebnis als Belastungsindiz „unausgesprochen“ verwertet; immerhin liegt auch der Beweiswert eines positiven Ergebnisses über dem Zufallswert. Doch ist dies kein Grund, einem Beschuldigten per se zu verbieten, sich eines Entlastungsbeweises zu bedienen. Denn anders als etwa Frister halte ich es für rechtsstaatlich bedenklich, Fehlurteile bei Unschuldigen um des Strafverfolgungsinteresses willen „ganz selbstverständlich“ in Kauf zu nehmen.99 Auch wenn „in unserer Strafprozeßordnung“100 stets das Risiko eines Fehlurteils enthalten sein mag, sollte unser Rechtsstaat doch bemüht sein, derartige Fehler auf ein Minimum zu reduzieren. Und dies gelingt, wenn man die polygrafengestützte Begutachtung des Beschuldigten ausschließlich als Entlastungsindiz zulässt.

b) Der freundliche Gutachter: Gibt es ein „Friendly Examiner Syndrome“? Zwar verhindert die Meistbegünstigungslösung, dass sich Beschuldigte „mittelbar“ unter Druck gesetzt fühlen und falsch-positive, belastende Ergebnisse zu falschen Verurteilungen führen könnten. Andererseits verlangt die Psychophysiologie ein Mindestmaß an „Bedrohlichkeit“ und Angespanntheit.101 Unter anderem Rogall und ihm folgend der Dritte Strafsenat – in einem Beschluss zur Nichtberücksichtigung eines privaten polygrafengestützten Gutachtens – stellen verlässliche Beweisergebnisse daher generell infrage, sollte ein belastendes Ergebnis nicht verwertet werden dürfen. Der beschuldigte Proband habe keine Nachteile zu befürchten.102 Mit anderen Worten: Er habe nichts zu verlieren und könne eine Begutachtung zumindest einmal versuchen.103 In der englischsprachigen Literatur spricht man von einem „Friendly Examiner Syndrome“ oder einer „Friendly Polygrapher Hypothesis“.104 Unabhängig davon, dass dieses Phänomen empirisch bislang nicht nachgewiesen werden konnte,105 gewinnt der Beschuldigte rein gar nichts, wenn 98 Vgl. Momsen KriPoZ 2018, 142 (149); Seiterle Hirnbild, S. 243 f. und S. 245: ansonsten wäre der „Einsatz eines ‚Lügendetektor‘-Tests […] generell zulässig“. 99 Vgl. Frister ZStW 106 (1994) S. 303 (327). 100 Frister a. a. O. 101 Siehe 4. Kapitel III 1 (S. 99 f.). 102 BGH NJW 1999, 662 (663); Rogall SK-StPO § 136a Rn. 87; offen gelassen von BGHSt. 44, 308 (320). 103 Siehe auch Schwabe NJW 1979, 576 (580): „Anreiz für Schuldige“; auch Schwabe hält das „Friendly Examiner Syndrome“ allerdings für widerlegt (a. a. O. in Fn. 35). 104 Vgl. Delvo, S. 60; Raskin/Kircher Credibility Assessment, S. 63 (119). 105 So selbst Iacono Handbook of Psychophysiology, S. 565 (572); siehe auch Seiterle Hirnbild, S. 268; Steller Aussagebeurteilung, S. 67; Putzke/Scheinfeld/Klein/Undeutsch ZStW 121 (2009) S. 607 (618 f.) halten die Befürchtung sogar für widerlegt mit Verweis auf Un-

164

6. Kapitel: Der Polygraf im Strafverfahren

er ein positives Ergebnis erzielt,106 zumal die Angst vor Entdeckung gerade nicht der einzige wesentliche Faktor ist für die Entstehung verschiedener Reaktionen auf tatrelevante und Vergleichsfragen.107 Schließlich misslingt sein in einer Aussage-gegen-Aussage-Konstellation meist einziger Entlastungsbeweis. Einem Probanden, dem diese Konsequenz bewusst sein wird, kann aber kaum unterstellt werden, er habe nichts zu verlieren und könne sich völlig entspannt begutachten lassen.108 In einem Punkt ist dem Dritten Strafsenat aber zuzustimmen: Der Beweiswert eines privat veranlassten Gutachtens geht zumindest dann gegen Null, wenn nicht sichergestellt werden kann, dass der Beschuldigte sich nicht einfach so oft begutachten ließ, bis er ein negatives, für ihn günstiges Ergebnis erzielen konnte.109 Auch dieser Punkt ist jedoch nur theoretischer Natur, da sich kaum ein professioneller Gutachter finden lässt, der sich bewusst standeswidrig und mit Blick auf § 79 Absätze 2 und 3 StPO rechtswidrig verhält.110 Zumindest für das deutsche Strafverfahren ist daher mit Schüssler das Friendly Examiner Syndrome unerheblich.111 Zusammengefasst ist ein positives Ergebnis ebenso wenig verwertbar wie die Weigerung des Beschuldigten, sich begutachten zu lassen. Die gegenteilige Auffassung, die weder ein entlastendes noch ein belastendes Ergebnis berücksichtigen möchte, scheint einen Entlastungsnachweis nur deshalb nicht zuzulassen, weil die Strafprozessordnung ohnehin schon beschuldigtenfeindlich sei.112

deutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (103 f.); und tatsächlich sprechen die Ergebnisse der allgemeinen Laborstudien gegen das „Friendly Examiner Syndrome“, da gerade nicht mehr falsch-negative als falsch-positive Ergebnisse erzielt worden sind, so auch Raskin/Kircher Credibility Assessment, S. 63 (120 f.); siehe nur Tabelle 10 im 5. Kapitel V (S. 139). 106 Gemäß Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (178) ist wenn überhaupt eine Zunahme nicht entscheidbarer Fälle denkbar; deutlicher Putzke/ Scheinfeld StraFo 2010, 58 (62): „Wer den Einwand des ‚friendly examiner syndrome‘ erhebt, macht damit deutlich, dass er mit der Untersuchungsmethode nicht hinreichend vertraut ist“. 107 Siehe erneut 4. Kapitel III 1 (S. 99 f.); konkret im Zusammenhang mit dem „Friendly Examiner Syndrome“ Steller/Dahle Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127 (178). 108 Wie hier Eisenberg Beweisrecht, Rn. 701 in Fn. 441; Putzke/Scheinfeld StraFo 2010, 58 (62); Raskin/Kircher Credibility Assessment, S. 63 (120). 109 Aus diesem Grund für eine generelle Unverwertbarkeit privater Gutachten Schüssler Polygraphie, S. 179, 185; Seiterle Hirnbild, S. 269. 110 Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (102). 111 Schüssler Polygraphie, S. 140 f.; wie hier auch Eisenberg Beweisrecht, Rn. 701: eine große Gefahr der Verfälschung darf nicht immer unterstellt werden (dort in Fn. 441). 112 Vgl. erneut Frister ZStW 106 (1994) S. 303 (327).

VI. Der Einsatz des Polygrafen beim Zeugen

165

VI. Der Einsatz des Polygrafen beim Zeugen Eine andere Ausgangslage besteht beim Zeugen. Bei einem überzufälligen Beweiswert liegt es nahe, den Polygrafen einzusetzen, um die Glaubhaftigkeit der eigenen Aussage zu untermauern, aber auch, um dem Verdacht einer Falschbeschuldigung nachzugehen.113 Der Einsatz des Polygrafen beim Zeugen wurde bislang weder höchstrichterlich entschieden noch ausführlich im Schrifttum behandelt.114 In der juristischen Literatur sprach sich soweit ersichtlich erstmals Less für eine Begutachtung auch des Belastungszeugen aus.115 Dieses Szenario ist zumindest nicht mehr nur theoretischer Natur: Das Amtsgericht Bautzen hatte 2013 nicht nur den Beschuldigten, sondern zusätzlich die Zeugin psychophysiologisch begutachten lassen.116 Jedoch ist zu unterscheiden: Einerseits kann der Zeuge eine polygrafengestützte Begutachtung wünschen, um der eigenen Aussage Nachdruck zu verleihen. Ein einleuchtendes Begehren, wenn man sich an den nur eingeschränkten Beweiswert sowohl der richterlichen Intuition als auch einer aussagepsychologischen Begutachtung erinnert. Davon abzugrenzen ist, ob sich ein Zeuge begutachten lassen muss, um die Glaubhaftigkeit seiner Aussage überprüfen zu lassen.117 Denn anders als der Beschuldigte ist der Zeuge gemäß § 48 Absatz 1 Satz 2 StPO zur Aussage verpflichtet, sofern ihm kein Aussageverweigerungsrecht nach §§ 52 bis 55 StPO zusteht. Da der Zeuge andernfalls ohnehin aussagen muss, gibt es hier keinen Konflikt mit dem Schweigerecht. Einer erzwungenen Begutachtung – man denke wieder an einen widerstrebenden Zeugen, der an einen Stuhl gefesselt wird – stünde allerdings § 69 Absatz 3 in Verbindung mit § 136a StPO entgegen – unabhängig davon, dass eine Begutachtung in einem solchen Fall schon methodisch nicht durchgeführt werden kann.118 Hier kann es also nur um eine Pflicht gehen, die sich gegebenenfalls im Sinne von § 70 StPO mit Zwangsmitteln wie Ordnungsgeld und Haft durchsetzen ließe.

113 114

Greuel/H. Offe/A. Fabian/Wetzels/T. Fabian/S. Offe/Stadler, S. 239. Jeweils knapp Eisenberg Beweisrecht, Rn. 700; Meyer-Mews NJW 2000, 916 (919); Schwabe NJW 1979, 576 (580). 115 Less DRZ 1950, 322 (ebd.) spricht sogar von einer „Erlösung für den Richter“ in Aussage-gegen-Aussage-Konstellationen. 116 AG Bautzen, Urteil vom 26.3.13 – 40 Ls 330 Js 6351/12; jedoch durch ein und dieselbe Sachverständige; kritisch dazu sogleich 7. Kapitel I (S. 174). 117 In diesem Sinne Less DRZ 1950, 322 (ebd.). 118 Siehe erneut Delvo, S. 23; Eisenberg Beweisrecht, Rn. 695; Jayne Polygraph 19 (1990) S. 105 (106).

166

6. Kapitel: Der Polygraf im Strafverfahren

1. Begutachtungspflicht beim Zeugen? Während ein nicht aussagender Zeuge trotz gesetzlicher Pflicht nicht zum Sprechen gezwungen werden kann – natürlich kann man ihn nicht dazu bringen, seine Stimmbänder zu aktivieren –, sieht die Strafprozessordnung in § 70 StPO dennoch konkrete Zwangsmittel vor, wenn er seine Aussage ohne gesetzlichen Grund verweigert. Und gemäß § 81c Absatz 6 Satz 1 gilt § 70 StPO entsprechend, wenn ein Zeuge ohne gesetzlichen Grund eine dort normierte Untersuchung verweigert. Doch eine mit solchen Mitteln durchsetzbare Verpflichtung, sich neben der Aussage zusätzlich einer polygrafengestützten Begutachtung zu unterziehen, ist zumindest de lege lata nicht denkbar.119 Einem solchen Szenario steht § 81c StPO entgegen. Nach herrschender und hier vertretener Auffassung wird eine Glaubhaftigkeitsbegutachtung, und zwar jeglicher Art, nicht von § 81c StPO umfasst, da es um keine „Spuren“ im Sinne der Vorschrift geht. Ohne Einwilligung kann eine Glaubhaftigkeitsbegutachtung somit nach gegenwärtiger Gesetzeslage nicht durchsetzbar angeordnet werden.120 Letztendlich könnte aber selbst eine Regelung de lege ferenda im Sinne von § 81c Absatz 6 Satz 1 StPO nicht garantieren, dass sich der Zeuge trotz Zwangsmittel auf eine polygrafengestützte Begutachtung derart einlässt, dass mit ihr verwertbare Ergebnisse erzielt werden können – obgleich die Aussicht auf ein sonst drohendes Zwangsgeld oder auf Beugehaft zumindest verhindern könnte, dass Zeugen eine polygrafengestützte Glaubhaftigkeitsbegutachtung stets grundlos verweigern. Davon abzugrenzen ist die Frage, ob und inwiefern die Weigerung verwertet werden kann (dazu sogleich). Auf die polygrafengestützte Begutachtung nicht übertragen lässt sich jedenfalls die Rechtsprechung, nach der trotz Weigerung des Zeugen, sich aussagepsychologisch begutachten zu lassen, der Sachverständige der richterlichen Vernehmung beiwohnen, den Zeugen befragen und dessen Aussage analysieren darf.121 Unabhängig davon, dass der Beweiswert dieser Analyse deutlich geringer ist als der einer aussagepsychologischen Begutachtung de lege artis,122 ist eine solche „Umgehung“ beim Polygrafen bereits methodisch undenkbar.

119 Anderer Ansicht Less DRZ 1950, 322 (ebd.); Petry, S. 175: das Unbehagen des Zeugen sei ihm in Interesse der Strafrechtspflege durchaus zuzumuten; T. Walter Strafprozessrecht, Rn. 188: de lege ferenda; dann erscheint auch eine Regelung wie § 81c Absatz 6 Satz 1 StPO denkbar. 120 Vgl. Krause LR § 81c Rn. 8 und in diesem Kapitel bereits unter III 1 a) (S. 146–148). 121 BGHSt. 23, 1 (2); Krause LR § 81c Rn. 9; L. Schneider Nonverbale Zeugnisse, S. 27. 122 Siehe nur Eisenberg Beweisrecht, Rn. 1661a; Krause LR § 81c Rn. 10; Schmitt MeyerGoßner/Schmitt § 81c Rn. 8.

VI. Der Einsatz des Polygrafen beim Zeugen

167

2. Die vom Zeugen gewünschte Begutachtung Deutlich weniger Probleme bereitet die Konstellation, dass sich der Belastungszeuge begutachten lassen möchte. Schüssler etwa hält den Einsatz des Polygrafen beim Zeugen mit dessen Zustimmung für „unbedenklich“ sowie die prozessuale Anwendung für „unproblematisch“ und zieht zu Recht die Parallele zur aussagepsychologischen Begutachtung.123 Immerhin liegt es nahe, dass ein Belastungszeuge seine belastende Aussage mithilfe des Polygrafen zu untermauern wünscht. Steller sah hierin sogar eine Möglichkeit, generell zur psychischen Entlastung von Zeugen beizutragen.124 Bei Opferzeugen liegt es jedoch nahe, dass (auch) sie nicht selten stärker auf die tatrelevanten Fragen reagieren werden, die sie an das Ereignis erinnern, und ihre Aussagen als Folge zu Unrecht als unglaubhaft eingestuft würden.125 Diese Gefahr unterscheidet sich allerdings nicht von dem auch beim Beschuldigten vorhandenen und schließlich methodenimmanenten Risiko eines falschen Ergebnisses – sowohl eines positiven als auch eines negativen.126 Der Richter muss diese beim Beschuldigten wie beim Zeugen im Rahmen der Beweiswürdigung berücksichtigen. Auch bei der Glaubhaftigkeitsbegutachtung des Zeugen (und zwar bei der polygrafengestützten und der aussagepsychologischen) verbietet sich ein Automatismus im Sinne von „positives Ergebnis beim Zeugen ist gleich unschuldig“ und „negatives Ergebnis ist gleich schuldig“.127 Dennoch ist aufgrund des überzufälligen Beweiswerts ein indizieller Wert nicht zu leugnen. Unabhängig davon ist bei einem negativen Ergebnis beim Zeugen – das Gutachten bestätigt also dessen Anschuldigungen – bei der Beweiswürdigung stets Vorsicht geboten.128 Folgender Sachverhalt ist denkbar: Für das Opfer war es subjektiv eine Vergewaltigung, da es den Beischlaf nicht wollte, was für einen objektiven Dritten auch erkennbar gewesen wäre. Der Angeklagte erkannte den Widerwillen jedoch nicht und ging von Einvernehmlichkeit aus. Hier könnte das Opfer zwar ein richtiges negatives Ergebnis erzielen, das dessen belastende Aussage bekräftigen würde. Falsch wäre eine Verurteilung dennoch, da der Angeklagte aufgrund eines Tatbestandsirrtums ohne Vorsatz handelte. 123 124

Schüssler Polygraphie, S. 87 f. Steller Aussagebeurteilung, S. 168. 125 Vgl. Raskin/Honts Handbook of Polygraph Testing, S. 1 (36 f.); Undeutsch/Klein Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45 (125 f.). 126 Schwabe NJW 1979, 576 (581) und Seiterle Hirnbild, S. 274, gehen davon aus, dass sich ein lügender Zeuge kaum freiwillig begutachten lassen wird, so dass das Risiko eines falsch-negativen Ergebnisses nur minimal sei; das lässt sich mit Blick auf den hohen Anteil vorsätzlicher Falschbeschuldigungen jedoch nicht pauschal behaupten. 127 Ein zumindest hinsichtlich der aussagepsychologischen Begutachtung realitätsfernes Argument in Anbetracht der hohen Übereinstimmungsquoten; diese zeigen jedoch umgekehrt, dass die Gefahr eines falschen (vor allem den Angeklagten belastenden) Ergebnisses ohne Weiteres hingenommen wird. 128 Schwabe NJW 1979, 576 (582) erwägt sogar ein Verwertungsverbot de lege ferenda.

168

6. Kapitel: Der Polygraf im Strafverfahren

In diesem Zusammenhang muss sich ein Richter zudem eines allgemeinen Problems bei Zeugenaussagen bewusst sein: So kann auch Suggestion beim Zeugen zu einem negativen Ergebnis führen, ohne dass es methodisch gesehen falsch ist. Wie die kriterienorientierte Inhaltsanalyse kann der Polygraf lediglich zur Aufdeckung subjektiv unwahrer Aussagen verhelfen. Jedenfalls hätte der Beschuldigte seinerseits wieder die Möglichkeit, sich psychophysiologisch begutachten zu lassen, um so den Beweiswert der Zeugenbegutachtung weiter zu schmälern.129

3. Folgen einer verweigerten Begutachtung Obgleich nach momentaner Gesetzeslage keine Begutachtungspflicht besteht, stellt sich die Frage, wie eine Weigerung des Belastungszeugen zu werten ist, zusätzlich einen Polygrafen zur Untermauerung seiner Aussage heranzuziehen. Sie stellt sich umso mehr, wenn man wie Walter fordert, eine Begutachtung beim Zeugen (inklusive Zwangsmittel) obligatorisch zu machen,130 dieser sich aber dennoch renitent wehrt, so dass eine Begutachtung methodisch nicht durchzuführen ist. Diese Frage betrifft letztendlich auch eine ohne gesetzlichen Grund verweigerte aussagepsychologische Begutachtung, obgleich sie dort entschärft ist durch die bereits erwähnte Möglichkeit, den Sachverständigen der Zeugenaussage beiwohnen zu lassen. Bei der polygrafengestützten Begutachtung kann der Sachverständige dagegen selbst keine Auskunft erteilen; er ist dann ein völlig ungeeignetes Beweismittel.131 Nach Less soll es einem Richter allerdings nicht verwehrt sein, Schlüsse aus einer verweigerten Begutachtung zu ziehen.132 Immerhin liegt es nahe – so Schwabe –, dass sich Belastungszeugen einer zusätzlichen Begutachtung nur dann stellen würden, wenn sie ohnehin nichts zu verbergen haben.133 Eine Weigerung erscheint daher zumindest verdächtig. Nun könnte man eine Verwertung mit denselben Argumenten ablehnen, die gegen eine Verwertung der Weigerung des Beschuldigten sprechen. Der entscheidende Unterschied ist allerdings, dass der sich weigernde Zeuge – anders als der Beschuldigte – keine unmittelbaren nachteiligen Konsequenzen zu befürchten hat. Hat er einen gesetzlichen Grund, die Begutachtung zu verweigern, folgt dies schon aus § 81c Absatz 3 StPO (analog). Doch auch wenn er sich grundlos weigert, gibt es für ihn keine unmittelbaren Nachteile. Wie der Beschuldigte kann der Zeuge grundsätzlich verschiedene Gründe haben, weshalb er eine Begutachtung ablehnt. Ein unmittelbares Indiz für eine Falschaussage 129

So auch Seiterle Hirnbild, S. 274. T. Walter Strafprozessrecht, Rn. 188. Julius HK-StPO § 244 Rn. 46. 132 Less DRZ 1950, 322 (ebd.). 133 Schwabe NJW 1979, 576 (581). 130 131

VI. Der Einsatz des Polygrafen beim Zeugen

169

und damit eine Strafbarkeit nach §§ 153 ff. StGB lässt sich aus einer Weigerung allein nicht herleiten.134 Zudem würde selbst bei einem positiven Ergebnis (die Aussage des Zeugen ist nicht glaubhaft) in einem Folgeverfahren gegen den Zeugen zu dessen Gunsten die hier vertretene Meistbegünstigungslösung greifen.135 Hinsichtlich des Beschuldigten entspricht es herrschender Meinung, dass eine berechtigte Verweigerung sowohl der Aussage als auch der Begutachtung nicht zu dessen Lasten gewertet werden darf.136 Dagegen gibt es keinen Grund, die Weigerung des Zeugen, seine belastende Aussage zu bekräftigen, nicht zu Gunsten des Angeklagten zu werten.137 Dies geht zurück auf ein teils missverstandenes Urteil des Bundesgerichtshofs aus dem Jahr 1983.138 Dieser Entscheidung lag ein Fall zugrunde, bei dem der mit der Angeklagten verheiratete Zeuge zunächst auf sein Aussageverweigerungsrecht nach § 52 Absatz 1 Nummer 2 StPO verzichtet und eine belastende Aussage getätigt hatte. Jedoch hatte der Zeuge unter Berufung auf sein Mitwirkungsverweigerungsrecht nach § 81c Absatz 3 Satz 1 StPO eine Blutprobenentnahme verweigert, die seine belastende Aussage hätte untermauern können. Dieses widersprüchliche Verhalten des Belastungszeugen hätte von der Vorinstanz – so der Bundesgerichtshof – zu Gunsten der Angeklagten gewertet werden müssen, da er die „Überprüfung der Richtigkeit seiner Angaben“ verhindert hatte.139 Nichts anderes hat bei einer verweigerten Glaubhaftigkeitsbegutachtung zu gelten. Immerhin blockiert der Zeuge die Überprüfung der Glaubhaftigkeit durch eine Methode, die einen deutlich höheren Beweiswert vorweisen kann als seine Aussage alleine. Dies gilt auch unabhängig davon, ob der Zeuge ein Mitwirkungsverweigerungsrecht hat oder nicht. Denn in beiden Fällen räumt man sonst dem Zeugen die Möglichkeit ein, durch taktisches Vorgehen die Überführung des Angeklagten beeinflussen zu können.140

134

Seiterle Hirnbild, S. 273. In diesem Kapitel III 4 (S. 161–164); wie hier T. Walter Strafprozessrecht, Rn. 188 a. E. BGH NStZ 2014, 415 (ebd.); NStZ-RR 2016, 117 (ebd.); Krause LR § 81c Rn. 33; Sander LR § 261 Rn. 152; Trück MK-StPO § 81c Rn. 57 (Verwertungsverbot). 137 Vgl. zum Schweigen des Zeugen als Indiz zu Gunsten des Angeklagten Geipel Beweiswürdigung, § 38 Rn. 301 f.; Sander LR § 261 Rn. 151–153; Schmitt Meyer-Goßner/Schmitt § 261 Rn. 19a–21; nach BGH NJW 1966, 351 (ebd.) kann das Schweigen eines aussageverpflichteten Zeugen nur zu Lasten des Angeklagten berücksichtigt werden, sofern das Motiv erkennbar ist. 138 Vgl. auch zum Folgenden BGHSt. 32, 140 (142–144). 139 So auch Ott KK § 261 Rn. 169; missverständlich Hadamitzky KK § 81c Rn. 10; Krause LR § 81c Rn. 33. 140 Wie hier Seiterle Hirnbild, S. 276 f. in Fn. 75, jedoch nur bei zeugnisverweigerungsberechtigten Zeugen. 135 136

7. Kapitel

Abschließende (statistische) Überlegungen: nicht „entweder oder“, sondern „sowohl als auch“ I. Indizienring, Gesamt-Likelihood-Quotient und Gesamtbelastungswahrscheinlichkeit Weder aussagepsychologische noch polygrafengestützte Glaubhaftigkeitsbegutachtungen sind fehlerlos, bei beiden kann weder einem positiven noch einem negativen Ergebnis ein 100-prozentiger Beweiswert zugesprochen werden. Restzweifel bleiben allemal. Doch was, wenn neben das eine Beweismittel ein zweites tritt? Beide haben zwar ihre Schwächen und sind angreifbar, deuten aber auf dieselbe zu beweisende Tatsache – nämlich die Glaubhaftigkeit der zu begutachtenden Aussage. In der Wahrscheinlichkeitstheorie spricht man von einem „Beweisring“ oder besser: einem „Indizienring“.1 Dabei sitzen die voneinander unabhängigen Indizien bildlich gesprochen auf einem Ring, von denen jedes einzelne für sich auf die zu beweisende Tatsache zeigt: Indiz 1

Indiz 2

Tatsache

Indiz 3

Indiz 4

1 Vgl. Geipel Beweiswürdigung, § 9 Rn. 100 f.; Neuhaus MAH Strafverteidigung § 61 Rn. 53; Sander LR § 261 Rn. 126; Velten SK-StPO § 261 Rn. 93; siehe auch zur Abgrenzung zu der hier nicht interessierenden „Beweiskette“, bei der sich die Indizien gegenseitig bedingen, also nicht unabhängig sind, Ott KK § 261 Rn. 78; Schwarz Bender/Häcker/Schwarz, Rn. 682– 685.

172

7. Kapitel: Abschließende (statistische) Überlegungen

So liegt es in den meisten Strafverfahren, in denen mehrere Indizien (Zeugenaussagen, Sachbeweise, etc.) zum Beispiel für die Täterschaft oder Unschuld des Beschuldigten sprechen. Diese Situation fehlt augenscheinlich in einer Aussage-gegen-Aussage-Konstellation, bei der es bekanntlich in aller Regel nur ein einziges belastendes Indiz gibt: die Aussage des Opferzeugen. Doch lässt sich auch in einer solchen Situation ein Indizienring schaffen: indem man die Aussage(n) anhand mehrerer Methoden unabhängig voneinander untersucht. Steller plädierte in seiner Habilitationsschrift bereits 1987 dafür, den Polygrafen nicht als konkurrierendes, sondern als die Aussageanalyse ergänzendes Mittel in Betracht zu ziehen.2 Es geht hier also nicht darum, zwischen einer der Methoden der Glaubhaftigkeitsbegutachtung zu wählen, sondern beide kumulativ heranzuziehen. Damit könnte der Polygraf die Lücke schließen, die durch die beschränkte Anwendbarkeit und den nur eingeschränkten Beweiswert einer aussagepsychologischen Begutachtung entstanden ist. Tritt zum Beispiel beim Zeugen neben das negative Ergebnis einer aussagepsychologischen Begutachtung ein positives Ergebnis einer polygrafengestützten Begutachtung – zeigen also beide Methoden unabhängig voneinander auf die Tatsache einer bewusst wahrheitswidrigen Aussage –, muss sich (denk-) logischerweise die Wahrscheinlichkeit insgesamt erhöhen, dass die Aussage tatsächlich erfunden und der Beschuldigte unschuldig ist. Von der Erhöhung einer solchen „Gesamtwahrscheinlichkeit“ geht selbst die Rechtsprechung aus, obgleich sie nicht ausdrücklich von einem Beweisring oder der Bayes-Regel spricht.3 Dasselbe gilt, wenn beide Zeugenbegutachtungen jeweils für sich auf die Tatsache einer subjektiv wahren Aussage „zeigen“. Das wäre der Fall, wenn die aussagepsychologische Begutachtung positiv, die polygrafengestützte negativ ausfällt. Diese Gesamtwahrscheinlichkeit lässt sich auch konkret beziffern, und zwar wieder mithilfe der Bayes-Regel. Hier wird vor allem der bereits angesprochene, wesentliche Vorteil der Likelihood-Quotienten deutlich, denn sie lassen sich einfach multiplizieren – vorausgesetzt sie kommen unabhängig zustande.4 Angenommen beide Gutachten deuten auf die Tatsache, dass die Aussage, zum Beispiel die des Belastungszeugen, subjektiv wahr ist. Die Gesamtbelastungswahrscheinlichkeit, dass diese Tatsache zutrifft, liegt dann bei 98 Prozent – und das selbst unter Zugrundelegung der Trefferquoten von Patrick und Iacono. Zur Erinnerung: Die Belastungswahrscheinlichkeit allein eines posi2

Steller Aussagebeurteilung, S. 167. Vgl. nur BGHSt. 38, 320 (324). 4 Schweizer, S. 148; siehe auch Schwarz Bender/Häcker/Schwarz, Rn. 735–737, jedoch ohne den Folgerechenschritt der Umwandlung der „Gesamt-Beweiskraft“ in die „Gesamt-Belastungswahrscheinlichkeit“. 3

I. Indizienring, Gesamt-Likelihood-Quotient

173

tiven Ergebnisses bei der aussagepsychologischen Begutachtung liegt in etwa bei 68 Prozent. Natürlich besteht nach wie vor das Risiko, dass der Richter den Beschuldigten zu Unrecht verurteilt, da beide Methoden lediglich den subjektiven Wahrheitsgehalt der Aussage einer Aussageperson und nicht die objektive Wahrheit messen. Eine Verurteilungsgrundlage von 98 Prozent lässt vernünftige Zweifel jedoch deutlich weniger zu als eine von nur 68 Prozent – zumal ein gewisser „Restzweifel“ wohl jedem Schuldspruch anhaftet.5 Die Berechnung der Gesamtbelastungswahrscheinlichkeit erfolgt in einem ersten Schritt durch Multiplikation der jeweiligen Likelihood-Quotienten, hier des positiven Likelihood-Quotienten bei der aussagepsychologischen Begutachtung von 2,125 und des negativen Likelihood-Quotienten der polygrafengestützten Glaubhaftigkeitsbegutachtung von 27,5.6 Das Produkt ist dann 58,4375. Mit diesem „Gesamt-Likelihood-Quotienten“ lässt sich nun anhand der oben dargelegten Rechenschritte wieder die Gesamtbelastungswahrscheinlichkeit berechnen. Denn die Zahl des Gesamt-Likelihood-Quotienten entspricht – bei einer nach wie vor gegebenen strafprozessualen Anfangswahrscheinlichkeit von 50 Prozent – wieder dem (Gesamt-)Endwahrscheinlichkeitswert. Zur Bestimmung der Gesamtwahrscheinlichkeit ergibt sich somit folgende Rechnung: Gesamtbelastungswahrscheinlichkeit =

58,4375 = 0,9832 1 + 58,4375

Deuten aber beide Gutachten auf die Tatsache, dass die Aussage erfunden ist, liegt die Gesamtbelastungswahrscheinlichkeit bei 89,7 Prozent – obwohl die Belastungswahrscheinlichkeit nur eines negativen aussagepsychologischen Gutachtens bei 80, die eines positiven polygrafengestützten Gutachtens nur bei 68,5 Prozent liegt. Der Gesamt-Likelihood-Quotient in dieser Konstellation ist nämlich wieder das Produkt aus dem positiven Likelihood-Quotienten der aussagepsychologischen und dem negativen Likelihood-Quotienten der polygrafengestützten Begutachtung, also 4 × 2,18 = 8,72, so dass Folgendes gilt: Gesamtbelastungswahrscheinlichkeit =

8,72 = 0,897 1 + 8,72

Denkbar ist zum Beispiel auch, den Beschuldigten und den Zeugen mittels einer polygrafischen Untersuchung zu begutachten. Erzielen beide sich logisch ergänzende Ergebnisse – sprechen also entweder beide Ergebnisse für oder beide gegen die Täterschaft des Beschuldigten – erhöht sich die Gesamtbelastungswahrscheinlichkeit jeweils auf über 98 Prozent. In diesen Fällen liegt bei einem 5 Und eine mathematische, jede andere Möglichkeit ausschließende Gewissheit“ ist (da utopisch) nicht erforderlich, vgl. nur BGHSt. 58, 212 (215). 6 Zur Berechnung des jeweiligen Likelihood-Quotienten siehe 3. Kapitel VI 5 (S. 81–84) und 5. Kapitel III 1 (S. 124).

174

7. Kapitel: Abschließende (statistische) Überlegungen

ein positives, beim anderen ein negatives Ergebnis vor. Der Gesamt-LikelihoodQuotient in dieser Konstellation ist dann 27,5 × 2,18 = 59,95; somit gilt hier: Gesamtbelastungswahrscheinlichkeit =

59,95 = 0,9836 1 + 59,95

Diese Konstellation ähnelt der vor dem Amtsgericht Bautzen von 2013. Dort hatte das Gericht eine polygrafengestützte Begutachtung sowohl des Beschuldigten als auch der Belastungszeugin angeordnet. Die Begutachtung des Beschuldigten hatte diesen entlastet, die Zeugin erzielte ein positives Ergebnis; ihre Aussage wurde von der Gutachterin also als bewusst wahrheitswidrig befunden. Auch wenn der Strafrichter darauf hinwies, dass diese beiden Ergebnisse die Wahrscheinlichkeit erhöhten, dass der Beschuldigte unschuldig sei, unterlief dem Gericht ein entscheidender Fehler: Beschuldigter und Zeugin wurden von derselben Gutachterin begutachtet.7 Unter solchen Umständen ist die Unabhängigkeit der beiden Ergebnisse nicht gewährleistet. Diese ist aber zwingend; anderenfalls kann die Bayes-Regel bei mehreren Indizien nicht angewendet werden.8 Die Gesamtbelastungswahrscheinlichkeit liegt sogar bei 99 Prozent, wenn die aussagepsychologische Begutachtung zu dem Ergebnis kommt, die Zeugenaussage sei nicht subjektiv wahr (LRN = 4), die polygrafengestützte Begutachtung des Beschuldigten zu dem Ergebnis, er sage die Wahrheit (LRN = 27,5). Diese Konstellation scheint der vor dem Amtsgericht Bautzen von 2017 zu entsprechen. Doch auch hier hatte dieselbe Gutachterin den Beschuldigten psychophysiologisch und die Zeugin aussagepsychologisch begutachtet.9 Sollte also ein Gericht in Zukunft in Erwägung ziehen, beide Methoden nebeneinander anzuwenden, muss es sicherstellen, dass die Gutachten unabhängig voneinander zustande kommen.

II. Ein letztes Baumdiagramm zur Kombinationslösung Die Wirkung mehrerer unabhängiger Indizien lässt sich erneut mithilfe eines Baumdiagramms veranschaulichen. Hier gehen wir entsprechend der strafprozessualen Anfangswahrscheinlichkeit von 50 Prozent wieder davon aus, dass von insgesamt 1.000 Aussagen jeweils 500 subjektiv wahr und bewusst wahrheitswidrig sind:

7

Vgl. AG Bautzen, Urteil vom 26.3.2013 – 40 Ls 330 Js 6351/12. BGHSt. 38, 320 (323); Geipel Beweiswürdigung, § 9 Rn. 87; Neuhaus StraFo 2001, 115 (117); Schweizer, S. 149 f. 9 AG Bautzen, Urteil vom 26.10.2017 – 42 Ds 610 Js 411/15 = Recht & Psychologie 36 (2018) S. 184 (185 f.). 8 Allgemein

45%

191 falsch

234 zutreffend

41 zutreffend

55 %

75 falsch

425 zutreffend

55%

15 %

34 falsch

45%

60%

98,3%

89,6%

294 zutreffend

98 %

2%

6 falsch

300 zutreffend

200 falsch

40%

196 zutreffend

98 %

500 erfunden

500 subjektiv wahr

85%

50%

50 %

1.000 Aussagen

4 falsch

2%

II. Ein letztes Baumdiagramm zur Kombinationslösung

175

176

7. Kapitel: Abschließende (statistische) Überlegungen

Das Baumdiagramm zeigt, dass wenn beide Methoden kumulativ und unabhängig voneinander eine Aussage für subjektiv wahr halten – bei insgesamt 238 Aussagen (untere Zeile ganz links und ganz rechts) –, nur vier dieser Aussagen falsch eingeschätzt werden. Der kombinierte Beweiswert oder die Gesamtbelastungswahrscheinlichkeit liegt folglich bei über 98 Prozent. Zeigen beide Methoden auf die zu ermittelnde Tatsache, die Aussage ist bewusst wahrheitswidrig – insgesamt 328 Aussagen (unten jeweils in der Mitte) – liegt die Gesamtbelastungswahrscheinlichkeit bei über 89 Prozent. Natürlich handelt es sich bei diesen Zahlen nicht um absolute Werte. Und in den Berechnungen eben wurde jeweils lediglich die Feldstudie von Patrick und Iacono berücksichtigt; der Einfachheit halber, aber auch, da diese selbst von Gegnern der Methode angeführt wird. Zieht man alternativ alle hier zitierten hochwertigen Feldstudien heran,10 erhöht sich der Likelihood-Quotient eines positiven Ergebnisses auf etwa 5,547 bei gleichzeitiger Reduzierung des Likelihood-Quotient eines negativen Ergebnisses auf ungefähr 12,235. Ob hochwertige Feldstudie oder realitätsnahe Laborstudie, die jeweiligen Studien geben so oder so nur Richtwerte wieder. Wer sich aber wie Fiedler und der Bundesgerichtshof auf eine Studie beruft, um der Methode ihre Eignung abzusprechen, muss im Umkehrschluss den hinter den Trefferquoten „verborgenen“ Beweiswert gegen sich gelten lassen. Likelihood-Quotienten, Belastungswahrscheinlichkeit oder konkreter Beweiswert sind keine unbekannten Begrifflichkeiten, sondern Bestandteil der denklogischen Regeln der Wahrscheinlichkeitsrechnung – mögen sie für unvertraute Leser zunächst befremdlich wirken. Wer sich aber auf Wahrscheinlichkeitsaussagen bezieht – und nichts anderes sind Trefferquoten –, darf sich diese nicht zur Unterstreichung seiner These herauspicken, schon gar nicht, wenn damit die für die praktische Anwendung bedeutsameren Zahlen unterschlagen werden.

10

Siehe erneut Tabelle 9 im 5. Kapitel IV 4 auf S. 136 f.

8. Kapitel

Ein Blick in die Zukunft I. Eine kurze Zusammenfassung In einer perfekten Welt gäbe es eine Methode, mit der sich stets ermitteln ließe, ob eine Person die Wahrheit sagt oder nicht. Doch auf dem Stand von heute existiert eine solche Methode nicht. Heute werden vielmehr Methoden angewandt, die kaum oder gar nicht geeignet sind, die Glaubhaftigkeit einer Aussage zu bestimmen. Gerichte lassen sich nach wie vor von angeblichen „Lügensymptomen“ leiten, obgleich es mittlerweile als unstreitig gilt, dass sich anhand solcher körperlicher, non-verbaler Reaktionen die Glaubhaftigkeit einer Aussage nicht ermitteln lässt. Ein für Lügen typisches Verhaltensmuster, das mit dem bloßen Auge zu erkennen wäre, gibt es aber nicht.1 Auch die subjektive Eindrucksbildung, die „Lebenserfahrung und Menschenkenntnis“, die „ureigene Aufgabe“ der Richterschaft können nicht den Wahrheitsgehalt einer Aussage mit der im Strafverfahren erforderlichen Sicherheit bestimmen. So ergab eine Meta-Studie aus dem Jahr 2008, dass „professionelle“ Aussagebeurteiler wie Polizeibeamte, Staatsanwälte und Richter Trefferquoten zwischen lediglich 45 und 60 Prozent im Erkennen von Lügen anhand eigener Erfahrung erzielen können. Im Durchschnitt lagen sie zu 55,91 Prozent richtig.2 Das entspricht in etwa der Zahl, die Bond und DePaulo für nicht-professionelle Aussagebeurteiler ermitteln konnten.3 Der für Vrij nennenswerte Unterschied zwischen Fachleuten und Laien: Erstere neigen dazu, sich maßlos zu überschätzen.4 Gerichte sind also in der Tat gut beraten, sich zumindest an den Voraussetzungen des Bundesgerichtshofs zur aussagepsychologischen Glaubhaftigkeitsbegutachtung zu orientieren, wenn sie darauf bestehen, keinen Sachverständigen heranzuziehen. Doch der Stellenwert, den die Aussagepsychologie offenbar genießt – ruft man sich die hohen Übereinstimmungsquoten in Erinnerung –, birgt die Gefahr, dass „das Gericht auf der Grundlage einer sachlich nicht ge1

Verwiesen sei nochmals auf die umfassende Meta-Analyse von DePaulo/Lindsay/Malone/Muhlenbruck/Charlton/H. Cooper Psychological Bulletin 129 (2003) S. 74–118 und auf das 1. Kapitel IV (S. 10 f.). 2 Vrij Detecting Lies, S. 147 f. 3 Bond/DePaulo Personality and Social Psychology Review 10 (2006) S. 214 (230). 4 Siehe erneut Vrij Finding the truth in the courtroom, S. 163 (176).

178

8. Kapitel: Ein Blick in die Zukunft

rechtfertigten Scheinsicherheit urteilt“.5 Denn bei Aussage-gegen-AussageKonstellationen – vor allem mit sexualstrafrechtlichem Bezug – kommt die Aussagepsychologie schnell an ihre methodenimmanenten Grenzen. Ist etwa die Einvernehmlichkeit der sexuellen Handlung im Streit, lässt sich die kriterienorientierte Inhaltsanalyse mangels hinreichenden Analysematerials kaum mehr anwenden. Und selbst wenn man den Anwendungsbereich der aussagepsychologischen Begutachtung für eröffnet hält, muss man sich vergegenwärtigen, wie dürftig das Fazit der bisherigen empirischen Forschung lautet: Weder konnte die Undeutsch-Hypothese empirisch bestätigt werden, noch sind die Trefferquoten der aussagepsychologischen Begutachtung so hoch, als dass sie den hohen Zuspruch im Strafverfahren und das Prädikat „wissenschaftlich fundiert“ rechtfertigen könnten. Anhand von Trefferquoten lässt sich mithilfe der sogenannten Bayes-Regel der konkrete Beweiswert einer Methode ermitteln. Legt man hinsichtlich der aussagepsychologischen Begutachtung die einzigen beiden Feldstudien zugrunde, denen eine einigermaßen unabhängige Bestimmung der „objektiven Wahrheit“ gelang, sowie die überschaubaren praxisnäheren Laborstudien, liegt der konkrete Beweiswert eines positiven Gutachtenergebnisses – der Proband sagt die Wahrheit – bei etwa 70 Prozent. Kommt die aussagepsychologische Begutachtung zur Anwendung, lässt sich ein Indizwert somit nicht leugnen. Jedoch bedeutet ein solcher Beweiswert auch, dass in drei aus zehn Fällen das Gutachten bei der Begutachtung des Zeugen falsch ist. Beruft sich ein Richter auf dieses Gutachtenergebnis, muss er sich des Risikos bewusst sein, dass drei von zehn Beschuldigten zu Unrecht verurteilt werden. Ein solches Risiko einzugehen, widerspricht aber den vom Bundesgerichtshof aufgestellten Anforderungen an die Beweiswürdigung, bei der das Gericht „alle Umstände, welche die Entscheidung zu Gunsten oder zu Ungunsten des Angeklagten zu beeinflussen geeignet sind, erkannt, in seine Überlegungen einbezogen und in einer Gesamtschau gewürdigt [haben muss]“.6 So kann nämlich kaum von einem „nach der Lebenserfahrung ausreichende[m] Maß an Sicherheit“ die Rede sein, das „vernünftige Zweifel nicht aufkommen lässt“.7 Die Konsequenz: In dubio pro reo müsste der Richter den Beschuldigten eigentlich freisprechen, wird es ihm doch kaum gelingen, diese Zweifel auszuräumen. Immerhin ist er an die Gesetze der Logik und der Wahrscheinlichkeitsrechnung – auch von Verfassungs wegen – gebunden.8 Doch anstatt freizusprechen oder dennoch auf unsicherer Grundlage zu verurteilen, bietet sich an, eine weitere Methode zur Glaubhaftigkeitsbeurteilung heranzuziehen, um den Gesamtbeweiswert zu erhöhen und die Zweifel zu eliminieren. 5

Erb Stöckel-FS, S. 181 (191). BGH StV 2020, 446 (447). BGH NStZ-RR 2010, 85 (ebd.). 8 Vgl. erneut BVerfG NStZ-RR 2003, 299 (300–302). 6 7

II. Zukunftsmusik

179

Diese Arbeit widmet sich dem Polygrafen, der polygrafengestützten Glaubhaftigkeitsbegutachtung. Eine Methode, der sich die Rechtsprechung bislang verweigert hat. Perfekt ist auch der Polygraf nicht, er war es nie und wird es voraussichtlich nie sein. Weder lässt sich mit der polygrafengestützten Glaubhaftigkeitsbegutachtung eine 100-prozentige Trefferquote erzielen noch ein „wasserdichter“ Beweiswert. Doch mit einem überzufälligen Beweiswert – und nur auf einen solchen kommt es an – kann eine „indizielle Wirkung“ ebenso wenig abgestritten werden wie bei ihrem aussagepsychologischen Pendant. Von völliger Ungeeignetheit zu sprechen, wie es unter anderem der Bundesgerichtshof tut, ist daher verfehlt. Da keine weiteren rechtlichen Bedenken jedenfalls bei einer Verwendung des Polygrafen zu Gunsten des Beschuldigten bestehen, ist die polygrafengestützte Glaubhaftigkeitsbegutachtung im Strafverfahren zuzulassen.

II. Zukunftsmusik Unabhängig davon bleibt das Streben nach Perfektion. Und tatsächlich gibt es neben aussagepsychologischer und polygrafengestützter Glaubhaftigkeitsbegutachtung weitere Bemühungen, die (subjektive) Wahrheit aufzudecken – mit der Hoffnung auf höhere Trefferquoten und einen besseren Beweiswert: So wird versucht, die Glaubhaftigkeit mit sogenannten hirnbildgebenden Verfahren zu ermitteln – vor allem mit der „funktionellen Magnetresonanztomografie“ (fMRT): Bei dieser werden mittels des Stoffwechsels, der Durchblutung oder der elektromagnetischen Aktivität Unterschiede zwischen den Reaktionen des Gehirns auf bestimmte Reize gemessen. Als Reize dienen wie bei der polygrafengestützten Begutachtung direkte, indirekte und Vergleichsfragen. Der entscheidende Unterschied zum herkömmlichen Polygrafen besteht somit in dem angewandten technischen Verfahren, das einen direkten Zugang zu den physiologischen Vorgängen im Gehirn verspricht, die Aufschluss geben sollen über die sie verursachenden psychischen Prozesse.9 Jedoch ist die Forschung bei Weitem nicht so fortgeschritten wie bei der „klassischen“ polygrafengestützten Glaubhaftigkeitsbegutachtung, und bislang konnten auch mit der fMRT keine spezifischen (Hirn-)Lügenreaktionen gefunden werden.10 Die ersten Laborstudien lassen jedoch vermuten, dass sich auch mit der funktionellen Magnetresonanztomografie deutlich überzufällige Trefferquoten erzielen lassen können.11 Sollten der zu erwartende technologische 9

Vgl. dazu Beck JR 2006, 146 (147 f.); Häcker Bender/Häcker/Schwarz, Rn. 285–287; Hillenkamp ZStW 127 (2015) S. 10 (92–94); Seiterle Hirnbild, S. 87; Stübinger ZIS 2008, 538 (548 f.). 10 Ganis Detecting Deception, S. 105 (110, 118); F. Schneider/Frister/Olzen, S. 409. 11 Überblick bei Ganis Detecting Deception, S. 105 (110–114); weitere Nachweise bei Seiterle Hirnbild, S. 87; Vrij/Ganis Credibility Assessment, S. 301 (351 f.): durchschnittlich

180

8. Kapitel: Ein Blick in die Zukunft

Fortschritt und die (Feld-)Forschung diese ersten Vermutungen bestätigen, wird sich auch das Strafrecht früher oder später fragen müssen, solche neurowissenschaftlichen Methoden zuzulassen.12 Doch nicht nur bildgebende Verfahren der Neurologie könnten die Justiz demnächst vor neue Herausforderungen stellen. Gerhold vermutet, dass der technische Fortschritt bei künstlicher Intelligenz „in nicht allzu ferner Zukunft“ auf Trefferquoten bei der Erkennung bewusst wahrheitswidriger Aussagen von über 90 Prozent hoffen lässt.13 Während Menschen sich auf das Gesamtbild konzentrieren, wenn sie die Glaubhaftigkeit beurteilen sollen, ist der Vorteil künstlicher Intelligenz, dass sie über die Fähigkeit verfügt, eine Vielzahl nonverbaler und verbaler Signale gleichzeitig und gleichberechtigt anhand von Algorithmen auszuwerten. Das könnte sie im Gegensatz zum Menschen zu einer zuverlässigeren Methode der Glaubhaftigkeitsbegutachtung machen, zumal zu erwarten ist, dass sich die Algorithmen der künstlichen Intelligenz durch erfahrungsbedingtes Selbstlernen immer weiter verbessern (in diesem Zusammenhang zu lesen ist oft von „machine“ oder „deep learning“).14 Gerhold verweist unter anderem auf eine kürzlich entwickelte Lügenerkennungssoftware der University of Maryland. Die „Deception Analysis and Reasoning Engine“ (DARE) bedient sich künstlicher Intelligenz, um Täuschungen in Videoaufnahmen anhand eines Parameters zu bewerten, den bestehende Systeme weitgehend ignorieren: den Gesichtsausdruck.15 Der Gesichtsausdruck ist entscheidend für unser intuitives Gefühl, ob jemand lügt, ist aber schwer zu quantifizieren und mit bloßem Auge zu erkennen.16 DARE wurde programmiert, in insgesamt 104 Aufnahmen von Gerichtsverhandlungen nach sogenannten Mikroexpressionen zu suchen, zum Beispiel nach hervorstehenden Lippen oder Stirnrunzeln, und die Tonfrequenz zu analysieren, um Stimmmuster zu erkennen, die darauf hinweisen, ob eine Person lügt oder nicht. Das System definierte sodann verschiedene „Klassifikatoren“ („classifiers“) auf Grundlage verschiedener visueller Filter. Ein Klassifikator ist eine Funktion, die einen Wahrscheinlichkeitswert liefert, der verwendet 85 Prozent; bislang wurden allerdings einzig Laborstudien durchgeführt, die sich am Ablauf der Tatwissenstechnik orientieren, die einen nur sehr überschaubaren Anwendungsbereich hat. 12 Vgl. auch Beck JR 2006, 146 (150); Ganis Detecting Deception, S. 105 (118); Hillenkamp ZStW 127 (2015) S. 10 (94); Vrij/Ganis Credibility Assessment, S. 301 (354); zweifelnd Eisenberg Beweisrecht, Rn. 1461a. 13 Gerhold ZIS 2020, 431 (ebd.); siehe auch Rodenbeck StV 2020, 479 (ebd.), der aber auf S. 483 einen Einzug künstlicher Intelligenz in deutsche Gerichtssäle „jedenfalls in näherer Zukunft“ nicht erwartet. 14 Vgl. Gerhold ZIS 2020, 431 (432); Rodenbeck StV 2020, 479 (481); zu den Grundlagen künstlicher Intelligenz Ibold ZStW 134 (2022) S. 504 (509–514). 15 Siehe auch zum Folgenden https://doubaibai.github.io/DARE/, zuletzt abgerufen am 20. Juni 2022. 16 Näher zu solchen facial micro expressions Vrij/Ganis Credibility Assessment, S. 301 (332 f.).

II. Zukunftsmusik

181

wird, um bestimmten Datenpunkten im Datensatz kategorische Etiketten zuzuweisen. Jeder erhält eine bestimmte Punktzahl, die einer Gewichtung entspricht. Ein größeres Gewicht bedeutet, dass das System diesem Klassifikator beim Erkennen einer Lüge mehr Bedeutung beimisst. Zum Beispiel beobachteten die Forscher, dass „Augenbrauen hochziehen“ ein effektiverer Klassifikator ist als andere Mikroexpressionen. Nachdem das System anhand der Videoaufzeichnungen programmiert wurde, führten die Forscher ein erstes Experiment unter Laborbedingungen durch mit Probanden, die nicht Teil des Trainingssets waren. Das vielversprechende Ergebnis: Das Programm konnte Täuschungen zu 87,7 Prozent erkennen. Konkret zur Glaubhaftigkeitsbeurteilung vor Gericht entwickelten bereits 2015 Forscher der University of Michigan eine Software zur Lügenerkennung – ebenfalls anhand von Videoaufzeichnungen aus realen Gerichtsverfahren.17 Diese berücksichtigt in erster Linie Zusammenhänge im Hinblick auf die Häufigkeit bestimmter Gesten, die Zahl der verwendeten Füllwörter und Gesprächspausen, die Häufigkeit von Blickkontakten sowie Besonderheiten in der Intonation beim Ausdrücken von Gedanken oder Erinnerungen.18 Erste Experimente mit der Software ergaben eine Trefferquote von 75 Prozent bei bewusst wahrheitswidrigen Aussagen. Diese Trefferquote liegt zwar noch unter der der herkömmlichen polygrafengestützten Glaubhaftigkeitsbegutachtung. Einen Mehrwert könnte eine solche Software dennoch erbringen. Und anders als beim Polygrafen bedarf es keines physischen Kontakts mit dem Probanden, um zu funktionieren. Oberflächenelektroden, Elektrokardiogramme oder Blutdruckmanschetten könnten bald der Vergangenheit angehören. Erforderlich wären allein ein Mikrofon, eine Kamera und ein leistungsstarker Computer.19 Dass künstliche Intelligenz im Zusammenhang mit der Glaubhaftigkeitsbeurteilung keine Zukunftsträumerei ist, beweist das Programm „iBorderCtrl“. Die Abkürzung steht für „Intelligent Portable Border Control System“, ein intelligentes tragbares Grenzschutzsystem, dessen Entwicklung von der Europäischen Union mit viereinhalb Millionen Euro gefördert wurde.20 Dessen Schöpfer berufen sich auf 40 Merkmale im Gesicht eines Menschen, sogenannte Microgestures – von der Bewegung der Augen über die Kopfhaltung bis zum Hochziehen der Brauen. Ziel ist es, den „mentalen Zustand“ eines Menschen zu messen, schreiben O’Shea et al. in einem 2018 veröffentlichten Paper, indem die künst17 Siehe auch zum Folgenden https://news.umich.edu/lie-detecting-software-uses-realcourt-case-data/, zuletzt abgerufen am 20. Juni 2022. 18 Gerhold ZIS 2020, 431 (432). 19 Gerhold ZIS 2020, 431 (432 f.). 20 Siehe dazu https://cordis.europa.eu/project/id/700626/de; ein ähnliches Programm – „AVATAR“ (Automated Virtual Agent for Truth Assessments in Real-Time) – wird derzeit von der University of Arizona entwickelt; erste Studien versprechen Trefferquoten zwischen 80 und 85 Prozent, https://www.discernscience.com/avatar/ (jeweils zuletzt abgerufen am 20. Juni 2022).

182

8. Kapitel: Ein Blick in die Zukunft

liche Intelligenz jene Mikro-Gesten im Gesicht auf etwaige verräterische Signale analysiert. Nach einem ersten Experiment konnten mit iBorderCtrl bewusst wahrheitswidrige Aussagen mit einer Treffsicherheit von 74 Prozent, subjektiv wahre Aussagen mit einer Treffsicherheit von 76 Prozent aufgedeckt werden.21 Nun steht die Forschung zur künstlichen Intelligenz erst am Anfang. Es wäre zu früh, die jeweiligen Systeme und Softwares heute schon im Gerichtsalltag einzusetzen. Soweit ersichtlich liegen noch keine Feldstudien vor. Und die bisherigen Laborstudien sehen sich allesamt den berechtigten „klassischen“ Vorwürfen fehlender Realitätsnähe und eingeschränkter Repräsentativität ausgesetzt.22 Zum Beispiel nahmen an der experimentellen Studie zu iBorderCtrl lediglich 32 Probanden teil, bei der Bestimmung der Trefferquoten wurden sogar nur 30 berücksichtigt.23 Wollen Gerichte aber den Anforderungen genügen, „alle Umstände, welche die Entscheidung zu Gunsten oder zu Ungunsten des Angeklagten zu beeinflussen geeignet sind“, einzubeziehen und zu würdigen,24 ist es dennoch nur eine Frage der Zeit, bis auf künstliche Intelligenz basierende Begutachtungssysteme im Strafverfahren zugelassen werden (müssen).25 Vorsicht wird weiterhin geboten sein – wie bei allen Methoden der Glaubhaftigkeitsbeurteilung. Denn Vieles spricht dafür, dass zukünftige, auf künstliche Intelligenz bauende Methoden ebenso wenig zu 100 Prozent sicher werden sagen können, ob eine Aussage subjektiv wahr ist oder nicht. Geht es um die Nützlichkeit für das Strafverfahren, ist Perfektion aber nicht erforderlich – wie erstrebens- und wünschenswert sie auch sein mag. Denn eine Methode liefert immer dann einen Mehrwert, wenn sie einen überzufälligen Beweiswert vorweisen kann – so wie heute schon die polygrafengestützte Glaubhaftigkeitsbegutachtung. Das entspricht einzig und allein den logischen Regeln der Wahrscheinlichkeitsrechnung. Die Frage, die bleibt, ist, ob Gerichte weiter an veralteten Ansichten zu Lasten des Beschuldigten festhalten wollen oder bereit sind, mit dem Wandel der Zeit zu gehen. Sie sind es der Wahrheitsfindung schuldig. 21 O’Shea/Crockett/Khan/Kindynis/Antoniades/Boultadakis International Joint Conference on Neural Networks, S. 1 (3, 7); der Beitrag ist zudem auf der Website von iBorderCtrl abrufbar. 22 Vgl. nur Heller, „Kann dieses Auge lügen?“, Frankfurter Allgemeine Sonntagszeitung vom 29. September 2019, S. 61, abrufbar unter https://www.faz.net/aktuell/wissen/kuenstlicheintelligenz-soll-luegendetektoren-endlich-praktikabel-machen-16408179.html; Nezik, „Falsch geblinzelt“, Die Zeit vom 27. August 2020, S. 22, abrufbar unter https://www.zeit.de/2020/36/ iborder-ctrl-luegen-detektor-software-algorithmus-forschung-kritik (jeweils zuletzt abgerufen am 20. Juni 2022); kritisch zu den bisherigen Laborstudien zur fMRT Vrij/Ganis Credibility Assessment, S. 301 (353). 23 O’Shea/Crockett/Khan/Kindynis/Antoniades/Boultadakis International Joint Conference on Neural Networks, S. 1 (7). 24 BGH StV 2020, 446 (447). 25 Zu den (auch) rechtlichen Perspektiven Ibold ZStW 134 (2022) S. 504 (523–533).

Schrifttum Achenbach, Hans, Polygraphie pro reo? NStZ 1984, S. 350–352. Akehurst, Lucy/Manton, Sarah/Quandte, Sabine, Careful Calculation or a Leap of Faith? A Field Study of the Translation of CBCA Ratings to Final Credibility Judgements, Applied Cognitive Psychology 25 (2011) S. 236–243. Amado, Bárbara/Arce, Ramón/Fariña, Francisca, Undeutsch Hypothesis and Criteria Based Content Analysis: A Meta-Analytic Review, European Journal of Psychology Applied to Legal Context 7 (2015) S. 3–12. Amelung, Knut, Anmerkung zu BVerfG, Beschluss vom 18.8.1981 – 2 BvR 166/81, NStZ 1982, S. 38–40. –, Anmerkung zu BGH, Urteil vom 17.12.1998 – 1 StR 156/98 (BGHSt. 44, 308), JR 1999, S. 382–385. American Polygraph Association, Meta-Analytic Survey of Criterion Accuracy of Validated Polygraph Techniques, Polygraph 40 (2011) S. 194–305. Amrhein, Valentin/Greenland, Sander/McShane, Blake, Retire Statistical Significance, Nature 567 (2019) S. 305–307. Anderson, Craig/Lindsay, James/Bushman, Brad, Research in the Psychological Laboratory: Truth or Triviality? Current Directions in Psychological Science 8 (1999) S. 3–9. Arntzen, Friedrich, Psychologie der Zeugenaussage, 5. Auflage, C. H. Beck 2011. Artkämper, Heiko, Wahrheitsfindung im Strafverfahren mit gängigen und innovativen Methoden (Teil 1), Kriminalistik 2009, S. 349–356. Barton, Stephan, Wenn Aussage gegen Aussage steht – die justizielle Bewältigung von Vergewaltigungsvorwürfen, in: Thomas Rotsch/Janique Brüning/Jan Schady (Hrsg.), Strafrecht, Jugendstrafrecht, Kriminalprävention in Wissenschaft und Praxis. Festschrift für Heribert Ostendorf zum 70. Geburtstag am 7. Dezember 2015, Nomos 2015, S. 41–56. –, Benötigen wir psychologische Sachverständige für die Glaubhaftigkeitsbeurteilung? in: Stephan Barton u. a. (Hrsg.), „Vom hochgemuten, voreiligen Griff nach der Wahrheit“. Fehlurteile im Strafprozess, Nomos 2018, S. 199–223. Baumhöfener, Jesko, Aktenkenntnis des Nebenklägers – Gefährdung des Untersuchungszwecks bei der Konstellation Aussage-gegen-Aussage, NStZ 2014, S. 135–138. Baumhöfener, Jesko/Daber, Beate/Wenske, Marc, Die Aktenkenntnis des Verletzten in der Konstellation Aussage-gegen-Aussage, NStZ 2017, S. 562–567. Baur, Max, Anmerkung zu BGH, Beschluss vom 21.1.2009 – 1 StR 722/08, StV 2010, S. 175–177. Beck, Susanne, Unterstützung der Strafermittlung durch die Neurowissenschaften? JR 2006, S. 146–150. Becker, Jörg-Peter u. a. (Hrsg.): Löwe-Rosenberg, Die Strafprozeßordnung und das Gerichtsverfassungsgesetz, Großkommentar, Band 2 (§§ 48–93 StPO), Band 4/1

184

Schrifttum

(§§ 112–136a StPO), Band 6 (§§ 212–255a StPO), Band 7 (§§ 256–295), 27. Auflage, De Gruyter 2018–2020. Zitiert: Bearbeiter LR. Beck’scher Online-Kommentar zur Strafprozessordnung, siehe bei Graf, Jürgen. Bell, Brian/Kircher, John/Bernhardt, Paul, New Measures Improve the Accuracy of the Directed-Lie Test When Detecting Deception Using a Mock Crime, Physiol Behav 94 (2008) S. 331–340. Bell, Brian/Raskin, David/Honts, Charles/Kircher, John, The Utah Numerical Scoring System, Polygraph 28 (1999) S. 1–9. Bender/Häcker/Schwarz, siehe bei Häcker, Robert/Schwarz, Volker. Ben-Shakhar, Gershon, A critical review of the Control Question Test (CQT), in: Murray Kleiner (Hrsg.), Handbook of Polygraph Testing, Academic Press 2002, S. 103–126. Ben-Shakhar, Gershon/Elaad, Eitan, The Guilty Knowledge Test (GKT) as an Application of Psychophysiology: Future Prospects and Obstacles, in: Murray Kleiner (Hrsg.), Handbook of Polygraph Testing, Academic Press 2002, S. 87–102. –, The Validity of Psychophysiological Detection of Information with the Guilty Knowledge Test: A Meta-Analytic Review, Journal of Applied Psychology 88 (2003) S. 131– 151. Berlinger, Adrian, Glaubhaftigkeitsbegutachtung im Strafprozess, Schulthess Juristische Medien 2014. Blackwell, N. Joan, PolyScore 3.3 and Psychophysiological Detection of Deception Examiner Rates of Accuracy When Scoring Examinations from Actual Criminal Investigations (Fort McClellan) 1998. Blandon-Gitlin, Iris/Pezdek, Kathy/Rogers, Martha/Brodie, Laura, Detecting Deception in Children: An Experimental Study of the Effect of Event Familiarity on CBCA Ratings, Law and Human Behavior 29 (2005) S. 187–197. Bockemühl, Jan (Hrsg.), Handbuch des Fachanwalts Strafrecht, 8. Auflage, Heymanns 2020. Zitiert: Bearbeiter Fachanwalt Strafrecht. Bond, Charles/DePaulo, Bella, Accuracy of Deception Judgments, Personality and Social Psychology Review 10 (2006) S. 214–234. Bonpasse, Morrison, Polygraphs and 215 Wrongful Conviction Exonerations, Polygraph 42 (2013) S. 112–127. –, Polygraphs and 281 Wrongful Conviction Exonerations, unveröffentlicht, 2015, online verfügbar unter https://www.researchgate.net/publication/280088196_Polygraphs_ and_280_Wrongful_Conviction_Exonerations, zuletzt abgerufen am 20. Juni 2022. Brause, Peter, Glaubhaftigkeitsprüfung und -bewertung einer Aussage im Spiegel der höchstrichterlichen Rechtsprechung, NStZ 2013, S. 129–136. Breu, Jochem, Anmerkung zu OLG Hamburg, Beschluss vom 24.10.2014 – 1 Ws 110/14 und vom 24.11.2014 – 1 Ws 120/14. Anmerkung eines Nebenklagevertreters: Wer sie nicht (mehr) braucht, kommt an die Akte, StraFo 2015, S. 248–251. Bublitz, Jan Christoph, Entwicklung und Kritik der höchstrichterlichen Rechtsprechung zur Glaubhaftigkeitsanalyse, ZIS 2021, S. 210–221. Bundesministerium der Justiz und für Verbraucherschutz, Abschlussbericht der Reformkommission zum Sexualstrafrecht, Nomos 2017. Busse, Detlef/Volbert, Renate, Glaubwürdigkeitsgutachten in Strafverfahren wegen sexuellen Mißbrauchs. Ergebnisse einer Gutachtenanalyse, in: Luise Greuel/Thomas Fabian/Michael Stadler (Hrsg.), Psychologie der Zeugenaussage. Ergebnisse der rechtspsychologischen Forschung, Psychologie Verlags Union 1997, S. 131–142.

Schrifttum

185

Colwell, Kevin/Hiscock-Anisman, Cheryl/Fede, Jacqueline, Assessment Criteria Indicative of Deception: An Example of the New Paradigm of Differential Recall Enhancement, in: Barry S. Cooper/Dorothee Griesel/Marguerite Ternes (Hrsg.), Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, Springer 2013, S. 259–291. Craig, Ron/Scheibe, Rick/Raskin, David/Kircher, John/Dodd, David, Interviewer Questions and Content Analysis of Children’s Statements of Sexual Abuse, Applied Developmental Science 3 (1999) S. 77–85. Daber, Beate, Akteneinsicht der Nebenklage in der Fallkonstellation „Aussage gegen Aussage“ aus aussagepsychologischer Perspektive, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, 2. Auflage, Berliner Wissenschafts-Verlag 2014, S. 169–182. Dahle, Klaus-Peter, Hat der sogenannte „Lügendetektor“ nach veränderter Rechtslage in Deutschland eine Zukunft? Psychologische Rundschau 54 (2003) S. 103–111. Deckers, Rüdiger, Aussage gegen Aussage – zur Entwicklung der revisionsgerichtlichen Rechtsprechung und der Aussagepsychologie, in: Regina Michalke u. a. (Hrsg.), Festschrift für Rainer Hamm zum 65. Geburtstag am 24. Februar 2008, De Gruyter 2008, S. 53–62. –, Fehlerquellen in Sexualstrafverfahren, in: Henning Ernst Müller/Günther M. Sander/Helena Válková (Hrsg.), Festschrift für Ulrich Eisenberg zum 70. Geburtstag, C. H. Beck 2009, S. 473–497. –, Höchstrichterliche Anforderungen an besondere Beweiskonstellationen – Aussage gegen Aussage, Aussage von Mitbeschuldigten oder des „Kronzeugen“, StraFo 2010, S. 372–379. –, Fehlervermeidung bei Staatsanwaltschaft und Polizei, StraFo 2015, S. 265–268. –, Aussagekonstanz aus juristischer und aussagepsychologischer Sicht, StV 2017, S. 50–54. –, Zur Reform des Sexualstrafrechts durch das StÄG 2016, StV 2017, S. 410–412. –, Glaubhaftigkeitsprüfung 2018, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess. Juristische, aussagepsychologische und psychiatrische Aspekte, 3. Auflage, Berliner Wissenschafts-Verlag 2019, S. 181–204. Delvo, Matthias, Der Lügendetektor im Strafprozeß der U. S. A., Athenäum 1981. DePaulo, Bella/Lindsay, James/Malone, Brian/Muhlenbruck, Laura/Charlton, Kelly/ Cooper, Harris, Cues to deception, Psychological Bulletin 129 (2003) S. 74–118. DePaulo, Bella/Morris, Wendy, Discerning lies from truths: behavioural cues to deception and the indirect pathway of intuition, in: Pär Anders Granhag/Leif A. Strömwall (Hrsg.), The Detection of Deception in Forensic Contexts, Cambridge University Press 2004, S. 15–40. Dettenborn, Harry, Anmerkungen zum Polygrafie-Beschluss des BGH für das Zivilverfahren, FPR 2003, S. 559–566. Drohsel, Franziska, Der Lügendetektor vor Gericht – ein Problem in Sachsen, StV 2018, S. 827–830. Dünnebier, Hanns u. a. (Hrsg.), Löwe-Rosenberg, Die Strafprozeßordnung und das Gerichtsverfassungsgesetz, Großkommentar, Band 1 (Einleitung, §§ 1–212b StPO), 22. Auflage, De Gruyter 1971. Zitiert: Bearbeiter LR22 (1971). Effer-Uhe, Daniel/Mohnert, Alica, Psychologie für Juristen, Nomos 2019.

186

Schrifttum

Eisenberg, Ulrich, Anmerkung zu zwei Entscheidungen des 5. Strafsenats des BGH zur Würdigung der in Kenntnis der Verfahrensakten erfolgten Aussage eines Nebenklägers, JR 2016, S. 390–395. –, Beweisrecht der StPO, 10. Auflage, C. H. Beck 2017. Erb, Volker, Grund und Grenzen der Unzulässigkeit einer regelmäßigen Einholung von Glaubwürdigkeitsgutachten im Strafverfahren, in: Matthias Jahn/Hans Kudlich/Franz Streng (Hrsg.), Strafrechtspraxis und Reform. Festschrift für Heinz Stöckel zum 70. Geburtstag, Duncker & Humblot 2010, S. 181–197. Eschelbach, Ralf, Zu den Voraussetzungen, unter denen es zur Sachaufklärung erforderlich ist, über eine Zeugenaussage ein aussagepsychologisches Gutachten einzuholen, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, 2. Auflage, Berliner Wissenschafts-Verlag 2014, S. 43–82. Eser, Albin (Gesamtredaktion), Strafgesetzbuch, Kommentar, begründet von Adolf Schönke, fortgeführt von Horst Schröder, 30. Auflage, C. H. Beck 2019. Zitiert: Bearbeiter Schönke/Schröder. European Network of Forensic Science Institutes, Guideline for Evaluative Reporting in Forensic Science 2015. Fabian, Thomas/Greuel, Luise/Stadler, Michael, Möglichkeiten und Grenzen aussagepsychologischer Glaubwürdigkeitsbegutachtung, StV 1996, S. 347–351. Faigman, David/Monahan, John/Slobogin, Christopher, Group to Individual (G2i) Inference in Scientific Expert Testimony, The University of Chicago Law Review 81 (2014) S. 417–480. Fezer, Gerhard, Tatrichterlicher Erkenntnisprozeß – „Freiheit“ der Beweiswürdigung, StV 1995, S. 95–101. Fiedler, Klaus, Gutachterliche Stellungnahme zur wissenschaftlichen Grundlage der Lügendetektion mithilfe sogenannter Polygraphentests, Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 5–44. –, Über Tests, psychophysiologische Methoden und den Schein der Präzision, Psychologische Rundschau 54 (2003) S. 112–115. Fiedler, Klaus/Schmid, Jeannette, Gutachten über Methodik und Bewertungskriterien für Psychologische Glaubwürdigkeitsgutachten, Praxis der Rechtspsychologie 9 (1999) S. 5–45. Fiedler, Klaus/Schmid, Jeannette/Stahl, Teresa, What Is the Current Truth About Polygraph Lie Detection? Basic and Applied Social Psychology 24 (2002) S. 313–324. Fincke, Martin, Die Pflicht des Sachverständigen zur Belehrung des Beschuldigten, ZStW 86 (1974) S. 656–675. Finkelstein, Michael, Basic Concepts of Probability and Statistics in the Law, Springer 2009. Fischer, Larissa/Paul, Bettina/Voigt, Torsten, Wahrheit unter dem Vergrößerungsglas. Vorstellungen von Subjekt und Technik in der Rechtsprechung zur Polygraphie, Zeitschrift für Soziologie 48 (2020) S. 418–434. Fischer, Thomas, Glaubwürdigkeitsbeurteilung und Beweiswürdigung – Von der Last der „ureigenen Aufgabe“, NStZ 1994, S. 1–5. –, Aussagewahrheit und Glaubhaftigkeitsbegutachtung. Anmerkungen zum Beweiswert von Glaubhaftigkeitsgutachten im Strafverfahren, in: Heinz Schöch u. a. (Hrsg.), Strafverteidigung, Revision und die gesamten Strafrechtswissenschaften Festschrift für Gunter Widmaier zum 70. Geburtstag, Heymanns 2008, S. 191–222.

Schrifttum

187

–, Normative Tatbestandsausweitung bei sexuellem Übergriff, NStZ 2019, S. 580–584. –, Strafgesetzbuch mit Nebengesetzen, Kommentar, 69. Auflage, C. H. Beck 2022. Friedrichs, Hans, Die aussagepsychologische Exploration, in: Udo Undeutsch (Hrsg.), Forensische Psychologie, Hogrefe 1967, S. 3–25. Frister, Helmut, Der Lügendetektor – Zulässiger Sachbeweis oder unzulässige Vernehmungsmethode? ZStW 106 (1994) S. 303–331. Ganis, Giorgio, Deception Detection Using Neuroimaging, in: Pär Anders Granhag/Aldert Vrij/Bruno Verschuere (Hrsg.), Detecting Deception. Current Challenges and Cognitive Approaches, Wiley 2015, S. 105–121. Geipel, Andreas, Die Verteidigung bei Straftaten gegen die sexuelle Selbstbestimmung, StV 2008, S. 271–276. –, Handbuch der Beweiswürdigung, 3. Auflage, ZAP Verlag 2017. –, Beweisführung und Lügenerkennung vor Gericht, UTB und Ferdinand Schöningh 2021. Gercke, Björn u. a. (Hrsg.), Heidelberger Kommentar zur Strafprozessordnung, 6. Auflage, C. F. Müller 2019. Zitiert: Bearbeiter HK. Gerhold, Sönke, Der Einsatz von Lügendetektorsoftware im Strafprozess – aufgrund des technischen Fortschritts in Zukunft doch rechtmäßig? ZIS 2020, S. 431–439. Ginton, Avital, A Non-Standard Method for Estimating Accuracy of Lie Detection Techniques Demonstrated on a Self-Validating Set of Field Polygraph Examinations, Psychology, Crime and Law 19 (2013) S. 577–594. –, A critical examination of Iacono and Ben‐Shekhar’s critique of Ginton’s innovative technique for estimating polygraph CQT accuracy in real‐life cases, Journal of Investigative Psychology and Offender Profiling 17 (2020) S. 296–309. Ginton, Avital/Daie, Netzer/Elaad, Eitan/Ben-Shakhar, Gershon, A Method for Evaluating the Use of the Polygraph in a Real-Life Situation, Journal of Applied Psychology 67 (1982) S. 131–137. Gödert, Heinz Werner, Forensische Glaubhaftigkeitsbeurteilung. Experimenteller Vergleich inhaltsorientierter und psychophysiologischer Methoden, zugleich Dissertation zur Erlangung des Akademischen Grades eines Dr. phil., Johannes-GutenbergUniversität Mainz 2002. Gödert, Heinz Werner/Gamer, Matthias/Rill, Hans-Georg/Vossel, Gerhard, Aussagepsychologische Glaubhaftigkeitsbeurteilung. Validität der Kriterienorientierten Inhaltsanalyse, wenn Zeugen und Täter sich gegenseitig beschuldigen, in: Clemens Lorei (Hrsg.), Polizei & Psychologie. Kongressband der Tagung „Polizei & Psychologie“ am 3. und 4. April 2006 in Frankfurt am Main, Verlag für Polizeiwissenschaft 2007, S. 519–532. Gödert, Heinz Werner/Rill, Hans-Georg/Vossel, Gerhard, Aussagepsychologische Glaubhaftigkeitsbegutachtung: Urteiler-Übereinstimmung bei der Anwendung der Kriterienorientierten Inhaltsanalyse, MschrKrim 86 (2003) S. 273–287. Golbs, Ulrike, Kastrationsgesetz, Kommentar, Nomos 2012. Graf, Jürgen (Hrsg.), Beck’scher Online-Kommentar StPO mit RiStBV und MiStra, 42. Edition, C. H. Beck 2022. Zitiert: Bearbeiter BeckOK-StPO. Greuel, Luise, Suggestibilität und Aussagezuverlässigkeit: ein (neues) Problem in der forensisch-psychologischen Praxis? in: Luise Greuel/Thomas Fabian/Michael Stadler (Hrsg.), Psychologie der Zeugenaussage. Ergebnisse der rechtspsychologischen Forschung, Psychologie Verlags Union 1997, S. 211–220.

188

Schrifttum

–, Der Einsatz des Polygraphen in der Behandlung und Überwachung hoch rückfallgefährdeter Sexualstraftäter, Praxis der Rechtspsychologie 8 (1998) S. 54–70. –, Was ist Glaubhaftigkeitsbegutachtung (nicht)? Zum Problem der Dogmatisierung in einem wissenschaftlichen Diskurs, Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 70–89. Greuel, Luise/Offe, Heinz/Fabian, Agnes/Wetzels, Peter/Fabian, Thomas/Offe, Susanne/Stadler, Michael, Glaubhaftigkeit der Zeugenaussage, Psychologie Verlags Union 1998. Griesel, Dorothee/Ternes, Marguerite/Schraml, Domenica/Cooper, Barry S./Yuille, John, The ABC’s of CBCA: Verbal Credibility Assessment in Practice, in: Barry S. Cooper/Dorothee Griesel/Marguerite Ternes (Hrsg.), Applied Issues in Investigative Interviewing, Eyewitness Memory, and Credibility Assessment, Springer 2013, S. 293– 323. Grubin, Don, Polygraphy, in: Elizabeth Campbell/Jennifer Brown (Hrsg.), The Cambridge Handbook of Forensic Psychology, Cambridge University Press 2010, S. 276– 282. Gubitz, Michael, Praxiskommentar zu BGH, Beschluss vom 5.4.2016 – 5 StR 40/16, NStZ 2016, S. 367–369. Häcker, Robert/Schwarz, Volker, Tatsachenfeststellung vor Gericht, begründet und weitergeführt von Rolf Bender/Armin Nack/Wolf-Dieter Treuer, 5. Auflage, C. H. Beck 2021. Zitiert: Bearbeiter Bender/Häcker/Schwarz. Hagen, Johann Josef, Statistik für Juristen, Neuer Wissenschaftlicher Verlag 2005. Hamm, Rainer, Monokeltests und Menschenwürde, NJW 1999, S. 922 f. Handbuch des Fachanwalts Strafrecht, siehe bei Bockemühl, Jan. Handbuch für den Staatsanwalt, siehe bei Vordermayer, Helmut/Heintschel-Heinegg, Bernd von/Schnabl, Robert. Handler, Mark/Honts, Charles/Goodson, Walt, A Literature Review of Polygraph Countermeasures and the Comparison Question Technique, Polygraph 44 (2015) S. 129– 139. Handler, Mark/Nelson, Raymond, Utah Approach to Comparison Question Polygraph Testing, Polygraph 38 (2009) S. 15–33. Hannich, Rolf (Hrsg.), Karlsruher Kommentar zur Strafprozessordnung, 8. Auflage, C. H. Beck 2019. Zitiert: Bearbeiter KK. Hartwig, Maria/Bond, Charles, Lie Detection from Multiple Cues: A Meta-analysis, Applied Cognitive Psychology 28 (2014) S. 661–676. Heidelberger Kommentar zur Strafprozessordnung, siehe bei Gercke, Björn. Heintschel-Heinegg, Bernd von, Scheinerinnerung, Suggestion, Lüge oder Trauma? in: Jan Bockemühl u. a. (Hrsg.), Festschrift für Ottmar Breidling zum 70. Geburtstag am 15. Februar 2017, De Gruyter 2017, S. 143–165. Heintschel-Heinegg, Bernd von/Bockemühl, Jan (Hrsg.), Kommentar zur Strafprozessordnung, begründet von Theodor Kleinknecht/Hermann Müller/Leonhard Reitberger, bis zur Aktualisierungslieferung Nr. 112, Juni 2022, Luchterhand 2022. Zitiert: Bearbeiter KMR. Heller, Piotr, Kann dieses Auge lügen? Frankfurter Allgemeine Sonntagszeitung vom 29. September 2019, S. 61, online unter https://www.faz.net/aktuell/wissen/kuenst liche-intelligenz-soll-luegendetektoren-endlich-praktikabel-machen-16408179.html, zuletzt abgerufen am 20. Juni 2022.

Schrifttum

189

Herdegen, Gerhard, Strafrichterliche Aufklärungspflicht und Beweiswürdigung, NJW 2003, S. 3513–3516. Herzog, Roman u. a. (Hrsg.), Grundgesetz, Band I, Kommentar, begründet von Theodor Maunz/Günter Dürig, 94. Ergänzungslieferung, Januar 2021, C. H. Beck 2021. Zitiert: Bearbeiter Maunz/Dürig. Hilgers, Ralf-Dieter/Bauer, Peter/Scheiber, Viktor, Einführung in die Medizinische Statistik, Springer 2007. Hilgers, Ralf-Dieter/Heussen, Nicole/Stanzel, Sven, Likelihood Ratio, in: Axel Gressner/ Torsten Arndt (Hrsg.), Lexikon der medizinischen Laboratoriumsdiagnostik, 3. Auflage, Springer 2019, S. 1466 f. –, Vierfeldertafel, in: Axel Gressner/Torsten Arndt (Hrsg.), Lexikon der medizinischen Laboratoriumsdiagnostik, 3. Auflage, Springer 2019, S. 2448 f. Hilgert, Peter, Aussagepsychologische Gutachten im Strafprozess, NJW 2016, S. 985– 989. Hillenkamp, Thomas, Hirnforschung, Willensfreiheit und Strafrecht – Versuch einer Zwischenbilanz, ZStW 127 (2015) S. 10–96. Hoffmann, Michael, Zum Problemkreis der differenzierten Einwilligung (Einverständnis) des Opfers im Bereich des § 177 StGB nach dem Strafrechtsänderungsgesetz 2016, NStZ 2019, S. 16–18. Hofmann, Frank, Das neue Sexualstrafrecht – ein Konjunkturprogramm für Strafverteidiger und eine große Herausforderung an die Justiz, Praxis der Rechtspsychologie 27 (2017) S. 7–25. Hohoff, Ute, Aktuelle Fragen der aussagepsychologischen Begutachtung von Opferzeugen in Strafverfahren, NStZ 2020, S. 387–390. Hommers, Wilfried, Die aussagepsychologische Kriteriologie unter kovarianzstatistischer und psychometrischer Perspektive, in: Luise Greuel/Thomas Fabian/Michael Stadler (Hrsg.), Psychologie der Zeugenaussage. Ergebnisse der rechtspsychologischen Forschung, Psychologie Verlags Union 1997, S. 87–100. Honts, Charles, Criterion Development and Vailidity of the CQT in Field Application, The Journal of General Psychology 123 (1996) S. 309–324. –, The psychophysiological detection of deception, in: Pär Anders Granhag/Leif A. Strömwall (Hrsg.), The Detection of Deception in Forensic Contexts, Cambridge University Press 2004, S. 103–123. –, Countermeasures and Credibility Assessment, in: David Raskin/Charles Honts/John Kircher (Hrsg.), Credibility Assessment. Scientific Research and Applications, Academic Press 2014, S. 131–158. Honts, Charles/Hartwig, Maria, Credibility Assessment at Portals, in: David Raskin/ Charles Honts/John Kircher (Hrsg.), Credibility Assessment. Scientific Research and Applications, Academic Press 2014, S. 37–61. Honts, Charles/Raskin, David, A Field Study of the Validity of the Directed Lie Control Question, Journal of Police Science and Administration 16 (1988) S. 56–61. Honts, Charles/Reavy, Racheal, The Comparison Question Polygraph Test: A Contrast of Methods and Scoring, Physiol Behav 143 (2015) S. 15–26. Honts, Charles/Schweinle, William, Information Gain of Psychophysiological Detection of Deception in Forensic and Screening Settings, Applied Psychophysiology & Biofeedback 34 (2009) S. 161–172.

190

Schrifttum

Honts, Charles/Thurber, Steven, Analyzing Iacono’s Thought Experiment About Polygraph Field Studies: Reason or Fantasy? Polygraph & Forensic Credibility Assessment 48 (2019) S. 76–86. Honts, Charles/Thurber, Steven/Handler, Mark, A comprehensive meta‐analysis of the comparison question polygraph test, Applied Cognitive Psychology Special Issue (2021) S. 1–17. Hörnle, Tatjana, Sexuelle Selbstbestimmung: Bedeutung, Voraussetzungen und kriminalpolitische Forderungen, ZStW 127 (2016) S. 851–887. –, Das Gesetz zur Verbesserung des Schutzes sexueller Selbstbestimmung, NStZ 2017, S. 13–21. Horowitz, Steven/Kircher, John/Honts, Charles/Raskin, David, The role of comparison questions in physiological detection of deception, Psychophysiology 34 (1997) S. 108–115. Horowitz, Steven/Lamb, Michael/Esplin, Phillip/Boychuk, Tascha/Krispin, Orit/ReiterLavery, Lisa, Reliability of Criteria-Based Content Analysis of Child Witness Statements, Legal and Criminological Psychology 2 (1997) S. 11–21. Iacono, William, Can we determine the accuracy of polygraph tests? in: J. Richard Jennings/Patrick Ackles/Michael Coles (Hrsg.), Advances in Psychophysiology. A Research Annual, 4. Auflage, Jessica Kingsley Publishers 1991, S. 201–207. –, Detection of Deception, in: Gary Berntson/John Cacioppo/Louis Tassinary (Hrsg.), Handbook of Psychophysiology, Cambridge University Press 2017, S. 565–580. Iacono, William/Ben-Shakhar, Gershon, Current Status of Forensic Lie Detection with the Comparison Question Technique: An Update of the 2003 National Academy of Sciences Report on Polygraph Testing, Law and Human Behavior 43 (2019) S. 86–98. Iacono, William/Patrick, Christopher, Employing Polygraph Assessment, in: Irving Weiner/Randy Otto (Hrsg.), The Handbook of Forensic Psychology, 4. Auflage, John Wiley & Sons 2014, S. 613–658. –, Assessing Deception. Polygraph Techniques and Integrity Testing, in: Richard Rogers (Hrsg.), Clinical Assessment of Malingering and Deception, 4. Auflage, The Guilford Press 2018, S. 361–386. Ibold, Victoria, Künstliche Intelligenz im Strafprozess – KI-basierte Lügendetektoren zur Tatsachenfeststellung? ZStW 134 (2022) S. 504–533. Jansen, Gabriele, Überprüfung aussagepsychologischer Gutachten, StV 2000, S. 224– 229. –, Zeuge und Aussagepsychologie, 3. Auflage, C. F. Müller 2022. Jayne, Brian, Contributions of Physiological Recordings in the Polygraph Technique, Polygraph 19 (1990) S. 105–117. Joecks, Wolfgang/Miebach, Klaus (Hrsg.), Münchener Kommentar zum Strafgesetzbuch, Band 2 (§§ 38–79b StGB), Band 3 (§§ 80–184j StGB), 4. Auflage, C. H. Beck 2020 f. Zitiert: Bearbeiter MK-StGB. Jordan, Benedikt/Gresser, Ursula, Wie unabhängig sind Gutachter? Der Sachverständige 2014, S. 71–83. Kannegießer, Anja/Eisenberg, Ulrich, Anmerkung zu KG, Beschluss vom 12.12.2018 – 161 Ss 150/18, NStZ 2019, S. 361 f. Karlsruher Kommentar zur Strafprozessordnung, siehe bei Hannich, Rolf. Kassab, Verena/Gresser, Ursula, Was macht Österreich besser? Ergebnisse einer Befragung von medizinischen Sachverständigen in Österreich und Vergleich mit einer Be-

Schrifttum

191

fragung medizinischer Sachverständiger in Deutschland, Der Sachverständige 2015, S. 268–276. Kircher, John/Raskin, David, Human Versus Computerized Evaluations of Polygraph Data in a Laboratory Setting, Journal of Applied Psychology 73 (1988) S. 291–302. Klimke, Olaf, Der Polygraphentest im Strafverfahren, NStZ 1981, S. 433 f. KMR-Kommentar zur Strafprozessordnung, siehe bei Heintschel-Heinegg, Bernd von/ Bockemühl, Jan. Knauer, Christian/Kudlich, Hans/Schneider, Hartmut (Hrsg.), Münchener Kommentar zur Strafprozessordnung, Band 2 (§§ 151–332 StPO), C. H. Beck 2016. Zitiert: Bearbeiter MK-StPO. Köhnken, Günter, Statement Validity Analysis and the ‚detection of the truth‘, in: Pär Anders Granhag/Leif A. Strömwall (Hrsg.), The Detection of Deception in Forensic Contexts, Cambridge University Press 2004, S. 41–63. –, Fehlerquellen in aussagepsychologischen Gutachten, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess. Juristische, aussagepsychologische und psychiatrische Aspekte, 3. Auflage, Berliner Wissenschafts-Verlag 2019, S. 25–69. Köhnken, Günter/Gallwitz, Simone, Fehlerquellen in aussagepsychologischen Gutachten, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess. Juristische, aussagepsychologische und psychiatrische Aspekte, 4. Auflage, Berliner Wissenschafts-Verlag 2021, S. 17–58. Köhnken, Günter/Kraus, Uta/Vom Schemm, Katja, Fünfzig Jahre und kein bisschen weise: Gibt es wirklich Lügensymptome im nonverbalen Verhalten? in: Clemens Lorei (Hrsg.), Polizei & Psychologie. Kongressband der Tagung „Polizei & Psychologie“ am 3. und 4. April 2006 in Frankfurt am Main, Verlag für Polizeiwissenschaft 2007, S. 361–375. König, Cornelia/Fegert, Jörg Michael, Zur Praxis der Glaubhaftigkeitsbegutachtung unter Einfluss des BGH-Urteils (1 StR 618/98), Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 16–41. Krahé, Barbara/Kundrotas, Silva, Glaubwürdigkeitsbeurteilung bei Vergewaltigungsanzeigen: Ein aussagenanalytisches Feldexperiment, Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 598–620. Krebs, Dagmar/Menold, Natalja, Gütekriterien quantitativer Sozialforschung, in: Nina Baur/Jörg Blasius (Hrsg.), Handbuch Methoden der empirischen Sozialforschung, 2. Auflage, Springer 2019, S. 489–504. Kudlich, Hans (Hrsg.), Münchener Kommentar zur Strafprozessordnung, Band 1 (§§ 1–150 StPO), C. H. Beck 2014. Zitiert: Bearbeiter MK-StPO. Lamb, Michael/Sternberg, Kathleen/Esplin, Phillip/Hershkowitz, Irit/Orbach, Yael, Assessing the Credibility of Children’s Allegations of Sexual Abuse: A Survey of Recent Research, Learning and Individual Differences 9 (1997) S. 175–194. Lamb, Michael/Sternberg, Kathleen/Esplin, Phillip/Hershkowitz, Irit/Orbach, Yael/ Hovav, Meir, Criterion-Based Content Analysis: A Field Validation Study, Child Abuse & Neglect 21 (1997) S. 255–264. Landry, Kristine/Brigham, John, The Effect of Training in Criteria-Based Content Analysis on the Ability to Detect Deception in Adults, Law and Human Behavior 16 (1992) S. 663–676. Langen, Nicole, Der Einfluß der Ergebnisse aussagepsychologischer Gutachten auf die Entscheidungen von Staatsanwaltschaft und Gericht in Strafverfahren wegen des Ver-

192

Schrifttum

dachts von Taten gegen die sexuelle Selbstbestimmung Minderjähriger, Peter Lang 2000. Laufhütte, Heinrich Wilhelm/Rissing-van Saan, Ruth/Tiedemann, Klaus (Hrsg.), Leipziger Kommentar zum Strafgesetzbuch, Band 7/2 (§§ 232–241a StGB), 12. Auflage, De Gruyter 2014. Zitiert: Bearbeiter LK. Lederer, Jenny, Ein (auch) interdisziplinärer Blick auf die Sexualstrafrechtsreform und ihre Auswirkungen, StraFo 2018, S. 280–287. Lederer, Jenny/Deckers, Rüdiger, Verteidigung mit Blick auf die Integration (aussage-) psychologischen Sachverstands in das Strafverfahren nach der Gesetzesnovelle einiger Normen des Sexualstrafrechts (§§ 177, 184i und j StGB), Praxis der Rechtspsychologie 27 (2017) S. 75–78. Leipziger Kommentar, siehe bei Laufhütte, Heinrich Wilhelm/Rissing-van Saan, Ruth/ Tiedemann, Klaus. Less, Günter, Zur Anwendung experimental-psychologischer Methoden bei Zeugen, DRZ 1950, S. 322 f. Löwe-Rosenberg, siehe bei Becker, Jörg-Peter. Lykken, David, The Psychopath and the Lie Detector, Psychophysiology 15 (1978) S. 137–142. –, The Detection of Deception, Psychological Bulletin 86 (1979) S. 47–53. –, Why (Some) Americans Believe in the Lie Detector While Others Believe in the Guilty Knowledge Test, Integrative Physiological and Behavioral Science 26 (1991) S. 214–222. –, A Tremor in the Blood, 2. Auflage, Plenum Trade 1998. MacLaren, Vance, A Quantitative Review of the Guilty Knowledge Test, Journal of Applied Psychology 86 (2001) S. 674–683. Malek, Klaus, Abschied von der Wahrheitssuche, StV 2011, S. 559–567. Mangan, Daniel/Armitage, Thomas/Adams, Gregory, A field study on the validity of the Quadri-Track Zone Comparison Technique, Physiol Behav 95 (2008) S. 17–23. Mao, Yuan-yi/Liang, Yun-dan/Hu, Ze-qing, Accuracy rate of lie-detection in China: Estimate the validity of CQT on field cases, Physiol Behav 140 (2015) S. 104–110. Matt, Holger/Renzikowski, Joachim (Hrsg.), Strafgesetzbuch, 2. Auflage, Vahlen 2020. Zitiert: Bearbeiter Matt/Renzikowski. Matte, James Allan, Forensic Psychophysiology Using The Polygraph, J. A. M. Publications 1998. Matte, James Allan/Reuss, Ronald, A Field Validation Study of the Quadri-Zone Comparison Technique, Polygraph 18 (1989) S. 187–202. Maunz/Dürig, siehe bei Herzog, Roman. McGee, Steven, Simplifying Likelihood Ratios, JGIM 17 (2002) S. 647–650. McGrayne, Sharon Bertsch, Die Theorie, die nicht sterben wollte, Springer 2014. Meijer, Ewout/Verschuere, Bruno, Detection Deception Using Psychophysiological and Neural Measures, in: Henry Otgaar/Mark L. Howe (Hrsg.), Finding the truth in the courtroom. Dealing with deception, lies, and memories, Oxford University Press 2018, S. 209–224. Meyer-Goßner/Schmitt, siehe bei Schmitt, Bertram/Köhler, Marcus. Meyer-Mews, Hans, Die „in dubio contra reo“-Rechtsprechungspraxis bei Aussage-gegen-Aussage-Delikten, NJW 2000, S. 916–919. Miebach, Klaus, Die Überprüfung des Glaubwürdigkeitsgutachtens in der neueren Rechtsprechung des BGH, NStZ-RR 2018, S. 36–39.

Schrifttum

193

Mokros, Andreas, Standardisierte und psychometrische Untersuchungsverfahren in der forensisch-psychiatrischen Begutachtung, in: Ulrich Venzlaff/Harald Dreßing/Stephan Bork (Hrsg.), Psychiatrische Begutachtung. Ein praktisches Handbuch für Ärzte und Juristen, 6. Auflage, Elsevier Urban & Fischer 2015, S. 29–52. –, Risikobeurteilung in der Rechtspsychologie, in: Eryk Noji u. a. (Hrsg.), Figurationen von Unsicherheit, Springer 2022, S. 241–258. Momsen, Carsten, Die Renaissance des Polygraphen? Wie effektiv lassen sich amerikanische Verteidigungsstrategien im deutschen Strafverfahren nutzen? KriPoZ 2018, S. 142–151. Müller, Eckhardt/Schlothauer, Reinhold/Knauer, Christoph (Hrsg.), Münchener AnwaltsHandbuch Strafverteidigung, begründet von Gunter Widmaier, 3. Auflage, C. H. Beck 2022. Zitiert: Bearbeiter MAH Strafverteidigung. Müller, Henning Ernst, Anmerkung zu BGH, Urteil vom 30.7.1999 – 1 StR 618/98 (BGHSt. 45, 164), JZ 2000, S. 267 f. Münchener Anwalts-Handbuch Strafverteidigung, siehe bei Müller, Eckhardt/Schlothauer, Reinhold/Knauer, Christoph. Münchener Kommentar zum Strafgesetzbuch, siehe bei Joecks, Wolfgang/Miebach, Klaus. Münchener Kommentar zur Strafprozessordnung, siehe bei Kudlich, Hans. Nack, Armin, Indizienbeweisführung und Denkgesetze, NJW 1983, S. 1035–1037. –, Revisibilität der Beweiswürdigung, StV 2002, S. 558–565. National Research Council, The Polygraph and Lie Detection, The National Academies Press 2003. Nelson, Raymond, Scientific Basis for Polygraph Testing, Polygraph 44 (2015) S. 28–61. Nestler, Nina, „Wer einmal lügt, dem glaubt man nicht …“ – Falschaussage, Glaubhaftigkeit, Lügendetektor, JA 2017, S. 10–16. Neuhaus, Ralf, Kriminaltechnik für den Strafverteidiger – Eine Einführung in die Grundlagen, StraFo 2001, S. 115–119. –, Fehlerquellen im Ermittlungsverfahren aus Sicht der Verteidigung, StV 2015, S. 185– 194. –, Die Psychosoziale Prozessbegleitung nach dem 3. ORRG: Ein verhängnisvoller Irrweg, StV 2017, S. 55–63. Nezik, Ann-Kathrin, Falsch geblinzelt, Die Zeit vom 27. August 2020, S. 22, online unter https://www.zeit.de/2020/36/iborder-ctrl-luegen-detektor-software-algorithmusforschung-kritik, zuletzt abgerufen am 20. Juni 2022. Niehaus, Susanna, Zur Anwendbarkeit inhaltlicher Glaubhaftigkeitsmerkmale bei Zeugenaussagen unterschiedlichen Wahrheitsgehalts, Peter Lang 2001. –, Merkmalsorientierte Inhaltsanalyse, in: Renate Volbert/Max Steller (Hrsg.), Handbuch der Rechtspsychologie, Hogrefe 2008, S. 311–321. Niveau, Gérard/Lacasa, Marie-Josée/Berclaz, Michel/Germond, Michèle, Inter-rater Reliability of Criteria-Based Content Analysis of Children’s Statements of Abuse, Journal of Forensic Sciences 60 (2015) S. 1247–1252. Nowrousian, Bijan, Darf der Beschuldigte im Ermittlungsverfahren getäuscht werden? – Zur grundsätzlichen Zulässigkeit aktiver Täuschung im Ermittlungsverfahren, NStZ 2015, S. 625–628. Oberlader, Verena/Naefgen, Christoph/Koppehele-Gossel, Judith/Quinten, Laura/Banse, Rainer/Schmidt, Alexander, Validity of Content-Based Techniques to Distinguish

194

Schrifttum

True and Fabricated statements: A Meta-Analysis, Law and Human Behavior 40 (2016) S. 440–457. Offe, Heinz, Zum Stellenwert der Aussagemotivation in aussagepsychologischen Gutachten, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, 2. Auflage, Berliner Wissenschafts-Verlag 2014, S. 87–98. Offe, Heinz/Offe, Susanne, Das BGH-Urteil zum Polygraphen: Eine Herausforderung für die Psychologie, Praxis der Rechtspsychologie 11 (2001) S. 5–15. –, Experimentelle Untersuchung zur Theorie der Vergleichsfragen in der physiopsychologischen Täterschaftsdiagnostik, MschrKrim 87 (2004) S. 86–102. –, The comparison question test: does it work and if so how? Law and Human Behavior 31 (2007) S. 291–303. –, Aussagekonstanz als Indikator für den Erlebnisbezug einer Aussage, Praxis der Rechtspsychologie 18 (2008) S. 97–115. Offe, Susanne/Offe, Heinz, Der Stellenwert der Motivanalyse in der Glaubwürdigkeitsbegutachtung, in: Thomas Fabian u. a. (Hrsg.), Rechtspsychologie kontrovers, Deutscher Psychologen-Verlag 1998, S. 80–90. O’Shea, James/Crockett, Keeley/Khan, Wasiq/Kindynis, Philippos/Antoniades, Athos/ Boultadakis, Georgios, Intelligent Deception Detection through Machine Based Interviewing, in: International Joint Conference on Neural Networks 2018, S. 1–8. Parker, Andrew/Brown, Jennifer, Detection of deception: Statement Validity Analysis as a means of determining truthfulness or falsity of rape allegations, Legal and Criminological Psychology 5 (2000) S. 237–259. Patrick, Christopher/Iacono, William, Psychopathy, Threat, and Polygraph Test Accuracy, Journal of Applied Psychology 74 (1989) S. 347–355. –, Validity of the Control Question Polygraph Test: The Problem of Sampling Bias, Journal of Applied Psychology 76 (1991) S. 229–238. Peters, Karl, Eine Antwort auf Undeutsch: Die Verwertbarkeit unwillkürlicher Ausdruckserscheinungen bei der Aussagenwürdigung, ZStW 87 (1975) S. 663–679. Petry, Horst, Beweisverbote im Strafprozess, Dr. Stoytscheff 1971. Pfister, Wolfgang, Was ist seit BGHSt 45, 164 geschehen? Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 3–11. –, Die Prüfung der Glaubhaftigkeit einer Aussage im Spiegel höchstrichterlicher Rechtsprechung, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess, 2. Auflage, Berliner Wissenschafts-Verlag 2014, S. 99–117. Plaum, Ernst, Probleme der psychologischen Begutachtung von Kindern als Opfer, Interdisziplinäre Fachzeitschrift für Prävention und Intervention 9 (2008) S. 102–121. –, Was ist Wahrheit? Zum Problem der Dogmatisierung in einer angewandten Wissenschaft, Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 4–15. Podlesny, John/Truslow, Connie, Validity of an Expanded-Issue (Modified General Question) Polygraph Technique in a Simulated Distributed-Crime-Roles Context, Journal of Applied Psychology 78 (1993) S. 788–797. Porter, Stephen/Yuille, John, The language of deceit: An investigation of the verbal clues to deception in the interrogation context, Law and Human Behavior 20 (1996) S. 443– 458. Prittwitz, Cornelius, Der Lügendetektor im Strafprozeß, MDR 1982, S. 886–895.

Schrifttum

195

Püschel, Christof, Fehlerquellen in der Sphäre von Staatsanwaltschaft und Polizei, StraFo 2015, S. 269–278. Putzke, Holm, Anmerkung zu BGH, Beschluss vom 30.11.2010 – 1 StR 509/10, ZJS 2011, S. 557–563. Putzke, Holm/Scheinfeld, Jörg, Entlastungsbeweis: polygraphische Untersuchung, StraFo 2010, S. 58–63. Putzke, Holm/Scheinfeld, Jörg/Klein, Gisela/Undeutsch, Udo, Polygraphische Untersuchungen im Strafprozess, ZStW 121 (2009) S. 607–644. Rakete-Dombek, Ingeborg, Der Einsatz des Polygraphen beim Vorwurf des sexuellen Mißbrauchs aus anwaltlicher Sicht, in: Joseph Salzgeber/Michael Stadler/Siegfried Willutzki (Hrsg.), Polygraphie. Möglichkeiten und Grenzen der psychophysiologischen Aussagebegutachtung, Bundesanzeiger 2000, S. 105–116. Raskin, David, Scientific Assessment of the Accuracy of Detection of Deception: A Reply to Lykken, Psychophysiology 15 (1978) S. 143–147. Raskin, David/Esplin, Phillip, Assessment of Children’s Statements of Sexual Abuse, in: John Doris (Hrsg.), The Suggestibility of Children’s Recollections, American Psychological Association; Copies from APA Order Dept 1991, S. 153–164. Raskin, David/Hare, Robert, Psychopathy and Detection of Deception In a Prison Population, Psychophysiology 15 (1978) S. 126–136. Raskin, David/Honts, Charles, The Comparison Question Test, in: Murray Kleiner (Hrsg.), Handbook of Polygraph Testing, Academic Press 2002, S. 1–47. Raskin, David/Kircher, John, Validity of Polygraph Techniques and Decision Methods, in: David Raskin/Charles Honts/John Kircher (Hrsg.), Credibility Assessment. Scientific Research and Applications, Academic Press 2014, S. 63–129. Raskin, David/Kircher, John/Honts, Charles/Horowitz, Steven, A Study of the Validity of Polygraph Examinations in Criminal Investigation (Salt Lake City) 1988. –, A Study of the Validity of Polygraph Examinations in Criminal Investigation, Polygraph & Forensic Credibility Assessment 48 (2019) S. 10–39. Rill, Hans-Georg, Forensische Psychophysiologie. Ein Beitrag zu den psychologischen und physiologischen Grundlagen neuerer Ansätze der „Lügendetektion“, zugleich Dissertation zur Erlangung des Akademischen Grades eines Dr. phil., Johannes-Gutenberg-Universität Mainz 2001. Rill, Hans-Georg/Vossel, Gerhard, Psychophysiologische Täterschaftsbeurteilung („Lügendetektion“, „Polygraphie“): Eine kritische Analyse aus psychophysiologischer und psychodiagnostischer Sicht, NStZ 1998, S. 481–486. Risse, Jörg, Mathematik, Statistik und die Juristerei, NJW 2020, S. 2383–2387. Rodenbeck, Julian, Lügendetektor 2.0 – Der Einsatz von Künstlicher Intelligenz zur Aufdeckung bewusst unwahrer Aussagen im Strafverfahren, StV 2020, S. 479–483. Rohmann, Josef, Das neue Sexualstrafrecht – eine aussagepsychologische Perspektive, Praxis der Rechtspsychologie 27 (2017) S. 27–45. Roma, Paolo/San Martini, Pietro/Sabatello, Ugo/Tatarelli, Roberto/Ferracuti, Stefano, Validity of Criteria-Based Content Analysis (CBCA) at trial in free-narrative interviews, Child Abuse & Neglect 35 (2011) S. 613–620. Roxin, Claus/Schünemann, Bernd, Strafverfahrensrecht, 29. Auflage, C. H. Beck 2017. Rückert, Sabine, Zwei blaue Flecke und ein Nullbefund, Die Zeit vom 24. Februar 2011, S. 18, online unter https://www.zeit.de/2011/09/WOS-Kachelmann, zuletzt abgerufen am 20. Juni 2022.

196

Schrifttum

Satzger, Helmut/Schluckebier, Wilhelm (Hrsg.), Strafprozessordnung mit GVG und EMRK. Kommentar, mitbegründet von Gunter Widmaier, 4. Auflage, Wolters Kluwer 2020. Zitiert: Bearbeiter SSW-StPO. Saxe, Leonard/Ben-Shakhar, Gershon, Admissibility of polygraph tests: The application of scientific standards post-Daubert, Psychology, Public Policy, and Law 5 (1999) S. 203–223. Schemmel, Jonas/Volbert, Renate, Gibt es eine personenspezifische Aussagequalität? Die Konsistenz der Qualität von wahren und erfundenen Aussagen einer Person zu verschiedenen Ereignissen, Praxis der Rechtspsychologie 27 (2017) S. 79–104. Schmandt, Stefan, Höchstrichterliche Anforderungen an besondere Beweiskonstellationen – Aussage gegen Aussage, Aussagen von Mitbeschuldigten oder des „Kronzeugen“, StraFo 2010, S. 446–451. Schmitt, Bertram/Köhler, Marcus, Meyer-Goßner/Schmitt, Strafprozessordnung, Gerichtsverfassungsgesetz, Nebengesetze und ergänzende Bestimmungen, Kommentar, begründet von Otto Schwarz, fortgeführt von Theodor Kleinknecht/Karlheinz Meyer/ Lutz Meyer-Goßner, 65. Auflage, C. H. Beck 2022. Zitiert: Bearbeiter Meyer-Goßner/Schmitt. Schneider, Frank/Frister, Helmut/Olzen, Dirk, Begutachtung psychischer Störungen, 4. Auflage, Springer 2020. Schneider, Lothar, Nonverbale Zeugnisse gegen sich selbst, Attempto 1991. Schneider, Peter/Schneider, Harald/Fimmers, Rolf/Brinkmann, Bernd, Allgemeine Empfehlungen der Spurenkommission zur statistischen Bewertung von DNA-DatenbankTreffern, NStZ 2010, S. 433–436. Schöch, Heinz, Praxiskommentar zu OLG Braunschweig, Beschluss vom 3.12.2015 – 1 Ws 309/15, NStZ 2016, S. 631 f. Schönke/Schröder, siehe bei Eser, Albin. Schoon, Wiebke/Briken, Peer, Zur Anwendbarkeit der Glaubhaftigkeitsbegutachtung unter spezifischen Begutachtungsumständen – Eine narrative Übersichtsarbeit, Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 125–135. Schoreit, Armin, Einsatz von Polygraphen und Glaubhaftigkeits-Gutachten psychologischer Sachverständiger im Strafprozeß, StV 2004, S. 284–287. Schüssler, Mark, Polygraphie im deutschen Strafverfahren, Peter Lang 2002. –, Das endgültige Aus oder neue Hoffnung für den „Lügendetektor“? JR 2003, S. 188– 191. Schwabe, Jürgen, Rechtsprobleme des „Lügendetektors“, NJW 1979, S. 576–582. –, Der „Lügendetektor“ vor dem Bundesverfassungsgerichts, NJW 1982, S. 367 f. Schweizer, Mark, Beweiswürdigung und Beweismaß, Mohr Siebeck 2015. Schwenn, Johann, Fehlurteile und ihre Ursachen – die Wiederaufnahme im Verfahren wegen sexuellen Mißbrauchs, StV 2010, S. 705–711. Seiterle, Stefan, Hirnbild und „Lügendetektion“, Duncker & Humblot 2010. –, Zur Frage der „völligen Ungeeignetheit“ einer polygraphischen Untersuchung, StraFo 2014, S. 58–64. Sommer, Ulrich, Effektive Strafverteidigung, 4. Auflage, Heymanns 2020. Sporer, Siegfried/Köhnken, Günter, Nonverbale Indikatoren von Täuschung, in: Renate Volbert/Max Steller (Hrsg.), Handbuch der Rechtspsychologie, Hogrefe 2008, S. 353–363. Statistisches Bundesamt, Strafverfolgung, Fachserie 10, Reihe 3, 2019.

Schrifttum

197

Staudinger, Wolfgang, Anmerkung zu KG, Beschluss vom 12.12.2018 – (2) 161 Ss 150/18 (53/18), StV 2019, S. 834–837. Steller, Max, Psychophysiologische Aussagebeurteilung, Hogrefe 1987. –, Recent Developments in Statement Validity, in: John Yuille (Hrsg.), Credibility Assessment. Proceedings of the NATO Advanced Study Institute on Credibility Assessment 1988, Kluwer 1989, S. 135–154. –, Psychophysiologische Täterschaftsermittlung („Lügendetektion“, „Polygraphie“), in: Max Steller/Renate Volbert (Hrsg.), Psychologie im Strafverfahren. Ein Handbuch, Hans Huber 1997, S. 89–104. –, Psychophysiologische Täterschaftsbeurteilung als Entlastungsmöglichkeit bei Verdacht auf sexuellen Mißbrauch? in: Joseph Salzgeber/Michael Stadler/Siegfried Willutzki (Hrsg.), Polygraphie. Möglichkeiten und Grenzen der psychophysiologischen Aussagebegutachtung, Bundesanzeiger 2000, S. 31–43. –, Kritische Bemerkungen zum Polygraphen, in: Marianne Heer/Matthias Brunner (Hrsg.), Gericht und Expertise. La justice et l’expertise, Stämpfli 2005, S. 173–184. –, Glaubhaftigkeitsbegutachtung, in: Renate Volbert/Max Steller (Hrsg.), Handbuch der Rechtspsychologie, Hogrefe 2008, S. 300–310. –, Psychophysiologische Aussagebeurteilung, in: Renate Volbert/Max Steller (Hrsg.), Handbuch der Rechtspsychologie, Hogrefe 2008, S. 364–375. –, Vier Jahrzehnte forensische Aussagepsychologie, Praxis der Rechtspsychologie 23 (2013) S. 11–32. –, Nichts als die Wahrheit? Heyne 2015. –, Revitalisierung der Lügendetektion? Recht & Psychiatrie 36 (2018) S. 173–178. –, Die Entdeckung der Scheinerinnerung, in: Rüdiger Deckers/Günter Köhnken (Hrsg.), Die Erhebung und Bewertung von Zeugenaussagen im Strafprozess. Juristische, aussagepsychologische und psychiatrische Aspekte, 3. Auflage, Berliner WissenschaftsVerlag 2019, S. 71–96. –, Stand und Herausforderungen der Aussagepsychologie, Forensische Psychiatrie, Psychologie, Kriminologie 14 (2020) S. 188–196. Steller, Max/Dahle, Klaus-Peter, Psychophysiologische Täterschaftsbeurteilung („Lügendetektion“). Unschuldsnachweis bei Verdacht auf sexuellen Mißbrauch? in: Luise Greuel/Thomas Fabian/Michael Stadler (Hrsg.), Psychologie der Zeugenaussage. Ergebnisse der rechtspsychologischen Forschung, Psychologie Verlags Union 1997, S. 309–323. –, Grundlagen, Methoden und Anwendungsprobleme psychophysiologischer Aussagebzw. Täterschaftsbeurteilung („Polygraphie“, „Lügendetektion“), Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 127–204. Steller, Max/Volbert, Renate, Glaubwürdigkeitsbegutachtung, in: Max Steller/Renate Volbert (Hrsg.), Psychologie im Strafverfahren. Ein Handbuch, Hans Huber 1997, S. 12–39. –, Forensisch-aussagepsychologische Begutachtung (Glaubwürdigkeitsbegutachtung), Praxis der Rechtspsychologie 9 (1999) S. 46–112. Steller, Max/Wellershaus, Petra/Wolf, Thomas, Realkennzeichen in Kinderaussagen: Empirische Grundlagen der Kriterienorientierten Aussageanalyse, Zeitschrift für experimentelle und angewandte Psychologie 39 (1992) S. 151–170. Stübinger, Stephan, Lügendetektor ante portas, ZIS 2008, S. 538–555.

198

Schrifttum

Suzuki, Akihiro/Ohnishi, Kazuo/Matsuno, Kazunori/Arasuna, Masana, Amplitude Rank Score Analysis of GSR in the Detection of Deception, Polygraph 8 (1979) S. 242– 252. Systematischer Kommentar zum Strafgesetzbuch, siehe bei Wolter, Jürgen. Systematischer Kommentar zur Strafprozessordnung, siehe bei Wolter, Jürgen. Tavor, Daphna, Aussagepsychologie einmal anders – Der „Lügendetektor“, in: Marianne Heer/Matthias Brunner (Hrsg.), Gericht und Expertise. La justice et l’expertise, Stämpfli 2005, S. 153–171. Trafimow, David/Marks, Michael, Editorial, Basic and Applied Social Psychology 37 (2015) S. 1–2. Undeutsch, Udo, Beurteilungen der Glaubhaftigkeit von Aussagen, in: Udo Undeutsch (Hrsg.), Forensische Psychologie, Hogrefe 1967, S. 26–181. –, Die Verwertbarkeit unwillkürlicher Ausdruckserscheinungen bei der Aussagenwürdigung, ZStW 87 (1975) S. 650–662. –, Die Leistungsfähigkeit der heutigen Methoden der psychophysiologischen Täterschaftsermittlung, MschrKrim 62 (1979) S. 228–241. –, Psychophysiologische Täterschaftsdiagnostik. Bedarf und Akzeptanz, insbesondere bei Verdacht des sexuellen Mißbrauchs, in: Luise Greuel/Thomas Fabian/Michael Stadler (Hrsg.), Psychologie der Zeugenaussage. Ergebnisse der rechtspsychologischen Forschung, Psychologie Verlags Union 1997, S. 303–308. –, Ergänzungen zum Artikel von K.‑P. Dahle: Hat der sogenannte „Lügendetektor“ nach veränderter Rechtslage in Deutschland eine Zukunft? Psychologische Rundschau 54 (2003) S. 115–119. Undeutsch, Udo/Klein, Gisela, Valide und invalide Methoden zur Beurteilung des Wahrheitsgehaltes von Kinderaussagen über sexuellen Mißbrauch, in: Thomas Fabian u. a. (Hrsg.), Rechtspsychologie kontrovers, Deutscher Psychologen-Verlag 1998, S. 67– 79. –, Wissenschaftliches Gutachten zum Beweiswert physiopsychologischer Untersuchungen, Praxis der Rechtspsychologie 9 (Sonderheft) (1999) S. 45–126. Vehrs, Wolfgang, Psychophysiologische Aussagebegutachtung (PPAB) mit der Vergleichsfragentechnik (VFT) in familiengerichtlichen Verfahren, Praxis der Rechtspsychologie 11 (2001) S. 16–25. Verschuere, Bruno/Meijer, Ewout/Merckelbach, Harald, The Quadri-Track Zone Comparison Technique: It’s just not science, Physiol Behav 95 (2008) S. 27–28. Volbert, Renate, Standards der psychologischen Glaubhaftigkeitsdiagnostik, in: HansLudwig Kröber/Max Steller (Hrsg.), Psychologische Begutachtung im Strafverfahren. Indikationen, Methoden, Qualitätsstandards, 2. Auflage, Steinkopff 2005, S. 171– 203. –, Glaubhaftigkeitsbegutachtung – mehr als Merkmalsorientierte Inhaltsanalyse, Forensische Psychiatrie, Psychologie, Kriminologie 2 (2008) S. 12–19. –, Suggestion, in: Renate Volbert/Max Steller (Hrsg.), Handbuch der Rechtspsychologie, Hogrefe 2008, S. 331–341. –, Glaubhaftigkeitsbegutachtung: Wie man die aussagepsychologische Methodik verstehen und missverstehen kann, Interdisziplinäre Fachzeitschrift für Prävention und Intervention 12 (2009) S. 52–69. Volbert, Renate/Lau, Steffen, Aussagetüchtigkeit, in: Renate Volbert/Max Steller (Hrsg.), Handbuch der Rechtspsychologie, Hogrefe 2008, S. 289–299.

Schrifttum

199

Volbert, Renate/Schemmel, Jonas/Tamm, Anett, Die aussagepsychologische Begutachtung: eine verengte Perspektive? Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 108–124. Volbert, Renate/Steller, Max, Is This Testimony Truthful, Fabricated, or Based on False Memory? European Psychologist 19 (2014) S. 207–220. –, Die Begutachtung der Glaubhaftigkeit, in: Ulrich Venzlaff/Harald Dreßing/Stephan Bork (Hrsg.), Psychiatrische Begutachtung. Ein praktisches Handbuch für Ärzte und Juristen, 6. Auflage, Elsevier Urban & Fischer 2015, S. 683–707. Volbert, Renate/Steller, Max/Galow, Anett, Das Glaubhaftigkeitsgutachten, in: HansLudwig Kröber u. a. (Hrsg.), Handbuch der forensischen Psychiatrie. Band 2: Psychopathologische Grundlagen und Praxis der forensischen Psychiatrie im Strafrecht, Steinkopff 2011, S. 623–689. Vordermayer, Helmut/Heintschel-Heinegg, Bernd von/Schnabl, Robert (Hrsg.), Handbuch für den Staatsanwalt, 6. Auflage, Heymanns 2018. Zitiert: Bearbeiter Handbuch Staatsanwalt. Vrij, Aldert, Criteria-Based Content Analysis, Psychology, Public Policy, and Law 11 (2005) S. 3–41. –, Detecting Lies and Deceit, 2. Auflage, John Wiley & Sons 2008. –, Verbal Lie Detection Tools: Statement Validity Analysis, Reality Monitoring and Scientific Content Analysis, in: Pär Anders Granhag/Aldert Vrij/Bruno Verschuere (Hrsg.), Detecting Deception. Current Challenges and Cognitive Approaches, Wiley 2015, S. 3–35. –, Nonverbal Detection of Deception, in: Henry Otgaar/Mark L. Howe (Hrsg.), Finding the truth in the courtroom. Dealing with deception, lies, and memories, Oxford University Press 2018, S. 163–185. Vrij, Aldert/Ganis, Giorgio, Theories in Deception and Lie Detection, in: David Raskin/ Charles Honts/John Kircher (Hrsg.), Credibility Assessment. Scientific Research and Applications, Academic Press 2014, S. 301–374. Vrij, Aldert/Kneller, Wendy/Mann, Samantha, The effect of informing liars about Criteria‐Based Content Analysis on their ability to deceive CBCA‐raters, Legal and Criminological Psychology 5 (2000) S. 57–70. Wagner, Michaela, Polygraphie im Strafverfahren? Verlag Österreich 2012. Walter, Tonio, Zu früh und zu weit – der aktuelle Referentenentwurf eines Gesetzes zur „Verbesserung des Schutzes der sexuellen Selbstbestimmung“, JR 2016, S. 361–369. –, Strafprozessrecht, UTB und Mohr Siebeck 2020. Wasserstein, Ronald/Lazar, Nicole, The ASA Statement on p-Values: Context, Process, and Purpose, The American Statistician 70 (2016) S. 129–133. Wasserstein, Ronald/Schirm, Allen/Lazar, Nicole, Moving to a World Beyond „p < 0.05“, The American Statistician 73 (2019) S. 1–19. Weinreich, Gerd/Klein, Michael (Hrsg.), Familienrecht Kommentar, 6. Auflage, Luchterhand 2019. Zitiert: Bearbeiter Weinreich/Klein. Welle, Ida/Berclaz, Michel/Lacasa, Marie-Josée/Niveau, Gérard, A call to improve the validity of criterion-based content analysis (CBCA): Results from a field-based study including 60 children’s statements of sexual abuse, J Forensic Leg Med 43 (2016) S. 111–119. Wells, Gary/Loftus, Elizabeth, Commentary: Is This Child Fabricating? Reactions to a New Assessment Technique, in: John Doris (Hrsg.), The Suggestibility of Children’s Recollections, American Psychological Association 1991, S. 168–171.

200

Schrifttum

Wolf, Thomas, Scheinerinnerungen und „false memory“ – aktuelle rechtliche Fragen an die Aussagepsychologie, Forensische Psychiatrie, Psychologie, Kriminologie 13 (2019) S. 136–141. Wolter, Jürgen (Hrsg.), Systematischer Kommentar zur Strafprozessordnung mit GVG und EMRK, Band I (§§ 1–93 StPO), Band II (§§ 94–136a StPO), Band IV (§§ 198– 246 StPO), Band V (§§ 246a–295 StPO), Band VIII (§§ 374–500 StPO), 5. Auflage, Heymanns 2015–2020. Zitiert: Bearbeiter SK-StPO. – (Hrsg.), Systematischer Kommentar zum Strafgesetzbuch, Band IV (§§ 174–241a StGB), 9. Auflage, Heymanns 2017. Zitiert: Bearbeiter SK-StGB. Würtenberger, Thomas, Ist die Anwendung des Lügendetektors im deutschen Strafverfahren zufällig? JZ 1951, S. 772–775.

Sachregister Accuracy rates siehe Trefferquoten Aggregation 58–60, 86, siehe auch Prinzip des induktiv-statistischen Schließens Akteneinsicht 35–38, siehe auch Nebenklagevertreter Alibibeweis 162 American Polygraph Association 132 f. Analoge Anwendung § 136a StPO 149– 152, siehe auch Täuschung Analysematerial 32 f. Anfangswahrscheinlichkeit 74–76, 79 f., 83–85 Ausdrucksverhalten siehe Lügensignale Aussage gegen Aussage 5–9, 35–38 Aussagebeurteiler, professionelle 10 f., 80, 177, siehe auch Überzeugung, richterliche Aussagefähigkeit siehe Aussagetüchtigkeit Aussagefreiheit 149 f., siehe auch Freiwilligkeit Aussagemotivation 26–28 Aussagepsychologie 15 f., 20, 24–26, 34, 39 f., 47–58, 61–63, 65–68 – Aussagematerial siehe Analyse material – Beweiswert 76–78, 86 f. – Forschung 47–58, 65–68, siehe auch Laborstudien; Feldstudien – Grenzen 32–38 – Inhaltsanalyse, kriterienorientierte 24– 26, 40–43, 48, 65–67, 86 – Leitfrage 20 – Motivationsanalyse siehe Aussagemotivation – Realkennzeichenanalyse siehe Realkennzeichen Aussagetraining siehe Coaching

Aussagetüchtigkeit 19 Außenkriterium 45 f., 50 Baumdiagramm 78 f., 125, 174 f. Bayes-Regel 73–78, 84, 172 Beweiskraft, abstrakte siehe LikelihoodQuotient Beweismittel, völlig ungeeignetes 90 f., 138–141 Beweisring 171 f. Beweiswert, konkreter 70–77, 81–84 Beweiswürdigung 7 f., 27, 38, 78 Coaching 34 f., 112–114 Confirmation bias 128 Criteria Based Content Analysis 26 Direkte Methode siehe Vergleichsfragenmethode Druck, mittelbarer 157–161, siehe auch Gesamtzusammenhang, strafprozessualer Eingriff, körperlicher 146 f., 154 f Einverständnis siehe Einwilligung Einwilligung 144, 153–155 Einwilligungsdruck siehe Druck, mittelbarer Elektrokardiogramm 93 f. Erlebnisbezug 16, 69 f. Erlebnishypothese 22 Falschbelastungen 4, 27 f., siehe auch Aussagemotivation False Memories siehe Scheinerinnerungen False Negative Rate 75, 82, 115 False Positive Rate 74 f., 82, 115 Familienrecht 92

202

Sachregister

Feldstudien 45, 47–56, 119–122, 126– 130, 136 f. Fight-or-flight-reaction 99 Freiwilligkeit 101, 144, siehe auch Aussagefreiheit Friendly examiner syndrome 163 f. Gesamtzusammenhang, strafprozessualer 157, siehe auch Druck, mittelbarer Geständnis 46, 121, 126 Glaubhaftigkeit 15–18 Glaubwürdigkeit 17 f. Ground truth siehe Außenkriterium Gütekriterien 42 f. Hirnbild 179 Hypnose 151 f. Indizienring siehe Beweisring Kastration 155 Kerngeschehen siehe Analysematerial Kinderzeichnungen 10 Kombinationslösung 170–174 Kompetenzanalyse 18 f. Konstanzanalyse 26 f. Kontrollfragentest siehe Vergleichsfragenmethode Künstliche Intelligenz 180–182 Laborstudien 44 f., 57 f., 67 f., 118 f., 137–139 Laplace 73 f., siehe auch Bayes-Regel Lebenserfahrung 9–11 Likelihood Ratio siehe Likelihood- Quotient Likelihood-Quotient 81–85, 115, 124, 171–174 Lügendetektor 93, 95 Lügenhypothese 20–24 Lügensignale 10, 94 f., 149 Magnetresonanztomografie, funktionelle 179 Manipulation 34 f., 96, 102, 107, 112– 114, siehe auch Täuschung Menschenwürde 152–156 Meta-Studien 65, 67 f., 72

Micro gestures 181 Narkoanalyse 151 f. National Research Council 130–132 Nebenklagevertreter 36 f., siehe auch Akteneinsicht Nemo-tenetur-Grundsatz 157–159 Nullhypothese 20–22 Objektivität 42 Persönlichkeitsrecht, allgemeines 153– 155 Polygrafengestütze Glaubhaftigkeitsbegutachtung – Beweiswert 140, 173 f. – Forschung 116 f., 119–139, siehe auch Laborstudien; Feldstudien – Funktionsweise 93–95 – Methoden 98–112, siehe auch Vergleichsfragenmethode; Tatwissenstechnik – Urteil des Bundesgerichtshofs 89–91, 122 f., 144 f., 148 f., 152 f. Prädiktiver Wert 70–72 Pre-Test Probability siehe Anfangswahrscheinlichkeit Prinzip des induktiv-statistischen Schließens 59, siehe auch Aggregation Pseudoerinnerungen siehe Scheinerinnerungen Puppen, anatomisch korrekte 10 Qualität-Kompetenz-Vergleich 61, 97 Realkennzeichen 24 f., 34, 59 f. Reliabilität 42 Sachverständiger 9, 96–98, 146 f. Scheinerinnerungen 19, 29, 93 Schweigerecht 5 f., 159 f. Selbstbestimmungsrecht 156, 158 Sensitivität 63 f., 74, siehe auch True Positive Rate Sexualstrafrechtsreform 1–4 Signifikanz, statistische 51 f., 55 f. Specific lie response siehe Lügen signale

Sachregister

Spezifität 65, 75, siehe auch True Negative Rate Standardisierbarkeit 61 f., 105 f., 108 Statement Validity Analysis 26 Suggestion 19, 21, 28–31, 95 – Autosuggestion 19, 31 – Fremdsuggestion 19, 30 Suggestionshypothese siehe Suggestion Tatwissenstechnik 110–112 Täuschung 102 f., 106 f., 148 f., siehe auch Analoge Anwendung § 136a StPO; Manipulation Trefferquoten 11, 46, 62–70, 122–140 True Negative Rate 65, 75, siehe auch Spezifität True Positive Rate 64, 74 f., siehe auch Sensitivität Übereinstimmungsquoten 12, 40, 87 Überzeugung, richterliche 7, 159, siehe auch Aussagebeurteiler, professionelle Undeutsch-Hypothese 23 f., 47, 58, 86 Untersuchung, körperliche 146–148 Validität 42–45, 62, 118

Verfassungsrecht 8, 152–155 Vergleichsfragenmethode 100–110, 116 f., 130–134 – Directed-Lie-Technik 107–110 – Numerisches Scoring System 105, 128 f. – Probable-Lie-Technik 103–107 Verwertbarkeit 144 f., 161 Verwertungsverbot 160–162 Vierfeldertafel 63–66 Vorgespräch 96, 100 f., 108 Vortestinterview siehe Vorgespräch Wahrheit 15–18, 44–46, 69 f. – objektive 16, 44 – subjektive 16, 22–25, 69 f. Wahrscheinlichkeit 64, 69, 73 Wiederaufnahmeverfahren 135 Zeuge 165–169 – Begutachtungspflicht 166 – verweigerte Begutachtung 168 f. Zufall 11, 79 f. Zuverlässigkeit 42 Zwang 147 f., 157 Zwangsmittel 165 f.

203