430 100 5MB
Spanish Pages [959] Year 2010
PROBLEMAS CONTEMPORÁNEOS DE LA FILOSOFÍA DEL DERECHO
INSTITUTO DE INVESTIGACIONES JURÍDICAS Serie DOCTRINA JURÍDICA, Núm. 244 Coordinador editorial: Raúl Márquez Romero Cuidado de la edición: Claudia Araceli González Formación en computadora: Sara Castillo Salinas
PROBLEMAS CONTEMPORÁNEOS DE LA FILOSOFÍA DEL DERECHO Enrique CÁCERES, Imer B. FLORES Javier SALDAÑA, Enrique VILLANUEVA Coordinadores
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO MÉXICO, 2005
Primera edición: 2005 DR © 2005, Universidad Nacional Autónoma de México INSTITUTO DE INVESTIGACIONES JURÍDICAS Circuito Maestro Mario de la Cueva s/n Ciudad de la Investigación en Humanidades Ciudad Universitaria, 04510 México, D. F. Impreso y hecho en México ISBN 970-32-2695-7
CONTENIDO Presentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . Imer B. FLORES
XI
La objetividad de las proposiciones jurídicas . . . . . . . . . . . Jorge ADAME GODDARD
1
La ponderación como procedimiento para interpretar los derechos fundamentales. . . . . . . . . . . . . . . . . . . . . . . . . . . . Carlos BERNAL PULIDO
17
La ética del discurso jurídico . . . . . . . . . . . . . . . . . . . . Arturo BERUMEN CAMPOS
37
Hermenéutica analógica, derechos humanos y culturas . . . . . . Mauricio BEUCHOT
55
Some Reflections on Methodology in Jurisprudence . . . . . . . Brian BIX
67
La interpretación en el derecho y en el arte. Primeras aproximaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Leticia BONIFAZ A.
97
Constructivismo jurídico, verdad y prueba . . . . . . . . . . . . . Enrique CÁCERES
113
Titularidad de los derechos . . . . . . . . . . . . . . . . . . . . . Juan Antonio CRUZ PARCERO
133
Qué es y para qué sirve el derecho . . . . . . . . . . . . . . . . . Magdalena ESPINOSA GÓMEZ
147
V
VI
CONTENIDO
¿Ensueño, pesadilla y/o realidad? Objetividad e (in)determinación en la interpretación del derecho . . . . . . . . . . . . . . . . 173 Imer B. FLORES Entre el discurso práctico general y la argumentación jurídica: las formas de la argumentación política . . . . . . . . . . . . . . . . Joaquín GARCÍA-HUIDOBRO How Facts Make Law . . . . . . . . . . . . . . . . . . . . . . . Mark GREENBERG
195 211
COMENTARIOS On the Normative Significance of Brute Facts . . . . . . . Ram NETA
263
Superveniencia, valor y contenidos legales . . . . . . . . . Enrique VILLANUEVA
281
La filosofía perenne. Una propuesta vigente para la filosofía contemporánea del derecho . . . . . . . . . . . . . . . . . . . . . . 289 Martín HERNÁNDEZ Fuentes, validez y aplicabilidad de las normas . . . . . . . . . . Carla HUERTA La evolución del debate multicultural y su estado actual en la teoría liberal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Francisco IBARRA PALAFOX Legalidad, legitimidad y legitimación. Implicaciones éticas . . . Jacqueline JONGITUD ZAMORA
303
329 353
A Left Phenomenological Critique of the Hart/Kelsen Theory of Legal Interpretation . . . . . . . . . . . . . . . . . . . . . . . 371 Duncan KENNEDY Seis problemas relacionados con el concepto de sanción . . . . . Roberto LARA CHAGOYÁN
385
CONTENIDO
Privilege in Mexican and American Criminal Law . . . . . . . . Larry LAUDAN
VII
403
Kelsen, Hart y Dworkin en Hispanoamérica: condiciones de posibilidad de una filosofía local del derecho . . . . . . . . . . . . 415 Diego Eduardo LÓPEZ MEDINA El simulacro de la readaptación . . . . . . . . . . . . . . . . . . Dante LÓPEZ MEDRANO
459
La teoría referencial-realista de la interpretación jurídica . . . . . Carlos I. MASSINI-CORREAS
477
La estrategia de la vio lencia política y la contravio lencia terro rista. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 Klaus MÜLLER UHLENBROCK Acerca de las normas derivadas . . . . . . . . . . . . . . . . . . Pablo E. NAVARRO
511
The Power of Image and the Image of Power: The Case of Law . Ana Laura NETTEL D.
527
La semántica de la derrotabilidad . . . . . . . . . . . . . . . . . María Inés PAZOS
541
Razones y normas. . . . . . . . . . . . . . . . . . . . . . . . . . María Cristina REDONDO
563
Caos y derecho . . . . . . . . . . . . . . . . . . . . . . . . . . . María Elodia ROBLES SOTOMAYOR
597
Kelsen y el problema de la objetividad . . . . . . . . . . . . . . Carlos RODRÍGUEZ MANZANERA
617
Reglas y principios. A propósito del origen y contenido de los principios jurídicos a partir de las regulae iuris . . . . . . . . 629 Javier SALDAÑA La interpretación del derecho . . . . . . . . . . . . . . . . . . . Augusto SÁNCHEZ SANDOVAL
669
VIII
CONTENIDO
El positivismo incluyente en la encrucijada . . . . . . . . . . . . Pedro SERNA
683
Interpretación y argumentación jurídica: los límites del positivismo jurídico . . . . . . . . . . . . . . . . . . . . . . . . . . 703 María Emma SILVA ROMANO Metasemantics and Objectivity. . . . . . . . . . . . . . . . . . . Ori SIMCHEN
719
COMENTARIO Can Objetivity Be Grounded in Semantics? . . . . . . . . Michel S. MOORE
739
A Hybrid Theory of Claim-Rights . . . . . . . . . . . . . . . . . Gopal SREENIVASAN
765
COMENTARIO Comment on pro fessor Go pal Sreeni va san’s A Hybrid Theory of Claim-Rights” . . . . . . . . . . . . . . . . . . Horacio SPECTOR Theory, Practice and Ubiquitous Interpretation: The Basics . . . Martin STONE
789
799
COMENTARIO Law as a Reflective Practice: A Comment on Stone’s “Theory, Practice and Ubiquitous Interpretation” . . . . . 833 Scott HERSHOVITZ Interpretación jurídica (dos lecturas del derecho) . . . . . . . . . Rolando TAMAYO Y SALMORÁN
843
El derecho y la filosofía de la ciencia . . . . . . . . . . . . . . . Ana Lilia ULLOA CUÉLLAR
871
CONTENIDO
IX
En torno al debate Raz/Coleman: ¿excluyente o incluyente? . . . Juan VEGA GÓMEZ
893
Justicia y multiculturalismo . . . . . . . . . . . . . . . . . . . . Ambrosio VELASCO GÓMEZ
917
Interpretación e indeterminación de la regla jurídica . . . . . . . Francesco VIOLA
929
!
PRESENTACIÓN El Congreso Internacional de Problemas Contemporáneos de la Filosofía del Derecho, en su primera versión, se llevó a cabo en la ciudad de México, del 7 al 11 de julio de 2003, auspiciado por siete dependencias de la Universidad Nacional Autónoma de México, a saber: la Coordinación de Humanidades, la Facultad de Estudios Superiores Acatlán, la Facultad de Estudios Superiores Aragón, la Facultad de Derecho, la Facultad de Filosofía y Letras, el Instituto de Investigaciones Filosóficas y el Instituto de Investigaciones Jurídicas. Su realización fue posible gracias a la generosidad y determinación de quienes son —o eran en aquel entonces— los titulares de cada una de estas dependencias universitarias: doctora Olga Elizabeth Hansberg Torres, maestra Hermelinda Osorio Carranza, arquitecta Lilia Turcott González, doctor Fernando Serrano Migallón, doctor Ambrosio Velasco Gómez, doctora Paulette Dieterlen Struck, y doctor Diego Valadés, respectivamente; así como al entusiasmo y dedicación de profesores e investigadores del área de filosofía y teoría del derecho de esta Universidad, al no escatimar esfuerzos para organizar y difundir este magno evento. Con toda solemnidad el Congreso fue inaugurado por el propio rector de nuestra Alma Mater, doctor Juan Ramón de la Fuente, el 7 de julio, en el Auditorio Héctor Fix-Zamudio del Instituto de Investigaciones Jurídicas; la conferencia inaugural estuvo a cargo del doctor Pedro de Vega, ilustre catedrático de la Universidad Complutense de Madrid. Fue clausurado por la doctora Dieterlen, en su calidad de integrante del Comité Organizador, en el mismo auditorio que lucía un lleno comparable con el de la inauguración y que mantuvo una asistencia constante durante todo el Congreso, gracias al gran interés que despertó. En las sesiones matutinas y vespertinas contamos con la participación de exponentes de la amplia gama de corrientes de la filosofía y teoría jurídica, así como representantes de una gran variedad de perspectivas. Se contó con 50 expositores: 26 nacionales y 24 extranjeros procedentes XI
XII
PRESENTACIÓN
de Alemania, Argentina, Canadá, Colombia, Chile, España, Estados Unidos de América, Inglaterra e Italia. Todos ellos se integraron en las 10 mesas y en los 4 seminarios, para disertar y discutir con gran elocuencia sobre los problemas contemporáneos de la filosofía del derecho: la argumentación, hermenéutica e interpretación jurídica; la concepción del derecho y los conceptos jurídicos fundamentales; la derrotabilidad normativa; la epistemología jurídica y la metodología del derecho; la metafísica y metasemántica del derecho; el multiculturalismo y el pluralismo jurídico; la objetividad e indeterminación en el derecho; el positivismo excluyente e incluyente; asi como la relación entre derecho, ética y política. Como producto de dicho encuentro se publica esta obra que reúne casi todas las versiones revisadas de las ponencias originales, así como las observaciones de los comentaristas en los seminarios, salvo algunas que por diferentes razones no pudieron ser incluidas en este volumen, como fue el caso de la conferencia inaugural. La publicación recopila las ponencias agrupadas en orden alfabético por autores, en lugar de por temas; y en su caso, los comentarios aparecen inmediatamente después de la ponencia a la que hacen referencia. Los largos procesos editoriales —comprendidos entre la recopilación, el procesamiento, la entrega, el dictamen, la revisión y, en su caso, la corrección de textos, la edición y la publicación— hicieron posible que pudiéramos incluir en este volumen un par de trabajos que estaban comprometidos para ser publicados originalmente en algún otro lugar, además de uno de sus comentarios. Tal es el caso de “How Facts Make Law” de Mark Greenberg que apareció en Legal Theory, (vol. 10, pp. 157-198, 2004); el comentario “On the Normative Significance of Brute Facts” de Ram Neta que también fue publicado en el mismo volumen (pp. 199-214) y “A Hybrid Theory of Claim-Rights” de Gopal Sreenivasan (vol. 25, pp. 257-274) en el Oxford Journal of Legal Studies. Por ello, agradecemos profundamente a las editoriales Cambridge University Press y a Oxford University Press los permisos para reeditar dichos textos. Para concluir, sólo resta reiterar nuestro más profundo agradecimiento a los becarios del Instituto de Investigaciones Jurídicas: Edgar Aguilera García, Pedro Contreras Orduño, María José Franco Rodríguez, Fernanda García Vega, Adrián Mancera Cota, Rodrigo Ortiz Totoricaguena, Cynthia Rebeca Sánchez Pérez y Ariadna Valdés, por hacer todo lo po-
PRESENTACIÓN
XIII
sible en escena —y hasta lo imposible tras bambalinas— para la realización del Congreso. Mención especial merece la última, porque además asistió con diligencia en la recopilación y procesamiento de los materiales para esta publicación. Para finalizar, reiteramos nuestra gratitud no sólo a las autoridades que aportaron lo necesario para poder sembrar una semilla sino también a quienes en diferentes momentos contribuyeron a regar, podar y cultivar esta planta que ya dió sus primeros frutos. Confiamos que muy pronto volverá a florecer. Imer B. FLORES
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS Jorge ADAME GODDARD* SUMARIO: I. Introducción. II. El derecho como ciencia del orden social. III. El derecho como ciencia de lo justo practicable. IV. El objeto de la ciencia jurídica. V. La objetividad de las proposiciones jurídicas. VI. Conclusiones.
I. INTRODUCCIÓN Presento aquí una mera hipótesis acerca de la cuestión de la objetividad de las proposiciones jurídicas, que tendrá que justificarse y argumentarse de manera más acabada. En todo caso, me parece una hipótesis plausible y mucho agradecería sus comentarios al respecto. Ciertamente esta cuestión presupone una serie de convicciones filosóficas previas. En primer lugar, la sola posibilidad de hablar de la “objetividad” de las afirmaciones que hace la ciencia del derecho implica la aceptación de que el conocimiento común, lo mismo que el conocimiento científico, tiene como objeto y medida la realidad de las cosas. Los conocimientos se pueden llamar entonces “objetivos” o incluso “verdaderos” en tanto reflejen fielmente la realidad de las cosas de las que son abstracciones o conceptos, y son subjetivos o falsos en caso contrario. Sé que hay posturas filosóficas que no comparten este punto de vista, pero no se trata de hacer de esta cuestión una polémica. Lo único que pretendo es hacer explícitos mis postulados con el fin de hacer más comprensible la hipótesis que les propongo; y a quienes tienen una postura diferente, simplemente les pido que hagan lo que solía hacerse en las disputas escolásticas: que “acepten sin conceder”. * Instituto de Investigaciones Jurídicas, UNAM, México. 1
2
JORGE ADAME GODDARD
Hay algo más implícito en la cuestión que quiero tratar ante ustedes, y es un poco más complicado que la presunción de objetividad del conocimiento. Se trata de una concepción acerca de la ciencia del derecho, a partir de la cual puedo señalar cuáles son las proposiciones específicamente jurídicas, distinguiéndolas de las de otras ciencias conexas, como la ética, la política o las ciencias de la organización social. Una vez aclarado este punto, se puede proceder a discurrir acerca de la objetividad de esas proposiciones jurídicas. Quizá la concepción del derecho que les propongo aquí resulte menos aceptable que mi convencimiento de que el ser es la medida del conocimiento, pero me atrevo a presentarla ante ustedes confiando, otra vez, en su comprensión. Se ve, por lo antes dicho, que la ponencia se estructura en dos partes. En la primera, me refiero a la concepción dominante en México del derecho como ciencia del orden normativo (epígrafe uno), y luego (epígrafe dos) presento mi posición acerca del derecho como ciencia de lo justo practicable. En la segunda (epígrafe tres y conclusiones) me refiero ya directamente a la cuestión objeto de este trabajo, la de la objetividad de las proposiciones jurídicas. II. EL DERECHO COMO CIENCIA DEL ORDEN SOCIAL Me parece que en México prevalece la concepción del derecho que lo concibe como un “orden normativo” o conjunto de normas que rigen la vida social. Un indicador significativo de esta preferencia es el concepto de derecho que da Eduardo García Máynez en su Introducción al estudio del derecho,1 que es una obra que suele seguirse con más o menos fidelidad en muchas facultades de derecho y es tomada en cuenta seriamente por otros autores de introducciones semejantes. La primera parte de la obra se encamina, como indica su título, a explicar “la noción del derecho”, para lo cual el autor explica los conceptos de ley, norma, derecho objetivo y subjetivo; distingue el derecho de la moral y de los convencionalismos sociales; propone una clasificación de las fuentes del derecho y de las normas jurídicas y concluye haciendo una reflexión sobre el Estado. El lugar importante que en esta reflexión toma el concepto de “norma” y su clasificación hace ver ya la preferencia por esa concepción 1 García Máynez, E., Introducción al estudio del derecho, México, 1940 (en 1995 se publicaba la 47a. reimpresión).
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
3
del derecho, que el autor hace expresa cuando define el derecho en sentido objetivo (capítulo IV) como un conjunto de normas. El mismo autor, en un trabajo monográfico titulado La definición del derecho (México 1948, 2a. ed., Xalapa, 1960) se plantea directamente la cuestión y responde que en todos los autores hay coincidencia en que el derecho es algo normativo, aunque difieren en la naturaleza y contenido de las normas que lo integran. La concepción normativista es común a positivistas y iusnaturalistas o racionalistas: ambos sostienen que el derecho es un conjunto de normas, un orden social u ordenación de la vida social, aunque se separan en cuanto al origen de las normas, que para los primeros es sólo el poder del Estado, mientras que los iusnaturalistas invocan, además de las positivas, unas normas naturales o racionales. Así, un connotado representante mexicano de esta última corriente, Rafael Preciado Hernández, proponía como conclusión de sus Lecciones de filosofía del derecho2 esta definición del derecho: es la ordenación positiva y justa de la acción al bien común. La concepción normativista del derecho en todo caso lleva a una negación de su carácter científico, lo mismo si se considera que el orden normativo es solamente positivo, como si se considera que es a la vez natural (o racional) y positivo. Si se mira el orden normativo como exclusivamente positivo, en el sentido de que se compone principalmente de las leyes emitidas por la potestad legislativa, así como otras disposiciones gubernamentales, las sentencias judiciales e inclusive usos y costumbres sociales reconocidos socialmente como vinculantes, la ciencia jurídica sería el conocimiento sistemático y organizado de esas normas, y en consecuencia su primer cometido es la descripción de sus características, por las que se distinguen las normas propiamente jurídicas de otras normas que regulan la vida social como las reglas éticas o las costumbres sociales, y luego la clasificación y jerarquía de esas normas como elementos integrantes de un orden jurídico. A la ciencia del derecho también le correspondería al análisis y organización del contenido de las leyes y demás mandatos potestativos, lo cual cada vez se hace más complejo dada la profusión de este tipo de normas y la variedad de sus contenidos, por lo que de hecho la ciencia jurídica se reduce a analizar el contenido de las leyes principales, la 2
Preciado Hernández, Rafael, Lecciones de filosofía del derecho, México, 1947, p. 268.
4
JORGE ADAME GODDARD
Constitución, los códigos y algunas leyes administrativas, pero lo hace sabiendo que en cualquier momento el legislador o las instancias administrativas pueden modificar los contenidos. Ante la perspectiva de una ciencia cuyos contenidos son de muy diversa naturaleza (económicos, fiscales, administrativos, sanitarios, forestales, urbanísticas, etcétera), tan diversa como las leyes mismas, y que varían por decisiones emanadas de una voluntad política y no por los resultados de la investigación científica, se ha dudado con razón de que tal conocimiento de los contenidos legales sea verdaderamente científico. Para superar esta objeción se han intentado dos caminos, uno lógico-formal, y otro de casualidad social. Desde la perspectiva lógica formal, la ciencia jurídica se concentra en el estudio de los aspectos formales de las normas y se vuelva una ciencia cuyo objeto no son los contenidos de las normas sino sus aspectos formales, que son permanentes y universales: la jerarquía de las normas dentro del sistema, su lógica, su lenguaje y sus fuentes. Desde esta perspectiva, las proposiciones jurídicas serán evidentemente de carácter lógico formal, como la que dice que la ley posterior deroga a la anterior, o la que dice que la norma se estructura sobre la relación “si es a... debe ser b”. Esto puede resultar atractivo para los filósofos, especialmente los de la actual corriente denominada analítica, pero no es suficiente para los juristas que además de consideraciones formales requieren criterios materiales —es decir con contenido— de juicio para solucionar los casos que se les presentan. La otra postura posible para afirmar que el derecho, entendido como un sistema normativo positivo, es una ciencia y no mera arbitrariedad legislativa, es la de considerar cuáles son las causas sociales del orden normativo. Desde el punto de vista formal, se reconoce que las normas jurídicas requieren de la aprobación y publicación de la potestad legislativa o gubernativa, pero es también evidente que el contenido de esas normas está en buena parte condicionado por las circunstancias sociales, económicas, geográficas, culturales de cada pueblo, por lo que el contenido de las normas jurídicas puede ser explicado con la ayuda de las ciencias sociales, especialmente la sociología, la economía y la ciencia política. Desde este punto de vista, las proposiciones de la ciencia jurídica serían las propias de las ciencias sociales que afirman la probabilidad, más o menos alta, de que ante un determinado fenómeno social o colectivo se dé un determinado orden social, como las que afirman que el régimen de
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
5
las sociedades anónimas de capitales, con preferencia al de sociedades de personas, se da en una economía capitalista en la que priva el lucro como motor principal de la affectio societatis; o la que indica que el régimen de la sucesión testamentaria, como alternativa de la sucesión legítima, presupone un desarrollo social en el que la familia pierde el carácter protagónico que tiene en las sociedades primitivas. Resulta así que si se afirma que el derecho es fundamentalmente el orden normativo que rige la vida social, y específicamente el impuesto por la potestad política por medio de las leyes y otras decisiones potestativas, su contenido es esencialmente variable, dependiente de las circunstancias sociales, sobre todo de la voluntad política, y no puede considerarse como el resultado o conclusión de un estudio científico. Para poder afirmar el carácter científico del derecho se tiene entonces que acudir a analizar el orden normativo, no en su contenido, sino desde el punto de vista lógico formal o desde el punto de vista de la causalidad social. La ciencia del derecho es entonces o lógica jurídica o sociología jurídica, lo cual equivale a decir que no tiene una especificidad propia sino que es simplemente un capítulo de la lógica o de la sociología. Hay sin embargo otra posibilidad, que ya se apuntó arriba, de considerar al derecho como una ciencia del orden social. Consiste en reconocer que el orden social se funda en ciertos principios universales e inmutables, cuyo análisis, explicación, sistematización y desarrollo serían el objeto propio de la ciencia jurídica. Ésta es la posición peculiar de la filosofía del derecho natural: su objeto de estudio son los primeros principios del orden social, que son permanentes y universales en cuanto están fundados en la naturaleza racional del ser humano, como el principio de que el poder político está al servicio del pueblo y no de los gobernantes, o el de que todos los integrantes de una comunidad deben participar en las cargas y beneficios del bien común. De conformidad con este planteamiento, las proposiciones de la ciencia jurídica serían de carácter filosófico: el conocimiento de los primeros principios del orden social. De hecho, así se ha entendido tradicionalmente la ciencia del derecho natural. Pero sigue entonces el problema de encontrar un contenido propio para la ciencia jurídica, pues si bien los primeros principios del orden normativo pueden ser objeto de análisis científico-filosófico, ellos no constituyen el orden social sino son sólo su guía y límite. El orden social es ante todo positivo, de múltiples contenidos, mudable y, como se ha explicado, no parece posible que sea como tal el objeto propio de una
6
JORGE ADAME GODDARD
ciencia, aunque puede analizarse desde el punto de vista lógico, de su causalidad social, o hacerse filosofía de sus primeros principios. III. EL DERECHO COMO CIENCIA DE LO JUSTO PRACTICABLE La posición que aquí presento es diferente porque no parto de la consideración del derecho como un orden normativo. No pretendo descalificar las posiciones analizadas, que me parece que aportan conclusiones válidas respecto del objeto que se proponen: la comprensión lógico formal del orden social normativo, la comprensión de su causas sociales o la de sus primeros principios. Simplemente propongo, o mejor diría, repropongo, una comprensión del derecho que lo concibe como algo diferente de un orden normativo: como la ciencia de la solución justa, o adecuada, de los conflictos patrimoniales entre las personas o entre los ciudadanos y la comunidad política. No es una concepción nueva, sino tradicional. Por eso Michel Villey la ha denominado la “concepción clásica” del derecho. Era la idea que tenían los juristas romanos,3 manifiesta en la célebre definición de Ulpiano (D 1,1,10,2), de la jurisprudencia como la ciencia de lo justo y lo injusto (Jurisprudentia est iusti atque iniusti scientia); ius era lo justo en el caso concreto; el jurista era quien sabía discernir cuál era la acción justa en casos concretos. Ésa fue también la concepción que tuvieron los juristas cultos de la Edad Media, como el famoso Bártolo de Saxosferrato, pues concebían su oficio principal el dar dictámenes o concilia para resolver problemas concretos. esa fue también la noción de derecho que tuvieron Aristóteles (particularmente en el Libro V de la Ética Nocomaquea) y Santo Tomás de Aquino (especialmente en la Summa Theologiae IIa IIae qq. 57-60), y que últimamente, ante la crisis de las concepciones normativistas modernas, se ha ido rescatando por juristas y filósofos como Álvaro d’Ors,4 Michel Villey,5 Juan Vallet de Goytizolo,6 Carlos Ignacio Mazzini,7 entre otros. 3 Véase Adame Goddard, J., “El derecho romano como jurisprudencia”, Revista de Investigaciones Jurídicas, México, núm. 15, 1991, pp. 9 y ss. 4 Véase especialmente su Nueva introducción al estudio del derecho, Madrid, 1999. 5 Villey, M., Compendio de filosofía del derecho, trad. de Diorki del original francés (París, Dallos, 1975), Pamplona, 1979. 6 Vallet de Goytisolo, J., Metodología jurídica, Madrid, Civitas, 1988. 7 Massini, C. I., La prudencia jurídica, Buenos Aires, 1983.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
7
De acuerdo con esta concepción clásica, el derecho es una ciencia que permite atribuir lo suyo a cada persona en relaciones y situaciones concretas. Como toda ciencia, el derecho parte de la observación de la realidad, específicamente de la realidad de los actos humanos y de las relaciones sociales motivadas por el intercambio de bienes y servicios. Observa esta realidad desde un punto de vista específico y propio (su objeto formal), que es el de discernir qué es lo que cada parte puede reclamar para sí como algo propio en esas relaciones, o en otras palabras, el de determinar qué es lo suyo de cada quien. La ciencia jurídica es, en un primer momento, meramente declarativa; declara o indica lo que a cada quien corresponde: declara, por ejemplo, que al vendedor le corresponde entregar la mercancía y cobrar el precio, que al propietario le corresponde usar, disfrutar y disponer de sus bienes sin interferencias de otras personas, o que al no propietario le corresponde respetar los derecho de propiedad, o que al delincuente le corresponde una determinada pena.8 A partir de esa declaración de lo que es de cada quien, se hace necesario un segundo juicio por el que el jurista elige la acción que ha de practicarse (o medio) para que efectivamente se consiga que cada quien tenga lo suyo. Después de averiguar, por ejemplo, que una persona es propietaria de una cosa que otra posee, hace falta juzgar acerca del medio idóneo para que recupere la posesión, como podría ser un interdicto posesorio o una acción reivindicatoria; o después de averiguar que la parte de un contrato tiene derecho a una indemnización por el incumplimiento de las obligaciones contractuales a cargo de la otra, hace falta elegir por medio de qué acción judicial o recurso extrajudicial podrá hacerse efectiva. Este segundo juicio es también una operación intelectual propia del oficio del jurista. El valor social de este juicio, esto es, la posibilidad de que sea seguido por los interesados, cuando no lo emite un juez o magistrado investido de potestad pública, depende exclusivamente de la autoridad 8 M. Villey llega a afirmar (Método, fuentes y lenguaje jurídico, Buenos Aires, 1978, capítulo V, “Sobre el indicativo en derecho”) que la ciencia jurídica es eminentemente declarativa y su lenguaje se expresa en modo indicativo y no imperativo. Esto es claro si uno se refiere sólo al discernimiento de lo justo, pero no lo es cuando se refiere a la determinación del medio adecuado o conducta a seguir, que puede proponerse en un lenguaje imperativo, como en la sentencia de un juez, o en un lenguaje persuasivo del tipo “es conveniente”, “se recomienda”, etcétera. No es posible excluir este segundo juicio (la determinación de la conducta a seguir) del lenguaje de la ciencia jurídica.
8
JORGE ADAME GODDARD
científica (sabiduría socialmente reconocida) del jurista que lo haya emitido y por eso vale simplemente como consejo o recomendación. Cuando este segundo juicio lo hacen personas investidas con potestad pública, como lo son ahora los jueces ordinarios, tiene valor imperativo y constituye una orden que ha de ser obedecida. En esta situación, la incidencia de la potestad pública no cambia la naturaleza intelectual del juicio que emiten los jueces oficiales. Ellos disciernen lo que es de cada quien en el litigio planteado, lo mismo que un jurista a quien se le hace una consulta, y cuando dictan la sentencia hacen esencialmente lo mismo que un jurista privado cuando aconseja a su cliente: determinan cuál es la conducta que ha de practicarse para resolver el caso. El acto del juez no deja de ser un acto propio del oficio jurídico, la solución de un conflicto específico, ni se convierte en el acto de un gobernante que emite una orden general imperativa (ley o decreto) que supone fundada en la voluntad política. Lo único que sucede es que la sentencia del juez se “reviste”, se pone el traje, de orden imperativa porque actúa en nombre del poder público, pero la sustancia del acto no es más que el juicio por el que se discierne lo justo del caso concreto y se determina el modo de practicarlo. El fin propio de la ciencia jurídica consiste entonces, además del discernimiento de lo justo en relaciones y situaciones concretas, en definir los actos (medios) a realizar para hacerlo efectivo. Tiene así el derecho una finalidad teórica, la declaración de lo justo en concreto, y otra práctica, la determinación de la conducta a practicar. Pudieran reunirse ambas diciendo que el derecho es la ciencia de lo justo posible o practicable. Para hacer su cometido, la ciencia jurídica, a través de una experiencia secular, ha ido formando una amplia variedad de herramientas intelectuales e integrándolas en un cuerpo de doctrina que se ha venido transmitiendo, con más o menos fidelidad y profundidad, a través de las generaciones de juristas hasta nuestros días. Este cuerpo de doctrina o saber jurídico comprende, como lo ha hecho ver Juan Vallet de Goytisolo,9 siguiendo a Francisco Elías de Tejada, cuatro niveles de conocimientos: a) el saber jurídico común o sindéresis, que corresponde al conocimiento de los primeros principios de la razón práctica; b) el saber filosófico, que corresponde a la filosofía del derecho; c) el saber científico, que es el conocimiento de la doctortrina jurídica (nociones, instituciones, reglas, distinciones, soluciones), y d) un saber técnico o instrumental que comprende 9
Vallet de Goytisolo, J., Metodología jurídica, Madrid, Civitas, 1988, pp. 62 y ss.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
9
los conocimientos y habilidades necesarias para hacer efectiva la aplicación del derecho, como la redacción de escritos, la localización de las fuentes jurídicas, las habilidades de negociación, etcétera. Es una concepción que, en comparación con la que considera el orden social normativo como objeto del derecho, ciertamente restringe el ámbito de lo jurídico, pero esta restricción no es en demérito de la ciencia jurídica, sino a favor de su mejor conocimiento y claridad. Se distingue así el derecho, de la ciencia de la legislación, de la política, entendida como ciencia del ejercicio del poder o arte de gobernar, y de las ciencias sociales, especialmente de la sociología, de la ciencia política y de las ciencias de la administración de grupos sociales. ¿Acaso no es un contrasentido que en una época de alta especialización científica se llame derecho, lo mismo a la ciencia de la organización del poder político y de su ejercicio (derecho constitucional), o a la de la organización y administración de las empresas mercantiles (derecho societario o “corporativo”) o a la regulación para preservar los recursos naturales de la contaminación (derecho ecológico) o a la organización y administración de las aduanas (derecho aduanero) o a la determinación de los impuestos y su recaudación (derecho fiscal), o a la organización del sistema financiero (derecho financiero), etcétera, etcétera?. Lo único que tienen en común todas estas supuestas “ramas” del derecho es que su contenido está determinado en una ley, pero materialmente son muy diferentes. La concepción del derecho como ciencia de lo justo concreto, si bien se fue olvidando entre los filósofos del derecho, en la realidad no desapareció, pues es así como entienden su oficio los jueces, abogados, notarios, consultores: su oficio es resolver casos concretos de manera justa. Es diferente el oficio de otros egresados de las Facultades de derecho, muy numerosos en México, que son funcionarios gubernamentales, legisladores, dirigentes sociales, que puede ser que consideren su oficio como una profesión jurídica, por esa ambigüedad en la que ha devenido el concepto de lo jurídico, pero a ellos la solución de casos concretos no les interesa, a no ser que sean colectivos y con repercusiones políticas. IV. EL OBJETO DE LA CIENCIA JURÍDICA Siguiendo la concepción del derecho como la ciencia de lo justo practicable, procuraré ahora precisar su objeto, acudiendo a la distinción tradicional entre objeto material y objeto formal de la ciencia.
10
JORGE ADAME GODDARD
1. El objeto material El objeto material o sector de la realidad que la ciencia jurídica procura conocer son las relaciones humanas; en primer lugar, las relaciones entre personas que se establecen respecto del aprovechamiento de las cosas, es decir, lo que suele conocerse como materia del derecho privado. Incluye también las relaciones entre las personas con la comunidad política, que se dan en dos sentidos diferentes: unas son las relaciones patrimoniales de los particulares con la administración pública que son relaciones iguales o muy semejantes a las del derecho privado, con la sola diferencia que una de las partes de la relación, la entidad administrativa, actúa sujeta a un condicionamiento y regulación especiales; las otras son las relaciones que se dan en un plano de subordinación entre ciudadanos y gobernantes; éstas son las que constituyen la materia del derecho público. Las relaciones que son materia del derecho privado se contraen libremente y se dan en una plano de igualdad formal; las relaciones a que se refiere el derecho público no se contraen libremente sino que están determinadas por el ordenamiento legal y político, por lo que tienen una naturaleza diferente que las primeras y conviene llamarlas con una palabra diferente: “situaciones”.10 Tanto las relaciones libremente contraídas como las impuestas por el ordenamiento legal o situaciones, no son más que actos humanos realizados en referencia a otra persona o a la comunidad. Por eso cabe decir que el objeto material del derecho son los actos humanos referidos a otras personas o a la comunidad, sean relaciones libremente contraídas, sean situaciones determinadas por el ordenamiento legal. Si se acepta que éste es el objeto material de la ciencia jurídica, se echa de ver la necesidad de que la filosofía del derecho cuente con una explicación de lo que son las relaciones, como actos humanos recíprocamente referidos, y del acto humano mismo. 2. El objeto formal El objeto formal o punto de vista específico de la ciencia jurídica es precisamente la determinación de lo que es propio (lo “suyo”) de cada 10 Véase D’Ors, Nueva introducción al estudio del derecho, Madrid, 1999, quien ha propuesto esta distinción entre relaciones y situaciones.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
11
una de las partes en esas relaciones o situaciones, es decir, lo que es justo en ellas. Esta perspectiva supone necesariamente que en dichas relaciones y situaciones cada una de las partes se ha de comportar de una determinada manera que la otra puede exigir, es decir, se entiende que hay acciones que una parte tiene como debidas y la otra como suyas. La determinación de la justicia consiste entonces en precisar las causas o títulos que hacen que una conducta sea debida para una parte o suya para la otra. Básicamente hay, a mi entender y siguiendo a Santo Tomás de Aquino, tres causas posibles que hacen que una conducta sea debida: la propia naturaleza de la relación, la convención privada y la convención pública (principalmente la ley o la costumbre) o, en otras palabras, la naturaleza, el convenio y la ley. La declaración de lo que es justo en cada relación o situación jurídica no agota el objeto formal de la ciencia jurídica, pues ésta pretende ser además una ciencia práctica, que determina los medios adecuados para hacer que se practique lo determinado como justo. El jurista termina concluyendo la práctica de una determinada acción con la que se quiere obtener el resultado justo. Hay así dos operaciones en el juicio propiamente jurídico. Una es un juicio de carácter teórico-práctico en el que se determina en forma general lo que es debido o justo en una relación o situación, y la otra es un juicio meramente práctico en el que se define cuál es la conducta en concreto a seguir. Considerando ambas facetas puede proponerse que el objeto formal del derecho es lo justo practicable. V. LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS Una vez precisados los objetos material y formal de la ciencia jurídica, se pueden precisar los tipos de proposiciones de la ciencia jurídica y juzgarlas desde el punto de vista de su objetividad. Me parece que se pueden considerar tres tipos diferentes de proposiciones, afirmaciones o conclusiones de la ciencia jurídica: a) los conceptos o categorías de análisis propias de la ciencia jurídica; b) la declaración o juicio de lo justo en relaciones o situaciones concretas, y c) la declaración o juicio de la conducta a seguir de conformidad con el juicio acerco de la justo concreto.
12
JORGE ADAME GODDARD
1. Los conceptos de la ciencia jurídica Me refiero al conjunto de conceptos, reglas, definiciones, distinciones que ha ido formando la ciencia jurídica a través del tiempo, tales como derecho real, obligación, propiedad, posesión, sucesión legítima, testamento, compraventa, etcétera. Todos estos conceptos son abstracciones formuladas por la inteligencia a partir de la realidad concreta de las relaciones entre las personas y con la comunidad. Su objetividad o veracidad depende de que reflejen fielmente la realidad de las relaciones a que se refieren, o sea que su criterio de objetividad es el mismo que el de las ciencias de la naturaleza o de las ciencias sociales. Por ejemplo, el concepto de compraventa será objetivo en cuanto refleje fielmente la relación que se da entre personas para el intercambio de una cosa por un precio; el de propiedad, en tanto refleje el poder atribuido a una persona sobre una cosa con exclusión de todas los demás, etcétera. 2. La declaración de lo justo en relaciones o situaciones concretas A diferencia de los conceptos jurídicos, que pretenden tener una validez universal, se trata aquí de juicios en casos particulares que no pretenden una validez tal. Sin embargo, se trata todavía de un juicio teórico que simplemente afirma cuál es la conducta debida o suya en una relación o situación determinada. Es un juicio teórico que pretende ser objetivo por lo mismo que los juicios teóricos individuales de cualquier otra ciencia, por su conformidad con la realidad. Para hacer este juicio, el jurista analiza el caso en lo individual, con todas sus circunstancias relevantes, así como los títulos o causas posiblemente aplicables al caso y que señalarían cuál es la conducta debida. Por ejemplo, la declaración de que una de las partes en un conflicto de tierras es el propietario, es o no objetiva según que exista o no un título de propiedad válido que adjudica la cosa a esa parte; o el juicio de que una cantidad de dinero es debida por una parte a otra, será objetivo en tanto que exista una causa que atribuya esa suma de dinero a tal parte. La objetividad de estos juicios, no obstante que quien los formule la pretenda decididamente, puede resultar difícil de alcanzar, por la incidencia de una multitud de circunstancias y por la posibilidad de considerar dos o más causas posibles
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
13
de atribución en una misma relación; por ejemplo, puede una relación en la que una persona paga un precio a otra para que fabrique cierta cosa verse desde el punto de vista de un contrato de arrendamiento de servicios o de la venta de una cosa futura, y los resultados en cuanto a los derechos y obligaciones de las partes son diferentes según cada postura. Por eso, estos juicios no pueden considerarse como una conclusión científicamente demostrable, y tienen sólo el valor de una opinión, pero de una opinión que pretende ser objetiva y fundada y no el mero resultado de una emoción o libre intuición.11 3. El juicio práctico sobre la conducta a seguir Al juicio teórico que declara lo “debido” o lo “suyo” en la relación o situación concreta, sigue un segundo juicio, un juicio práctico, por el que se determina una acción concreta que ha de practicarse. El juez, por ejemplo, que declara que el actor en un juicio reivindicatorio es el propietario, no ha terminado su labor; tiene ahora que prescribir la conducta que ha de seguir el demandado: restituir la cosas en tales y cuales condiciones y circunstancias. De este juicio práctico no se puede predicar la objetividad porque se refiere a una conducta que todavía no es, de modo que no puede ser medido por la realidad. Pero hay otra medida para valorarlo. La conducta que determina el juicio práctico se concibe como un medio para alcanzar la finalidad de resolver o prevenir un conflicto en una determinado relación o situación, haciendo que cada quien dé lo debido y reciba lo suyo. Es, en otras palabras, la acción adecuada para restablecer o mantener la justicia del caso concreto. En consecuencia, la validez de este juicio práctico depende de la idoneidad de la conducta prescrita para realizar la 11 Debe tenerse en cuanta que las mismas relaciones y situaciones que son objeto de la ciencia jurídica, pueden serlo también de otras ciencias y dar lugar a su discernimiento con puntos de vista diferentes. Especialmente las relaciones de la comunidad política con los ciudadanos. De las relaciones de la comunidad política, que actúa por medio de los gobernantes investidos de potestad pública, con los ciudadanos, algunas dan lugar a conflictos que se resuelven con criterios de justicia, y por eso pueden considerarse jurídicas; otras dan lugar a conflictos que se resuelven por medio de un poder disciplinar interno (la auto corrección de la administración pública) o por medio de decisiones o actos políticos determinados por criterios de preservación del orden, equilibrio de poderes o factores geopolíticos, y que me parece deben excluirse del ámbito jurídico.
14
JORGE ADAME GODDARD
justicia posible, de que sea efectivamente el medio adecuado. Por eso, de estos juicios se predica, en vez de la objetividad, su rectitud, es decir, que realmente enderecen la conducta hacia el fin perseguido. Hay una vinculación lógica necesaria entre el juicio teórico y el práctico. El primero determina qué es lo justo objetivo y, con base en ello, el juicio práctico, señala cómo ha de restablecerse o mantenerse la justicia en esa relación o situación concreta. El juicio práctico depende así del juicio teórico acerca de lo justo y no es, por consiguiente, un juicio arbitrario. Cabe notar que este juicio práctico puede tener un diferente valor social según sea la persona que lo pronuncie. Los juicios que hacen los juristas en función de abogados, consultores o notarios, sólo tiene el valor de una recomendación o consejo: el jurista aconseja realizar determinada conducta, de manera semejante a como un médico recomienda un tratamiento; su consejo será más o menos seguido en la medida de la confianza y autoridad científica que se le reconozcan. Si el juicio lo pronuncia un juez investido de potestad pública tiene entonces el valor de una orden imperativa que debe ser obedecida; pero debe advertirse que este carácter no le viene por su elaboración intelectual, sino que es algo añadido, externo, que no modifica ni el contenido del juicio ni el modo de realizarlo. Una cuestión conexa con la objetividad y rectitud de los juicios jurídicos es la de cómo se forma la experiencia personal del deber, es decir, de qué manera lo resuelto en un juicio práctico se percibe por la persona que ha de ejecutar la acción como un “deber”, o sea como una necesidad que la compele a practicarla. Evidentemente puede una persona sentirse forzada a cumplir un juicio práctico cuando proviene de un juez investido con potestad; pero sentirse forzada, constreñida o amenazada no es lo mismo que tener la experiencia de que una conducta es debida, pues el deber no excluye la libertad sino que la presupone. El sentido del deber depende de la inclinación a apetencia de un fin. Alguien experimenta una conducta como debida cuando la concibe como un medio adecuado para alcanzar un fin, y entonces el mismo deber resulta amable, tan amable como el fin que se busca. Por tanto, para que los juicios jurídicos se experimenten personalmente como un deber, se requiere que la conducta que propongan realizar se vea como un medio adecuado para realizar la justicia del caso concreto; y esto depende de que el juicio práctico sea recto y de que el juicio teórico sea objetivo.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
15
Como quienes juzgan son hombres concretos, la validez social de sus juicios depende finalmente de la sabiduría y rectitud que se les reconozca y no del cargo que ostenten, es decir, depende de su autoridad y no de su potestad. VI. CONCLUSIONES Para resumir lo expuesto y en cuanto al punto tratado en esta ponencia, propongo las siguientes conclusiones por vía de hipótesis, partiendo de la concepción del derecho como ciencia de lo justo practicable, cuyo objeto material son las relaciones humanas (actos humanos recíprocamente referidos) y cuyo objeto formal es la determinación de lo justo practicable: 1. Se puede hablar de la objetividad de los conceptos jurídicos en la medida que reflejen la realidad de las relaciones o situaciones que significan, de manera semejante a la objetividad de los conceptos de otras ciencias teóricas. 2. Respecto del juicio que, atendiendo a las diversas causas de atribución, declara lo qué es lo debido o lo suyo en una relación o situación concreta, se puede también hablar de objetividad, aunque ésta no puede demostrarse científicamente, por lo que estos juicios tienen el valor de opinión que pretende ser objetiva. 3. Respecto del juicio práctico que determina la conducta a seguir para mantener o restablecer la justicia en una relación o situación concreta, no se puede hablar de objetividad pero sí de rectitud, en el sentido de si la conducta que determina es adecuada para alcanzar la justicia posible del caso.
!
LA PONDERACIÓN COMO PROCEDIMIENTO PARA INTERPRETAR LOS DERECHOS FUNDAMENTALES Carlos BERNAL PULIDO* SUMARIO: I. Introducción. II. El concepto de ponderación. III. La estructura de la ponderación. IV. Los límites de la ponderación. V. Conclusión.VI. Bibliografía.
I. INTRODUCCIÓN Una de las ideas más importantes de la teoría del derecho contemporánea, tanto en el mundo anglosajón como en el del derecho continental es que los ordenamientos jurídicos no están compuestos exclusivamente por reglas, es decir, por el tipo tradicional de normas jurídicas, sino también por principios. La convicción tradicional, que en la jurisprudence inglesa aparece en la obra de Austin1 y que se perpetúan con el concepto de derecho de Herbert Hart,2 que en el derecho continental aparece sobre todo en los trabajos de Kelsen, sostenía que el derecho estaba constituido exclusivamente por reglas, es decir, por normas bien determinadas, provistas de una estructura condicional hipotética. Junto a esta tesis, se difundió la idea de que la única manera de aplicar el derecho era la subsunción. Estas ideas básicas eran correlativas, por cuanto la forma de aplicación de las reglas es precisamente la subsunción. Expliquémoslo mejor. De un lado, se consideraba que todo el derecho estaba conformado únicamente por reglas, es decir, por normas, cuyo ejemplo más claro son las del Código Penal, integradas por un supuesto de hecho y una sanción * Universidad Externado de Colombia. 1 Cfr. Austin, J., El objeto de la jurisprudencia, Madrid, Centro de Estudios Constitucionales, 2003. 2 Cfr. Hart, H. L., El concepto de derecho, Buenos Aires, Abeledo-Perrot, 1963. 17
18
CARLOS BERNAL PULIDO
claramente diferenciadas. Como Kelsen aclaró en su Teoría pura del derecho,3 la estructura de estas normas es condicional hipotética: Si A entonces debe ser B En esta estructura, A es el supuesto de hecho de la norma, y B la consecuencia jurídica. Y lo que la norma prevé es que, en caso de que en la realidad ocurriese el supuesto de hecho A de la norma, entonces el juez debería imputar la sanción B al agente que hubiese cometido la acción prevista en el supuesto de hecho. Ahora bien, debe decirse que la manera de aplicar estas normas es la subsunción. La subsunción es una especie del silogismo que, como tal, está integrado por dos premisas y una conclusión. La premisa mayor es la norma con su estructura condicional hipotética: Si A entonces B Al paso que la premisa menor es un enunciado subsuntivo de la forma: x es A Este enunciado afirma que x es un caso de A Por último, la conclusión se deriva de las premisas mayor y menor y establece que debe aplicarse la sanción y al caso x, por ser un caso de A. Pues bien, a las reglas y a la subsunción, en la moderna teoría del derecho, y sobre todo a partir de las investigaciones de Dworkin en el mundo anglosajón y de Alexy en el germánico, se suman los principios y la ponderación. De esta manera, se ha impuesto la convicción de que junto a las reglas de estructura condicional hipotética, existen los principios. Además, el reconocimiento de la existencia de los principios implica a su vez el reconocimiento de una nueva forma de aplicación del derecho: la ponderación. Los principios son normas, pero no normas dotadas de una estructura condicional hipotética con un supuesto de hecho y una sanción bien determinados. Más bien, los principios son mandatos de optimización que ordenan que algo sea realizado en la mayor medida posible, de acuerdo con las posibilidades jurídicas y fácticas que juegan en sentido contrario.4 3 Kelsen, H., Teoría pura del derecho, Buenos Aires, Editorial Universitaria de Buenos Aires, 1994, pp. 60 y ss. 4 Alexy, R., Tres escritos sobre los derechos fundamentales y la teoría de los principios, Bogotá, Universidad Externado de Colombia, 2002, p. 95.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
19
Los derechos fundamentales son el ejemplo más claro de principios que tenemos en el ordenamiento jurídico. A pesar de que desde sus primeras sentencias la Corte Constitucional haya reconocido que los derechos fundamentales son normas, nadie puede decir que estas normas tienen la estructura condicional hipotética de las reglas. Por su redacción abstracta, estas normas tienen más bien la estructura de los principios que, en cuanto mandatos de optimización, ordenan que su objeto sea realizado en la mayor medida posible, de acuerdo con las posibilidades jurídicas y fácticas que juegan en sentido contrario. Ahora bien, la ponderación es la manera de aplicar los principios y de resolver las colisiones que puedan presentarse entre ellos y los principios o razones que jueguen en sentido contrario. La palabra ponderación deriva de la locución latina pondus que significa peso. Esta referencia etimológica es significativa, porque cuando el juez o el fiscal pondera, su función consiste en pesar o sopesar los principios que concurren al caso concreto. Y es que, como dejó claro Ronald Dworkin,5 los principios están dotados de una propiedad que las reglas no conocen: el peso. Los principios tienen un peso en cada caso concreto y ponderar consiste en determinar cuál es el peso específico de los principios que entran en colisión. Por ejemplo, cuando la Corte Constitucional aplica los principios constitucionales de protección de la intimidad y del derecho a la información, los pondera para establecer cuál pesa más en el caso concreto. El principio que tenga un peso mayor será aquel que triunfe en la ponderación y aquel que determine la solución para el caso concreto. En un caso en el que se trate de la divulgación de una información de interés público, muy probablemente se concluirá que el derecho a la información pesa más que el derecho a la intimidad, y, como consecuencia, deberá considerarse legítima la divulgación de la información. La ponderación es entonces la actividad consistente en sopesar dos principios que entran en colisión en un caso concreto para determinar cuál de ellos tiene un peso mayor en las circunstancias específicas, y, por tanto, cuál de ellos determina la solución para el caso. En razón de esta función, la ponderación se ha convertido en un criterio metodológico indispensable para el ejercicio de la función jurisdiccional, especialmente la que se desarrolla en las Cortes Constitucionales, 5 Dworkin, R., “¿Es el derecho un sistema de normas?”, La filosofía del derecho, México, FCE, 1980, pp. 84 y ss.
20
CARLOS BERNAL PULIDO
que se encargan de la aplicación de normas que, como los derechos fundamentales, tienen la estructura de principios. A pesar de ello, la ponderación se sitúa en el centro de muchas discusiones teóricas, que revelan que algunos aspectos tales como su estructura y sus límites, aun distan de estar del todo claros. El objetivo de este artículo es analizar estos problemas. Con todo, de antemano es preciso aclarar con mayor detalle el concepto de ponderación.6 II. EL CONCEPTO DE PONDERACIÓN Como ya se mencionó, la ponderación es la forma en que se aplican los principios jurídicos, es decir, las normas que tienen la estructura de mandatos de optimización. Estas normas no determinan exactamente lo que debe hacerse, sino que ordenan “que algo sea realizado en la mayor medida posible, dentro de las posibilidades jurídicas y reales existentes”.7 Las posibilidades jurídicas están determinadas por los principios y reglas opuestas, y las posibilidades reales se derivan de enunciados fácticos. Para establecer esa mayor medida posible en que debe realizarse un principio, es necesario confrontarlo con los principios opuestos o con los principios que respaldan a las reglas opuestas. Esto se lleva a cabo en una colisión entre principios. Existe una colisión entre principios, cuando en un caso concreto son relevantes dos o más disposiciones jurídicas que fundamentan prima facie dos normas incompatibles entre sí, y que pueden ser propuestas como soluciones para el caso. Se presenta una colisión entre principios, por ejemplo, cuando los padres de una niña que profesan el culto evangélico, y en razón del respeto a los mandamientos de esta doctrina religiosa, se niegan a llevarla al hospital, a pesar de que corre peligro de muerte.8 Si referimos este caso al derecho constitucional colombiano, observaremos que las disposiciones de los artículos 19 y 16 de la Constitución, que establecen, respectivamente, la libertad de
6 Para un análisis detenido del concepto de ponderación: Cfr. Bernal Pulido, C., El principio de proporcionalidad y los derechos fundamentales, Madrid, Centro de Estudios Políticos y Constitucionales, 2003, pp. 757 y ss. 7 Cfr. Alexy, Robert, Teoría de los derechos fundamentales, trad. de Ernesto Garzón Valdés, Madrid, Centro de Estudios Políticos y Constitucionales, 1997, pp. 86 y 87. 8 El ejemplo es de la sentencia T-411 de 1994 de la Corte Constitucional Colombiana.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
21
cultos y el derecho al libre desarrollo de la personalidad,9 fundamentan un principio que en la mayor medida posible permite decidir a los padres si de acuerdo con sus creencias deben llevar o no a sus hijos al hospital. Este principio entra en colisión con los principios del derecho a la vida y a la salud de la niña, establecidos por los artículos 11, 44 y 49 de la Constitución, que ordenan proteger la vida y la salud de los niños en la mayor medida posible.10 La incompatibilidad normativa se presenta en este caso, porque de los artículos 19 y 16 se deriva que está permitido prima facie a los padres de la niña decidir si la llevan o no al hospital mientras que de los artículos 11, 44 y 49 se sigue que llevar a la niña al hospital es una conducta ordenada prima facie por los derechos fundamentales. La ponderación es la forma de resolver esta incompatibilidad entre normas prima facie. Para tal fin, la ponderación no garantiza una articulación sistemática material de todos los principios jurídicos que, habida cuenta de su jerarquía, resuelva de antemano todas las posibles colisiones entre ellos. Por el contrario, al igual que el silogismo, la ponderación es sólo una estructura que está compuesta por tres elementos mediante los cuales se puede fundamentar una relación de precedencia condicionada entre los principios en colisión,11 para así establecer cuál de ellos debe determinar la solución del caso concreto. III. LA ESTRUCTURA DE LA PONDERACIÓN Quizá ha sido Robert Alexy quien con mayor claridad y precisión haya expuesto la estructura de la ponderación. De acuerdo con Alexy, para establecer la relación de precedencia condicionada entre los principios en colisión, es necesario tener en cuenta tres elementos que forman la estructura de la ponderación: la ley de ponderación, la fórmula del peso y las cargas de argumentación. 9 Artículo 19 de la Constitución colombiana: “Se garantiza la libertad de cultos. Toda persona tiene derecho a profesar libremente su religión y a difundirla en forma individual o colectiva. Todas las confesiones religiosas e iglesias son igualmente libres ante la ley”. 10 Artículo 11 de la Constitución colombiana: “El derecho a la vida es inviolable. No habrá pena de muerte”. Artículo 44 de la Constitución colombiana: “Son derechos fundamentales de los niños: la vida, la integridad física, la salud, la seguridad social, la alimentación equilibrada… Los derechos de los niños prevalecen sobre los derechos de los demás”. 11 Esto es lo que Alexy llama la ley de la colisión. Cfr. Teoría de los derechos fundamentales, cit., nota 7, pp. 90 y ss.
22
CARLOS BERNAL PULIDO
1. La ley de la ponderación Según la ley de la ponderación, “Cuanto mayor es el grado de la no satisfacción o de afectación de uno de los principios, tanto mayor debe ser la importancia de la satisfacción del otro”.12 Si se sigue esta ley, la ponderación se puede dividir en tres pasos que el propio Alexy identifica claramente: “En el primer paso es preciso definir el grado de la no satisfacción o de afectación de uno de los principios. Luego, en un segundo paso, se define la importancia de la satisfacción del principio que juega en sentido contrario. Finalmente, en un tercer paso, debe definirse si la importancia de la satisfacción del principio contrario justifica la afectación o la no satisfacción del otro”.13 Es pertinente observar que el primero y el segundo paso de la ponderación son análogos. En ambos casos, la operación consiste en establecer un grado de afectación o no satisfacción —del primer principio— y de importancia en la satisfacción —del segundo principio—. En adelante nos referiremos a ambos fenómenos como la determinación del grado de afectación de los principios en el caso concreto.14 Alexy sostiene que el grado de afectación de los principios puede determinarse mediante el uso de una escala triádica o de tres intensidades. En esta escala, el grado de afectación de un principio en un caso concreto puede ser “leve”, “medio” o “intenso”. Así, por ejemplo, la afectación de la vida y la salud de la niña, que se originaría al permitir a los padres evangélicos no llevarla al hospital, podría catalogarse como intensa, dado el peligro de muerte. De forma correlativa, la satisfacción de la libertad de cultos de los padres, que se derivaría de dicha permisión, podría graduarse sólo como media o leve. Conviene reconocer que el grado de afectación de los principios en el caso concreto no es la única variable relevante para determinar, en el tercer paso, si la satisfacción del segundo principio justifica la afectación 12 13
Ibidem, pp. 161 y ss. Cfr. Alexy, Robert, “Epílogo a la teoría de los derechos fundamentales”, trad. de Carlos Bernal Pulido, REDC, núm. 66, 2002, p. 32. 14 En esta terminología puede decirse que mientras el primer principio se afecta de manera negativa, el segundo se afecta de forma positiva. Siguiendo la notación de Alexy, simbolizaremos el grado de afectación o no satisfacción del primer principio en el caso concreto como IPiC y la importancia en la satisfacción del segundo principio, también en el caso concreto, como WPjC. Cfr. ibidem, pp. 40 y ss.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
23
del primero. La segunda variable es el llamado “peso abstracto” de los principios relevantes.15 La variable del peso abstracto se funda en el reconocimiento de que, a pesar de que a veces los principios que entran en colisión tengan la misma jerarquía en razón de la fuen te del derecho en que aparecen —por ejemplo, dos derechos fundamentales que están en la Constitución tienen la misma jerarquía normativa—, en ocasiones uno de ellos puede tener una mayor importancia en abstracto, de acuerdo con la concepción de los valores predominante en la sociedad. Así, por ejemplo, eventualmente puede reconocerse que el principio de protección a la vida tiene un peso abstracto mayor que la libertad, por cuanto para poder ejercer la libertad es necesario tener vida, o como sostiene Joseph Raz, porque la vida es un presupuesto para que podamos acceder a todas las cosas que tienen valor y ejercer todos nuestros derechos.16 De la misma manera, la jurisprudencia constitucional de diversos países en ocasiones ha reconocido un peso abstracto mayor a la libertad de información frente al derecho al honor o a la intimidad, por su conexión con el principio democrático, o a la intimidad y a la integridad física y psicológica sobre otros principios, por su conexión con la dignidad humana.17 A lo anterior se agrega una tercera variable, que denotaremos como la variable S. Ella se refiere a la seguridad de las apreciaciones empíricas, que versan sobre la afectación que la medida examinada en el caso concreto —por ejemplo, permitir que los padres evangélicos decidan si llevan o no a la hija al hospital— proyecta sobre los principios relevantes.18 La existencia de esta variable surge del reconocimiento de que las apreciaciones empíricas relativas a la afectación de los principios en colisión pueden tener un distinto grado de certeza, y, dependiendo de ello, mayor o menor deberá ser el peso que se reconozca al respectivo principio. Así, 15 Siguiendo la notación de Alexy, simbolizaremos el peso abstracto del primer principio como GPiA y del segundo principio como GPjA. 16 Cfr. Raz, Joseph, Value, Respect and Attachtment, Cambridge University Press, 2001, capítulo IV. Tiene traducción al castellano de Marta Bergas Ferriol, Bogotá, Universidad Externado de Colombia, en prensa. 17 Cfr. Con un análisis de la jurisprudencia constitucional española en estos aspectos: Bernal Pulido, Carlos, El principio de proporcionalidad y los derechos fundamentales, cit., nota 6, pp. 770 y 772. 18 Cfr. Alexy, Robert, “Epílogo”, op. cit., nota 7, pp. 56, especialmente la nota de pie 101. Siguiendo la notación de Alexy, denotaremos aquí la seguridad de las apreciaciones empíricas relativas a la afectación del primer principio como SPiC y del segundo como SPjC.
24
CARLOS BERNAL PULIDO
por ejemplo, la afectación del derecho a la salud y a la vida de la hija de los evangélicos deberá considerarse como intensa, si existe certeza de que morirá de no ser ingresada en el hospital. Esta afectación, en cambio, será de menor intensidad, si los médicos no pueden identificar el problema que la aqueja, o no pueden establecer cuáles serían las consecuencias en caso de que no recibiera un tratamiento médico. A partir de lo anterior, la pregunta es: ¿cómo se relacionan los pesos concretos y abstractos de los principios que concurren a la ponderación, más la seguridad de las premisas empíricas, para determinar, en el tercer paso, si la importancia de la satisfacción del principio contrario justifica la afectación o la no satisfacción del otro? De acuerdo con Alexy, esto es posible mediante la llamada “fórmula del peso”. 2. La fórmula del peso Esta fórmula tiene la siguiente estructura:19 IPiC · GPiA · SPiC GPi,jC= ————————————WPjC · GPjA · SPjC Esta fórmula expresa que el peso del principio Pi en relación con el principio Pj, en las circunstancias del caso concreto, resulta del cociente entre el producto de la afectación del principio Pi en concreto, su peso abstracto y la seguridad de las premisas empíricas relativas a su afectación, por una parte, y el producto de la afectación del principio Pj en concreto, su peso abstracto y la seguridad de las premisas empíricas relativas a su afectación, por otra. Alexy mantiene que a las variables referidas a la afectación de los principios y al peso abstracto se les puede atribuir un valor numérico, de acuerdo con los tres grados de la escala triádica, de la siguiente manera: leve 2º, o sea 1; medio 2¹, o sea 2; e intenso 2², es decir 4.20 En cambio, a las variables relativas a la seguridad de las premisas fácticas se les puede atribuir un valor de seguro 2º, o sea, 1; plausible 2¹, o sea ½; y no evidentemente falso 2², es decir, ¼. De este 19 Cfr. En castellano: Idem. Con mayor profundidad: Alexy, Robert, “Die Gewichtsformel”, en Jickeli, Joachim; Kreutz, Meter y Reuter, Dieter (eds.), Gedächtnisschrift für Jürgen Sonnenschein, Berlín, De Gruyter, 2003, pp. 771 y ss. 20 Cfr. Alexy, Robert, “Epílogo”, op. cit., nota 7, pp. 42 y ss.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
25
modo, por ejemplo, el peso del derecho a la vida y la salud de la hija de los evangélicos podría establecerse de la siguiente manera, bajo el presupuesto de que la afectación de estos derechos se catalogue como intensa (IPiC = 4), al igual que su peso abstracto (¡se trata de la vida!) (GPiA = 4) y la certeza de las premisas (existe un riesgo inminente de muerte) (SPiC = 1). Paralelamente, la satisfacción de la libertad de cultos y del derecho al libre desarrollo de la personalidad de los padres puede catalogarse como media (WPjC = 2), su peso abstracto como medio (la religión no es de vida o muerte, podría argumentarse) (GPjA = 2) y la seguridad de las premisas sobre su afectación como intensa (pues es seguro que ordenarles llevar a la hija al hospital supone una restricción de la libertad de cultos) (SPjC =1).21 En el ejemplo, entonces, la aplicación de la fórmula del peso al derecho a la vida y a la salud de la niña arrojaría los siguientes resultados: 4 ·4· 1 16 GPi,jC= —————— = ———— = 4 2·2· 1 4 De forma correlativa, el peso de la libertad de cultos y del derecho al libre desarrollo de la personalidad de los padres sería el siguiente: 2 ·2·1 4 GPj,iC= —————— = ———— = 0.25 4·4·1 16 Así llegaría entonces a establecerse que la satisfacción de la libertad de cultos y del derecho al libre desarrollo de la personalidad de los padres —satisfechos sólo en 0.25— no justifica la intervención en los derechos a la vida y la salud de la niña —afectados en 4—. Estos últimos derechos tendrían que preceder en la ponderación y, como resultado del caso, debería establecerse que está ordenado por los derechos fundamentales que los padres ingresen a la niña al hospital.
21 Cfr. ibidem, pp. 56. Asimismo, Alexy, Robert, “Die Gewichtsformel”, op. cit., nota 19, pp. 789 y ss.
26
CARLOS BERNAL PULIDO
3. Las cargas de argumentación El tercer elemento de la estructura de la ponderación son las cargas de la argumentación.22 Las cargas de la argumentación operan cuando existe un empate entre los valores que resultan de la aplicación de la fórmula del peso, es decir, cuando los pesos de los principios son idénticos (GPi,jC = GPj,iC). En este aspecto, sin embargo, Robert Alexy parece defender dos posiciones, una en el capítulo final de la Teoría de los derechos fundamentales, y otra en el Epílogo a dicha teoría, escrito quince años después, que podrían resultar incompatibles entre sí en algunos casos. En la Teoría de los derechos fundamentales, Alexy defiende la existencia de una carga argumentativa a favor de la libertad jurídica y la igualdad jurídica, que coincidiría con la máxima in dubio pro libertate.23 De acuerdo con esta carga de argumentación, ningún principio opuesto a la libertad jurídica o a la igualdad jurídica podría prevalecer sobre ellas, a menos que se adujesen a su favor razones más fuertes.24 Esto podría interpretarse en el sentido de que en caso de empate, es decir, cuando los principios opuestos a la libertad jurídica o a la igualdad jurídica no tuviesen un peso mayor sino igual, la precedencia debería concederse a estas últimas. Dicho de otra manera, el empate jugaría a favor de la libertad y de la igualdad jurídica. Como consecuencia, si una medida afectara a la libertad o a la igualdad jurídica y los principios que la respaldan no tuviesen un mayor peso que éstas, entonces la medida resultaría ser desproporcionada y, si se tratase de una ley, ésta debería ser declarada inconstitucional. No obstante, en el Epílogo a la Teoría de los derechos fundamentales, Alexy se inclina a favor de una carga de argumentación diferente. En los casos de empate, sostiene, la decisión que se enjuicia aparece como no desproporcionada y, por tanto, debe ser declarada constitucional. Esto quiere decir que los empates jugarían a favor del acto que se enjuicia, acto que en el control de constitucionalidad de las leyes es precisamente la ley. En otros términos, de acuerdo con el Alexy del Epílogo, los empates no jugarían a favor de la libertad y la igualdad jurídica, sino a favor del legislador y del principio democrático en que se funda la competen22
Cfr. Con mayor profundidad sobre este elemento: Bernal Pulido, Carlos, El principio de proporcionalidad…, cit., nota 6, pp. 789 y ss. 23 Alexy, Robert, Teoría de los derechos fundamentales, cit., nota 7, pp. 549 y ss. 24 Ibidem, p. 550.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
27
cia del Parlamento. De este modo, cuando existiera un empate, la ley debería declararse constitucional, por haberse producido dentro del margen de acción que la Constitución depara al legislador.25 Desde luego, la contradicción entre estas dos posturas acerca de la carga de argumentación, únicamente se presentaría cuando existiera una colisión entre la libertad jurídica o la igualdad jurídica, de un lado, y otro principio diferente a ellas, del otro. En este caso, podrían aventurarse dos interpretaciones sobre la posición de Alexy, dado que este autor no se pronuncia explícitamente acerca de esta posible contradicción. Por una parte, que Alexy cambió de postura y que, quince años después, ha revaluado su inclinación liberal y ahora privilegia al principio democrático. O, por el contrario, que Alexy persiste en conceder la carga de argumentación a favor de la libertad jurídica y la igualdad jurídica, y entonces, que en principio los empates juegan a favor de lo determinado por el legislador, a menos que se trate de intervenciones en la libertad jurídica o la igualdad jurídica. En este caso excepcional, los empates favorecerían a estos principios. IV. LOS LÍMITES DE LA PONDERACIÓN Debe señalarse que esta contradicción entre cargas de la argumentación no es el único límite de racionalidad que tiene la ponderación, por lo menos cuando se entiende con la estructura que la presenta Robert Alexy. Aquí nos referiremos a los límites que se encuentran en la ley de ponderación y en las cargas de la argumentación. 1. Los límites racionales de la ley de ponderación Sobre este primer aspecto conviene señalar que no existe un criterio objetivo para determinar los factores determinantes del peso que tienen los principios en la ley de ponderación, y que conforman la fórmula del peso, es decir: el grado de afectación de los principios en el caso concreto, su peso abstracto y la seguridad de las premisas empíricas relativas a la afectación.26 25 26
Cfr. Alexy, Robert, “Epílogo”, op. cit., nota 7, pp. 44 y ss. Cfr. Sobre algunas reglas argumentativas para determinar la magnitud de estos factores: Bernal Pulido, Carlos, El principio de proporcionalidad…, cit., nota 6, pp. 760 y ss.
28
CARLOS BERNAL PULIDO
En cuanto a lo primero, es bien cierto que, como argumenta Alexy en el Epílogo a la Teoría de los derechos fundamentales, en ocasiones “es posible hacer juicios racionales”27 sobre el grado en que están afectados los principios que colisionan en el caso concreto. En este sentido, existen casos fáciles en lo concerniente a la graduación de las afectaciones de los principios. Así, por ejemplo, que una revista satírica llame “tullido” a un parapléjico, constituye claramente una ofensa grave contra su derecho al honor que, a la vez, contribuye sólo de manera leve —si es que lo hace de algún modo— a la satisfacción de la libertad de información. Sin embargo, junto a estos casos fáciles existen siempre casos difíciles, en los que las premisas que fundamentan la graduación, y no sólo las fácticas sino también las analíticas y las normativas, son extremadamente inciertas. Así tiende a ocurrir, por ejemplo, en todos los casos en los que está en juego la libertad religiosa. De ordinario, la gravedad de una intervención en la libertad religiosa no es susceptible de determinarse en abstracto con base en criterios objetivos o, si se quiere, intersubjetivos, sino que, por el contrario, es algo que en principio sólo podría establecer el creyente involucrado y que dependería de su subjetividad. La gravedad de obligar a un evangélico a llevar a su hija al hospital o a un testigo de Jehová a autorizar la práctica de una transfusión de sangre para su hijo o para sí mismo es algo que sólo el titular de la libertad religiosa puede precisar. Para un creyente puede ser más importante la muerte bajo el cumplimiento de sus reglas religiosas que la continuación de una vida impura, en pecado, a la que sobrevenga una condena eterna. En general, esta modalidad de casos difíciles se presenta cuando lo que está en juego en la ponderación es un margen de libertad o de autonomía que la Constitución ha deparado a un individuo o a un colectivo. En este sentido, se presenta el mismo fenómeno cuando los objetos que concurren a la ponderación son un derecho fundamental —la integridad física, verbigracia— y la autonomía de una comunidad. De este fenómeno es ejemplo el caso en que de acuerdo con sus leyes tradicionales, cuya aplicación está avalada por la Constitución, las autoridades de una comunidad indígena colombiana imponen a un infractor un pena consistente en 60 latigazos.28 Es probable que desde la perspectiva de la sociedad mayoritaria los latigazos se consideren casi unánimemente como una afectación gra27 28
Cfr. Alexy, Robert, “Epílogo”, op. cit., nota 7, pp. 33 y ss. El caso es de la Sentencia T-523 de 1997.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
29
ve del derecho a la integridad física. No obstante, desde esta perspectiva será muy difícil catalogar atinadamente el grado de afectación de la autonomía de la comunidad indígena, que llevaría consigo la inaplicación de la ley tradicional que ordena los latigazos. Así como cuando está en juego la libertad religiosa no está claro cuál es el punto de vista a partir del cual debe hacerse la graduación. Y esta duda sólo puede ser resuelta por el operador jurídico —el juez sobre todo—, después de adoptar una postura material e ideológica. Un juez más respetuoso de la libertad religiosa o de la autonomía de las comunidades indígenas hará valer el punto de vista interno del afectado. Por el contrario, un juez más partidario de la universalidad de los derechos humanos y de la imposición de los valores de la sociedad mayoritaria hará prevalecer la visión de esta última. Así las cosas, este aspecto de la ponderación depararía al juez un margen de acción, en el que éste puede hacer valer su ideología política29 para encaminarse, en términos de Duncan Kennedy, a “la-sentencia-a-la-que-quiere-llegar”.30 Además de lo anterior, también la ponderación depara un margen de acción al intérprete, cuando existen dudas sobre si un caso es fácil o difícil en cuanto a la graduación de la afectación de los principios. Puede suceder que incluso un caso que parece fácil resulte ser en realidad un caso difícil. Esto puede mostrarse con un ejemplo al que alude el propio Robert Alexy y que se refiere a la sentencia sobre el tabaco del Tribunal Constitucional Alemán.31 Alexy considera que esta sentencia es representativa del conjunto de los “ejemplos fáciles en los que resulta plausible formular juicios racionales sobre las intensidades de las intervenciones en los derechos fundamentales y sobre los grados de realización de los principios, de tal modo que mediante la ponderación pueda establecerse un resultado de forma racional”. La sentencia versa sobre el deber de los productores de tabaco de colocar etiquetas que adviertan del peligro para la salud que implica fumar. Alexy sostiene que ésta es una intervención “relativamente leve en la libertad de profesión y oficio”,32 sobre todo si se le compara con otras medidas alternativas: la prohibición 29 Cfr. Kennedy, Duncan, A Critique of Adjudication (fin de siècle), Cambridge-Londres, Harvard University Press, 1997, p. 1. 30 Cfr. Kennedy, Duncan, Libertad y restricción en la decisión judicial, trad. de Diego López Medina y Juan Manuel Pombo, Bogotá, Ediciones Uniandes, 1999, pp. 91 y ss. 31 Cfr. BVerfGE, 95, 173, p. 184. 32 Cfr. Alexy, Robert, “Epílogo”, op. cit., nota 7, p. 33.
30
CARLOS BERNAL PULIDO
de expender tabaco o la restricción en su venta. Correlativamente, Alexy piensa que esta medida satisface el principio contrapuesto, la protección de la salud, de manera intensa o alta. Como argumento señala: “El Tribunal Constitucional no debía de exagerar, cuando, en su Sentencia sobre las advertencias acerca del tabaco, considera cierto, «de acuerdo con el estado de los conocimientos de la medicina actual», que fumar origina cáncer, así como enfermedades cardiovasculares”.33 De este modo, la afectación leve de la libertad de profesión y oficio se enfrentaría a una satisfacción intensa del derecho a la salud. Ahora bien, cabe reconocer que esta argumentación de Alexy frente al caso no es la única viable. Por el contrario, existen graduaciones alternativas que podrían llevar a soluciones diferentes. Aquí sobre todo podría tenerse en cuenta que desde el punto de vista fáctico es bien discutible que la obligación de etiquetar las cajetillas de cigarrillos con advertencias sobre los riesgos que fumar ocasiona para la salud pueda implicar una satisfacción intensa del derecho a la salud. Bien puede pensarse que la eficacia disuasoria de estas etiquetas es mínima o inclusive nula, porque la información que divulga es altamente conocida; porque la adicción al tabaco no es el resultado de la carencia de información sobre su carácter nocivo, sino más bien un caso claro de debilidad de la voluntad; e incluso —un argumento irónico— porque en ocasiones para la mente humana lo prohibido y lo nocivo es lo más apetecido. Si se observan las cosas desde esta perspectiva, entonces, en lo concerniente al grado en que se satisface el derecho a la salud, puede concluirse que la graduación que Alexy —y el Tribunal Constitucional Alemán— llevan a cabo, está errada, o que, en este punto, se trata de un caso difícil. Ahora bien, esta dificultad para determinar el punto de vista correcto para la graduación de la afectación de los principios y los argumentos correctos en los casos difíciles también se presenta en lo referente a la fijación del peso abstracto y de la seguridad de las premisas relevantes en la ponderación. El peso abstracto es una variable muy singular, que remite siempre a consideraciones ideológicas y hace necesaria una toma de postura por parte del intérprete sobre aspectos materiales, relativos a la idea de Constitución, de Estado y de justicia. Naturalmente, la variable del peso abstracto pierde toda su importancia cuando los principios enfrentados en la 33
Idem.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
31
ponderación son de la misma índole. Los pesos abstractos se anulan, cuando, por ejemplo, se establece una colisión entre un mismo derecho fundamental ejercido por dos titulares diversos —dos grupos políticos contrarios que quieren manifestarse en la misma calle de una ciudad a la misma hora y en el mismo día y es posible que la manifestación simultánea derive en peleas entre los grupos—. Sin embargo, muy por el contrario, los pesos abstractos adquieren gran relieve cuando en la colisión confluyen derechos o principios distintos, y presentan características que lleven a atribuirles un peso abstracto mayor o menor. De este modo, es posible otorgar un peso abstracto mayor al derecho a la vida o a los derechos fundamentales que tienen una conexión con el principio democrático —la libertad de información, verbigracia— o con la dignidad humana34 —el derecho a la intimidad o a la integridad física—, o simplemente, cuando la propia Constitución lo establece de alguna manera, como cuando el artículo 44 del texto colombiano prescribe que “Los derechos de los niños prevalecen sobre los derechos de los demás”. Correlativamente, también puede otorgarse un peso abstracto menor a los principios que colisionan con los derechos fundamentales y que no aparecen en la Constitución, sino que han sido establecidos por el legislador dentro de su margen para la determinación de fines y están respaldados en última instancia por el principio democrático. A pesar de todo lo anterior, es necesario reconocer que la fijación del peso abstracto también tiene ciertos límites de racionalidad que asimismo deparan un espacio a la subjetividad del intérprete. Bien difícil resulta establecer una completa graduación preestablecida de pesos abstractos que se formule en términos de la escala triádica. Es posible que la idea de que el derecho a la vida tenga el valor más elevado (4) no concite ningún desacuerdo. Pero, a partir de allí, ¿cuál es el valor que debe otorgarse a los derechos que están vinculados con el principio democrático o con la dignidad humana? Y, además, ¿ese valor debe ser igual para todos los derechos, o puede cambiar de acuerdo con lo estrecho o laxo del nexo que esos derechos tengan con dichos principios? ¿Tendría entonces la libertad de información el mismo peso abstracto que la vida (4), o debe estimarse que tiene sólo un peso abstracto medio (2)? Estas dificultades surgen porque la graduación del peso abstracto en el marco de la escala 34 Cfr. Sobre el principio democrático y la dignidad humana como elementos relevantes para la fijación de peso abstracto de los principios, las sentencias colombianas: Sentencias T-556 de 1998 y T-796 de 1998.
32
CARLOS BERNAL PULIDO
triádica pasa por el mismo problema que presenta la construcción del llamado por Böckenförde “orden fundamental”, en el que la Constitución aparece como una detallada escala jerárquica de todos los derechos y principios existentes. Aunque la graduación del peso abstracto es menos compleja, porque no exige la construcción de una detallada jerarquía ordinal sino sólo la clasificación de los principios en tres rangos de peso, en esta operación no deja de ser fundamental la influencia de la ideología del intérprete. De este modo, un juez más individualista otorgará a la libertad general de acción y a las libertades específicas el peso abstracto más alto y a los principios que tengan que ver con la colectividad un peso menor. Lo contrario hará un juez que actúe bajo el prurito de lograr la construcción, la integración y la defensa de la comunidad. Por último, los límites de racionalidad también aparecen al intentar establecer la certeza de las premisas empíricas relativas a la afectación de los principios. Como hemos expuesto en otro lugar,35 desde el punto de vista empírico, la afectación de un principio depende de la mayor o menor eficacia, rapidez, probabilidad, alcance y duración de la intervención que en él implique la medida enjuiciada en la ponderación. De esta manera, la afectación negativa y la satisfacción de los principios será mayor cuanta mayor eficacia, rapidez, probabilidad, alcance y duración ostente la medida examinada. En este punto las posibilidades de racionalidad están limitadas, en primer lugar, en razón de la dificultad para establecer la certeza de las premisas empíricas desde todas esas perspectivas, esto a su vez, porque los conocimientos empíricos del intérprete también son limitados. Al mismo tiempo, y en segundo lugar, las limitaciones surgen de la complejidad que resulta al combinar las variables. ¿Cómo debe catalogarse, por ejemplo, la certeza de una premisa empírica cuya eficacia puede establecerse de forma plausible (½), su rapidez de manera no evidentemente falsa (¼), su probabilidad segura (1), su alcance plausible (½) y su duración segura (1)?.Y, correlativamente, ¿será mayor esa certeza si a las mismas variables se les atribuyen los mismos valores de seguridad pero en un orden distinto: eficacia (¼), rapidez (1), probabilidad (½), alcance (1) y duración (½)? En fin ¿cuál de estas variables es más determinante de la certeza, en definitiva?
35 Bernal Pulido, Carlos, El principio de proporcionalidad y los derechos fundamentales, cit., nota 6, pp. 763 y ss.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
33
A partir de ello sólo puede concluirse que sobre este aspecto el intérprete también dispone de un margen irreducible de subjetividad, en el que puede hacer valer sus apreciaciones empíricas sobre las circunstancias en que se desarrolla la ponderación. 2. Los límites de racionalidad en las cargas de la argumentación Como antes observamos, la contradicción entre las cargas de argumentación in dubio pro libertate e in dubio pro legislatore también constituye un límite a la racionalidad de la ponderación que depara al intérprete un margen de subjetividad. La aplicación de una u otra carga depende de la postura ideológica del juez. Un juez que quiera dar prevalencia al principio democrático operará siempre con el in dubio pro legislatore y, de este modo, concederá al Parlamento la posibilidad de equilibrar los principios en conflicto mediante un empate entre sus pesos específicos. Por el contrario, un juez liberal se servirá en todo caso del in dubio pro libertate y declarará desproporcionadas a aquellas medidas que no consigan favorecer al principio que constituye su finalidad, en un grado mayor a aquel en que se afecta la igualdad jurídica o la libertad jurídica. Esta igualdad y esta libertad, aducirá, son los pilares del Estado de derecho y su sacrificio sólo se justifica cuando se obtienen beneficios mayores. Finalmente, es posible que el juez defienda soluciones matizadas que combinen la aplicación de una u otra carga argumentativa o que sea el resultado de una ponderación entre ellas. Así entonces, podría aplicarse el in dubio pro legislatore para las medidas ordinarias de afectación de los derechos fundamentales y reservar el in dubio pro libertate para las medidas que en el caso concreto afecten intensamente a la igualdad jurídica o a la libertad jurídica. O también, se podría considerar la aplicación del in dubio pro libertate como la regla general y destinar el in dubio pro legislatore a áreas que las que el Parlamento tiene un margen de acción más amplio en razón de la materia, co mo la política económica o la política criminal. No parece desatinado sostener que una Constitución abierta permitiría cualquiera de estas posibilidades, porque contiene, al mismo tiempo, los principios, a veces contrarios entre sí, de la democracia y la libertad, de la igualdad jurídica y la igualdad fáctica, de la construcción de la comunidad y el respeto a la órbita individual.
34
CARLOS BERNAL PULIDO
V. CONCLUSIÓN Todo lo anterior muestra que la ponderación no es un procedimiento algorítmico que por sí mismo garantice la obtención de una única respuesta correcta en todos los casos. Por el contrario, tiene diversos límites de racionalidad que deparan al intérprete un irreducible margen de acción, en el que puede hacer valer su ideología y sus propias valoraciones. Sin embargo, el hecho de que la racionalidad que ofrece la ponderación tenga límites, no le enajena su valor metodológico, así como la circunstancia de que el silogismo no garantice la verdad de las premisas mayor y menor, tampoco le resta por completo su utilidad. La ponderación representa un procedimiento claro, incluso respecto de sus propios límites. Si bien no puede reducir la subjetividad del intérprete, en ella sí puede fijarse cuál es el espacio en donde yace esta subjetividad, cuál es el margen para las valoraciones del juez y cómo dichas valoraciones constituyen también un elemento para fundamentar las decisiones. La ponderación se rige por ciertas reglas que admiten una aplicación racional, pero que de ninguna manera pueden reducir la influencia de la subjetividad del juez en la decisión y su fundamentación. La graduación de la afectación de los principios, la determinación de su peso abstracto y de la certeza de las premisas empíricas y la elección de la carga de la argumentación apropiada para el caso, conforman el campo en el que se mueve dicha subjetividad. VI. BIBLIOGRAFÍA Referencias doctrinales ALEXY, R., Teoría de los derechos fundamentales, trad. de Ernesto Garzón Valdés, Madrid, Centro de Estudios Políticos y Constitucionales, 1997. ———, “Epílogo a la teoría de los derechos fundamentales”, trad. de C. Bernal Pulido, REDC, núm. 66, 2002. ———, Tres escritos sobre los derechos fundamentales y la teoría de los principios, Bogotá, Universidad Externado de Colombia, 2002. ———, “Die Gewichtsformel”, en JICKELI, Joachim; KREUTZ, Meter y REUTER, Dieter (eds.), Gedächtnisschrift für Jürgen Sonnenschein, Berlín, De Gruyter, 2003.
LA PONDERACIÓN PARA INTERPRETAR LOS DERECHOS
35
AUSTIN, J., El objeto de la jurisprudencia, Madrid, Centro de Estudios Constitucionales, 2003. BERNAL PULIDO, C., El principio de proporcionalidad y los derechos fundamentales, Madrid, Centro de Estudios Políticos y Constitucionales, 2003. DWORKIN, R., “¿Es el derecho un sistema de normas?”, La filosofía del derecho, México, FCE, 1980. HART, H. L., El concepto de derecho, Buenos Aires, Abeledo-Perrot, 1963. KELSEN, H., Teoría pura del derecho, Buenos Aires, Editorial Universitaria de Buenos Aires, 1994. KENNEDY, D., A Critique of Adjudication (fin de siècle), Cambridge-Londres, Harvard University Press, 1997. ———, Libertad y restricción en la decisión judicial, trad. de Diego López Medina y Juan Manuel Pombo, Bogotá, Ediciones Uniandes, 1999. RAZ, Joseph, Valor, respeto y apego, Bogotá, Universidad Externado de Colombia, 2004. Referencias jurisprudenciales Corte Constitucional, Sentencia T-411 de 1994. M. P. Antonio Barrera Carbonell. Corte, Constitucional, Sentencia T-523 de 1997. M. P. Carlos Gaviria Díaz. Corte Constitucional, Sentencia T-556 de 1998. M. P. José Gregorio Hernández Galindo.
!
LA ÉTICA DEL DISCURSO JURÍDICO Arturo BERUMEN CAMPOS* El lenguaje del espíritu ético es la ley**
SUMARIO: I. Introducción. II. Coordinación comunicativa de la acción social. III. Ética del discurso. IV. La ética del discurso legislativo.
I. INTRODUCCIÓN Si Apel puede hablar de la “ética del discurso”, queriendo decir que la ética se encuentra en el lenguaje, no vemos porque no se pueda hablar de la “ética del discurso jurídico”, para querer decir que la ética jurídica se encuentra en el lenguaje del derecho. Antes de que ideólogos y críticos tomen esta frase como si fuera todo el discurso, añadiremos que no todo el lenguaje del derecho es ético, sino que intentaremos determinar en qué condiciones el discurso jurídico puede considerarse como un discurso ético. Para ello, nos valdremos de las teorías de Habermas y Apel para aplicarlas al discurso del derecho, lo cual no significa que sean éstas sus opiniones al respecto. Nos referiremos, en primer lugar, a la ética del discurso en general y después a la ética del discurso ju rídico, del cual só lo to caremos la ética del discurso legislativo sin poder ocuparnos de la ética del discurso judicial.
* Facultad de Estudios Superiores Acatlán, UNAM, México. ** Hegel, Fenomenología. 37
38
ARTURO BERUMEN CAMPOS
II. COORDINACIÓN COMUNICATIVA DE LA ACCIÓN SOCIAL El siguiente esquema está tomado de Habermas.1 Nos parece que es válido para cualquier proceso de comunicación social, pero nos resulta particularmente útil en el análisis de los procedimientos jurídicos, es decir, en la ética del discurso jurídico. El esquema obtenido de la teoría de Habermas, es el siguiente: COORDINACIÓN COMUNICATIVA DE LA ACCIÓN SOCIAL PLAN DE ACCIÓN SOCIAL Tipo de acción social
Interpretación común de la situación
Alternativas de acción
Ejecución del plan
Orientada al éxito: - Instrumental - Estratégica - Dramatúrgica
No se tematizan todos los ingredientes relevantes de la situación comunicativa que se requiere resolver con el plan
Se restringen las La eficacia del plan alternativas de ac- es baja ción, porque los ingredientes no tematizados aparecen como obstáculos inamovibles para la acción
Orientada al entendimiento mutuo: - Acción comunicativa
Se intenta tematizar todos los ingredientes relevantes de la situación, por medio de la participación, libre de coacción, de todos los afectados por la situación
Se amplían las El nivel de efialternativas de ac- cacia del plan es ción, porque los alto obstáculos se trans forman en recursos adicionales de acción
El esquema anterior parte de la idea de que el uso más pragmático del lenguaje es la coordinacion de la acción social. Por acción social, Habermas entiende no sólo cualquier interacción entre dos o más sujetos capaces de lenguaje y de acción, sino la secuencia de interacciones recíprocas. El lenguaje tiene que garantizar la secuencia de interacciones. Para ello se precisa, normalmente, de un plan de acción social. Incluso, en la más mínima interacción, como por ejemplo, las actividades que una fa1 Habermas, “Sobre el concepto de acción comunicativa”, Teoría de la acción comunicativa. Complementos y estudios previos, pp. 479-507.
LA ÉTICA DEL DISCURSO JURÍDICO
39
milia realiza un fin de semana, se requiere de un plan, aunque sea mínimo también. Con mayor razón se necesita de una plan de acción social, cuando se trata de interacciones entre grandes conglomerados humanos. Para Habermas, el plan de acción social se compone, cuando menos, de las siguientes fases: la interpretación común de la situación, las alternativas de acción y la ejecución del plan. Sólo tomando en cuenta estas tres fases del plan de acción, es posible garantizar la secuencia de interacciones recíprocas. La interpretación de la situación problemática debe ser común entre los participantes en la interacción. Sin el acuerdo en la interpretación de las necesidades de los participantes, no es posible la coordinación de la acción social, no es posible la misma acción social. Si cada quién interpreta de diferente manera los elementos de la situación, si no se ponen de acuerdo en la interpretación de la situación que afecta a ambos, la acción social, la coordinación de sus acciones no sería posible. La interpretación común de la situación es, quizá, la fase más importante de la planeación de la acción social, pues de ella se derivan las alternativas de acción. Según como sea dicha interpretación, las alternativas serán unas o serán otras. Así mismo, la eficacia del plan de acción social se encuentra vinculada a las alternativas elegidas para resolver la situación social, las cuales dependen de la interpretación común de la situación. Si la interpretación no es la adecuada, la eficacia del plan dejará mucho que desear, porque las alternativas serán poco pertinentes a la situación. Las fases del plan de acción social pueden cruzarse matricialmente con los tipos de acción social que, para Habermas, pueden ser dos: la acción social orientada al éxito y la acción social orientada al entendimiento mutuo. La acción social orientada al éxito es aquella en la cual los participantes buscan su éxito, a cualquier costo o a cualquier precio, mediante un lenguaje patológico. Por su lado, la acción social orientada al entendimiento mutuo también busca el éxito, pero no a cualquier precio, sino mediante un lenguaje racional. La acción social orientada al éxito se puede subdividir en tres subtipos de acción social: la acción instrumental, la acción estratégica y la acción dramatúrgica. Por su parte, la acción social orientada al entendimiento es la acción comunicativa, de donde deriva el nombre de la teoría de Habermas: la teoría de la acción comunicativa. Definamos cada una de ellas. En la acción instrumental, los participantes se instrumentalizan unos a otros, es decir, se utilizan como instrumentos para conseguir sus fines o se consideran como obstáculos para conseguirlos. Los actos de habla me-
40
ARTURO BERUMEN CAMPOS
diante los que se coordina este tipo de acción carecen de la pretensión de la rectitud, es decir, el lenguaje mediante el cual se realiza esta acción padece de la patología de la violencia, abierta o subrepticia. Aunque se usa en todos los ámbitos de la realidad social, es particularmente usada en las relaciones económicas de mercado. Por ejemplo, en la contratación de la fuerza de trabajo o en la incondicionalidad de los contratos de adhesión. En la acción estratégica, los participantes simulan llegar a un acuerdo sin el propósito de cumplirlo, con la finalidad de que el otro sí lo cumpla. Dicha acción está coordinada por actos de habla que carecen de veracidad, por lo tanto en una acción que carece de moralidad y de racionalidad. Se le puede encontrar también en cualquier interacción social, pero es la acción que predomina en la política y en la política jurídica, por tanto, el engaño estratégico, como hemos visto, puede ser total o parcial. Por ejemplo, la demagogia electoral es un engaño completo y la publicidad comercial y las ideologías políticas y religiosas pueden entenderse como engaños parciales, lo cual las hace mucho más eficaces que la primera, para lograr el éxito, a cualquier precio. La acción dramatúrgica es aquella en la cual los participantes hacen uso de los sentimientos del otro y le ocultan sus propios pensamientos para lograr salirse con la suya. Es decir, se hace un drama para lograr que el otro acepte nuestro punto de vista o que actúe como nosotros queremos. Se usa sobre todo en la vida privada, aunque no está ausente de otros ámbitos de la vida social. Los actos de habla mediante los cuales se realiza padecen también de la patología de la falta de veracidad e incluso de rectitud. Por ejemplo, cuando, en las relaciones de pareja, los hombres hacen los ofendidos y las mujeres lloran para lograr el éxito. 2 Por su parte, la acción comunicativa es la acción orientada al entendimiento mutuo, en la cual los participantes están dispuestos a convencer y a dejarse convencer mediante los mejores argumentos. Es decir, es la acción social coordinada mediante actos de habla cuyo elemento ilocucionario es una actitud hipotética. Es la acción social paradigmática, es decir, la que sirve de modelo para criticar las acciones sociales y determinar la medida en que se acercan o se alejan de este modelo. No es que Habermas crea, como muchos malinterpretan, que sea esta acción la 2 La acción dramatúrgica puede ser tanto una acción orientada al éxito, como una acción orientada al entendimiento. Véase Habermas, “Observaciones sobre el concepto de acción comunicativa”, Teoría de la acción comunicativa. Complementos y estudios previos, pp. 487, 491 y 492.
LA ÉTICA DEL DISCURSO JURÍDICO
41
que describe las acciones sociales reales, sino que es el concepto, en sentido hegeliano, al que deben aspirar las acciones sociales reales. Podemos decir que la acción comunicativa es la medida ética de las acciones sociales, entre ellas, las acciones jurídicas. Por esta razón, podemos aplicar este modelo al análisis de los procesos jurídicos de creación y de aplicación de las normas jurídicas, para verificar en qué medida se acercan o se alejan de la acción comunicativa. Comparemos ahora la acción social orientada al éxito y la acción social orientada al entendimiento, con respecto de las tres fases del plan de acción social. Comencemos con la interpretación común de la situación. Si la acción instrumental, o la acción estratégica o la acción dramatúrgica buscan el éxito a cualquier precio, lo que va a suceder, al momento de interpretar la situación que se quiere resolver, es que no se van a tematizar, de una manera adecuada, ni de una manera completa ni de una manera suficiente, los ingredientes o elementos o factores relevantes de la misma situación problemática. Tematizar significa convertir en tema explícito del discurso los elementos o ingredientes relevantes de la situación, sin dejarlos sobreentendidos o implícitos, de modo que se reduzcan los equívocos o los malos entendidos, a lo mínimo. La manera como puede impedirse la adecuada tematización de un ingrediente relevante depende de la acción utilizada para ello: si se actúa instrumentalmente, la adecuada tematización se impide mediante la violencia abierta o subrepticia. Si se actúa estratégicamente, una amplia tematización se impide mediante el engaño parcial o total. Y si se actúa dramatúrgicamente, la manera de impedir una suficiente tematización, puede ser la violencia subrepticia o el engaño parcial. Por su parte, tratándose de la acción orientada al entendimiento, es decir, de la acción comunicativa, se intentan tematizar todos los ingredientes relevantes de la situación, mediante la participación libre de coacción, de engaño, de error y de oscuridad (libre de patologías de la comunicación) de todos los afectados por la situación o por sus representantes. Si no participan todos los afectados por la situación, es probable que los puntos de vista de los no participantes no sean tomados en cuenta en la interpretación de la misma situación. Claro que la falta de tematización también puede llevarse a cabo mediante cualquiera de las patologías de la comunicación, como hemos visto.
42
ARTURO BERUMEN CAMPOS
Si en la acción orientada al éxito no se consideran todos los aspectos de un problema, por causa de cualquiera de las patologías de las acciones instrumentales, estratégicas o dramatúrgicas, la consecuencia de ello es que se restringen o se limitan las alternativas de solución al mismo problema, porque los ingredientes no tematizados aparecen, en el discurso, como obstáculos intocables e inamovibles de la situación. Esta falta de tematización o de discusión y su subsecuente “intocabilidad”, nos parece, que es el origen de las ideologías. Es decir, es la abstracción, en el sentido de Hegel, y la falacia abstractiva, en el sentido de Apel lo que ocasiona la falsa conciencia de la realidad o la inversión de la realidad en la conciencia, en el sentido de Marx y de Correas.3 Por ello, en la acción comunicativa, la tematización completa de los ingredientes más relevantes de la situación permite encontrar alternativas adicionales de solución al problema social que se pretende resolver. En ella los obstáculos ideológicos se pueden transformar en recursos comunicativos que contribuyan a la solución de la situación social. Los ingredientes no tematizados que, por ello, eran obstáculos ideológicos inamovibles, pueden ser retematizados y, por ello, redeterminados en los aspectos morales de la solución.4 En la tercera fase del plan de acción social, la acción social orientada al éxito, paradójicamente, la eficacia del mismo es muy baja, pues las alternativas de solución han quedado restringidas y limitadas por los ingredientes no tematizados, convertidos en ideologías, que impiden remover los obstáculos reales de la situación. Eso no impide que algunos de los participantes en la interacción tengan éxito en la consecución de sus intereses personales o sistémicos, pero si no existe eficacia del plan, la situación problemática volverá a resurgir, constantemente, hasta que los intereses de todos los participantes hayan sido considerados y tomados en cuenta adecuadamente. Esto es lo que sucede en la acción social orientada al entendimiento, en la acción comunicativa, pues si los ingredientes no tematizados, inicialmente, se retematizan y se transforman en recursos adicionales de solución, la eficacia del plan aumenta en esa misma medida. En este caso la eficacia del plan es alta, pues los intereses de todos los afectados han sido tomados en cuenta, de modo que la situación se ha resuelto, en la 3 4
Correas, Crítica de la ideología jurídica, México, UNAM, 1993, p. 115. Véase Berumen, Arturo, La ética jurídica como redeterminación dialéctica del derecho natural, México, Cárdenas, 2000, p. 50.
LA ÉTICA DEL DISCURSO JURÍDICO
43
medida en que han quedado satisfechos los intereses de todos los afectados por la misma. Del análisis del esquema comunicativo podemos extraer algunas conclusiones: la primera de ellas es que la eficacia de la acción social se encuentra estrechamente vinculada con la ética del discurso. De acuerdo con Habermas, el plan de acción social eficaz es el que la coordina con la ética del discurso y el plan de la acción social, ineficaz, es el que la coordina con la patología del discurso. La segunda conclusión es que las ideologías sociales son obstáculos para la eficacia del plan de acción social y son producto de la falta de tematización de alguno o algunos de los ingredientes de la situación social que el plan de la acción social quiere resolver. Y la tercera es que la acción comunicativa es el resultado del plan de la acción social eficaz porque se encuentra coordinada por actos de habla cuyo elemento ilocucionario es una asunción hipotética, o emitidos en actitud de tercera persona, lo cual permite una adecuada tematización o retematización de los ingredientes de la situación social, incrementando las alternativas de acción; mientras que la acción orientada al éxito está coordinada por actos de habla cuyo elemento ilocucionario es una asunción asertórica, o emitidos en actitud de primera o de segunda persona, lo cual obstaculiza la adecuada tematización, restringiendo las alternativas de acción y, por tanto, reduce la eficacia del plan de la acción social. III. ÉTICA DEL DISCURSO El esquema de la coordinación comunicativa de la acción social propuesto por Habermas es un excelente método de crítica y de análisis comunicativo de las acciones sociales reales e incluso de redeterminación comunicativa de la acción social. Sin embargo, puede resultar difícil que sirva como guía en la práctica de acciones sociales reales por su elevada exigencia de racionalidad comunicativa, como seguido se le ha reprochado a Habermas. En el mundo social real la realización de la acción comunicativa es sumamente rara, el mismo Habermas lo reconoce.5 Lo importante es que la acción social real se acerque, paulatinamente, a su modelo ético y racional. Mientras tanto, las exigencias comunicativas de la acción pueden flexibilizarse un tanto, en determinadas condiciones y con determinados requisitos. Tales condiciones y requisitos son lo que se 5
Habermas, “Entrevista con la New Left Review”, Ensayos políticos, p. 196.
44
ARTURO BERUMEN CAMPOS
llama la ética del discurso que Habermas ha retomado de varios autores, sobre todo de Apel.6 Podemos resumir la teoría de la ética del discurso de este último autor en cinco puntos: los niveles de desarrollo de la conciencia ética; la distinción entre la ética de los principios y la ética de la responsabilidad; la búsqueda del consenso posible; las contradicciones performativas y, por último, las falacias abstractivas. Analizaremos cada uno de ellos. La ética del discurso parte de la validez de la acción comunicativa como exigencia de eticidad y de racionalidad. Ésta supone, en abstracto, que todos los sujetos capaces de lenguaje y acción están obligados igualmente a cumplirla. Sólo que los sujetos se encuentran en distintos niveles de desarrollo de su conciencia ética. Siguiendo a autores como Piaget y Kohlberg, Apel y Habermas distinguen hasta seis niveles de desarrollo de la conciencia ética, pero que podemos reducir a sólo tres: el nivel pre-convencional, el nivel convencional y el nivel post-convencional. En el primero, es decir, en el nivel pre-convencional, se encuentran aquellos sujetos que sienten la obligación moral de reconocer como sujetos sólo a las personas de su familia, es decir, están guiados por intereses. Es el nivel alcanzado por los niños y algunos adultos delincuentes. En el segundo, es decir, en el nivel convencional, se encuentran aquellos que sienten la obligación moral de reconocer como sujetos, a miembros de grupos más amplios, como los miembros de su país, de su raza, de su religión, de su partido, de su sexo, de su clase, entre otros, pero no a los extranjeros, a los “negros”, a los “católicos”, a los “liberales”, a las “mujeres”, a los “pobres”, etcétera. Están guiados por normas. Es el nivel de la moral convencional de un grupo social más o menos amplio. Por último, en el tercer nivel, es decir, en el nivel post-convencional, se encuentran aquellas personas que sienten la obligación moral de reconocer como sujetos a todos los seres humanos, independientemente de su país, de su raza, de su religión, de su ideología política, de su sexo, de su clase social, etcétera. Están guiados por principios y por la actitud en tercera persona. Son aquellos que creen en los derechos humanos, son los que tienen una conciencia ética universal. Es la conciencia de los grandes hombres de la historia de la humanidad. 6 Apel, Karl-Otto, “La ética del discurso como ética de la responsabilidad: una transformación postmetafísica de la ética de Kant”, Fundamentación de la ética y filosofía de la liberación de Apel, Dussel y Fornet, pp. 11-44.
LA ÉTICA DEL DISCURSO JURÍDICO
45
Ahora bien, vamos a suponer que, por alguna razón, sujetos que tienen un diferente nivel de desarrollo de su conciencia ética tienen que coordinar su acción social. Supongamos, que tienen que coordinarse, por un lado, Eichman y, por otro lado, Gandhi. El primero, con un nivel de desarrollo pre-convencional o convencional de su conciencia ética, está dispuesto a utilizar todas las acciones sociales, tanto instrumentales como estratégicas y dramatúrgicas, con tal de salirse con la suya. El segundo, con un nivel de desarrollo post-convencional de su conciencia ética, ¿sólo va actuar comunicativamente? ¿No le es lícito actuar estratégicamente o instrumentalmente cuando el primero sí lo va a hacer e incluso ya lo esta haciendo? ¿Hasta qué punto está obligado a tolerar las acciones patológicas de Eichman? ¿Indefinidamente? O ¿puede pasar a una acción orien tada al éxito inmediatamente? Estas preguntas son más comunes de lo que parece. Se las puede plantear un abogado ante un contrincante que no juega limpio. Un maestro ante sus alumnos desordenados. Un gobernante ante sus gobernados rebeldes. Un fiscal o un defensor ante el acusado o su defendido, respectivamente. Para empezar a responder a ellas, Apel y Habermas, con base en Weber, han distinguido entre la ética de principios y la ética de la responsabilidad. La primera es la ética que resulta de la acción comunicativa, es decir, de la ética que busca el entendimiento mutuo sin ninguna patología comunicativa. La segunda es la ética que resulta de la situación de un sujeto que tiene bajo su responsabilidad a otra persona o a un grupo social, como lo puede ser el abogado, el maestro, el gobernante, el fiscal, el mismo Gandhi. Alguien en una situación de responsabilidad no puede estar sujeto, incondicionalmente, a una ética de principios. Es decir, puede dejar de cumplir la ética de principios para salvaguardar a las personas que están bajo su responsabilidad. El caso de la legítima defensa lo ilustra bastante bien. Pero, dejar de cumplir la ética de principios para salvaguardar a los que están bajo la responsabilidad de alguien no quiere decir que pueda pasar a la acción estratégica o a la acción instrumental o a la acción dramatúrgica en cualquier momento. Es necesario, dice Apel, agotar las posibilidades del consenso, buscar el consenso posible. Es decir, antes de pasar a la ética de la responsabilidad, es imperativo tratar de intentar llegar a un acuerdo con el otro, o sea, tratar de lograr una interpretación común de la situación, tematizando todos los elementos relevantes de la misma, hasta el momento mismo en que el peligro de los que están bajo la
46
ARTURO BERUMEN CAMPOS
responsabilidad se vuelva actual e inminente. Este mismo criterio, el del peligro eminente de quienes están bajo responsabilidad, será el límite de las acciones instrumentales o estratégicas que se tomen para ello, pero no más allá, pues se estaría incumpliendo la misma ética de la responsabilidad. Hay que tomar en cuenta que es posible y es común que la búsqueda del consenso posible sea sólo una simulación, con el objeto querer justificar un incumplimiento de la acción comunicativa con el pretexto del peligro de quienes se encuentran bajo la responsabilidad de alguien, en especial, los gobiernos y las autoridades judiciales y administrativas. Para tratar de detectar la búsqueda simulada del consenso posible hay que detectar lo que Apel llama las contradicciones performativas, es decir, la contradicción entre el elemento ilocucionario y el elemento proposicional de los actos de habla que coordinan la acción social, entre la intención ilocucionaria y la expresión proposicional, entre lo que se dice y la intención con la que se dice. Dicha contradicción puede evidenciarse, confrontando ambos elementos de los actos de habla, cuando están expresos ambos, pero cuando el elemento ilocucionario se encuentra implícito, se puede comparar la coherencia de los enunciados proposicionales entre sí y con algunos indicios de la intención ilocucionaria no explícita. Pero para ello es necesario contar con la mayor información posible, evitando caer o identificando las falacias abstractivas en términos de Apel, es decir, en la creencia de que una parte de la información es toda la información. Es en la búsqueda de las contradicciones performativas donde se hace más necesario señalar la necesidad de la completa tematización de todos los elementos relevantes de la situación. Si la otra parte se niega, obstinadamente, a tematizar, es posible que esté incurriendo en falacias abstractivas para ocultar sus contradicciones perfomativas. Sólo entonces es válido no tematizar adecuadamente, pero sólo en la medida y en el tiempo necesario para evidenciar las contradicciones performativas del interlocutor, todo ello para retematizar adecuadamente los ingredientes relevantes de la situación comunicativa. La ética del discurso no clarifica, con precisión, cuándo nos encontramos en la ética de la responsabilidad o en la simulación de la ética del discurso, pues tanto las falacias abstractivas como su combate “responsable” pueden llevarnos a no tematizar adecuadamente y, por tanto a limitar las alternativas de acción, las que convienen a sólo una de las partes, con lo cual la acción social sólo reproducirá o agravará la situación pro-
LA ÉTICA DEL DISCURSO JURÍDICO
47
blemática indefinidamente. A pesar de ello, sí nos proporciona algunos principios generales que pudieran orientar nuestra acción e ilustrar nuestro análisis y nuestra crítica. Podemos señalar tres criterios o principios, cuando menos. El principio más general es que hay que actuar comunicativamente. El segundo es que, cuando no se pueda actuar comunicativamente, por una situación de responsabilidad, hay que asumir, hipotéticamente, la voluntad de consenso en el interlocutor, cuando investiguemos las contradicciones performativas y sus falacias abstractivas de sus actos de habla. Y el tercer principio podría ser la asunción hipotética de que no buscamos el consenso cuando intentamos demostrar que no incurrimos en contradicciones performativas o en falacias abstractivas en nuestros actos de habla. Es claro que esta dialéctica de la ética del discurso no resuelve todos los problemas, ni mucho menos, pero puede servirnos de guía cuando actuemos socialmente, en actitud participante, en primera o segunda persona, o cuando analicemos comunicativamente las acciones sociales, en actitud objetivamente, en tercera persona, como dice Habermas.7 Si mitigamos la acción comunicativa de Habermas con la ética del discurso de Apel, podemos redeterminarlas en el siguiente esquema: Como se verá, en el esquema siguiente se ha incluido en la acción orientada al éxito, en la fase de interpretación común de la situación, a la simulación del consenso; del mismo modo, se ha incluido, en la acción comunicativa, la actitud hipotética del consenso del “tú” y del “yo”, para que la búsqueda y la refutación, respectivamente, de las contradicciones performativas y las falacias abstractivas, sean más objetivas. Éste será el esquema que utilizaremos como base del análisis del discurso jurídico.
7
Habermas, Conciencia moral y acción comunicativa, pp. 172 y 186.
48
ARTURO BERUMEN CAMPOS
LA ÉTICA DEL DISCURSO EN LA COORDINACIÓN DE LA ACCIÓN SOCIAL PLAN DE ACCIÓN SOCIAL Alternativas de acción
Ejecución del plan
Tipo de acción
Interpretación común de la situación
Orientada al éxito: - Instrumental - Estratégica - Dramatúrgica
No se tematizan todos los ingredientes por falacias abstractivas o por simulación de consenso para o- cultar constradicciones performativas
Se restringen las La eficacia del plan alternativas de ac- es baja ción, porque los ingredientes no tematizados aparecen como obstáculos inamovibles para la acción
Orientada al entendimiento mutuo: - Acción comunicativa
Se intenta tematizar todos los ingredientes relevantes de la situación, por medio de la asunción hipotética de la búsqueda del consenso del tú y el yo
Se amplían las al- El nivel de eficaternativas de ac- cia es alto ción, porque los obstáculos se transforman en recursos adicionales de acción
IV. LA ÉTICA DEL DISCURSO LEGISLATIVO En este inciso, intentaremos aplicar la ética del discurso a los procedimientos de creación legislativa de normas jurídicas generales. Nuestro punto de partida, nuestro “tópico”, será el hecho general de que los procedimientos jurídicos son procedimientos sociales de comunicación sujetos a reglas. Tanto los procedimientos jurídicos legislativos, judiciales, administrativos y contractuales pueden ser interpretados, ya en lo particular, como actos de habla argumentativos, sujetos a actos de habla regulativos. Es decir, los actos de habla regulativos que “regulan” los procedimientos jurídicos son las normas que, según Kelsen, establecen los procedimientos de creación normativa de un sistema jurídico. Y los actos de habla argumentativos son los procedimientos concretos de creación de normas, es decir, de creación de nuevos actos de habla regulativos. Desde el punto de vista de la teoría de los actos de habla, puede in-
LA ÉTICA DEL DISCURSO JURÍDICO
49
terpretarse el modelo de sistema jurídico de Kelsen como una estructura de actos de habla regulativos y argumentativos. Si esta interpretación fuera posible, la cuestión de la “eticidad” del derecho se podría plantear con toda legitimidad filosófica, por la razón de que el elemento ilocucionario de los actos de habla, es decir, su intención ilocucionaria, puede ser moral o inmoral. Tanto los actos de habla regulativos como los argumentativos puede padecer diversas patologías de la comunicación, en el sentido de Habermas.8 Nos parece que la moralidad o la inmoralidad de los actos de habla regulativos provienen de la moralidad o de la inmoralidad de los actos de habla argumentativos mediante los cuales se discutió la aprobación de aquéllos. Por otro lado, si recordamos que, según el propio Habermas, el uso más pragmático del lenguaje es la “coordinación de la acción social”,9 entonces la cuestión de la eticidad del derecho, entendido como actos de habla, no se encuentra desvinculada de su eficacia, es decir, de la finalidad del derecho que, al decir de Del Vecchio, consiste en coordinar, de manera objetiva, las acciones de varios sujetos, sin ningún impedimento ético.10 Si entendemos esto a la manera comunicativa, podemos decir que la eficacia de la coordinación social depende de la ética del discurso jurídico. Claro que ésta es sólo una hipótesis que habrá que demostrar en un estudio sociológico jurídico al respecto. Aquí sólo nos compete formularla con mayor amplitud. Ahora bien, si redeterminamos la teoría de Kelsen y la de Del Vecchio por medio de la teoría de Habermas, podemos decir que la coordinación de la acción social es eficaz cuando la estructura de actos de habla regulativos y argumentativos se articula mediante la ética del discurso jurídico. Si, por el momento, nos concentramos en los actos de habla argumentativos y regulatorios “legislativos”, podemos aplicarles el esquema de la ética del discurso, sintetizado más arriba, del siguiente modo: 8 Habermas, Teoría de la acción comunicativa, trad. de Manuel Jiménez Redondo, Madrid, Taurus, 1999, tomo I, caps. I y III y tomo II, cap. V. 9 Habermas, Teoría de la acción comunicativa, I, p. 124: “el concepto de acción comunicativa se refiere a la interacción de a lo menos dos sujetos capaces de lenguaje y de acción que... entablan una relación interpersonal. Los actores buscan entenderse sobre una situación de acción para poder así coordinar de común acuerdo sus planes de acción y con ello sus acciones... En este modelo de acción el lenguaje ocupa, como veremos, un puesto prominente”. 10 Vecchio, Giorgio del, Filosofía del derecho, p. 327: “el derecho consiste en la coordinación objetiva de las acciones posibles entre varios sujetos, según un principio ético que las determina excluyendo todo impedimento”.
50
ARTURO BERUMEN CAMPOS
LA ÉTICA DEL DISCURSO JURÍDICO LEGISLATIVO EN LA COORDINACIÓN DE LA ACCIÓN SOCIAL
LA LEY COMO PLAN DE ACCIÓN SOCIAL Tipo de acción social
El discurso legislativo como interpretación de la situación
El articulado de la ley como el conjunto de las alternativas de acción
La aplicación de la ley como ejecución del plan
Orientada al éxito: - Instrumental - Estratégica - Dramatúrgica
No se tematizan todos los ingredientes por falacias abstractivas o por simulación de consenso para o- cultar constradicciones performativas
Se restringen las alternativas de acción, porque los ingredientes no tematizados aparecen como obstáculos inamovibles para la acción
La eficacia de la ley es baja aunque no lo sea su efectividad
Orientada al en- Se intenta tematitendimiento mu- zar todos los intuo: gredientes relevantes de la situa- Acción ción, por medio comunicativa de la asunción hipotética de la búsqueda del consenso del tú y el yo
Se amplían las al- El nivel de eficaternativas de ac- cia y efectividad ción, porque los de la ley es alto obstáculos se trans forman en recursos adicionales de acción
Partimos de tópico “Del Vecchio-Habermas-Kelsen”, de que el discurso jurídico tiene como finalidad la coordinación de la acción social de grandes conglomerados humanos, como los habitantes de un país, de un estado o de una región. Por ello, podemos entender a la ley como un plan de acción social, en el que el discurso legislativo está constituido por los actos de habla argumentativos que buscan una interpretación común de la situación por parte de los afectados por la misma; los artículos de la ley serán entendidos como los actos de habla regulativos que constituyen las alternativas de acción y la aplicación de la ley son los actos de habla argumentativos y regulativos que sirven para la ejecución del plan de acción. Del mismo modo, podemos distinguir dos modalidades jurídicas de acción, que pueden ser orientadas al éxito y orientadas al entendimiento.
LA ÉTICA DEL DISCURSO JURÍDICO
51
Las primeras se encuentran constituidas por actos de habla realizados en actitud asertórica y las segundas, por actos de habla realizados en actitud hipotética. Sólo las primeras pueden ser consideradas éticas y racionales y no las segundas, distinción que no toman en cuenta ni Del Vecchio ni Kelsen.11 La falta de ética en el discurso legislativo va llevar que en los debates legislativos no se tematicen todos los elementos relevantes de la situación problemática que el plan legal pretende resolver, debido a las actitudes instrumentales, estratégicas o dramatúrgicas de los legisladores. Por ejemplo, en la discusión de la iniciativa de reformas de la Constitución en materia penal sobre el cuerpo del delito y los elementos del tipo, no se tematizaron adecuadamente los aspectos a favor o en contra de cada una de las alternativas, sino que se incurrió en falacias abstractivas, mediante la realización de acciones estratégicas por parte de la entonces bancada oficialista (como desviar la atención a temas incidentales) o acciones dramatúrgicas (como la exagerada alarma social por la inseguridad pública). Así mismo, se simuló un consenso entre los especialistas para ocultar las contradicciones performativas entre ellos mismos. Ello llevó, por supuesto, a reducir las alternativas de acción legal, pues todo se orientó a reducir las garantías penales de los procesados, como única alternativa para reducir la impunidad y la inseguridad. Todo ello, por asumir una actitud asertórica en sus actos de habla, por parte de quienes elaboraron y quienes estuvieron a favor de la iniciativa. En un trabajo dedicado especialmente, predecimos una muy baja efectividad de dichas reformas en el combate a 11 Aunque podría pensarse en redeterminar, en términos de la ética del discurso, lo que Kelsen llamó primero la norma hipotética fundamental y luego la ficción que fundamenta el orden jurídico. De acuerdo a Habermas, la norma hipotética fundamental como fundamento del sistema jurídico, no sería otra cosa que asumir a los actos de habla constitucionales en actitud hipotética, es decir, susceptibles de ser problematizados y, por tanto desempeñables, argumentativamente. En cambio, la ficción que fundamenta a la Constitución, no sería otra cosa sino la asunción de los actos de habla constitucionales, en actitud asertórica, es decir, no problematizables y no desempeñables, argumentativamente. En consecuencia, desde el punto de vista de la ética del discurso habermasiana, la construcción kelseniana de una norma que fundamente a la constitución es innecesaria, pues no sería otra cosa sino el elemento ilocucionario (en el caso de la norma hipotética fundamental) o el elemento perlocucionario (en el caso de la ficción fundamental) de los actos de habla constitucionales, cuyos elementos proposicionales serían los contenidos de la misma Constitución. Las consecuencias y el desarrollo de esta redeterminación será objeto de un trabajo mucho más amplio.
52
ARTURO BERUMEN CAMPOS
la impunidad y a la inseguridad pública, aunque se haya aumentado la eficacia en el número de los detenidos preventivamente, pues no todos los factores del aumento de la delincuencia se tematizaron adecuadamente, en el procedimiento legislativo correspondiente.12 Si, en el mismo ejemplo, los legisladores, tanto los que estaban a favor o en contra de la iniciativa, hubieran asumido una actitud hipotética en sus respectivos actos de habla, es posible que se hubiera tematizado un poco más ampliamente la situación del aumento de la delincuencia. La razón de ello hubiera sido que la asunción de la actitud hipotética en sus actos de habla, en el sentido de que todos los legisladores buscaban el consenso legítimo, hubiera posibilitado sopesar, tanto las razones a favor como las razones en contra de cada alternativa. Entonces, es posible que las alternativas hubieran comprendido medidas preventivas además de las represivas y, en consecuencia, la disminución de la impunidad y de la inseguridad hubiera sido más eficaz, lo cual no ha sido posible, porque los legisladores sólo buscaban el éxito político, a cualquier precio, el cual, sin embargo, no se identifica con el éxito en la coordinación de la acción social para disminuir la delincuencia, mediante el discurso jurídico, legislativo y judicial. Por otro lado, no basta analizar la ética del discurso legislativo para determinar los motivos de la ineficacia del discurso jurídico para coordinar la acción social, pues bien puede suceder que la ley haya sido elaborada mediante un discurso legislativo ético, pero que el discurso judicial padezca de diversas patologías de la comunicación. Lo cual puede hacer que el discurso legislativo sea efectivo, pero no eficaz, es decir, que se cumpla el plan legislativo pero no se alcancen los objetivos consensados de la ley, sino sólo los objetivos de algunos de los participantes.13 En otros términos, la eficacia del discurso jurídico requiere de la ética tanto del discurso legislativo como del discurso judicial. Si las patologías comunicativas sólo afectan al discurso legislativo, es posible, aunque no probable, que la ética del discurso judicial pueda hacer que la ley sea eficaz además de efectiva. Y, a la inversa, la ética del discurso legislativo puede corregir la patologías de las reglas del 12 13
Berumen, Arturo, Análisis comunicativo del proceso penal en México, p. 86. Tomamos, un tanto redeterminada, esta distinción entre efectividad de la ley y su eficacia de Correas, Introducción a la sociología jurídica, México, Coyoacán, 1994, pp. 207-253.
LA ÉTICA DEL DISCURSO JURÍDICO
53
discurso judicial que pudieran estar impidiendo una mayor eficacia de la ley, en tanto que plan de coordinación racional de la acción social. Si ambos discursos jurídicos, el legislativo y el judicial, constituyen patologías comunicativas, la coordinación jurídica de la acción social se torna completamente inefectiva e ineficaz.
!
HERMENÉUTICA ANALÓGICA, DERECHOS HUMANOS Y CULTURAS Mauricio BEUCHOT* SUMARIO: I. Planteamiento del problema. II. Hermenéutica analógica. III. La analogicidad, la particularidad y la universalidad. IV. Derechos humanos y multicultura. V. Balance.
I. PLANTEAMIENTO DEL PROBLEMA Nos planteamos aquí el problema de buscar algo que haga compatible, en el caso de los derechos humanos, el que sean diversamente entendidos en diversas culturas y, sin embargo, comprendidos y valorados lo más unitariamente que sea posible, dada su vocación de universalidad. Enfrentamos aquí el problema de la universalidad y la particularidad. Pues bien, como ya algunos se han esforzado por mostrar, no es necesario renunciar a toda universalidad para salvaguardar las particularidades ni es necesario sacrificar lo particular para asegurar algo de universalidad. ¿Qué nos puede brindar esto? Será algo que nos haga ver que son compatibles una cierta universalidad y una cierta particularidad, esto es, no la universalidad sin más ni la particularidad sin más, sino matizadas, como una racionalidad transcultural o una interculturalidad suficientemente racional, frente a los relativismos extremos de hoy en día. Pues bien, creo que para esto nos servirá de instrumento una hermenéutica analógica; esto es, la hermenéutica nos ayudará a ser sensibles con los contextos, con las particularidades; pero lo analógico nos ayudará a no perder la advertencia de una cierta unidad en medio de las parti-
* Instituto de Investigaciones Filológicas, UNAM, México. 55
56
MAURICIO BEUCHOT
cularidades, de los fragmentos, ya que desde siempre la analogía ha sido el instrumento conceptual que ha servido para concordar y hacer coherente lo plural y lo igual, a través de la semejanza.1 Esto puede ser aplicado al problema de los derechos humanos en un mundo contextuado, de culturas múltiples y diferentes. Por ello, en este trabajo comenzaré tratando de explicar cuál es la estructura y la función de una hermenéutica analógica, que nos sirva como instrumento para comprender a otras culturas (lo cual requiere capacidad de comunicación o de cierta universalización) y al mismo tiempo, actuar respetando sus diferencias (particulares). Luego pasaré a explicar cómo la hermenéutica analógica permite oscilar entre el universalismo y el particularismo sin ser completamente lo uno o lo otro; y, finalmente, lo aplicaré al problema de los derechos humanos en un contexto pluricultural. II. HERMENÉUTICA ANALÓGICA He dicho que se trata de una hermenéutica analógica, y comienzo exponiéndola brevemente. La mencionada hermenéutica analógica es una construcción teórica que consiste en la interpretación vertebrada según el modelo de la analogía, intermedio entre la univocidad y la equivocidad. Desde la univocidad, se pretendería una interpretación clara y distinta, dejando margen sólo para una interpretación como la única válida de un texto, siendo todas las demás falsas o inválidas. En cambio, desde la equivocidad, se llegaría a una interpretación confusa y relativista, que da cabida a tantas interpretaciones cuantos intérpretes haya, incluso todas ellas, sin dejar lugar para seleccionar con criterios suficientes cuáles son válidas y cuáles no. En cambio, desde la analogicidad, se llega a una interpretación consciente de su poca claridad, pero luchando porque sea la suficiente como para poder captar el sentido del texto en cuestión con objetividad. No hay una sola interpretación válida, sino más de una; pero tampoco todas son válidas, sino un grupo de ellas, en el cual se pueden señalar grados de aproximación a la verdad textual o verdad del texto, es decir, con una jerarquía de interpretaciones que nos permita establecer cuáles se acercan a la verdad del texto y cuáles se alejan francamente de ella. 1 Para una exposición detallada, cfr. Beuchot, Mauricio, Tratado de hermenéutica analógica. Hacia un nuevo modelo de interpretación, 3a. ed., México, UNAM-Ítaca, 2004.
DERECHOS HUMANOS Y CULTURAS
57
Una hermenéutica analógica es pertinente para la hermenéutica, porque la hermenéutica está distendida hoy entre las corrientes univocistas y las equivocistas, y se echan de menos las analógicas, intermedias entre esos extremos. Las corrientes univocistas pertenecen a un cientificismo reduccionista, y las equivocistas a un relativismo irreductible. Los universalismos y los relativismos están desangrando la hermenéutica en la actualidad, sin encontrar punto de integración en algo distinto y más viable, aunque se está buscando.2 Uno de esos caminos sería la analogicidad. La analogía es semejanza, esto es, algo intermedio entre la identidad y la diferencia, pero tiene más de diferencia que de identidad, en la semejanza predomina la diferencia. Por eso la analogía puede ayudar a integrar lo particular en lo universal sin que eso particular quede destruido, devorado por lo universal. Como en la analogía predomina la diferencia, en una hermenéutica analógica habrá más cabida para lo particular y diferencial que para lo universal, idéntico y homogeneizador. De esta manera, una hermenéutica analógica nos permitirá interpretar la filosofía latinoamericana como un fenómeno cultural que tiene una parte de particularidad y una parte de universalidad, pero la parte de particularidad será más grande y fuerte que la de universalidad. Con ello se supera tanto el universalismo como el particularismo. El universalismo pretendería que estamos inmersos en algo universal e indiferenciado, es el reino de la univocidad. El relativismo pretendería que estamos inmersos en lo singular y completamente diferente, es el reino de la equivocidad. En cambio, el analogismo dará cabida a nuestra inmersión en la filosofía universal pero sin negar la carga de particularidad o de especificidad latinoamericana, que es la que, por cierto, va a predominar, como es condición de la analogía, en la que la diferencia predomina sobre la identidad, se privilegia lo distinto, la distinción y, por ende, la particularidad (sin perder, de vista, como dijimos, la universalidad a la que el objeto pertenece). Esto es una especie de universal concreto, el universal análogo, que no tiene la indiferenciación del universal unívoco, pero tampoco la diferencialidad tan extrema que se atribuye al universal equívoco. O también puede hablarse de particular análogo (o individuo vago, como se lo llamaba en los antiguos manuales de lógica), el cual no tiene la precisión 2 Quintana Paz, Miguel Ángel, “Cómo no ser relativistas ni universalistas”, en Murillo, I. (ed.), Filosofía práctica y persona humana, Salamanca, Universidad Pontificia de Salamanca, 2004, pp. 149-167.
58
MAURICIO BEUCHOT
del individuo unívoco, pero tampoco la fragmentación del individuo equívoco. Es, como analógico, un individuo que alcanza lo suficiente para individualizarse, para identificarse en su concreción, pero también alcanza lo suficiente para integrarse en lo universal, que le da la especificidad o generalidad, que lo identifica en su concepto. Y de esta manera queda una hermenéutica que se afana por buscar la particularidad, pero sin renunciar a su universalidad o generalidad, que es de donde le viene el carácter genérico, al cual se añadirá aquello que la especifica o le da la diferencia específica. Una hermenéutica analógica reconoce las diferencias de las culturas particulares, pero también reconoce la inmersión de éstas en el seno de algo más amplio, como es la cultura universal o mundial. En esos dos contextos, particular y universal, tratará de ubicar los derechos humanos. III. LA ANALOGICIDAD, LA PARTICULARIDAD Y LA UNIVERSALIDAD Recordemos que la semántica, en la filosofía del lenguaje, nos habla de tres modos de significar o de atribuir un predicado a un sujeto: el unívoco, el equívoco y el análogo.3 La univocidad es la significación idéntica para todos los significados, es una significación clara y distinta, y que se aplica de manera completamente idéntica a los individuos que significa, como “hombre” o “mortal”. En cambio, la equivocidad es la significación diferente para todos los significados, es una significación obscura y confusa, y que se aplica de manera completamente diferente a los individuos que significa, como “gato”, aplicado al animal y a la herramienta, por ejemplo. Y la analogía es el modo de significación o de predicación a un sujeto que está entre lo unívoco y lo equívoco. No alcanza la unidad de significación de lo unívoco, pero tampoco cae en la fragmentación de la significación de lo equívoco; se predica de sus sujetos de manera en parte idéntica y en parte diferente, es decir, sólo semejante; por ejemplo, “ser” se predica de la substancia y del accidente, pero de modos muy distintos; “sano” se aplica al organismo, al alimento, a la medicina y al clima, pero de maneras muy distintas. La univocidad, está, pues, en la línea de la identidad, y la equivocidad en la línea de la diferencia, mientras que la analogía ni es mera identidad 3 Ferrater Mora, José, “Pinturas y modelos”, Las palabras y los hombres, Barcelona, Península, 1972, pp. 145 y 146.
DERECHOS HUMANOS Y CULTURAS
59
ni pura diferencia, está entre una y otra; sin embargo, en ella predomina la diferencia sobre la identidad, como es la condición de la semejanza misma. Por eso nos conviene tanto la analogía, para preservar lo más que se pueda de la diferencia, incluso privilegiándola por encima de la identidad. Y es que nuestra experiencia humana nos hace ver que siempre las cosas se nos quedan más en la diferencia que en la perfecta unificación, la univocidad es raramente alcanzable. Los que introdujeron la analogía fueron los pitagóricos, esos filósofos presocráticos que fueron grandes matemáticos y grandes místicos a la vez, que buscaron siempre la mediación, la coincidencia proporcional de los opuestos, sólo proporcional. Y es sabido que introdujeron la analogía cuando toparon con lo irracional (los números irracionales) y la inconmensurabilidad (de la diagonal), para poder conmensurar sólo de manera proporcional. Y es lo que ahora necesitamos: conmensurar las culturas, tradiciones o paradigmas, lo cual sólo se podrá hacer de manera proporcional, pero es una medida suficiente. De los pitagóricos la analogía pasó a Platón, que tuvo varios maestros de esa escuela o secta.4 Él la usó principalmente en las comparaciones, mitos, alegorías, etcétera, que usa en sus diálogos, recursos que hacen de éstos una lección viva y altamente significativa. Así llega a Aristóteles, quien la aplica de manera muy fuerte en la mayoría de sus doctrinas, principalmente en el ámbito de la metafísica, de la ética y la política.5 La mayoría de los términos filosóficos, por lo menos los más importantes, son analógicos (es decir, se dicen de muchas maneras), como el ser, el uno, el bien, la justicia, etcétera. También tiene la analogía cierta presencia en los neoplatónicos, sobre todo recalcando la idea de jerarquía que introduce la analogía entre los elementos analogados. El concepto de analogía atraviesa la Edad Media; se encuentra en San Alberto, en San Buenaventura, en Santo Tomás, en el maestro Eckhart. Es puesto en reservas, pero no negado sino más bien limitado, en Duns Escoto, quien privilegia la univocidad. Y decae mucho en los nominalistas, que a veces adoptan posturas sumamente univocistas o sumamente equivocistas. Esta idea de la analogicidad llega casi a perderse en la modernidad. Se mantiene en los barrocos, que la ven como el juego entre la metáfora y la 4 5
Secretan, Philibert, L’analogie, París, PUF, 1984, pp. 19-23. Ibidem, pp. 23-28.
60
MAURICIO BEUCHOT
metonimia, y en los románticos, que la ven como el contrapeso de la ironía, así como aquello que hermana con la naturaleza, pues eran muy dados a proclamar una vuelta a lo natural. Pero en la actualidad es tiempo ya de su plena recuperación, hay que recobrar esta idea de analogía porque estamos dolorosamente distendidos entre el univocismo del cientificismo y el equivocismo de muchos posmodernos. Por eso viene tan a cuento una hermenéutica analógica, ya que la hermenéutica ha llegado a ser el instrumento cognoscitivo de nuestros tiempos, pero se halla dolorosamente distendido entre los hermeneutas univocistas y los equivocistas; los primeros pretenden una interpretación clara y distinta, y dicen que sólo puede haber una sola interpretación válida de un texto; los segundos sostienen casi que toda interpretación es válida, porque no hay parámetros ni criterios para decidir cuándo una interpretación es objetiva, todo se hunde en la subjetividad y en el relativismo; en cambio, una hermenéutica analógica sostiene que no hay una única interpretación válida de un texto, sino que puede haber más de una; pero también sostiene que no todas son válidas, sino un conjunto de interpretaciones, que se pueden jerarquizar o colocar en diferentes grados de aproximación a la verdad del texto, de modo que se pueda decir cuándo se alejan demasiado de ella y empiezan a hundirse en la falsedad. De esta manera, una hermenéutica analógica nos permitirá tener grados de aproximación a la verdad textual en nuestras interpretaciones, y nos hará oscilar entre lo particular y lo universal, dando predominio a lo particular sobre lo universal, como vimos que daba predominio a la diferencia por encima de la identidad. Tal es la condición de la semejanza o analogía, y esto se manifiesta como ventajas de una hermenéutica basada en la analogía, de una hermenéutica analógica. En este sentido, la analogía es el juego y rejuego, o un equilibrio no estático, sino dinámico o proporcional, entre la identidad y la diferencia, entre la universalidad y la particularidad. Como en la analogía predomina la diferencia sobre la identidad, y la particularidad sobre la universalidad, tiene la ventaja de poderse aplicar a la interacción cultural privilegiando las diferencias y particularidades culturales evitando la homogeneización y el universalismo. En efecto, el universalismo corresponde a la univocidad, de ahí que una hermenéutica unívoca o univocista tenga el defecto de exigir una universalización u homogeneización que lastimará las diferencias cultu-
DERECHOS HUMANOS Y CULTURAS
61
rales y llegará a acabar con ellas. En cambio, el particularismo a ultranza corresponde a una hermenéutica equívoca o equivocista, la cual tiene el defecto de propiciar un relativismo tal que no habrá punto de contacto entre las culturas, disueltas en la inconmensurabilidad; eso llega a diluir toda conexión en algo común, universal o continuo, hunde en un relativismo extremo. A diferencia de esas dos hermenéuticas anteriores, la hermenéutica analógica privilegia la diferencia cultural y el particularismo de las identidades, pero sin acabar con la posibilidad de conexión intercultural o transcultural, logrando universales analógicos que salvaguardan la solución de continuidad y de comunicación entre las diversas culturas que conviven, impidiendo que unas se aprovechen de las otras o lleguen a ejercer algún tipo de imposición o de opresión. IV. DERECHOS HUMANOS Y MULTICULTURA Apliquemos ya la hermenéutica analógica al problema de la relación de los derechos humanos con muchas culturas, tan distintas. ¿Cómo se plantea pasablemente bien el problema? Taylor y Walzer parecen hacerlo bien.6 En el fondo, nos dicen: ¿Cómo atender a las justas demandas de las diversas culturas (incluso minoritarias), dando lugar a sus derechos propios, sin lesionar los derechos humanos, que son universales pero individuales? Como se ve, hay una oscilación entre lo universal y lo individual; ambas cosas deben salvaguardarse. Tenemos una exigencia de atender a la universalidad de los derechos humanos; pero, también, una exigencia de atender a las particularidades con las que se dan en los seres (o grupos) humanos a los que se aplican. Esto es, por una parte, la universalidad de los derechos humanos, y por otra, la particularidad de las culturas en las que se realizan. ¿Cómo podemos hacerlo? Necesitamos una epistemología o teoría del conocimiento que nos permita dar cuenta de los dos extremos y nos haga mediarlos. Esto suena a ese principio que rige la frónesis. Gadamer, MacIntyre, Ferrara, han privilegiado la frónesis, de la Ética Nicomaquea;7 pero creo 6 Cfr. Taylor, Charles, El multiculturalismo y la “política del reconocimiento”, México, FCE, 1993; Walzer, Michael, Las esferas de la justicia. Una defensa del pluralismo y la igualdad, México, FCE, 1997. 7 Cfr. Ferrara, Alessandro, Reflective Authenticity. Rethinking the Project of Modernity, Londres-Nueva York, Routledge, 1998; Justice and Judgement. The Rise and Prospect of the Judgment Model in Contemporary Political Philosophy, Londres, Sage, 1999.
62
MAURICIO BEUCHOT
que aquí, en los casos conflictivos, hay que potenciar también la Epiqueya o Epiquía, de la Magna moralia.8 Esto tiene que ver con la manera de aplicar un derecho, que es universal, al caso particular y concreto. Inclusive, hay derechos humanos que, de alguna manera, permiten y favorecen la diversidad cultural.9 Pero, por supuesto, dicha diversidad tiene límites. Es bueno proteger la diversidad cultural, mas dentro de ciertos límites. Tan necesario es poner límites a la universalidad como a la particularidad. En ese límite entre lo universal y lo particular se da lo que puede ayudarnos a mediarlos. De manera parecida a los derechos individuales, se nos manifiestan los derechos culturales. Con una cierta analogía. Así, toda cultura tiene derecho a defenderse, a preservar su desarrollo y a hacerlo prosperar. No sólo a resistir, sino a subsistir. Pero sólo pueden hacerlo las que no se opongan a los derechos humanos, o quitando de ellas aquellos aspectos que se opongan a ellos. Hay casos en los que los derechos de una comunidad entrarán en conflicto con los derechos humanos. Pero hay que pensar el conflicto, analizar la contradicción. Para sacar la manera —limitada— en que pueden hacerse compatibles los extremos que no se podían unir. Aquí se aplica algo en lo que ha insistido Raúl Alcalá, en el sentido de que, de una cultura, ni se puede aceptar todo ni se puede rechazar todo, sino unas partes y otras partes.10 Hay que propiciar, de las culturas, lo constructivo, y rechazar lo destructivo. Ya un límite que se impone son los derechos humanos. Los derechos humanos son, pues, un límite; tal vez el límite frente a los derechos comunitarios o étnicos o culturales. Tienen que encontrar la convergencia, para no lesionar ni a los individuos ni a los grupos. En todo caso —me parece—, hay que tratar de privilegiar a la persona frente a la sociedad.
8 9
Cfr. Aristóteles, Gran Ética, libro II, capítulo 2. Cfr. los que expone Fernández-Largo, Antonio Osuna, Los derechos humanos. Ámbitos y desarrollo, Salamanca, España, San Esteban-Ebesa, 2002, pp. 265-268. Véase también, Puy Muñoz, Francisco, Derechos humanos. Derechos económicos, sociales y culturales, Santiago de Compostela, Imp. Paredes, 1983; Castro Cid, Benito de, Los derechos económicos, sociales y culturales, León, España, Universidad de León, 1993; Lucas Martín, José de (dir.), Derechos de las minorías en una sociedad multicultural, Madrid, Consejo General del Poder Judicial, 1999. 10 Cfr. Alcalá Campos, Raúl, Hermenéutica. Teoría e interpretación, México, UNAM-Plaza y Valdés, 2002, pp. 65-74.
DERECHOS HUMANOS Y CULTURAS
63
El dilema ya es conocido. ¿Se ha de proteger a la persona o a la sociedad? Si se privilegia demasiado a la persona, se lesiona a la sociedad. Y, a la inversa, si se privilegia demasiado a la sociedad, se lesiona a la persona. En cuanto a lo primero (privilegiar a la persona por encima de la sociedad), está el célebre caso de la guerra. Una guerra defensiva implica que el individuo se sacrifique por la sociedad, pues en ella puede perder la vida. Aquí parece que la sociedad va contra el individuo, pero, si bien se mira, al defender a la sociedad, el individuo se está defendiendo a sí mismo; esto es, aquí coinciden la defensa del individuo y la de la sociedad. Algo parecido se presenta en la dialéctica de los derechos individuales y los derechos comunitarios (o culturales). Si se privilegia demasiado a los derechos culturales, pueden ir contra los individuos, como en prácticas ancestrales de ciertos grupos que lesionan la dignidad de las mujeres. Y ahí de ninguna manera se está protegiendo a la mujer al proteger al grupo. Tiene que buscarse la confluencia de los derechos del individuo y los derechos del grupo al defender cualesquiera derechos. Se ha dicho que hay culturas que no conocen o no reconocen los derechos humanos. Y tendemos de inmediato a decir que están mal. Lo cual no creemos que sea producto de nuestra misma cultura, de nuestro solo contexto cultural. Hay un consenso intercultural y, en ese sentido, transcultural que lo atestigua. ¿Qué haremos con esas culturas? Nuestra reacción es tender a sujetarlas, o por lo menos a persuadirlas. Aquí es donde se ve la vocación universalista de los derechos humanos. No se reducen a ser producto de un relativismo cultural. ¿Se resuelve esto mirando los derechos humanos, liberales, con una óptica comunitarista? ¿O hace falta crear nuevos derechos que expliciten esos contenidos comunitaristas? Se ha visto que no estaría mal imprimirles a los derechos humanos, a veces demasiado individualistas, un matiz más comunitario o de mayor compromiso con la comunidad.11 Por ejemplo, en el ámbito de la globalización y las culturas, se trata de que todas las culturas gocen de las ventajas de la globalización y no de sus desventajas, esto es, de la exclusión o de la esclavización a ella. Más que de multiculturalidad, ahora se habla de interculturalidad.12 11 Cfr. Ballesteros, Jesús, Posmodernidad: decadencia o resistencia, 2a. ed., Madrid, Tecnos, 2000, pp. 54-65. 12 Cfr. González Arnaiz, Graciano, “La interculturalidad como categoría moral”, El discurso intercultural. Prolegómenos a una filosofía intercultural, Madrid, Biblioteca Nueva, 2002, pp. 77-106.
64
MAURICIO BEUCHOT
En la realidad, aplicamos los derechos humanos de manera diferenciada o matizada. Incluso los derechos humanos culturales. Por ello se necesita que nos demos cuenta de que la aplicación de los derechos humanos se realiza con ciertas particularidades, dentro de un margen de diferencia. Para eso es necesaria una antropología filosófica o filosofía del hombre que nos hable de la convivencia pacífica multicultural. Lo que suele llamarse interculturalidad. Que lleguemos a un ser humano abierto, pero que reconozca límites y sea atento a ellos. Que, frente al otro, se cuestione sobre sí mismo y no sólo sobre el otro; pero que también cuestione al otro, en vista de lo que ha aprendido que es correcto de lo propio, y así ir construyendo lo universal; es decir, que sea capaz de aprender del otro y a la vez de criticarlo; que sea capaz de criticarse a sí mismo y de aprender de su propio proceso. De esta manera, a partir de lo propio, se irá construyendo lo común; desde lo particular, lo universal. De entre los derechos humanos culturales o de una cultura, está el de la propia supervivencia, el de preservarse como cultura. Por ejemplo, el derecho a preservar su lengua, pues en ella se encuentra, acumulada a presiones de tiempos, la experiencia colectiva. Derecho, además, a narrar y a interpretar su historia, pues ella constituye la memoria colectiva que guarda esa experiencia común. Derecho a practicar su religión, o a vivir sus símbolos; en definitiva, a tener sus creencias o ideas, sus usos y costumbres. Pero el problema surge cuando esos usos y costumbres se oponen a lo que consideramos como derechos humanos. Por ejemplo, cuando la religión que una cultura tiene la mueve a agredir, desde el fundamentalismo, a otra. Hay religiones que entablan cruzadas, hacen atrocidades, etcétera. Esto es afectar la convivencia con otras culturas, en el pluralismo. Hay problemas, como es bien sabido, cuando alguna cultura tiene prácticas ancestrales que van contra la dignidad de la mujer, prácticas machistas. Hay casos muy extremos de conflicto, por ejemplo frente a una cultura que hace sacrificios humanos o practica la antropofagia. Allí sí debe persuadírseles de no hacerlo, y, si no es posible, obligarlos a no hacerlo. Otros casos no son tan extremos, pero son difíciles para la convivencia, como el del vestido. Puede suceder que, en esa convivencia, haya problemas menores, por ejemplo, en cuanto al vestido, cuando se dé lo que algunos vean como desnudez o casi desnudez. ¿Qué hacer cuando conviven culturas que entienden de manera distinta el estar vestido? Piénsese en los españoles e indígenas en la conquista. Y aun los indígenas acabaron adoptando el vestido no tan a la fuerza. También es notable el caso
DERECHOS HUMANOS Y CULTURAS
65
de Mahatma Gandhi, cuando se entrevistó con los reyes de Inglaterra, y no se le quería dar paso, por pensarse que iba casi desnudo. Vemos, así, que hay un derecho a la diferencia, pero no absoluto, irrestricto. Se da dentro de cierta búsqueda de identidad o igualdad, que permite la justicia. Es lo que Adela Cortina pone como el juego entre mínimos de justicia y máximos de bienes o ideales de vida, que suelen depender de las comunidades.13 Los primeros se atraen fácilmente el consenso; los segundos, difícilmente. Por eso los primeros son “obligatorios”; en cambio, los segundos dependen, para su aceptación, de la tolerancia, el respeto, la solidaridad y la apertura (y, por ende, de la educación en estas virtudes). Pero estos máximos son importantes, pues dan sentido a los mínimos, los hacen vivibles, atractivos. La justicia sin ideales de vida buena está incompleta, no basta, no llena. V. BALANCE Con lo anterior, tenemos que la continua lucha entre individualismo y universalismo, o entre relativismo y absolutismo, es una lucha entre el equivocismo y el univocismo. Descansa en un falso supuesto, el de la dicotomía o separación insalvable entre los dos polos. Pero ha hecho falta una postura intermedia y mediadora (analógica), que nos permita beneficiarnos de lo que ambos polos tienen de verdadero y evitar lo que tienen de falso. Lo verdadero les viene de lo que tengan de moderado o prudencial (fronético) y lo falso les viene de lo que tengan de extremo o exagerado. Y, como entre la univocidad y la equivocidad está la analogía, y ésta se ha excluido de la discusión, hace falta rescatar una hermenéutica analógica para el multiculturalismo. Una hermenéutica así, tal como la hemos expuesto, nos ayudará a salvar las diferencias lo más que sea posible, sin perder las semejanzas, que son las que permiten universalizar, y encontrar lo común entre las culturas. La analogía nos hará comprender y valorar las culturas en lo que tengan de diferencial y también de universal, de modo que puedan integrarse sin violencia a la universalidad mundial, sin perder completamente sus diferencias propias. Habrá elementos de la cultura propia o de la(s) 13 Cfr. Cortina, Adela, Alianza y contrato. Política, ética y religión, Madrid, Trotta, 2001, pp. 140 y ss.
66
MAURICIO BEUCHOT
otra(s) culturas que se deban rechazar, pero también otros que inclusive habrá que tratar de fomentar o de incorporar a la nuestra. La analogía nos permitirá, en el diálogo, enjuiciar las culturas para aprender y para criticar. Esto, que parece tan trivial, ha sido entendido pocas veces y ha causado demasiados debates poco fructíferos.
SOME REFLECTIONS ON METHODOLOGY IN JURISPRUDENCE Brian BIX* SUMMARY: I. Introducction. II. Objetives. III. General Jurisprudence, Conceptual Analysis, and “Necessity”. IV. The Challenge of Naturalism. V. Description and Selection. VI. The Internal Point of View, and the Challenge of Ideology. VII. Legal Positivism vs. Natural Law. VIII. Kelsen and Normative Logic. IX. Truth and Nature of Law. X. Conclusion. XI. Bibliography.
I. INTRODUCTION For much of the twentieth century, from the time of the American legal realists through the work of H. L. A. Hart, most of the important works in legal theory1 were written by lawyers, though lawyers who had some interest in, and perhaps some basic training in, philosophy. More recently, many, perhaps most, of those working in English-language legal theory * Frederick W. Thomas Professor of Law and Philosophy, University of Minnesota. I am grateful for the comments and suggestions of Pablo Navarro and other participants at the UNAM Conference. Some of the material in this piece derives from or parallels works of mine that are forthcoming or have been recently published: “Legal Positivism”, for Blackwell Guide to the Philosophy of Law (forthcoming, Edmundson, William A., & Golding, Martin (eds.), Oxford, Blackwell, 2004); “Raz on Necessity”, Law and Philosophy (forthcoming, 2003); “Can Theories of Meaning and Reference Solve the Problem of Legal Determinacy?,” Ratio Juris, num. 16, 2003, pp. 281; Book Review (reviewing Dickson, Julie, Evaluation and Legal Theory), Australian Journal of Legal Philosophy, num. 28, 2003, p. 231; and “Will versus Reason: Truth in Natural Law, Positive Law, and Legal Theory”, Truth (forthcoming, Pritzl, Kurt (ed.), Washington, D. C., The Catholic University of America Press, 2004). 1 “Legal theory” in this paper is to be understood narrowly, as referring to the abstract theorizing about the nature of law, the nature of particular legal concepts, legal reasoning, etcetera. It does not refer to the mid-range theories used to defend and rationally reconstruct areas of doctrine within particular legal systems. 67
68
BRIAN BIX
have doctorates in philosophy or other significant philosophical training. It may thus be unsurprising that more and more sophisticated theoretical machinery is being brought to bear on jurisprudential topics, and more attention is being given to questions of philosophical methodology. Legal philosophy is a broad category, and the portion of it with which I will be concerned is one with a long tradition, but an area which nonetheless still seems unusual to most readers of American law journals, and is poorly understood by many legal scholars. I will be focusing on analytical jurisprudence, and within analytical jurisprudence, theories about the nature of law. Analytical jurisprudence offers to analyze the basic nature of law and legal concepts (e. g., ‘rights’, ‘duty’), in contrast to the motivation in discussing legal questions that predominated both in classical times and in more recent work: that of viewing law as one more forum for considering the moral question of how individuals should act (e. g., the proper response to immoral laws, or the question of how legislators could improve the law). This paper offers an overview of methodological issues connected with theories about the nature of law, and it is important to note early on how the methodological questions for this sort of inquiry diverge from the methodological concerns for critical theories (about how to improve law), or sociological or historical theories (relating to the causes and effects of legal rules). With questions regarding, say, judicial behavior, the methodological ones are the familiar ones within the social sciences: e. g., the extent to which the participants’ perspectives must be incorporated into accounts of social actions, whether explanation is best offered at the level of individuals or structures, the extent to which participant perceptions can or must be incorporated into claims of causation, etcetera.2 To state the obvious: theories that purport to describe or explain the nature of law seem to be doing something quite different from standard social science theories (and distinctly different from theories of the physical sciences). The discussion that follows will focus primarily on the basic methodological assumptions assertions within analytical theories about the nature of law, and possible criticisms of those positions, particularly relating to the role of general jurisprudence and conceptual analysis. 2 Lucy, W., Understanding and Explaining Adjudication, Oxford, Oxford University Press, 1999, pp. 17-32.
METHODOLOGY IN JURISPRUDENCE
69
Additionally, at the end, there will be brief discussions of related issues regarding the debate between legal positivism and natural law theory, Kelsen’s distinctive theory of law, and the problem of truth in law. II. OBJECTIVES What do we expect theories about the nature of law to do? How can we distinguish good theories of this type from bad ones? We cannot test theories about the nature of law the way we test sci en tific the o ries: by setting up controlled experiments to see if the events predicted by the theory come about or not. Nor can we even apply the test of historical theories: judging theories by the extent to which they match with the facts in the past. Neither conventional approach to verification or falsification works with theories about the nature of law, because such theories do not purport to be (merely) empirical theories, but rather conceptual claims, claims about what is “essential” to the concept (or “our concept” of) “law”. A good theory about the nature of law (or the nature of any other concept or practice) explains. A good theory would be one that tells us something significant – that says something interesting about the category of phenomenon we call “law”. Even if it is not a claim that can be verified or falsified, one can still feel that a theory either does or does not give us an insight onto the practice or phenomenon that we did not have before. A theory that offers to tell us something about the “nature of law” needs, of course, to reflect, to a substantial extent, the way citizens and lawyers perceive and practice law – it must “fit” our legal practice, though the fit need not be perfect, though significant deviations from the participants’ understanding of a practice must be justified by some insight offered. This relates to the second point: a theory should offer more than general descriptive fit – it should also tell us something about the practice that even regular participants in the practice might not have been able to articulate, but which they would recognize when confronted with the theory. These are perhaps vague standards, but it is not clear that “explanation” or the role of theory generally, could be reduced to more precise terms, one it is understood that we are (or at least might be) separated from the more concrete tethering of prediction or simple falsifiability.
70
BRIAN BIX
III. GENERAL JURISPRUDENCE, CONCEPTUAL ANALYSIS, AND “NECESSITY” References to theories about the nature of law implicitly assume that it makes sense to have a general theory of law (as contrasted to a theory of a particular legal system or group of legal systems, or sociological or historical investigations tied to a particular legal system or group of systems). This assumption is neither obvious or uncontested. This question is often equated with or transformed into a second – whether it makes sense to speak of “the concept of law” or “the («essential») nature of law”. (There are aspects of the debate about the possibility of general jurisprudence that are not entirely covered by discussions about “necessity” and “conceptual analysis”; these will be discussed later in this paper). References to “necessary” or to “essential” properties were traditional within classical philosophy. However, to modern sensibilities, such references seem out of place, at least when discussing a social practice or a social institution. Talk of necessity sounds of abstract and eternal Platonic Ideas; but if legal practices and institutions are human products, can we not define them as we like? And if “law” just is whatever we say it is, there seems little room for the kind of conceptual analysis Joseph Raz and H. L. A. Hart, and most other prominent analytical legal theorists, purport to do. Is there a place for “necessity” within discussions of law? Some philosophers have argued for ‘necessity’ in the definition of certain terms, when those terms denote some category whose boundaries are arguably set out by “the way the world is”. These are ‘natural kind’ terms, like “water” and “gold”, and the debate within the literature, at least initially, was addressed to the question of whether terms of this kind have their reference determined by people’s beliefs about the item’s nature or by the way the world is.3 Whatever the merit of a ‘natural kinds’ analysis for terms that refer to natural or physical entities, its applicability to human institutions and social practices would 3 See generally Putnam, “The Meaning of Meaning”, Mind, Language and Reality: Philosoplical Papers, Cambridge, Cambridge University Press, 1975, vol. 2. For a critical analysis of attempts to apply ‘natural kinds’ theories to law, see Bix, Brian, Law, Language and Legal Determinacy, Oxford, Oxford University Press, 1993, pp. 157-173.
METHODOLOGY IN JURISPRUDENCE
71
seem to be much more problematic. “Gold” may be a category whose boundaries are set by the world, and its essence estimated by the best scientific theory we currently have; there is, however, little reason to think that a similar approach would work for ‘baseball’ or for “law”. In what way could ‘the world’ be said to delimit what does and does not count as “law”?, and what would it mean to have a “scientific theory” of the nature of law?4 Another analogy within the philosophical literature might be Saul Kripke’s idea5 of rigid designators: that in counterfactuals, singular terms are intended to have the same reference in all possible worlds. Again, while the analysis is arguably persuasive as regards proper names, it would be awkward, at best, if applied to a social practice or social institution like law.6 In the context of theories about the nature of law, and the use of ‘necessity’ within such discussions, the Kripke-Putnam theories about reference and semantics do not seem helpful, except perhaps by broad analogy.7 1. Conceptual Analysis and Jurisprudence One likely response to the discussion up to this point would be: “Of course, a jurisprudential discussion about the nature of law is not an analysis of logical necessity, or even of a natural kind. It is a conceptual analysis, and whatever “necessary” or “essential” claims involved are those of the inquiry into concepts”.8 Philosophical analysis of concepts 4 Moore, Michael (“Hart’s Concluding Scientific Postscript”, Legal Theory, num. 4, 1998, p. 312) suggests that H. L. A. Hart’s legal theory could be seen as implying something analogous —“just as there are ‘natural kinds’ in the natural world, so there are ‘social kinds’ in the social world, and law is one of them”— but this still leaves us with the question of what it would mean for there to be ‘social kinds’. 5 Kripke, S. A., Naming and Necessity, Cambridge, Harvard University Press, 1972. 6 One can accept Kripke and Putnam’s positions on a more general level, that meaning has a social dimension, and is not individualistic (‘in the mind’), even if one does not accept that ‘the world’ determines the meaning of our concepts. Raz, “Two Views of the Nature of the Theory of Law: A Partial Comparison”, Legal Theory, num. 4, 1998, pp. 262-264 & num. 26. The significance of this ‘compromise position’ for the present analysis will become clearer later in the paper. 7 See num. 4 above. 8 Of course, when the classical philosophers wrote of essential and accidental properties, they were usually referring to the essential and accidental properties of things, not of concepts. See, e. g., Aristotle, “Metaphysics,” Book VII, chapter 4, in Barnes, J. (ed.),
72
BRIAN BIX
is, of course, nothing new. For example, there was a long-standing debate about whether knowledge should be defined as “justified true belief”.9 Philosophers frequently do believe that we can sensibly analyze our concepts, and, at least sometimes, determine what their essential (and accidental) attributes are.10 Also, conceptual analysis is certainly nothing new for jurisprudence either: arguably the most important jurisprudential text published in English in the last century was described by its title as being about a concept, H. L. A. Hart’s The Concept of Law.11 However, one might ask, why should we study the concept if we can study the thing itself (the practice, the type of institution) instead? This may seem like an empiricist’s (or an anti-intellectual’s) response to impractical, overly abstract philosophers. At that level, the proper response is that conceptual analysis is a prior inquiry – we cannot study law until we know what we mean by “law.”12 Some might persist that the proper study of law —a social institution— is through social theory. Law is a set of social practices, the argument would go, so its nature is best discovered, not by armchair reflections, but by an investigation of the actual practices (a view that will be considered at greater length below). However, should someone suggest that the investigation of the nature of law be purely empirical/sociological, that claim would be vulnerable to the argument just offered: how can one have a “sociological theory of law” if one does not have at least a rough prior notion of what is or is not ‘law’?13 Aristotle, The Complete Works of Aristotle, Princeton, Princeton University Press, 1984, pp. 1625-1627. 9 Gettier, E. L., “Is Justified True Belief Knowledge?, Analysis, num. 23, 1963. 10 Cfr. Raz, “Two Views of the Nature of the Theory of Law: A Partial Comparison”, Legal Theory, num. 4, p. 273, num. 38, where Raz distinguishes “those features of law which are general, i.e., shared by all legal systems” and the “essential features of law, features without which it would not be law.” 11 Hart, The Concept of Law, 2nd. ed., Oxford, Clarendon Press, 1994; see also Raz, The Concept of a Legal System, 2nd. ed., Oxford, Clarendon Press, 1980. 12 See, e. g., Jackson, F., From Metaphysics to Ethics: A deference of Conceptual Analysis, Oxford, Clarendon Press, 2000, pp. 30 & 31; cfr. Coleman, J. L., “Methodology”, in Coleman J. L. & Shapiro, Scott (eds.), Handbook of Jurisprudence and Legal Philosophy, 2002, pp. 3473-3551) (offering a similar response to a naturalist critique of conceptual analysis). 13 One possible response is that while a prior notion of ‘law’ is needed before beginning other (empirical) work, simple intuitions and linguistic usage patterns would be sufficient for that purpose. No thicker conceptual analysis is needed (or, some commenta-
METHODOLOGY IN JURISPRUDENCE
73
There is thus a sense in which conceptual work must be prior to empirical work.14 For the focus is inevitably on the boundaries of the category – here, what makes something ‘law’ or “not law”? We are not asking empirical questions about particular institutions: e. g., about the historical origins of common law reasoning in the English legal system, or the interpretive practices of American judges when construing statutes. Questions about specific institutional practices would be social theory inquiries which would call for some combination of model building, observation, and statistical analysis. However, as mentioned earlier, the more general discussion of the nature of law, if such discussion has any place at all, is not a comparably empirical inquiry.15 One might point out that if it would be mistaken to try to ground a theory of the nature of law solely on empirical or sociological grounds, without reference to conceptual analysis, it would be equally mistaken to ground such a theory solely on conceptual analysis, without reference to empirical and sociological truths.16 Indeed, what sense or value could there be to a purported “«concept of “law»” if that concept had no relation whatsoever to the practices we associate with legal systems? Raz’s own view17 is that the concept of law is grounded on the perceptions and self-understandings of people – self-understandings which, in turn, one presumes, reflect the social practices that help to constitute the social
tors might add, possible). Leiter, B., “Naturalism in Legal Philosophy”, in Zalta, E. N. (ed.), Stanford Encyclopedia of Philosophy, 2003. 14 However, there is also a sense in which the theorist doing conceptual analysis must defer to the way the world is, at least in those cases where the theorist is investigating the nature of an already-existing concept. The matter would be different if we were positing some new concept or category, and then considering what empirical claims could be made about that concept. Raz, J., Ethics in the Public Domain, Oxford, Clarendon Press, 1994, p. 221. 15 None of this is to claim that sociological inquiry must be subordinate to conceptual analysis. The fact that we have a rough sense of (e. g.) what is and what is not ‘law’ does not mean that social theories must be built on categories that track those concepts. 16 Tamanaha, B. Z., Realistic Socio-Legal Theory: Pragmatism and Social Theory of Law, Oxford, Clarendon Press, 1997; id., “Conceptual Analysis, Continental Social Theory, and CLS: A response to Bix, Rubin and Livingston”, Rutgers Law Journal, num. 32, 2000; and “Socio-Legal Positivism and a General Jurisprudence”, Oxford Journal of Legal Studies, num. 21, 2001, pp. 1-32. 17 Raz, “On The Nature of Law” (Kobe Lectures of 1994), Archiv für Rechts- und Sozial-Philosophie, num. 82, 1996, pp. 5 & 6.
74
BRIAN BIX
institution. The connection between conceptual analysis and empirical truths will be discussed further, below. 2. Family Resemblance Ludwig Wittgenstein18 famously introduced the notion of “family resemblance” as a shorthand for the way that some concepts and categories (Wittgenstein used the examples “language”, “game” and ‘number’) cannot be understood in terms of necessary and sufficient conditions, but rather have a variety of different and overlapping criteria.19 Wittgenstein was not claiming that all concepts were family resemblance concepts, only that some were, and therefore it would be a mistake to assume that there would always be necessary and sufficient conditions for every concept20 A number of writers have suggested that “law” might be such a family resemblance concept, with instantiations having no feature in common – and thus no “necessary” features.21 Hart himself suggested22 that the notion of “family resemblance” might be particularly relevant to legal terms, and he broadly hinted early in The Concept of Law23 that “law” might well best be understood in this way, though later in the same book he offered what appeared to be a set of necessary and sufficient conditions for that term.24 That noted, because no one claims that all concepts are family-resemblance concepts, even if one accepts that some are, analysis and debate must be developed concept by concept. One way to “disprove” that “law” is a family resemblance concept is to provide an analysis in terms of necessary and sufficient conditions, as Raz and others have attempted
18 19 20 21
Philosophical Investigation, 3rd. ed., Oxford, Basil Blackwell, 1958, §§ 65-68. Glock, H. J., A Wittgenstein Dictionary, Oxford, Blackwell, 1996, pp. 120-124. Glock, op. cit., footnote 19, pp. 123 & 124. Burton, S. J., “Law, Ob1igation and a Good Faith Claim of Justice”, California Law Review, num 73, 1985, pp. 1979 & 1980; Lyons, D., “Book Review”, Cornell Law Review, num. 68, 1983, p. 259. 22 Hart, The Concept of Law, 2nd. ed., Oxford, Clarendon Press, 1994, pp. 279 & 280. 23 Ibidem, pp. 15 & 16. 24 Ibidem, p. 81.
METHODOLOGY IN JURISPRUDENCE
75
to do. If the analysis succeeds, that suffices to show that ‘law’ is not a family resemblance concept.25 3. The Connection with Practice and the Number of Concepts To say that conceptual analysis is connected with lived experience in some ways leads reasonably to the question —a surprisingly difficult one— of what that connection is.26 Raz27 suggests the following: “The concept of law is a historical product, changing over the years, and the concept as we have it is more recent than the institution it is used to single out”. But the concept of law is not a product of the theory of law. It is a concept that evolved historically, under the influences of legal practice, and other cultural influences, including the influence of the legal theory of the day. In other words, today’s concept of law is different from the concept of law of some generations or centuries in the past. This in turn raises the question of the quantity of concepts of law (more than one over time?, more than one at any given time?), and their parochial or universal nature. When we are analyzing the concept ‘law,’ the modifier we place in the description can be crucial. Are we describing, as in the title to H. L. A. Hart’s book, The Concept of Law, implying that there is (and has always been) only one? Or are we merely offering “a concept of law”, implying that this is merely one possible concept among many.28 Also, even if it is only one possible concept among many (and thus, in a sense, “contingent”, not “necessary”), is the focus on this concept non-arbitrary —that is, is there some good reason why we should look to this concept rather than another? For example, might one argue that we are focusing on a particular concept among different possible concepts because it is 25 Although, of course, the opposite is not the case: the failure of a particular necessary-and-sufficient-conditions analysis does not prove that ‘law’ is a family resemblance concept, though it may help to fuel doubt in that direction. 26 I discuss the issue in Bix, “Conceptual Jurisprudence and Socio-Legal Studies”, Rutgers Law Journal, num. 32, 2000. 27 Op. cit., note 10, pp. 280 & 281. 28 Someone once suggested that the two books, Hart, The Concept of Law, op. cit., note 11; and Rawls, J., A Theory of Justice, Cambridge, Harvard University Press, 1999, might have usefully exchanged articles.
76
BRIAN BIX
“our concept of law”— though contingent, in the sense that there are other concepts of law, this is the one that matches our community’s linguistic practices or general self-understanding? Jules Coleman, in a recent article,29 has advocated thinking in terms of “our concept of law”, tying that position to a somewhat deflationary notion of necessity: The descriptive project of jurisprudence is to identify the essential or necessary features of our concept of law. No serious analytical philosopher... believes that the prevailing concept of law is in any sense necessary: that no other concept is logically or otherwise possible. Nor do we believe that our concept of law can never be subject to revision. Quite the contrary. Technology may someday require us to revise our concept in any number of ways. Still, there is a difference between the claim that a particular concept is necessary and the claim that there are necessary features of an admittedly contingent concept.30
Raz similarly writes of a concept of law that seems to be both contingent and necessary (or, in his somewhat different terminology, both “partial” and “universal”).31 According to Raz: (1) we have a concept of law; (2) based on our society’s self-understanding; and (3) our concept of law has changed over time, in response to changes in institutions, practices, attitudes, and even philosophical theories.32 Let us look more closely at these notions within Raz’s analysis. Raz is not a Platonist, and therefore does not believe that the concept of law is some eternal Platonist Idea, which would be the same for all people or for all times.33 Therefore, it is natural to suspect that the concept we in29 “Incorporationism, Conventionality, and the Practical Difference Thesis”, Legal Theory, num. 59, 1998, p. 393. 30 While I am not entirely sure what Coleman means by technology requiring the revision of a/our concept, the notion of a contingent concept, on its own, seems understandable. 31 Raz, op. cit., note 17, pp. 1-7. 32 Raz, “On the Nature of Law”, Archiv für Rechts und Sozial-Philosophie, 1996; “Two Views of the Nature of the Theory of Law: A Partial Comparison”, Legal Theory, num. 4, 1998; and, “Legal Theory”, in Golding, M. P. & Edmundson, W. A. (eds.), Blackwell Guide to ThePhilosophy of Law and Legal Theory (forthcoming, Oxford, Blackwell, 2004). 33 Contrast Cicero’s comments on “natural law”: True law is right reason in agreement with nature; it is of universal application, unchanging and everlasting... And there will not be different laws at Rome and at Athens, or different laws now and in the future, but one eternal and unchangeable law will be valid for all nations and all times...
METHODOLOGY IN JURISPRUDENCE
77
vestigate is “our concept”, “the product of a specific culture” – our own.34 And since what counts as “law” (under our concept) is independent of a society’s possessing that concept, there were likely earlier cultures or alien cultures that did not or do not “share” or “have” our concept, yet still had law.35 While the concept of law has changed over time—not some unchanging Idea we are “discovering”—Raz treats the/our concept of law as something unique, a matter about which we can be right or wrong in our descriptions, and which we cannot simply re-invent for our own purposes (though he does note that since concepts of law are in flux, our theories of law, even mistaken theories, could influence the concept of law future generations have).36 Similarly, Raz rejects the notion that we (as theorists) can choose a concept of law based, say, on its fruitfulness in further research,37 or even according to its simplicity or elegance;38 rather, it is a concept already present, already part of our self-underMarcus Tullius Cicero, “The Republic,” Book III, xxii, in Cicero, De Re Publica, De legibus, Keyes, W., trans., Cambridge, Harvard University Press 1928, p. 211. I do not mean to imply that Cicero’s view of an ideal law, or an eternal standard for morally judging all positive laws, is the same as modern conceptual analyses of ‘law.’ I use Cicero’s language only to exemplify a view of something unchanging over time and independent of experience. 34 Raz, “On The Nature of Law”, Archiv für Rechts un Sozialphilosophie, num. 82, 1996, p. 5. 35 Ibidem, pp. 4, 5 and 6. 36 Ibidem, p. 7. 37 See, e. g., Raz, Ethics in the Public Domain, Oxford, Clarendon Press, p. 221. “[I]t would be wrong to conclude... that one judges the success of an analysis of the concept of law by its theoretical sociological fruitfulness. To do so is to miss the point that, unlike concepts like ‘mass’ or ‘electron’, ‘the law’ is a concept used by people to understand themselves. We are not free to pick on any fruitful concepts. It is a major task of legal theory to advance our understanding of society by helping us understand how people understand themselves”. Among those who appear to take a contrary view regarding choosing concepts according to usefulness, see, e. g., Leiter, “Realism, Hard Positivism, and Conceptual Analysis”, Legal Theory, num. 4, 1998; Lyons, D., The Ethics and the Rule of Law, Cambridge, Cambridge University Press, 1983, pp. 57-59; Tamanaha, B. Z., “Conceptual Analysis, Continental Social Theory, and CLS: A response to Bix, Rubin and Livingston”, Rutgers Law Journal, num 32, 2000, pp. 283-288. In another work (Bix, Jurisprudence: Theory and Context, 3rd. ed., London, Sweet & Maxwell, 2003, pp. 9-29), I also seem to endorse a contrary view, but I was, and am, more agnostic on this subject than that text might imply. 38 Raz, “Legal Theory”, in Golding, M. P. & Edmundson, W. A. (eds.), Blackwell Guide to The Philosopy of Law and Legal Theory, Oxford, Blackwell, 2004.
78
BRIAN BIX
standing. Raz refers repeatedly to “the concept of law” which “exists independently” of the legal philosophy which attempts to explain it,39 and “the nature of law” which general theories of law must strive to elucidate.40 When these aspects of Raz’s view of the concept of law are combined, they result in a position which might seem problematic in two different ways. First, under Raz’s analysis, the concept may apply to societies who do not or did not have the concept.41 Raz emphasizes that nothing radical is implied or assumed by this position: only that some ways of articulating our understanding of ourselves develop slowly, as do concepts for understanding alien cultures (such understanding requiring the development of concepts which allow us to relate those cultures’ understanding of their practices to our understanding of our own practices).42 As Raz points out, we seem untroubled by this sort of analysis elsewhere: for example, we can talk about the “standard of living” of a society which existed long before that concept had been articulated.43 The second problem is one that some might find harder to shake off: the way Raz combines references to “necessity” with talk of historical contingency. This can be confusing, given the connections, mentioned earlier, within normal philosophical discourse between “necessity” and “the way things must be” or “the way things must be in all possible world”. The “necessity” in conceptual analysis – at least in Raz’s conceptual analysis – is of a “softer” kind, as it were. It means only that these are connections internal to the concept in question (e. g., to be a legal system is to claim authoritative status), a concept which is itself contingent and may be tied to a particular community and time-period. It is perhaps a more Wittgensteinian (or Hegelian) notion, a necessity relative to a society and a time or a “way of life”.
39 40
Raz, op. cit., note 10, pp. 280 and 281 (emphasis added). Raz, “Postema on Law’s Autonomy and Public Practical Reasons: A Critical Comment,” Legal Theory, num. 4, 1998, p. 2 [emphasis added]; see also Raz, “Legal Theory”, op. cit., note 38. 41 See, e. g., Raz, “On The Nature of Law”, Archiv für Rechts un Sozialphilosophie, num. 82, p. 4. “The concept of law is itself a product of a specific culture, a concept which was not available to members of earlier cultures which in fact lived under a legal system”. 42 Raz, “Postema on Law”, op. cit., note 40, pp. 4 and 5. 43 Raz, “Legal Theory”, op. cit., note 38.
METHODOLOGY IN JURISPRUDENCE
79
4. Nominalism and Pluralism As discussed above, there is a strong connection between the view that one can and should offer conceptual analysis of law and the view that general jurisprudence is both possible and valuable. However, as will be seen in the coming sections, one can deny the first and still affirm the second. Some theorists argue that there is no single concept of law, or at least none that should be given priority over all the others. This view is well-presented by Brian Tamanaha’s comment: The project to devise a scientific concept of law was based upon the misguided belief that law comprises a fundamental category. To the contrary, law is thoroughly a cultural construct, lacking any universal nature. Law is whatever we attach the label law to.44 This can be seen to be a nominalist attack on conceptual theory: there is no category (natural or otherwise) “law” “law” is whatever we want it to be, so it is a strange exercise at best to wonder about the ‘nature’ or ‘essential nature’ of something we have constructed (and could construct a different way if we so choose). Perhaps jurisprudence can only be, in a phrase used by one commentator, “a conjunction of lexicography with local history, or... a juxtaposition of all lexicographies conjoined with all local histories”.45 One response to this sort of nominalism (though one more modest or minimalist than Raz would likely offer) is that one need not posit any sort of metaphysical grouping to justify theorizing about concepts. However arbitrary the inclusion or exclusion of items in our category ‘law’, if there is something interesting that can be said about all (and perhaps only) the items in that category, the process of theorizing will have value.46 (One could also come at the question from the other direction, as
44 Tamanaha, Realistic Socio-Legal Theory: Pragmatism and a Social Theory of Law Oxford, Clarendon Press, 1997, p. 128. 45 Finnis, J., Natural Law and Natural Rights, Oxford, Clarendon Press, 1980, p. 4. Finnis’s position, of course, is that Jurisprudence is more than just such a conjunction. See id. at pp. 3-18. 46 Bix, “Conceptual Jurisprudence and Socio-Legal Studies,” Rutgers Law Journal, num. 32, 2000, p. 231.
80
BRIAN BIX
Frederick Schauer47 did, and offer the suggestion that maybe there is a single concept, ‘law’, but nothing interesting can be said about it).48 One can invert the prior point: not that there should be more-or-less arbitrary categories, about which there may or may not be something interesting to say, but rather that we should “build” or “select” the categories which will have the best practical consequences.49 Frederick Schauer, controversially, associates that position with both H. L. A. Hart and Lon Fuller: “Both Fuller and Hart appear equally committed to the belief that giving an account of the nature of law is not so much a matter of discovery as one of normatively-guided construction, with the best account of the nature of law being the one most likely to serve deeper normative goals”.50 5. Doubts About General Jurisprudence A different criticism is offered, albeit more implicitly than expressly, in Ronald Dworkin’s work. Dworkin offers an interpretive approach to law and legal theory, within which he asserts that the interesting work will be at the level of interpretations of particular legal systems, rather than at the level of general theories of law. Dworkin’s position is not so much that theories generally about law are impossible or incoherent, but rather that they are not productive: that there is nothing terribly interesting that one can say about all legal systems, but that there are many things of value one can say about particular legal systems.51 47 48
Schauer, “Fuller’s Internal Point of View”, Law and Philosophy, num. 13, 1994. Schauer, F., “Critical Notice of Roger Shiner, Norm and Nature: The Movements of Legal Thought”, Canadian Journal of Philosophy, num. 24, 1994, p. 508, writes: [N]ot every class that exists in the world is philosophically interesting as a class. The classes “residents of London”, “foods that begin with the letter «Q»”, and “professional basketball players” are all “real” even though they are not natural classes, not ontologically primary, and not of great philosophical interest. Similarly, law may exist as an analogously non-ontologically primary aggregation of individuals, institutions, and practices, undeniably part of the world but simply not having the philosophically interesting core that philosophers of law have often supposed. 49 This is not to be confused with categories that have the best theoretical consequences (consequences for research), a view associated below with Brian Leiter. 50 Schauer, op. cit., note 48, p. 290 [footnote omitted]. 51 It may also be significant that Dworkin sees more general statements about law being tied to quite specific claims made within daily legal practice. He famously states
METHODOLOGY IN JURISPRUDENCE
81
One might respond to Dworkin the same way he has responded to challenges to his right-answer theory based on global indeterminacy or global incommensurability (incomparability). His response has been that arguments cannot, or cannot easily, be made on a global level, but must be made piecemeal. Dworkin’s argument is that for a particular case, one puts up an argument for there being a (certain) right answer, and it is up to the critic to show that for this question there is no right answer, or that the values factored into a possible answer are incommensurable.52 The same sort of response could be offered to Dworkin’s view on the proper scope of legal theory: once a theory purporting to say something interesting about (the concept of) law generally, it will then be proper for critics to show that this theory is faulty in some way. Dworkin’s own work is, at best, doubtful support for this critique. While it is true that he writes of the interpretation of particular legal systems, and doctrinal areas within particular legal systems, he simultaneously makes claims that apply to all legal systems:53 most importantly, that all legal systems – indeed, all social institutions – are (should be) understood through constructive interpretation.54 Also, while he offers one theory in discussions of the legal system of the United States,55 he never indicates that a distinctly different theory would be appropriate for some other, distinctly different legal system (e. g., that of England, France, Iran, or Tibet). (Dworkin, “Legal Theory and the Problem of Sense,” in Gavison, R. (ed.), Issues in Contemporary Legal Philosophy, Oxford, Clarendon Press, 1987, p. 14) that “no firm line divides jurisprudence from adjudication or any other aspect of legal practice”. See Dworkin, Law’s Empire, Cambridge, Harvard University Press, 1986, pp. 102 & 103. 52 Dworkin, Laws Empire, cit., note 51, 1986, pp. 266-275; Id., “On Gaps in the Law,” in Amselek, P. & MacCormick, N. (eds.), Controversies About Law’s Ontology, Edinburgh, Edinburgh University Press, 1991, pp. 89 & 90. 53 Cfr. Raz, “Two Views of the Nature of the Theory of Law: A Partial Comparison”, Legal Theory, num. 4, 1998, p. 282: “the book [Law’s Empire] belies the modesty of passages like the above [Law’s Empire, at pp. 102 and 103]. Time and again, from its beginning to its very last section, it declares itself to be offering an account of law, unqualified, in all its imperial domains”. 54 See Dworkin, R., Law’s Empire, Cambridge, Harvard University Press, 1986, pp. 49-53). Dworkin defines “constructive interpretation” as “a matter of imposing purpose on an object or practice in order to make of it the best possible example of the form or genre to which it is taken to belong.” Id. at p. 52. 55 On some occasions, he makes passing references to the law of England (and Wales), but he has not offered a distinct theory of english law.
82
BRIAN BIX
IV. THE CHALLENGE OF NATURALISM Brian Leiter56 has argued that conceptual analysis is inappropriate for analytical jurisprudence, and should be abandoned for a more naturalistic (that is, more empirical and scientific) methodology, as has occurred in other areas of philosophy. Here, he summarizes (though only partly endorses) a general critique of conceptual analysis:“What is a «concept»? A cynic might say that a «concept» is just what philosophers used to call ‘meaning’ back when their job was the analysis of meaning. But ever since Quine embarrassed philosophers into admitting that they didn’t know what «meanings» were, they started analyzing «concepts» instead”.57 In a way, this challenge to conceptual analysis is related to a nominalist critique. In addition to the responses to the nominalist critique, one might add (as Leiter himself does), “the concept of law” has an advantage over ‘the concept of the good’, in that there is an identifiable set of practices and institutions to ground our discussions.58 The concept of law cannot easily be accused of being an entirely mysterious entity, made up by metaphysicians in their spare time.59 Further, as Jules Coleman has argued,60 the search for analytic truths that W. V. O. Quine criticized is quite different from what modern legal theorists were (and are) doing in their conceptual theories. Neither H. L. A. Hart nor Joseph Raz or Jules Coleman, nor any other prominent legal 56 “Rethinking Legal Realism: Toward a Naturalized Jurisprudence,” Texas Law Review, num. 76, 1997; “Realism, Hard Positivism, and Conceptual Analysis”, Legal Theory, num. 4, 1998; and “Naturalism in Legal Philosophy,” in Zalta, E. N. (ed.), Stanford Encyclopedia of Philosophy [http://plato.satanford.edu], 2003. 57 Leiter, B., “Naturalism in Legal Philosophy”, in Zalta, E. N. (ed.), Stanford Encyclopedia of Philosophy, 1998, p. 535). Leiter continues: “The cynical view has, I believe, a modicum of truth, but it is hardly the whole story.” Id., cfr. Jackson, From Metaphysics to Ethics: A Defence of Conceptual Analysis, Oxford, Clarendon Press, 2000, p. vii) (“Properly understood, conceptual analysis is not a mysterious activity discredited by Quine that seeks after the a priori in some hard-to-understand sense. It is, rather, something familiar to everyone, philosophers and non-philosophers alike”); see also id., pp. 44-46, 52-55 (responding to Quine). 58 Leiter, “Realism, Hard Positivism, and Conceptual Analysis,” Legal Theory, num. 4, 1998, p. 536. 59 Compare Mackie’s (Ethics: Inventing Right and Wrong, 1977) famous accusation that moral objectivism depends on the belief in “queer entities”. 60 Coleman, “Methodology”, in Coleman, Jules L. & Shapiro, Scott (eds.), Handbook of Jurisprudence and Legal Philosophy, Oxford, Oxford University Press, 2002, pp. 343-351.
METHODOLOGY IN JURISPRUDENCE
83
theorist, could reasonably be understood as trying to determine the analytical “essence” of some trans-historical trans-empirical (platonic) idea.61 V. DESCRIPTION AND SELECTION While analytical legal theorists frequently refer to their theories about the nature of law as ‘descriptive’, the sense in which such theories can be, or should be, descriptive requires further elaboration. While H. L. A. Hart famously referred to his book, The Concept of Law, as an exercise in “descriptive sociology”62 he knew that his theory was hardly “mere description” (and it warranted the term “sociology” only in the broadest sense of that term, but that is another issue). He did not want to discuss what was common to all rule-guidance and dispute-resolution systems that we might call “law”. He emphasized that his focus was on the more sophisticated or more mature legal systems, and on systems ‘accepted’ by at least some of their members as giving reasons for action (that is, as giving reasons for action beyond the fear of sanctions).63 This basic methodological point was elaborated and clarified by later theorists:64 the construction of a theory of law is inevitably a matter of selection and evaluation. Some basis is required for selection, under Hart’s approach: that law should be analyzed in its fullest and richest sense (not what is universal to all instances we might be inclined to call “law”), and that the analysis of a legal system should take into account the perspective of someone who accepts the legal system.65 Finnis re-characterizes the process (using ideas from Aristotle and Max Weber) as one of seeking the “ideal type” or “central case” of law.66 Other theorists, emphasize other aspects of the process of selection within theory-production: e. g., that one should prefer theories that are simple, comprehensive, and coherent,67 and that a 61 Coleman, The Practice of Principle, Oxford, Oxford University Press, 2001., pp. 210-217; id., Handbook…, cit., note 60, pp. 350 and 351. 62 Hart, op. cit., footnote 11, p. v. 63 Hart, op. cit., footnote 11, pp. 14-17, 116 and 117. 64 Finnis, op. cit., footnote 45, pp. 3-18; Raz, Ethics in the Public Domain, Oxford, Clarendon Press, 1994, pp. 219-221. 65 Hart, op. cit., footnote 22, 1994, p. 98; Finnis, op. cit., footnote 45, pp. 6 & 7. 66 Finnis, op. cit., footnote 45, pp. 9-11. 67 Waluchow, Inclusive Legal Positivism, Oxford, Clarendon Press, 1994, pp. 19-29.
84
BRIAN BIX
legal theory should strive to identify the “central, prominent, important” features of law68 Legal positivists emphasize that such evaluation should not be confused with moral evaluation.69 However, if the construction of a theory comes down to judgments of “importance” and “significance”, this hardly seems the most stable or objective basis for a discussion. “Importance” and “significance” seem like relative terms —“important” for whom? “significant” relative to which purpose? These evaluations seem likely to be matters over which reasonable observers could disagree— and disagree sharply. One response would be that the possibility of reasonable disagreement need not rebut the view that a theory about the nature of law need not turn on moral evaluation of the law. However, it is just the argument of theorists like Stephen Perry70 that choices among different tenable theories about the nature of law can only be made on the basis of moral evaluation. Raz’s references to “the concept of law”, and even to the way “concepts emerge within a culture at a particular juncture”,71 seem to assume that there is only one concept of law (or, perhaps more precisely, only one concept of law for us in the present era), but the view is, of course, not self-evident. When Raz and Coleman and others try to defend a conceptual jurisprudence unconnected with classical Platonism, this approach has the advantage of not being burdened with a metaphysics many people find unlikely (at least where applied to social practices and institutions). On the other hand, Platonism has the relative advantage of explaining why it is that there is a single (correct) answer to conceptual inquiries about law. When we move from ‘the concept of law’ to ‘our concept of law,’ there is more work to be done in justifying the assumption or conclusion that there is only one such concept. In fact, important work by Stephen Perry has argued forcefully for the claim that there is more than one tenable theory about the nature of law (grounded on different tenable theories about the purpose of law), and the choice among 68 Raz, “The Morality of Obedience,” Michigan Law Review, num. 83, 1985, p. 735; cfr. Raz, op. cit., footnote 64, pp. 219-221; Dickson, Evaluation and Legal Theory, Oxford, Hart Publishing, 2001. 69 See Coleman, op. cit., footnote 61, pp. 175-197; Dickson, op. cit., footnote 68, 2001. 70 “Interpretation and Methodology,” in A. Marmor (ed.), Law and Interpretation, Oxford, Clarendon Press, 1995; id., “The Varieties of Legal Positivism”, Canadian Journal of Law and Jurisprudence, num. 9, 1996. 71 Raz, op. cit., footnote 64, p. 4.
METHODOLOGY IN JURISPRUDENCE
85
them must be made on moral or political grounds.72 In the jurisprudential literature on methodology, there remains substantial controversy regarding whether there are in fact choices that need to be made among tenable theories of law (or among the tenable purposes of law that ground these alternative theories), and about whether such choices are necessarily normative, or can be justified on conceptual or morally neutral meta-theoretical grounds.73 Perhaps we should at least be open to the possibility that our society contains multiple and conflicting concepts of law; perhaps, as Gallie, W. B.74 suggested for the concepts of “art” and “democracy”, our concept of “law” is essentially contested (grounded in different tenable interpretations of a complex paradigm or set of paradigms). VI. THE INTERNAL POINT OF VIEW, AND THE CHALLENGE OF IDEOLOGY H. L. A. Hart, under the influence of Max Weber, Peter Winch, and others, led English-language analytical jurisprudence to a “hermeneutic turn”.75 The basic idea is that since social practices and social institutions are purposive activities, a purely external theory or description will be inadequate. Theorists must take into account the purposes and perceptions of participants in the practice. Austin’s work can be seen as having tried to find a ‘scientific’ approach to the study of law, and this scientific approach included trying to explain law in empirical terms: an empirically observable tendency of some to obey the commands of others, and the ability of those others to impose sanctions for dis obedi ence. 76 Hart criti cized Austin’s ef forts 72 Perry, “Interpretation and Methodology”, in Marmor, A. (ed.), Law and Interpretation, Oxford, Clarendon Press, 1995; Id., “The Varieties of Legal Positivism”, Canadian Journal of Law and Jurisprudence, num. 9, 1996. See also Leiter, “Realism, Hard Positivism, and Conceptual Analysis”, Legal Theory, num. 4, 1998. 73 For a response to Perry, arguing that there are sufficient resources in conceptual analysis to choose, see Coleman, J. L., The Practice of Principle, Oxford, Oxford University Press, 2001, pp. 197-210. 74 “Essentially Contested Concepts”, Proceedings of the Aristotelian Society, num. 56, 1955 and 1956. 75 Hart, op. cit., footnote 22; see also Morawetz, “Law as Experience: Theory and the Internal Aspect of Law”, SMU Law Review, num. 52 1999; Bix, “H. L. A. Hart and the “Hermeneutic Turn in Legal Theory”, SMU Law Review, num. 52, 1999. 76 Austin, The Province of Jurisprudence Determined, Cambridge, Cambridge University Press, 1995, pp. 21-26.
86
BRIAN BIX
to reduce law to empirical terms of tendencies and predictions,77 for to show only that part of law that is externally observable is to miss a basic part of legal practice: the acceptance of those legal norms, by officials and citizens, as giving reasons for action.78 The attitude of those who accept the law cannot be captured easily by a more empirical or scientific approach, and the advantage of including that aspect of legal practice is what pushed Hart towards a more “hermeneutic” approach. Hart’s hermeneutic turn involved the grounding of his theory of law on the perceived differences (1) between acting out of habit and acting according to a rule; and (2) between being obliged and having an obligation.79 According to Hart, a person takes an “internal point of view” towards some norm when that person uses the norm as a justification for action, and the basis for criticism (and self-criticism) on observing deviation from the norm. Hart added that for a legal system to exist, the officials of the system must have an internal point of view to the system’s criteria of validity (‘the rule of recognition’) and the citizens must be in general compliance with the system’s rules.80 One can, of course, reject or modify Hart’s particular use of the internal point of view81 without rejecting his basic point that taking into account the participant’s perspective is crucial for a successful theory of law – or any other social practice or social institution. (For example, one might argue that Hart’s theory fails by emphasizing the internal perspective of the system’s officials rather than the internal perspective of citizens.) A more basic challenge to a hermeneutic approach is likely to come from two arguments (which sometimes seem to overlap). First, some would argue that a more empirical, scientific approach is better (more objective, less likely to be tainted by bias, and/or more likely to lead to useful insights and successful predictions). Second, some are concerned about the biases inherent in the participants’ perspective, biases sometimes characterized in terms of self-deception and sometimes 77 A similar effort, to reduce law to empirical terms, was offered by the Scandinavian legal realists (e. g., Olivecrona, K., Law as Fact, 2nd. ed., London, Stevens & Sons, 1971); and Hart (Essays in Jurisprudence and Philosophy,1983, pp. 161-169) criticized those theorists for those attempts. 78 Hart, op. cit., footnote 22, pp. 13, 55-58, 82-84, 88-91, 99. 79 Ibidem, pp. 9 and 10, 55-58. 80 Ibidem, p. 116. 81 For example, Finnis offers a modification of Hart’s internal point of view in his work. Finnis, J., op. cit., note 45, pp. 6-18.
METHODOLOGY IN JURISPRUDENCE
87
in terms of ideology.82 The first challenge just re-states the basic methodological debate from the social sciences, which cannot be resolved here, though one should note that most writers in the area seem to believe that a hermeneutic approach – or a hermeneutic approach supplemented at the margins with a more behaviorist approach – is superior83 and one can see how the first challenge (social sciences behaviorism versus hermeneutic approaches) merges into the second (ideology): focusing on the internal perspective of participants in a practice is open to the criticism that the participants are in fact deluded about the significance of the practice or their participation in it, or the argument that the participants’ perspective is distorted in some important way. If that is the case, then this distortion is an important part of the story that theory should tell.84 One response might be that though the claim of general error, bias, or ideology is a potentially crushing argument against conventional social theories, it would have significantly less critical power against a theory about the nature of law. One could of course argument that a particular theory of the nature of law reflected the political biases of its author, or was merely a reflection of the cultural moment, or worked obliquely to legitimate injustice, but these claims, even if true, would not be conclusive of the validity of the theory (though they might, of course, make us less confident regarding the theory’s validity).The theory would rise and fall on other grounds; there are criteria for selecting better theories from worse theories.85 82
Here I am using “ideology” in its sense of unconscious coloring or distortion of perception (both variants traceable to Marx) (Williams, R., Keywords: A Vocabulary of Culture and Society, New York, Oxford University Press, 1976, pp. 126-130), rather than in the sense of a more conscious or articulated political program (e. g., Kennedy, D., A Critique of Adjudication (fin de siècle), Cambridge, Harvard University Press, 1997, pp. 41-44). 83 Tamanaha, Realistic Socio-Legal Theory: Pragmatism and a Social Theory of Law, Oxford, Clarendon Press, 1997, pp. 58-90. 84 Lucy, Understanding and Explaining Adjudication, Oxford, Oxford University Press 1999, p. 69 and 70. 85 Of course, one can argue that most of these criteria, or their applications in the past, have themselves been tainted by ideological distortion. However, if the notion of ideology itself assumes that one can distinguish truth from distortion, and thereby assumes that in some way it must be possible to distinguish true theories from false ones, or at least less distorted theories from more distorted ones.
88
BRIAN BIX
VII. LEGAL POSITIVISM VS. NATURAL LAW One reason why natural law theorists and legal positivists frequently seem to be talking past one another is that they have quite different starting points about what law is, and what legal theory should be trying to do. Legal positivists (with the possible, though important exception of Hans Kelsen, discussed briefly in the next section) tend to focus on law as a kind of social system. This is well-phrased by H. L. A. Hart:86 “[T]here is a standing need for a form of legal theory or jurisprudence that is descriptive and general in scope, the perspective of which is… that of an external observer of a form of social institution with a normative aspect, which in its recurrence in different societies and periods exhibits many common features of form, structure, and content”. By contrast, natural law theorists focus on law as a kind of reason-giving practice.87 Law gives reasons for action, at least (many would say) when it is consistent with higher moral standards. (Natural law theorists are here focusing on the moral reasons for action that law may (sometimes) offer, not on the prudential reasons that legal sanctions (like all threats of force or public shame) may entail.) This aspect of law points the attention of theorists to the congruence of particular laws, and particular legal systems, with moral criteria, to determine when law adds to the list of our moral reasons for action. For this broader category of theorizing about reason-giving practices, there would be obvious tensions in any effort to create a ‘descriptive’ or ‘neutral’ theory of an intrinsically evaluative practice. At the least, there are evident arguments for preferring a perspective on reason-giving practices that would reflect on their merits according to their ultimate purposes.88 It seems inevitable that a focus on law as a reason-giving activity, a focus on when or how legal systems create new moral reasons for action, will take us in a different direction from a study of law as a particular kind of social institution, and vice versa. 86 “Comment” in Gavison, Ruth (ed.), Issues in Contemporary Legal Philosophy, Oxford, Clarendon Press, 1987, p. 36. 87 Finnis, “On the Incoherence of Legal Positivism”, Notre Dame Law Review, num. 75, 2000, pp. 1602-1604. 88 Cfr. Finnis, “Natural Law: The Classical Tradition,” in Coleman, Jules L. & Shapiro, Scott (eds.), Handbook of Jurisprudence and Legal Philosophy, Oxford, Oxford University Press, 2002; Id., op. cit., footnote 87.
METHODOLOGY IN JURISPRUDENCE
89
It may well be that law’s double nature – as a social institution and as a reason-giving practice – makes it impossible to capture the nature of law fully through any one approach, with a more ‘neutral’ approach (like legal positivism) required to understand its institutional side, and a more evaluative approach (like natural law theory) required to understand its reason-giving side. VIII. KELSEN AND NORMATIVE LOGIC In English-speaking countries, the best-known legal positivist theory (and, along with Ronald Dworkin’s interpretive approach, one of the two best-known legal theories of any kind) is that of H. L. A. Hart, already discussed at length. However, in other countries, the legal positivism of Hans Kelsen89 is far better known than that of Hart, and Kelsen’s “pure theory of law” is highly influential. Kelsen’s work does not fit comfortably within the structure of the analysis given so far, but its methodological assumptions are of obvious importance. Kelsen’s work has certain external similarities to Hart’s theory, but it is built from a distinctly different theoretical foundation: a neo-Kantian derivation, rather than (in Hart’s case) the combination of social facts, hermeneutic analysis, and ordinary language philosophy.90 Kelsen applied something like Kant’s Transcendental Argument to law: his work can be best understood as trying to determine what follows from the fact that people sometimes treat the actions and words of other people (legal officials) as valid norms91 Kelsen’s work can be seen as drawing on the logic of normative thought. Every normative conclusion (e. g., “one 89 Pure Theory of Law, Berkeley, University of California Press, 1967; id., Introduction to the Problems of Legal Theory, Oxford, Clarendon Press, 1992. 90 Kelsen’s ideas developed and changed over the course of six decades of writing; the claims made about his work here apply to most of what he wrote, but will generally not apply to his last works (Kelsen, General Teory of Norms, Oxford, Clarendon Press, 1991), when he mysteriously rejected much of the theory he had constructed during the prior decades (Hartney, “Introduction”, in Kelsen, op. cit., supra, pp. xxxvii - liii; Paulson & Paulson (eds.), Normativity and Norms: Critical Perspectives on Kelsenian Themes, Oxford, Clarendon Press, 1998, p. vii; and Paulson, “Kelsen’s Legal Theory; The Final Round” Oxford Journal of Legal Studies, num. 12, 1992). This section discusses the main body of Kelsen’s writings, but does not purport to cover all its permutations, especially excluding the views in his last works. 91 Paulson, “The Neo-Kantian Dimension of Kelsen’s Pure Theory of Law”, Oxford Journal of Legal Studies, num. 12, 1992.
90
BRIAN BIX
should not drive more than 55 miles per hour” or “one should not commit adultery”) derives from a more general or more basic normative premise. This more basic premise may be in terms of a general proposition (e. g., “do not harm other human beings needlessly” or “do not use other human beings merely as means to an end”) or it may be in terms of authority (“do whatever God commands” or “act according to the rules set down by a majority in Parliament”). Thus, the mere fact that someone asserts or assumes the validity of an individual legal norm (“one cannot drive faster than 65 miles per hour”) is implicitly to affirm the validity of the foundational link of this particular normative chain (“one ought to do whatever is authorized by the historically first constitution of this society”). Like John Austin, but unlike Hart, Kelsen is a “reductionist”: trying to understand all legal norms as variations of one kind of statement. In Austin’s case, all legal norms were to be understood in terms of commands (of the sovereign); in Kelsen’s case, all legal norms are to be understood in terms of an authorization to an official to impose sanctions (if the prescribed standard is not met). Kelsen’s work diverges from the usual approach of Anglo-American (in particular, Hartian) legal positivism, in that it is not grounded on the view of law as a social institution, while also diverging from the natural law view of law as a factor in practical reasoning. Kelsen’s analysis is of law as a particular kind of normative thought (differing from Hartian legal positivism in not emphasizing, while also not denying, the social-fact basis of law; and differing from natural law in separating legal normativity from moral normativity, rather than analyzing how the first affects the second). IX. TRUTH AND THE NATURE OF LAW While this is a paper about methodology and not about legal truth, it may be worth noting briefly how some of the same matters that raise particular methodological issues for analytical jurisprudence also raise questions for discussions of truth in legal and jurisprudential propositions. This is particularly true for law’s double-nature,92 discussed earlier: that 92 See Finnis, “Natural Law: The Classical Tradition,” in Coleman, Jules L. & Shapiro, Scott (eds.), Handbook of Jurisprudence and Legal Philosophy, Oxford, Oxford University Press, 2002, pp. 11 & 12.
METHODOLOGY IN JURISPRUDENCE
91
it is both a set of past and present actions by officials, and a mode of thinking meant to affect our practical reasoning. In different terms, it is both “will” and “reason”.93 In fact, one thing that makes law distinctive from morality is that it is, as a practical matter if not by conceptual necessity, a mixture of both “will” and “reason” And it is this intertwining of reason and will, of normative system and practical reasoning, which makes assertions about the nature of legal truth, and theories about the nature of law, so difficult. There are a number of other aspects of legal practice that will also raise problems regarding truth in law. Any theory about the nature of ‘truth’ within law (or about the nature of law generally) must be able to deal with two aspects of legal practice true of most modern legal systems: (1) that the decisions of certain legal officials have authority, at least until expressly reversed, even when those officials have acted in a mistaken interpretation of the relevant legal texts or even when they have acted beyond the scope of their authority; and (2) officials applying legal texts are often ordered or authorized to make the all-things-considered morally best decision, taking into account the legal sources, but not necessarily confined to those sources. X. CONCLUSION Most of the prominent contemporary theories about the nature of law tend to assume that it is possible and valuable to do general jurisprudence, and that conceptual analysis is the appropriate approach. However, these basic methodological positions have been subject to challenge, and they require justification. Conceptual analysis in jurisprudence needs to be defended against the naturalist critique; and those who would justify general jurisprudence on grounds other than (an unlikely) Platonism about law need to clarify whether the choice among competing theories can be made on purely conceptual and meta-theoretical grounds, or whether moral evaluation is inevitably part of the process.
93 Bix, “Will versus Reason: Truth in Natural Law, Positive Law, and Legal Theory”, Truth, Washington, D. C., The Catholic University of America Press, 2004.
92
BRIAN BIX
XI. BIBLIOGRAPHY ARISTOTLE, The Complete Works of Aristotle, BARNES, J. (ed.), Princeton, Princeton University Press, 1984. AUSTIN, J., The Province of Jurisprudence Determined, RUMBLE, W. E. (ed.) Cambridge, Cambridge University Press, 1995. BIX, B., “Conceptual Jurisprudence and Socio-Legal Studies”, Rutgers Law Journal, num. 32, 2000. ———, “H. L. A. Hart and the Hermeneutic Turn in Legal Theory”, SMU Law Review, num. 52, 1999. ———, Jurisprudence: Theory and Context, 3rd. ed., London, Sweet & Maxwell, 2003. ———, Law, Language and Legal Determinacy, Oxford, Oxford University Press, 1993. ———, “Will versus Reason: Truth in Natural Law, Positive Law, and Legal Theory”, Truth PRITZL, Kurt (ed.), forthcoming, Washington, D. C., The Catholic University of America Press, 2004. BLACKBURN, S., The Oxford Dictionary of Philosophy, Oxford, Oxford University Press, 1994. BURTON, S. J., “Law, Obligation, and a Good Faith Claim of Justice”, California Law Review, num. 73, 1985. CICERO, M. T., Cicero: De Re Publica, De Legibus, W. Keyes, trans., Cambridge, Harvard University Press, 1928. COHEN, F.,“Transcendental Nonsense and the Functional Approach”, Columbia Law Review, num. 35, 1935. COLEMAN, J. L.,“Incorporationism, Conventionality, and the Practical Difference Thesis”, Legal Theory, num. 4, 1998. ———, “Methodology”, in COLEMAN, Jules L. & SHAPIRO, Scott (eds.) & HIMMA, Kenneth Einar (assoc. ed.) Handbook of Jurisprudence and Legal Philosophy, Oxford, Oxford University Press, 2002. ———, The Practice of Principle, Oxford, Oxford University Press, 2001. DICKSON, J., Evaluation and Legal Theory, Oxford, Hart Publishing, 2001. DWORKIN, R., Law’s Empire, Cambridge, Harvard University Press, 1986. ———, “Legal Theory and the Problem of Sense”, in GAVISON, R. (ed.), Issues in Contemporary Legal Philosophy, Oxford, Clarendon Press, 1987.
METHODOLOGY IN JURISPRUDENCE
93
———, “On Gaps in the Law,” in AMSELEK, P. & MACCORMICK, N. (eds.), Controversies About Law’s Ontology, Edinburgh, Edinburgh University Press, 1991. ———, “A Reply”, in COHEN, M. (ed.), Ronald Dworkin and Contemporary Jurisprudence, London, Duckworth, 1984. FINNIS, J., “On the Incoherence of Legal Positivism”, Notre Dame Law Review, num. 75, 2000. ———, Natural Law and Natural Rights, Oxford, Clarendon Press, 1980. ———, “Natural Law: The Classical Tradition”, in COLEMAN, Jules L. & SHAPIRO, Scott (eds.) & HIMMA, Kenneth Einar (assoc. ed.) Handbook of Jurisprudence and Legal Philosophy, Oxford, Oxford University Press, 2002. GALLIE, W. B., “Essentially Contested Concepts,” Proceedings of the Aristotelian Society, num. 56, 1955-1956. GETTIER, E. L., “Is Justified True Belief Knowledge?”, Analysis, num. 23, 1963. GLOCK, H.-J., A Wittgenstein Dictionary, Oxford, Blackwell, 1996. HART, H. L. A., “Comment”, in GAVISON, Ruth (ed.), Issues in Contemporary Legal Philosophy, Oxford, Clarendon Press, 1987. ———, The Concept of Law, 2nd .ed., Oxford, Clarendon Press, 1994. ———, Essays in Jurisprudence and Philosophy, 1983. HARTNEY, M., “Introduction”, in KELSEN, H., General Theory of Norms, HARTNEY, M. (ed.), Oxford, Clarendon Press, 1991. JACKSON, F., From Metaphysics to Ethics: A Defence of Conceptual Analysis, Oxford, Clarendon Press, 2000. KELSEN, H., Pure Theory of Law, M. Knight, trans., Berkeley, University of California Press, 1967. ———, General Theory of Norms, HARTNEY, M. (ed. and trans.), Oxford, Clarendon Press, 1991. ———, Introduction to the Problems of Legal Theory, B. L. Paulson & S. L. Paulson, trans., Oxford, Clarendon Press, 1992. KENNEDY, D., A Critique of Adjudication (fin de siècle), Cambridge, Harvard University Press, 1997. KRAMER, M. H., In Defense of Legal Positivism, Oxford, Clarendon Press, 1999.
94
BRIAN BIX
KRIPKE, S. A., Naming and Necessity, Cambridge, Harvard University Press, 1972. LEITER, B., “Naturalism in Legal Philosophy”, in ZALTA, E. N. (ed.), Stanford Encyclopedia of Philosophy, [http://plato.stanford.edu], Spring, 2003. LEITER, B.,“Realism, Hard Positivism, and Conceptual Analysis”, Legal Theory, num. 4, 1998. LEITER, B., “Rethinking Legal Realism: Toward a Naturalized Jurisprudence”, Texas Law Review, num. 76, 1997. LUCY, W., Understanding and Explaining Adjudication, Oxford, Oxford University Press, 1999. LYONS, D., “Book Review (reviewing Neil MacCormick, H. L. A. Hart)”, Cornell Law Review, num. 68, 1983. LYONS, D., Ethics and the Rule of Law, Cambridge, Cambridge University Press, 1983. MACKIE, J. L., Ethics: Inventing Right and Wrong, Harmondsworth, Penguin, 1977. MOORE, M. S., “Hart’s Concluding Scientific Postscript”, Legal Theory, num. 4, 1998. MOORE, M. S.,“Law as a Functional Kind”, in GEORGE, R. P. (ed.), Natural Law Theory: Contemporary Essays, Oxford, Clarendon Press, 1992. MORAWETZ, T., “Law as Experience: Theory and the Internal Aspect of Law”, SMU Law Review, num. 52, 1999. MURPHY, L., “The Political Question of the Concept of Law,” in COLEMAN, J. L. (ed.), Hart’s Postscript, Oxford, Oxford University Press, 2001. OLIVECRONA, K., Law as Fact, 2nd. ed., London, Stevens & Sons, 1971. PAULSON, S. L., “Kelsen’s Legal Theory: The Final Round”, Oxford Journal of Legal Studies, num. 12, 1992. ———, “The Neo-Kantian Dimension of Kelsen’s Pure Theory of Law”, Oxford Journal of Legal Studies, num. 12, 1992. ——— and PAULSON, B. L. (eds.), Normativity and Norms: Critical Perspectives on Kelsenian Themes, Oxford, Clarendon Press, 1988. PERRY, S. R., “Interpretation and Methodology”, in MARMOR, A. (ed.), Law and Interpretation, Oxford, Clarendon Press, 1995.
METHODOLOGY IN JURISPRUDENCE
95
———, “The Varieties of Legal Positivism”, Canadian Journal of Law and Jurisprudence, num. 9, 1996. PUTNAM, H., “The Meaning of ‘Meaning’”, Mind, Language and Reality: Philosophical Papers Vol. 2, Cambridge, Cambridge University Press, 1975. RAWLS, J., A Theory of Justice, Cambridge, Harvard University Press, 1999. RAZ, J., The Authority of Law, Oxford, Clarendon Press, 1979. ———, The Concept of a Legal System, 2nd. ed., Oxford, Clarendon Press, 1980. ———, Engaging Reason, Oxford, Clarendon Press, 1999. ———, Ethics in the Public Domain, Oxford, Clarendon Press, 1994. ———, “Legal Theory”, in GOLDING, M. P. & EDMUNDSON, W. A. (eds.), Blackwell Guide to The Philosophy of Law and Legal Theory, Oxford, Blackwell, 2004. ———, The Morality of Freedom, Oxford, Clarendon Press, 1986. ———, “The Morality of Obedience”, Michigan Law Review, num. 83, 1985. ———, “On the Nature of Law (Kobe Lectures of 1994)”, Archiv für Rechts- und Sozialphilosophie, num. 82, 1996. ———, “Postema on Law’s Autonomy and Public Practical Reasons: A Critical Comment”, Legal Theory, num. 4, 1998. ———, Practical Reason and Norms, Princeton, Princeton University Press, 1990. ———, The Practice of Value, Oxford, Clarendon Press, 2003. ———, “Two Views of the Nature of the Theory of Law: A Partial Comparison”, Legal Theory, num. 4, 1998. ———, Value, Respect, and Attachment, Cambridge, Cambridge University Press, 2001. ROSS, A., On Law and Justice, Berkeley, University of California Press, 1959. SCHAUER, F.,“Critical Notice of Roger Shiner, Norm and Nature: The Movements of Legal Thought”, Canadian Journal of Philosophy, num. 24, 1994. ———, “Fuller’s Internal Point of View”, Law and Philosophy, num. 13, 1994.
96
BRIAN BIX
SOPER, P.,“Legal Systems, Normative Systems, and the Paradoxes of Positivism”, Canadian Journal of Law and Jurisprudence, num. 8, 1995. STAVROPOULOS, N., Objectivity in Law, Oxford, Clarendon Press, 1996. TAMANAHA, B. Z., “Conceptual Analysis, Continental Social Theory, and CLS: A Response to Bix, Rubin and Livingston”, Rutgers Law Journal, num. 32, 2000. ———, “The Folly of the ‘Social Scientific’ Concept of Legal Pluralism,” Journal of Law and Society, 20, 1993. ———, Realistic Socio-Legal Theory: Pragmatism and a Social Theory of Law, Oxford, Clarendon Press, 1997. ———, “Socio-legal Positivism and a General Jurisprudence”, Oxford Journal of Legal Studies, num. 21, 2001. WALUCHOW, W. J., Inclusive Legal Positivism, Oxford, Clarendon Press, 1994. WILLIAMS, R., Keywords: A Vocabulary of Culture and Society, New York, Oxford University Press, 1976. WITTGENSTEIN, L., Philosophical Investigations, 3rd. ed., Oxford, Basil Blackwell, 1958.
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE. PRIMERAS APROXIMACIONES Leticia BONIFAZ A.* SUMARIO: I. Introducción. II. La relación entre el autor y su obra. III. La autoridad del intérprete. IV. Los límites de la interpretación.
I. INTRODUCCIÓN Con el presente trabajo buscamos hacer un primer acercamiento para mostrar las semejanzas y diferencias que existen entre la interpretación en el derecho y en el arte; los problemas que comparten y las reflexiones que sobre los mismos se han formulado. La premisa de la que se parte es ésta: tanto el derecho como las obras de arte son creaciones humanas y existen para ser interpretadas. Aunque las obras de arte atienden más a los sentimientos que a la razón, en la historia del pensamiento se ha dado todo un proceso de racionalización respecto del arte. En la Edad Media se elaboraron un buen número de teorías sobre lo bello. Para San Agustín, por ejemplo, lo bello requiere tres condiciones: cierto orden y un modo y aspecto conveniente. Para Descartes, una percepción es placentera cuando existe una cierta proporción entre el objeto percibido y el sentido percipiente.1 David Sobrevilla señala que en la antigüedad se pensaba que la poesía y la música respondían a la inspiración y las artes plásticas y la arquitectura obedecían a reglas.2 En lo personal, considero que esta distinción no es del todo válida ya que todas las artes están ligadas con la inspiración y también todas obedecen a ciertos parámetros, moldes, pautas o re* Facultad de Derecho, UNAM, México. 1 Citados por David Sobrevilla, “El surgimiento de la estética. Del Renacimiento a la Ilustración”, Enciclopedia Iberoamericana de Filosofía, Trotta, núm. 6, pp. 163 y ss. 2 Ibidem, p. 163. 97
98
LETICIA BONIFAZ A.
glas que, por cierto, pueden irse modificando al nacer nuevas corrientes de expresión y propuestas dentro del propio arte. Vale la pena resaltar esto porque, independientemente de la inspiración, sentimiento, intención y razones del artista, en el momento de la interpretación que formula alguien distinto al artista, siempre se echa mano de los parámetros establecidos como pauta para armar las conclusiones.3 Con la poesía, por ejemplo, el poeta quiere comunicar, pero, sobre todo, trasmitir emociones. Como en toda lírica, se busca que haya sonoridad, música en las palabras. Se pueden usar, como en el caso del Altazor de Huidobro, palabras que en estricto sentido gramatical no significan nada, pero que en el poema tienen gran fuerza, como es el caso de la conversión de la golondrina, en golontrina: golonclima, goloniña o golonrisa...4 En este trabajo vamos a reflexionar acerca de lo que es la interpretación, de quiénes están facultados para interpretar y si existen límites para la misma, así como los parámetros que se han construido, manteniendo en todo momento el esquema comparativo entre el derecho y el arte. La razón de la comparación estriba en que creemos que la relación entre el legislador, la ley y el juez puede ser muy semejante a aquella que se da entre el artista, su obra y el intérprete. Por ello, se buscará hacer evidentes algunas similitudes entre la interpretación jurídica y la interpretación en las artes: música, literatura, pintura, teatro, escultura, poesía y arquitectura, entre otras. Algunos teóricos del derecho contemporáneos como Ronald Dworkin o Joseph Raz han hecho algunas alusiones a la literatura y, en general, a las artes, que rescataremos en este trabajo. 3 Leonardo Da Vinci (1452-1519) es de los pocos artistas que también teorizó sobre el arte. A su muerte, dejó una gran cantidad de manuscritos sobre arte. “Pintar [decía] consiste en recrear el mundo visible. La pintura muestra la esencia de un objeto en la facultad visual constituyendo al mismo tiempo esa armónica proporción de las partes que constituyen el todo para contento del ojo”. Por su parte, Miguel Ángel, en el Alto Renacimiento, reacciona contra el arte clásico. “La belleza no es tanto una cuestión de reglas sino que está basada sobre las imágenes del intelecto y el juicio de los ojos del artista, No es que las formas no existan: en su actualidad las capta éste con su mente y potencialmente ellas se dan de manera escondida”. Para Miguel Ángel, la belleza se manifiesta sobre todo al corazón. Para Alberto Durero (1471-1528) el arte consiste en la habilidad productiva que debe ir acompañada de talento y entrenamiento. No hay una sola proporción humana ideal. Durero representa el pluralismo estético con enfoque empírico. 4 Cfr. Huidobro, Vicente, Altazor, 7a. ed., México, Coyoacán, 2002.
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE
99
Ronald Dworkin en un ensayo denominado Law as Interpretation dice que “Las teorías del arte no existen aisladas de la filosofía, de la psicología, de la sociología y de la cosmología. Alguien que acepte un punto de vista religioso probablemente tendrá una teoría del arte distinta de alguien que no lo tenga”.5 Las diferentes teorías del arte, dice Dworkin, se generan desde diferentes teorías de la interpretación. En How Law is Like Literature,6 Dworkin dice que “hay importantes diferencias entre la idea de consistencia usada en las referencias legales y la idea de narrativa consistente en la literatura”. Los estudiantes de literatura hacen muchas cosas bajo el título “interpretación” y “hermenéutica” y muchas veces le llaman “descubrir el sentido del texto”. Cuando una regla no es clara en algún punto porque uno de los términos cruciales es vago o ambiguo, los juristas dicen que esa regla debe ser interpretada aplicando techniques of statutory construction. En gran parte de la literatura jurídica se asume que la interpretación de un documento particular es un descubrimiento de lo que el autor (los legisladores o los constituyentes) quisieron decir usando esas palabras. Pero muchos juristas reconocen que, en muchos casos, el autor no tuvo una intención particular y, en otros, la intención no puede ser descubierta. Algunos juristas asumen una posición escéptica al respecto. Dicen que cuando algunos jueces pretenden descubrir la intención que hay detrás de un trozo de legislación se trata de una cortina de humo que el juez usa para imponer su propio punto de vista de lo que la norma debe decir.7 Para Dworkin, “decidir casos en derecho es como los ejercicios interpretativos en la literatura. La similitud es más evidente cuando los jueces consideran y deciden casos en el common law, esto es, cuando la ley no es la figura central sino los argumentos se toman a partir de principios de derecho presentes en las decisiones de otros jueces en el pasado”. 8 “El derecho, a diferencia de la literatura —dice el filósofo del derecho norteamericano— no es una empresa artística. El derecho es una empresa política que en términos generales busca la coordinación social y los esfuerzos individuales, resolver disputas individuales y colectivas, o se-
5 6 7 8
Dworkin, Ronald, A Matter of Principle, Harvard University Press, 1985, p. 151. Ibidem, pp. 146-166. Cfr. Dworkin, op. cit., nota 5, p. 148. Idem.
100
LETICIA BONIFAZ A.
guridad jurídica entre ciudadanos y entre ellos y el gobierno o alguna combinación de éstas.”9 “El deber del juez es —dice Dworkin— encontrar la historia legal, no inventar la mejor historia. En la literatura, en cambio, se pueden encontrar biografías noveladas o la historia hecha novela”.10 En el derecho, aunque se pueden tomar casos como materia prima para un cuento o novela, la pretensión de quien narra los hechos es convencer de que las cosas sucedieron del modo como se señala en el texto, e importa, sobre todo, la manera ordenada como se dé la narración, aunque no lleve elegantes giros lingüísticos ni cuidadosas construcciones literarias. En la literatura y en el cine es válido jugar con los tiempos, comenzar incluso por el final, mantener en vilo al lector o al espectador por la forma como se le van presentando los hechos. Ningún litigante se atrevería, intencionalmente, a presentar hechos desarticulados al juez, sabiendo que la consecuencia puede ser perder el caso. El juez revela un particular acercamiento a la interpretación legal que debe atender a metas sociales y a principios de justicia. Ése es, para Dworkin, el propósito del sistema legal: la función del derecho. Aunque compartimos lo dicho por Dworkin, la comparación puede ser incluso más amplia. Nuestro punto de partida es que derecho y arte comparten muchos más elementos que los planteados hasta ahora, aunque es claro que el derecho siempre tendrá reglas más específicas e institucionalizadas para formular interpretaciones válidas por la razón fundamental de búsqueda de certeza. En términos generales, nadie niega el papel creador del artista o del legislador. Sin duda crean algo que antes era inexistente. La pregunta es si también puede haber creación en la interpretación. A mi juicio sí. En la interpretación hay descubrimiento, revelación, creación, recreación y construcción de algo distinto a la obra de arte o a la ley, aunque la nueva creación invariablemente se da a partir de aquéllas.
9 10
Ibidem, p. 160. Aunque pueden haber muchos ejemplos, podemos citar Las noticias del Imperio de Fernando del Paso en donde se narran con detalle sucesos de la época del imperio de Maximiliano y Carlota, o los cuentos de Ibargüengoitia a partir de pasajes de la Independencia, etcétera.
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE
101
Donde hay lenguaje escrito o no escrito,11 donde hay comunicación, hay interpretación. Además de las palabras, se pueden interpretar los gestos, las señales, las actitudes y aun los silencios. ¿Qué sería de la música sin los silencios?, ¿o de la arquitectura y la escultura sin los espacios vacíos? Aunque en el derecho ha habido escuelas de pensamiento que han señalado que sólo se interpreta cuando la norma no es clara, nosotros pensamos que se interpreta siempre. Afirmar que una norma es clara, implica haber hecho ya una interpretación y haber llegado a la conclusión de que el enunciado normativo no admite otras interpretaciones, lo cual constituye un riesgo, sobre todo, si se confronta con las lecturas y apreciaciones de otros sujetos que interpretan. Decir “para mí es claro” o “así lo veo yo”, significa que el peso de la interpretación se está volcando en lo subjetivo, en elementos que posee el sujeto, en su bagaje cultural e ideológico, en vivencias, en conocimientos previos. No significa que otro no lo pueda ver de otro modo, hacer otra lectura y tampoco significa que la discusión se debe dar por terminada porque las subjetividades no van a permitir llegar a un resultado objetivo. En la interpretación, como en todo proceso de apreciación y conocimiento, se da la interacción del objeto y del sujeto. El sujeto no puede abandonar su subjetividad pero tampoco puede dejar de considerar lo que el objeto le da. El sujeto imprime necesariamente subjetividad en la acción de interpretar, pero hay elementos objetivos y metodológicos que son determinantes en el resultado. II. LA RELACIÓN ENTRE EL AUTOR Y SU OBRA El juez, al aplicar las normas, interpreta los enunciados normativos. Se ha discutido mucho si la ley queda vinculada permanentemente a la voluntad del legislador o si una vez expedida ésta, se independiza de su creador y queda sujeta a las interpretaciones que en cada momento vayan dando los operadores del derecho, particularmente los jueces. Un artista puede decir que trabaja para sí, pero la mayoría de las veces, tratándose de los grandes maestros, su obra los trasciende.12 Se vuel11 En la danza, es el lenguaje corporal el que transmite las emociones y las significaciones. 12 La obra puede trascender al autor. Alguien dijo que se puede dudar de la existencia de Cervantes, pero no así de la del Quijote, que por supuesto, logró trascenderlo.
102
LETICIA BONIFAZ A.
ve algo ajeno a ellos y queda sujeta a interpretaciones y juicios muy variados. El legislador y el juez, en cambio, no pueden decir que trabajan para sí, puesto que es evidente que con las leyes y resoluciones que emiten, siempre su trabajo va dirigido a otros. El autor de una pieza musical, de una obra de teatro o de un guion cinematográfico, puede mostrar su descontento con alguna interpretación que se hace de su obra o, por el contrario, expresar su satisfacción por la forma como los intérpretes le están dando vida a su creación. Pero puede suceder también —y sucede con frecuencia— que hay autores que ya no han estado vivos para calificar las interpretaciones de sus obras y éstas se siguen interpretando una y otra vez, de muy distintas maneras, sin que podamos saber cuál hubiera sido la reacción del autor. En el fondo, todo autor sabe que su obra está ahí para ser interpretada y que en la interpretación hay posibilidades de guardarle fidelidad o que se dé una distorsión o mejora. Aun los clásicos pueden ser recreados con nuevas interpretaciones. Una partitura de Beethoven puede ser interpretada de mil maneras; sigue siendo Beethoven, pero con el sello particular del intérprete. Esto que parece evidente al aplicarlo al arte, también sucede en el derecho. La ley trasciende al legislador. El producto legislativo se desliga de su creador. Cuando se quiere interpretar un texto constitucional no se busca a los constituyentes para preguntarles qué quisieron decir, sino que se parte de lo que dejaron plasmado como enunciados normativos. ¿Alguien puede afirmar que la música existe en la partitura? Obviamente, la partitura cobra vida en la interpretación cuando el músico con el instrumento que corresponda sigue la partitura. Dice Brassaï: “la música mientras no se ejecuta ¿qué es sino un montón de notas?13 Lo mismo pasa con el derecho que no existe sólo en los códigos, sino fundamentalmente en la interpretación que a partir de los enunciados normativos hacen los operadores del derecho. En la música interviene el instrumentista mientras que en las artes plásticas estamos en contacto inmediato con el símbolo. Con las artes plásticas pareciera que el intérprete no da una nueva recreación de la obra cada vez que lo observa, del mismo modo como cuando se interpreta una sinfonía o se pone en escena una obra de teatro. Tanto la pintura como el derecho están plasmadas en el lienzo y en las codificaciones, pero eso no 13
Brassai, Gilberto, Conversaciones con Picasso, México, FCE, 1964, 1997, p. 81.
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE
103
implica que no sean permanentemente susceptibles de ser reinterpretadas por el sujeto que observa el cuadro o bien, por parte de quién dé vida al enunciado normativo cuando lo aplica a un caso concreto. El pintor Henri Michaux señaló en una entrevista que para él “la poesía era la pariente pobre de las artes... la palabra es tan sólo una alusión. Los artistas que trabajan con sus manos son mucho más felices. Lo que crean tiene un cuerpo visible, palpable, es un eco, algo concreto que separado de nosotros nos responde” y agrega: “Sólo las artes plásticas tienen un eco inmediato. No dependen del recitador o de la imprenta o de los ejecutantes; no dependen de nada. Lo que se crea con las manos está vivo, existe realmente. Por eso pinto ahora”.14 Ésta es la opinión de un pintor; los músicos y poetas seguramente no estarían de acuerdo con su observación. Tal es el caso de Hölderlin quien considera que “la poesía es el medio de llevar la esencia de las cosas a la conciencia humana: la palabra del poeta establece por vez primera la realidad.”15 Por su parte, el escultor Henry Moore decía: “la belleza no es el objetivo de mi escultura… para mí una obra debe tener en primer lugar una vitalidad propia… una obra puede tener energía reprimida, una intensa vida propia independientemente del objeto que represente”.16 Frente a Las Meninas17 nosotros podemos identificar a los personajes ya sea porque nos auxiliamos de la historia o por el pequeño cartel de ayuda que colocan los museógrafos. Eso no significa que lo único que podamos hacer frente a la pintura sea identificar a los personajes o evaluar qué tan fiel fue el trabajo del pintor al confrontarlo con la realidad. Podemos hacer interpretaciones que van más allá de la identificación de los personajes. ¿Por qué Velásquez se incluyó en el cuadro? ¿Por qué decidió poner en su rostro esa expresión y no otra? Los expertos nos darán una y mil explicaciones atendiendo a toda la obra de Velásquez, al contexto histórico, a la técnica pictórica, etcétera. Todo servirá de marco de
14 15 16 17
Entrevista incluida en Conversaciones con Picasso, cit., supra, p. 81. Citado por Read, Herbert, Imagen e idea, México, FCE, 2003, p. 191. Ibidem, p. 40. Diego Velásquez terminó de pintar en 1656 un monumental retrato de grupo titulado La Familia de Felipe IV. La escena se sitúa en un taller que tenía Velásquez en el Alcázar de Madrid. En el centro se encuentra la infanta Margarita hija de Felipe IV y de Mariana de Austria, a la edad de 5 años.
104
LETICIA BONIFAZ A.
referencia para entender la obra. Aunque eso no quiere decir que nosotros mismos no podamos encontrar nuevos significados. Es más, respecto de Las Meninas existe la reinterpretación de Picasso a través de un cuadro que denominó Las Meninas según Velásquez y que fue pintado en 1957. El pintor malagueño recreó y reinterpretó el cuadro clásico y dejó a los intérpretes nuevos elementos de reinterpretación. En esta segunda pintura no se juzga la fidelidad del retrato sino sus características plásticas y un nuevo sentido de la belleza. En la literatura tenemos un ejemplo reciente de la relación entre autor y obra. Millones de personas en este planeta fuimos transportados hace algunas décadas al mundo mágico de Cien años de soledad. Los personajes —no necesariamente García Márquez— nos situaron en un Macondo inexistente desde el punto de vista geográfico, pero existente en la imaginación del autor colombiano y de todos sus lectores. Cuando García Márquez en su libro autobiográfico Vivir para contarla, narra muchos de los detalles que fueron llevados a Cien Años de Soledad y muchas de las razones de la inclusión de algunos pasajes de la obra, nos ayuda a aclarar situaciones, pero es evidente que no es necesario leer la autobiografía para entender e interpretar la novela. Es más, mucha gente puede preferir no saber qué partes correspondieron a una realidad distinta a la de la novela. La significación de la obra será distinta para un colombiano, contemporáneo suyo, que para alguien que nació en la Colombia de otra época, y más aún para un nórdico o un oriental alejado de la realidad latinoamericana. El artista no necesita, como el legislador, hacer su exposición de motivos. No es necesario que un pintor, un músico, un poeta, o un escultor explique lo que tenía en mente cuando creó el cuadro, la sinfonía, el poema o la pieza escultórica. Éstas van a generar sensaciones e interpretaciones diversas sin necesidad de una explicación adicional que, claro, podría dar mayores elementos pero no aquellos indispensables porque, como dijimos líneas arriba, la obra trasciende al autor. En el arte, puede cualquier persona interpretar y sentir algo distinto a lo que tuvo en mente el autor. El efecto deseado —o no deseado— se produce aunque haya una interpretación equivocada a juicio del propio autor y de los expertos. La obra puede provocar algo distinto a lo que el autor quiso. Más de una persona puede haber sentido ganas de llorar o ha llorado al contemplar la noche estrellada de Van Gogh. ¿El cuadro provoca el
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE
105
llanto? Uno puede decir que sí, pero ¿habría que determinar si el efecto se produce por la fuerza de las pinceladas, por los colores, por la técnica empleada o por la vida que llevó el pintor holandés? A un espectador que ha leído la biografía de Van Gogh pueden venirle a la mente los avatares de su vida y el sufrimiento por el que atravesaba en el momento preciso de pintar el cuadro. ¿el cuadro provocaría el mismo efecto en alguien que desconoce la vida del pintor y que se dejó llevar por la fuerza del cuadro y su contexto? Insistimos en que quien escribe un poema o una novela, pinta un lienzo o da forma al mármol o al bronce, no necesariamente debe hacer explícitas sus intenciones o motivos. Es más, al hacerlos explícitos puede empobrecer y reducir las posibilidades de interpretación. El artista no necesita explicitar sus razones, en cambio, el intérprete del arte sí. En el caso del derecho, para el autor de una iniciativa de ley es obligatorio exponer sus razones, algunas otras quedan plasmadas en el diario de debates, pero estas razones van a ser distintas a aquellas que deberá incluir el juez en la motivación de una resolución. Para el juez motivar es una acción obligatoria. Al interpretar se busca descubrir el sentido del mensaje. Si se usó una palabra específica, una línea, una nota, una frase, hay que referirlos al sistema, al contexto y a elementos esenciales de la obra que se interpreta. Hay que recordar que aunque la intención del emisor de un mensaje haya sido la de ser claro, esto no siempre se logra. Por otro lado, el artista también puede tener la intención de dejar un sentido oculto. Eso, en principio, no estaría permitido para el legislador y mucho menos para el juez. Aunque el autor de una iniciativa de ley exprese los motivos y las razones que lo llevaron a proponer una iniciativa de ley, eso no significa que con ello se limiten las posibilidades de interpretación del juez, sobre todo si se considera que el momento de creación y el de aplicación no coinciden en el tiempo y que el juez, al conocer del caso concreto, debe atender a las circunstancias del momento de aplicación. Hay que separar, por tanto, lo que el artista crea y lo que los receptores de la obra y los críticos interpretan después.18 De la misma manera como hay que separar lo que el legislador crea y lo que los jueces inter18 El crítico de arte desarrolla la habilidad para aplicar los elementos y reglas de interpretación, a diferencia del hombre de buen gusto que sería quien sabe, de manera natural, apreciar las obras de arte sin entrar a un complejo proceso de racionalización.
106
LETICIA BONIFAZ A.
pretan al conocer del caso concreto, aplicando las pautas que el propio legislador consagró. El artista no crea algo privado de interpretación. El artista produce arte. Los críticos y estudiosos crean y aplican reglas de interpretación. Construyen de manera formal y académica la teoría del arte. El legislador, del mismo modo, establece enunciados normativos y, la mayoría de las veces, es él mismo quien define las reglas de interpretación, pero son los destinatarios de la norma, los jueces y los teóricos de la interpretación, quienes interpretan con pretensión distinta de validez. La interpretación hecha por el destinatario de la norma, por su abogado, por el teórico o por el juez, tiene una validez diferente. Cada una de las partes en un juicio busca convencer al juez de que la interpretación que da a la norma en el caso concreto es la correcta, pero la interpretación obligatoria sólo dependerá de lo que el juez resuelva. Esto nos lleva a revisar la fuerza de la autoridad proveniente de quienes están facultados para interpretar, o mejor, para hacer interpretaciones válidas. La validez va a depender de los cánones y las pautas usadas. Los estudiosos del arte buscan factores estéticos constantes. Como dijimos antes, dependiendo del tipo de obra, se atenderá a la simetría, a la métrica, a la armonía, a la proporción, al equilibrio, al ritmo, etcétera. Los hermeneutas en el derecho también atienden a las pautas de interpretación que el legislador plasmó. Cabe además aclarar que los cánones para la interpretación en el arte y en el derecho no están fijados de una vez para siempre. Todo cambio en el arte y en el derecho lleva a la construcción de nuevas pautas de interpretación. La belleza estuvo por mucho tiempo aprisionada en su gran templo clásico, como una virgen, separada de las fuentes vitales de la vida. Muchos artistas se sentían usando la metáfora de Lethaby: “como una golondrina en un granero.” El artista se puede hallar inquieto e insatisfecho con sus medios de expresión sintiéndose encerrado en los muros de dichas limitaciones. 19 Muchas recomendaciones de Da Vinci —nos dice Read— pasaron a las academias de pintura que empezaron a surgir en Europa en el siglo XVII y no fue sino hasta Delacroix, Manet y Degas que se rebelaron contra esta artificialidad cuando la conciencia artística se purificó nuevamente. Le Corbusier o Mies Van der Rohe rompieron cánones en la arquitectura. 19
Cfr. Read, Herbert, op. cit., nota 15, p. 23.
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE
107
En la interpretación del derecho también se están rompiendo cánones, sobre todo si se considera que la vida social se ha ido haciendo más compleja. III. LA AUTORIDAD DEL INTÉRPRETE Como ha quedado asentado, cualquier persona puede hacer interpretaciones de las obras de arte y de los enunciados normativos, pero hay expertos que calificamos como “autoridades en la materia” que hacen interpretaciones válidas e incluso obligatorias y que necesariamente conocen los cánones de la interpretación. Michel Ragon en su libro El arte ¿para qué? señala que “todo el mundo sin excepción se cree capaz de juzgar al primer golpe de vista cualquier cuadro, pero en cambio hay mucha gente cerrada a la comprensión musical y, por consiguiente, no se pronuncia tanto al respecto”. Este autor agrega: “Todo el mundo nace crítico de las artes plásticas, mientras que es raro que alguien pretenda ser crítico musical; la crítica de la música parece una especie de ciencia. ¿No es preciso saber los jeroglíficos de las notas? Y la expresión popular «saber música» ¿no quiere decir saber hasta las reglas más sutiles?”20 Asimismo, establece: “parece como si juzgar una pintura o una escultura no requiriera conocimiento especial, que bastara con mirar… No se le ocurre a casi nadie la idea de que el arte (pictórico o musical) es un lenguaje en sí, lenguaje constituido —como todos— por signos que poseen una carga cultural, signos alegóricos que son fatalmente incomprensibles para quién no ha aprendido a leerlos.”21 Lo mismo pasa con el derecho. Hay que aprender a leer los enunciados normativos. Aunque cualquier persona puede hacer sus propias lecturas, hay una lectura válida y cánones de interpretación. En el arte existen los llamados críticos de arte que realizan interpretaciones que se consideran válidas y también califican otras interpretaciones como válidas en una comunidad y en un contexto determinado. Un crítico de arte puede, después de haber asistido a un concierto o a la puesta en escena de una obra de teatro, emitir juicios que estarán dotados de autoridad en la medida en que presenten elementos que muestren que no sólo conoce la obra que se interpreta, sino la forma como fue interpre20 21
Ragon, Michel, El arte ¿Pára qué?, México, Extemporáneos, 1974, p. 8. Ibidem, p. 9.
108
LETICIA BONIFAZ A.
tada. Normalmente usan parámetros que le sirven para ir subsumiendo el juicio particular. Estos parámetros varían dependiendo de la rama del arte de que se trate, de la corriente en la que queda inscrita la obra y de los propios autores. Así, si se trata de pintura, atenderán a la proporción, a la perspectiva, a la luminosidad, a la técnica empleada, etcétera, o si se trata de poesía, a la medida, al tiempo, a la armonía, al ritmo, etcétera.22 Aunque las posibilidades de interpretación están siempre abiertas, eso no significa que no existan personas que, convencionalmente, se reconozcan como autoridades para interpretar en el arte o estén legitimados, —como en el caso de los jueces— para hacer interpretaciones válidas e incluso obligatorias. Las interpretaciones de los críticos, a juicio del observador, no tienen que ser las mejores, pero los críticos de arte y los estetas poseen pautas y parámetros que les permiten motivar sus razones, aunque las pautas de interpretación pueden modificarse con el nacimiento de nuevas corrientes en el arte. Si una obra se juzga con parámetros no idóneos, se puede llegar a descripciones aberrantes.23 Por ejemplo, no ha faltado quien encuentre semejanzas entre la pintura moderna y la pintura prehistórica. Obviamente esto es impreciso. Herbert Read dice que “el arte prehistórico es un arte de líneas, un arte de croquis y en esa medida no es arte impresionista…”.24 Van a existir pautas descubiertas por los estudiosos del arte para entender el arte prehistórico y descubrir sus cánones. En el derecho es evidente que es el juez el que está legitimado para interpretar y es una autoridad en el sentido antes descrito, pero también porque el propio derecho dice que él es la autoridad, al otorgarle la competencia para interpretar y al señalar las reglas de las interpretaciones válidas. A diferencia de lo que pasa en las artes, en el derecho está señalado —para dar certeza— quién puede interpretar, cuándo se puede interpretar, cuáles son las interpretaciones permitidas y cuáles son los 22 En el Tratado del arte de la pintura, de Giovanni Paolo Lomazzo, encontramos que la pintura es un arte que, en líneas proporcionadas y colores similares a la naturaleza de las cosas y siguiendo la luz perspectiva, imita la naturaleza de las cosas corpóreas de modo de no representar sobre un plano sólo la masa y el relieve de los cuerpos, sino también el movimiento, y que visiblemente demuestra ante nuestros ojos muchos afectos y pasiones del alma. Sobrevilla, David, op. cit., nota 1, p. 168. 23 Andrea Palladio (1508-1580) recomienda seguir las reglas establecidas por los clásicos pero con un considerable margen de libertad para apartarse de ellas si la razón demuestra ser de utilidad y necesidad. Su obra está referida particularmente a la arquitectura. 24 Cfr. La imagen vital, México, FCE, 2003, p. 23.
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE
109
límites de la interpretación. En las artes, aunque puede considerarse que hay reglas no escritas es evidente que los márgenes de interpretación son mucho más amplios. Casi siempre, la norma señala que la interpretación de un juez puede ser revisada por un órgano superior normalmente colegiado. El órgano colegiado tiene la última palabra. El propio derecho no admite que se siga interpretando ad infinitum, como sí podría suceder en el arte, porque es evidente que en ese campo las reglas de interpretación no tienen cierre. Sabido es que el legislador da normas generales y abstractas y que éstas sirven de pauta para que el juez dicte la norma particular (individualizada) cuando conoce el caso concreto. La reiteración de la interpretación lleva a constituir la jurisprudencia y la obligatoriedad de la resolución se amplía. Es común que los órganos que crean jurisprudencia sean órganos colegiados. Y que, a veces, se requiera de una votación calificada para terminar con los efectos de una interpretación o para que a partir de ahí la interpretación sea obligatoria. Es necesario que varias personas interpreten del mismo modo. Eso no significa que la posición de la minoría implique una interpretación equivocada o incorrecta. Se trata, más bien, de una interpretación que tuvo menor peso que la interpretación que hizo la mayoría. IV. LOS LÍMITES DE LA INTERPRETACIÓN En el caso del derecho, hay normas que permiten mayor diversidad de interpretaciones y normas que sólo llevan a una. Aunque hay que considerar que la claridad u oscuridad, la mayor claridad o la menor oscuridad, no sólo van a depender del enunciado normativo sino del caso concreto y del contexto en el momento de la aplicación. La distinción entre casos fáciles y difíciles depende de si hay una interpretación única o hay varias, obviamente con distintas consecuencias. Si hay dos lecturas o más, se tiene necesariamente que argumentar y mostrar la coherencia de los argumentos. Con los mismos esquemas que en el derecho, en la pintura podemos diferenciar aquellas obras renacentistas, por ejemplo, que dejan aparentemente poco a la interpretación de aquellas contemporáneas que dejan la interpretación más abierta. Alguien puede afirmar que no entiende la pintura moderna, pero habría que ver si lo que quiere decir esa persona es
110
LETICIA BONIFAZ A.
que le faltan los códigos para entender la pintura moderna, o que la pintura moderna no le dice nada, y que de ella no puede extraer ningún significado. ¿Hay más libertad del intérprete frente a la pintura moderna que frente a la pintura renacentista? Parecería que la respuesta obvia es que sí, que en una pintura moderna uno puede ver “cualquier cosa”,25 que la subjetividad del observador (intérprete) es mayor. Sin embargo, como decíamos antes, frente a la pintura moderna, el que conoce lo clásico, normalmente se desconcierta, se siente perdido por el desconocimiento de los códigos. Tal vez un niño interprete con más facilidad algo por la ausencia de preconcepciones. Michel Ragon asegura que: “el desciframiento de los signos plásticos no se aprende en las escuelas… el aficionado al arte aprende muy lenta y largamente a descifrar esos signos que constituyen a la vez lenguaje e historia. El cuadro le hablará o no le hablará si no está cargado de signos que sean inteligibles para el aficionado en cuestión”.26 Herbert Read, por el contrario, pone énfasis en el hecho de que “se crean escuelas y academias que enseñan a los hombres no a usar sus sentidos, no a cultivar su conciencia del mundo visible, sino a aceptar ciertos cánones de expresión y a partir de éstos a construir artificios retóricos cuya sutileza va dirigida más a la razón que a la sensibilidad. El arte se convierte en un juego que se juega según reglas convencionales.”27 Borges se preguntaba si era más fácil escribir poesía libre o la poesía que lleva métrica. La conclusión a la que él llega es que es más difícil la poesía libre porque sus posibilidades son infinitas. En la música, hay un género como el jazz donde la regla consiste en permitir la improvisación al interpretar la melodía. Eso no lleva al extremo que cada vez que se haga una interpretación se toque otra pieza de música. Dependiendo del saxofonista o percusionista en turno, habrá distintos sonidos que no sólo muestran su virtuosismo, sino la forma de sentir el jazz, esto es, una particular forma de interpretar que, en el fondo, es una manera de recrear la melodía. 25 A veces, el nombre que el autor dio al cuadro puede darnos pautas de interpretación, pero en ocasiones, aun con esa pauta, la posibilidad de ver lo que el autor quiso, sigue siendo difícil. 26 Ragon, Michel, op. cit., nota 21, p. 10. 27 Read, Herbert, La imagen vital, México, FCE, 2003, p. 129.
LA INTERPRETACIÓN EN EL DERECHO Y EN EL ARTE
111
En el teatro, aunque haya un guion, hay ciertas obras que dejan más libertad al intérprete y que tienen como propósito hacer interactuar a la gente y recrear la obra en atención a las particularidades del público que presencie cada puesta en escena. En el teatro hay un antes y después a partir de Pirandello que fue un innovador de la técnica escénica al ignorar los cánones del realismo. A decir de sus biógrafos, “liberó al teatro contemporáneo de las desgastadas convenciones que lo regían”. 28 En el derecho, habrá ramas cuyos márgenes de interpretación son más estrictos. Tal es el caso del derecho penal o del derecho fiscal, pero por el contrario, habrán ramas donde la libertad del intérprete es más amplia: como es el caso de la interpretación funcional en el derecho electoral.29 No perder de vista la finalidad de los enunciados normativos es algo fundamental en esta rama del derecho.30 Lo importante es, tratándose del derecho o del arte, que al interpretar se conozcan las reglas permitidas; la flexibilidad o rigidez de las mismas; el contexto general y las particularidades del caso. Un trabajo artístico puede quedar sujeto a opiniones acerca de la coherencia y la integridad en el arte. Una interpretación en el derecho necesariamente debe atender al sistema normativo en su conjunto (interpretación sistemática) y puede también, válidamente, aislar las intenciones interpretativas que el autor tuvo en un particular momento. En el ámbito jurídico es, sin duda, el juez el que conoce las reglas de operación del sistema y tiene la labor creativa en la interpretación, debiendo buscar siempre que la letra de la ley, al mismo tiempo que encierra significados, abra posibilidades de solución de los casos concretos.
28 29
[www.epdip.com/pirandello.html] y [www.pirandelloweb.com]. El derecho ambiental debería tener formas de interpretación más flexibles por los derechos de tercera generación que protege y por la dificultad para la armonización de los derechos individuales con los colectivos. Sin embargo, hasta que no se consolide el derecho procesal ambiental y se sigan reglas generales del derecho administrativo, la interpretación se seguirá quedando corta y no responderá adecuadamente a los retos ambientales actuales. 30 En la arquitectura puede verse cómo, además de la estética, se cuida la funcionalidad y la utilidad de la construcción. Jacopo Barozzi, en 1562, escribió los cinco órdenes de la arquitectura clasificada según la utilidad y función de los edificios.
!
CONSTRUCTIVISMO JURÍDICO, VERDAD Y PRUEBA Enrique CÁCERES* SUMARIO: I. Introducción. II. Las reflexiones de Lobsang después de este día. III. Taxonomía proposicional IV. Breve referencia al coherentismo y la sistematización cognoscitiva V. Proposiciones prescriptivas y construcción social de la realidad (construcción de los hechos p’). VI. Al final del día.
I. INTRODUCCIÓN En esta ocasión esbozaré algunas ideas relativas a la relación entre una concepción constructivista del derecho, la verdad y la prueba; lo haré de una manera metafórica, con fines mnemotécnicos, a efecto de que le dé coherencia a la ponencia, considerando el tiempo del que dispongo. Para tales efectos, seguiremos un día en la vida de Lobsang. Lobsang es un muchacho budista que estudia derecho y lógica. En la agenda de un día determinado tiene tres actividades principales. Las dos primeras corresponden al ejercicio de la meditación zen, y la tercera a sus tareas como estudiante de derecho.
* Instituto de Investigaciones Jurídicas, UNAM, México. 113
114
ENRIQUE CÁCERES
Para las dos primeras, por una parte, tiene que desarrollar la atención consciente mediante un ejercicio de percatación; y, por otra, efectuar otro ejercicio que tiene que ver con la disociación consciente de distintos niveles de realidad. El primero, cuyo objetivo es concentrarse en algo para percibir lo que originalmente le había pasado desapercibido, Lobsang lo realiza en el jardín de su casa donde, al fijarse en una porción del césped, se da cuenta que no había reparado en que estaba naciendo una nueva flor.
Como Lobsang está interesado en el constructivismo, no le resulta difícil establecer deliberadamente la siguiente analogía: dentro de las distintas concepciones del derecho, parece estar surgiendo una nueva que se encuentra en estado germinal y que bien podría quedar denotada por la expresión “constructivismo jurídico”. Para explicar esta lámina, me voy a permitir citar al profesor Brian Bix, quien dice: “en muchas de las discusiones que tienen lugar en el nombre de la jurisprudencia, aquello que está siendo considerado no es otra cosa sino la aplicación al derecho de alguna teoría más general proveniente de otra área, por ejemplo, una teoría moral, teoría política, teoría social, etcétera”.1 En el cuadro siguiente tenemos, en la columna de la izquierda, a las teorías generales y, en la columna de la derecha, a las teorías jurídicas. 1 Véase Bix, Brian, Jurisprudence. Theory and Context, 2a ed., Canadá y Estados Unidos, Sweet and Maxwell, 1999, p. 23.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
115
Alguien podría suponer que hablar de constructivismo jurídico presupone únicamente la aplicación de una teoría constructivista ya acabada, sin embargo, no es el caso.
En realidad no podemos hablar de constructivismo sino de constructivismos. Por ejemplo, de cons truc tivis mo ra di cal, so cial, episte mo lógico, pedagógico (y dentro de éste el genético, ausbeliano, etcétera). Una clasificación más próxima al derecho es proporcionada por el doctor Vittorio Villa,2 quien refiere los constructivismos ético-político, social, sistémico, empirista, sociológico y post-positivista.
2
Véase Villa, Vittorio, Constructivismo e teoría del diritto, Giappichelli Editore, 1999.
116
ENRIQUE CÁCERES
CONSTRUCTIVISMOS
• • • •
Constructivismo radical Constructivismo social Constructivismo epistemológico Constructivismo pedagógico Constructivismo génetico Constructivismo ausbeliano Constructivismo sociocultural
Constructivismo ético-político Constructivismo social Constructivismo intucionista Constructivismo sistématico Constructivismo empirista Constructivismo sociológico Constructivismo post-positivista
Coll
Villa
Esto significa que no tenemos aún un concepto unívoco de constructivismo, y que las aportaciones que puedan realizarse respecto a la elaboración del concepto de constructivismo jurídico, pueden también contribuir a la construcción del concepto general.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
117
Al respecto, debo indicar que después de una extensa búsqueda en Internet (en la que no incluyo al alemán), he localizado muy pocos autores que expresamente se aboquen a lo que podría llamarse “constructivismo jurídico”. Sólo he encontrado el libro de Bruce Ackerman, Del realismo al constructivismo jurídico3 (que en realidad utiliza la expresión en un sentido muy diferente al que interesa destacar aquí); el trabajo de Vittorio Villa “Constructtivismo e teoría del diritto”;4 un excelente articulo de Paolo Comanducci, donde presenta un análisis comparativo entre Kelsen y Searle como constructivistas,5 junto con los cuales ubicaría algunos de mis trabajos: “Psicología y constructivismo jurídico”,6 “Institucionalismo jurídico y constructivismo social”7 y “Las teorías jurídicas como realidades hermenéuticas”8; “Constructivismo jurídico sociorepresentacional”9 y “Estudio para un nuevo manual para la comisión de hechos violatorios de los derechos humanos”.10 (Cuadro anterior). A mi juicio: ¿cuáles deberían de ser los dominios de estudio de una concepción constructivista del derecho? El primero tendría que ver con una reflexión metajurisprudencial (por ejemplo, el trabajo de Vittorio Villa11) que ocuparía dos niveles de reflexión; el de la teoría general del derecho y el de las teorías particulares del derecho, esto es, las teorías de las diferentes disciplinas dogmáticas (penal, civil, mercantil, etcétera). Otro tipo de problemas susceptibles de ser abordados por el constructivismo jurídico tendría que ver con la manera en que los operadores ju3 Véase Ackerman, Bruce A., Del realismo al constructivismo jurídico, Barcelona, Ariel, 1988, p. 150. 4 Véase Villa, Vittorio, op. cit., nota 2. 5 Véase Comanducci, Paolo, Kelsen vs. Searle: A Tale of Two Constructivists, disponible en línea en: http://www.giuri.unige.it/intro/dipist/digita/filo/testi/analisi1999/comanducci.pdf. 6 Véase Cáceres Nieto, Enrique, Psicología y constructivismo jurídico: apuntes para una transición paradigmática interdisciplinaria, en Muñoz de Alba Medrano, Marcia, (coord.), Violencia social, México, UNAM, Instituto de Investigaciones Jurídicas, 2002. 7 Véase Cáceres Nieto, Enrique, “Institucionalismo jurídico y constructivismo social”, Boletín Mexicano de Derecho Comparado, México, nueva serie, año XXXIV, núm. 100, enero-abril de 2001. 8 Véase Cáceres Nieto, Enrique, Las teorías jurídicas como realidades herûenéuticas, disponible en línea en: http://www.jurídicas.unammx/publica/revboletin/cont/103/art/avtz.htm. 9 Véase Cáceres Nieto, Enrique, Constructivismo jurídico sociorepresentacional, en prensa. 10 Véase Cáceres Nieto, Enrique, Estudio para un nuevo manual para la comisión de hechos violatorios de los derechos humanos, en prensa. 11 Véase Villa, Vittorio, op. cit., nota 2.
118
ENRIQUE CÁCERES
rídicos actúan dentro de las instituciones públicas y, consecuentemente, la forma en que el derecho y dichas instituciones inciden en los procesos de la construcción social de la realidad. Asumiendo que hay una corriente muy importante de constructivismo pedagógico, evidentemente también tendríamos que considerar la posibilidad de tener impacto en el área de la enseñanza del derecho. ALGUNOS TEMAS DEL CONSTRUCTIVISMO JURÍDICO
• Teoría del derecho Teoría general del derecho (Villa) Teorías partículares del derecho
• Institucionalismo y operaciones jurídicos • Derecho y construcción social de la realidad • Enseñanza del derecho Como he comentado, el término “constructivismo” no tiene una significación unívoca. Encontrar una definición omnicomprensiva es complicado. Me permitiré dar una de carácter provisional: Para la posición constructivista, el conocimiento no es una copia fiel de la realidad, sino una construcción del ser humano. ¿Con qué elementos realiza la persona dicha construcción? Generalmente con los esquemas que ya posee, es decir, con lo que ya construyó en su relación con el medio que lo rodea. Esto significa que para el constructivismo, el cerebro del sujeto cognoscente funciona como un generador y procesador simbólico, cuyos productos se manifiestan en fenómenos como las imágenes mentales o los significados proposicionales. Algunos de esos productos, a diferencia de lo que ocurre con los que reconocemos como actos de ficción, corresponden a los que tomamos como realidad en alguna de las acepciones de la expresión. Es en el nivel de una explicación constructivista sobre la manera en que actúan los operadores jurídicos donde se ubicará la plática que tenemos hoy. Lobsang —para continuar con el modelo— terminó su trabajo de atención consciente con respecto de la planta y se fijó ahora en un objeto de su despacho.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
119
Lo primero que vio, fue que dentro del mismo había algo que podría ser identificado como una entidad ontológicamente objetiva (en términos de Searle):12 una piedra; es decir, algo cuya existencia no depende de ser pensada por un sujeto cognoscente y que en este caso ocupa una dimensión espacial y es perceptible sensorialmente. Esta constituye un ejemplo de lo que sería el primer nivel de realidad disociado por Lobsang.
Acto seguido, identifica un segundo nivel de realidad. Como Lobsang está familiarizado con los trabajos de psicología cognitiva contemporánea, sabe que nuestras percepciones del mundo no corresponden a como el mundo sea, sino que son el resultado del equipamiento psicofísico con el que contamos, de nuestro personal estilo de procesar información, así como de los entornos físico y social con que interactuamos. En ese sentido, incluso la percepción que hacemos de objetos o eventos exteriores es una construcción perceptiva sobre la que puede producirse un segundo tipo de construcción perceptiva de índole atencional, semejante a la que ocurrió cuando contemplaba el crecimiento de una flor. Así, después de haber hecho la construcción perceptiva de la piedra y observarla detenidamente se dio cuenta de que sobre ella estaban caminando hormigas.
12
Véase Searle, John, The Construction of Social Reality, Penguin, 1995, pp. 1-30.
120
ENRIQUE CÁCERES
En un tercer sentido del término realidad, Lobsang se percata de que hay cierta construcción de significados generados por nuestro cerebro que presuponen a la construcción de primer nivel, es decir, que sobre la construcción perceptiva se puede realizar una construcción de segundo nivel, también constitutiva de realidad. Esto es lo que sucede cuando la misma piedra labrada es un pisapapeles. Desde luego, pensar la piedra en términos de pisapapeles implica una entidad ontológicamente subjetiva que no podría existir sin un sujeto cognoscente que la pensara.
Evidentemente entre significado y expresiones hay una relación. Lobsang puede calificar a “esto” con el término “pisapapeles” porque satisface las condiciones de designación de la definición de “pisapapeles” (por razones de simplicidad asumimos que Lobsang suscribe una teoría clásica del significado). Además de las anteriores, para algunos, hay otra acepción de realidad que supuestamente se refiere a la realidad tal cual es. Ésta sería defendida por algunos teóricos o filósofos de la ciencia que asumen que lo que hacen las teorías científicas es generar aproximaciones sucesivas que cada vez nos aproximan a conocer a “la realidad” tal como ella es. Dicha acepción no tiene cabida en nuestras consideraciones. Una representación gráfica y sintética de los distintos niveles de realidad referidos sería la siguiente:
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
121
Después de haber concluido con sus dos tareas vinculadas con la meditación zen, Lobsang procede a efectuar las de carácter jurídico:
122
ENRIQUE CÁCERES
Asiste a un tribunal y observa lo siguiente: en un juicio penal escucha y ve que una persona está emitiendo un enunciado mediante el cual afirma que x ha cometido el delito de parricidio a través de envenenamiento. Dado que su práctica no sólo se circunscribe al ámbito del derecho penal, posteriormente asiste a un juzgado civil, en donde una persona está presentando una demanda de divorcio por abandono de hogar.
II. LAS REFLEXIONES DE LOBSANG DESPUÉS DE ESTE DÍA El primer objeto de reflexión de Lobsang es sobre la definición de verdad proporcionada por Tarsky. Para toda proposición (‘p’), ‘p’ pertenece al conjunto V, si y sólo si es el caso que p. Con respecto a dicha formulación, Lobsang cae en la cuenta de que, traducida al derecho, el problema principal al que se enfrentan los juzgadores es el de determinar si las proposiciones particulares contenidas en el discurso jurídico práctico pertenecen a V o no. (‘p’): ‘p’ e V 34 p’
"
‘p’ e V 34 p’ ¿‘p’ e V34 p’ ¿p’?
En el terreno de los hechos, una teoría del significado de carácter tradicionalmente empirista, identificaría que es el caso que p’, cuando “p” corresponde a eventos que ocurren en el mundo externo y pueden ser ob-
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
123
servados de la misma manera por todos. Sin embargo, para un constructivista, que sea el caso que p’ implica un proceso de construcción del propio p’ en términos perceptivos, atencionales y/o significativos. Con relación a sus prácticas, Lobsang cae en la cuenta que en el caso del proceso penal, el enunciado sobre el parricidio correspondería a una proposición semejante a las observacionales en cuanto a su estructura sintáctica, respecto de la cual cabe preguntarse si pertenece al conjunto V, y cuándo es el caso que p’.13 Decir que p’ es un constructo, implica ciertas consecuencias con respecto a la postura empirista, pues la nítida separación entre la proposición y lo que acontece en el mundo se relativiza. En este sentido, Lobsang recuerda la siguiente afirmación de Hugo Zemelman: “los datos empíricos no tienen significado intrínseco y ni siquiera significado unívoco”.14 Lo hemos visto en el caso de la piedra y el pisapapeles. Otro ejemplo podría ser el siguiente: los mismos trazos dejados en la nieve podrían constituir el observable de un esquema que permite considerarlos como marcas del paso de alguien con zapatos para la nieve, pero también podrían serlo respecto al concepto de obra de arte abstracto. Desde luego, la posibilidad de que una realidad de primer orden pueda corresponder al observable de una realidad de segundo orden implica cierto rango de plausibilidad en la relación, es decir, no toda realidad de primer orden (perceptual) cuenta como un observable para cualquier esquema cognitivo. Así, por ejemplo, los trazos de la nieve de nuestro ejemplo no podrían constituir observables respecto de un esquema apto para identificar teléfonos. Por lo que respecta al derecho, Lobsang se plantea la siguiente cuestión ¿Qué sucede con los esquemas cognitivos o constructos jurídicos y su relación con la determinación de que sea el caso que p’?. En el derecho, estos esquemas conceptuales suelen tener como presupuesto una regla constitutiva a la manera de Searle que responde a la fórmula canónica: “x vale como y en el contexto c”, y que, de la misma manera que sucede en los juegos, es determinante de consecuencias tanto conceptuales, como perceptivas y prácticas. 13 Las notaciones simbólicas son presentadas como esquemas gráficos y no como formalizaciones lógicas estrictas. En su notación original, Tarsky representa los hechos con la letra p y yo utilizo p’. 14 Véase Zemelman, Hugo, Problemas antropológicos y utópicos del conocimiento, Jornadas, 126, Colegio de México, p. 123.
124
ENRIQUE CÁCERES
Por ejemplo, en el caso del ajedrez, la pensabilidad de la acción ajedrecista, la identificación de ciertos movimientos como movimientos de ajedrez, el hecho de comprender cuál es la estrategia que se está siguiendo con determinado movimiento e incluso la percepción de algo como movimiento del juego, implica una regla constitutiva del tipo: “x vale como y en el contexto c”. Esta función constitutiva también está presente en el discurso jurídico y juega un papel sumamente importante en la manera en que el derecho contribuye a la construcción social de la realidad. Con respecto a esto, Comanducci hace notar que ya en la Teoría pura del derecho, Kelsen presenta un planteamiento constructivista cuando define a las normas como sustratos de sentido, y cita el caso de la asamblea, donde una serie de sujetos han levantado la mano, lo cual vale como haber votado una ley, en el contexto del derecho.15 PROPOSICIONES OBSERVACIONALES (‘po’)
— — — — — —
(‘po’ e V) 34 p’ ¿‘po’ e V ¿p’? p’ como constructo p’ desde la perspectiva empirista tradicional p’ como constructo en el ambito jurídico p’ y la regla constitutiva: ‘X vala cono Y en en contexto C’ p’ las normas jurídicas como substratos de sentido (kelsen) p’ la práctica jurídica (el ejemplo de la flagrancia)
Como recordamos, en algún momento Lobsang asistió a tribunales y se percató de que había cierto tipo de proposiciones que no eran observacionales (al menos no en el sentido de las observacionales directas del tipo la nieve es blanca), las llama proposiciones expostfácticas. ¿Qué es lo que las caracteriza? Son proposiciones que se emiten en pasado; hacen referencia a hechos que se supone deben haber acontecido, y para los efectos de Lobsang, además, están deónticamente calificadas. La diferencia fundamental entre las proposiciones expostfácticas y las observacionales directas estriba en que, en el caso de las primeras, el suje15
Véase Comanducci, Paolo, op. cit., nota 5.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
125
to cognoscente no se encuentra frente a un evento o un objeto del mundo; por tanto, no puede hacer una construcción perceptiva sobre la cual hacer una construcción de realidad de segundo nivel, acerca de la cual emitir el enunciado. Tomando en cuenta estas consideraciones, la pregunta que se plantea Lobsang es: ¿Tiene sentido preguntarse si la proposición expostfáctica pertenece al conjunto de proposiciones verdaderas en el caso del derecho?, y la respuesta que da es la siguiente: En el caso específico de las proposiciones expostfácticas en el derecho, procede cuestionar su pertenencia al conjunto de las proposiciones probadas (P), pero no al conjunto de las proposiciones verdaderas, lo cual permite explicar aquellos casos en los cuales sabemos que ciertas proposi cio nes fue ron pro ba das aun que se pamos que no son verdaderas. La nueva pregunta que surge es ¿en qué condiciones una proposición expostfáctica pertenece a P? La respuesta a esta pregunta implica una taxonomía proposicional. PROPOSICIONES ESPOSTFÁCTICAS ( ‘pe’) ‘pe’ e V 34 pe’ ¿¿‘pe’ e V?? ¿¿ ‘pe’ e P? III. TAXONOMÍA PROPOSICIONAL 1. Proposiciones representacionales (“pr”) Además de las expostfácticas (“pe”), Lobsang piensa que es posible hablar de proposiciones representacionales (“pr”). Todos sabemos que una conducta regulada normativamente puede satisfacerse de múltiples formas. Por ejemplo, podemos privar de la vida a otro a través de envenenamiento, de un arma de fuego o de un arma blanca, de inducción al suicidio etcétera. A cada una de las diversas maneras en que la conducta normativa puede llevarse a cabo, Lobsang la denota con la expresión “modalidad de instanciación normativa”.
126
ENRIQUE CÁCERES
Es posible decir que a cada modalidad de instanciación normativa le corresponde al menos una representación mental, un esquema cognitivo en el razonamiento de los jueces que no es establecido normativamente, pero cuyas condiciones deben satisfacerse para considerar que los hechos regulados normativamente acontecieron. Por ejemplo, en el caso del parricidio por envenenamiento, es necesario que el sujeto que murió haya ingerido una sustancia tóxica; segundo, que esa sustancia tóxica sea la causante de su muerte; tercero, que haya sido suministrada por un sujeto distinto a la víctima. Debe subrayarse que estas propiedades no se encuentran explicitadas en el derecho donde no se tipifica un delito de “envenenamiento”. Esta representación mental se puede traducir en términos proposicionales, es decir, en una proposición que represente cada una de las partes del esquema mental correspondiente a la modalidad de instanciación normativa, a la que Lobsang llama proposición “r” y cuya estructura generalmente es molecular. 2. Proposiciones de hechos (“ph”) Una segunda clase de proposiciones estaría constituida por las “proposiciones de hechos” que corresponden a las que se exponen en las demandas y en las contestaciones de demanda. Algunas proposiciones de hechos son, por ejemplo: 1) “A las diez de la noche Juan entró a mi casa” y 2) “Tomó una piedra y me golpeó en la cabeza”; 3) “El día de los hechos, a las diez de la noche, yo estaba en el gimnasio”. Una de las características de las proposiciones de hechos es que suelen ser contradichas por otras proposiciones de hechos dentro de un proceso jurisdiccional. Dicho en otros términos, normalmente en las demandas se afirma ph, y en la contestación, no ph, en cuyo caso, el juez debe resolver atendiendo al principio de no contradicción lógica y considerar, con base en las evidencias, cuál de las proposiciones de hechos en conflicto derrota a la otra (u otras). 3. Proposiciones probatorias (“pp”) Por último, es posible hablar de proposiciones probatorias que son las que se expresan en los instrumentos de prueba. Las aseveraciones hechas
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
127
por los testigos, las aseveraciones de quienes presentan una confesión, las conclusiones en los dictámenes periciales, etcétera. Debe resaltarse la importancia que se da a estas proposiciones dentro de los procesos jurisdiccionales, sobre la base de que quienes las emiten, las expresan como resultado de una constatación “objetiva” de lo que ha acontecido en el mundo. Sin embargo, tal como se ha indicado previamente, la creencia en dicha constatación, ignora la función constructivista del sujeto cognoscente quien, en todo caso, realiza una construcción de realidad de segundo nivel sobre una construcción perceptiva y, por tanto, puede dar lugar a diferentes construcciones sobre los mismos hechos y la consecuente emisión de diferentes proposiciones de hechos, como han puesto de manifiesto empíricamente trabajos de psicología de testigos.16 Con estos elementos procede preguntarse ¿cuál es el criterio conforme al cual Lobsang considera que una proposición “pe” pertenece al conjunto P? Diría lo siguiente, pe pertenece al conjunto P si y sólo si la proposición representacional pr pertenece al conjunto P, (ya sabemos que el conjunto P es el de las proposiciones probadas). Ahora, ¿cuándo una proposición “pr” pertenece al conjunto P? Si y sólo si ph, la proposición de hechos (normalmente molecular) construida a partir de las proposiciones de hechos derrotantes, pertenece al conjunto P y además al conjunto L, donde el conjunto L es el de las ph que corresponden a pr. (‘pe’ e P) 1 [ (‘pr’ e P) 1 (‘ph’ e P1L) ] Un ejemplo de correspondencia entre proposiciones de hechos y proposiciones representacionales sería el siguiente: supongamos un caso en el que el juez cuenta con una proposición representacional molecular constituida por cinco proposiciones atómicas y únicamente 3 proposiciones de hechos han sido probadas; en esta situación, el juez concluiría que no es el caso que este probado que pr, debido a que no se han probado todas las ph necesarias i. e., por que no se satisface la correspondencia entre la proposición representacional y las proposiciones de hechos. Consecuentemente, tampoco pe se tiene por probada. La siguiente cuestión a dilucidar es: ¿En qué caso un enunciado “ph” pertenece a P? La respuesta sería, ph pertenece a P si y sólo si ph pertene16
Véase Cáceres Nieto, Enrique, op. cit., nota 6, pp. 17 y 18.
128
ENRIQUE CÁCERES
ce al conjunto C, donde el conjunto C es el de las proposiciones de hechos coherentes con las proposiciones probatorias (“pp”) pertenecientes a P. (‘pp’ e P) 1 (‘ph’ e C) Por último, tendríamos que responder cuándo una proposición probatoria (“pp”) pertenece a P: cuando pertenece a K, es decir, al conjunto de las proposiciones probatorias coherentes entre sí (precisamente a lo que en la práctica jurídica se conoce con el nombre de “adminiculación probatoria”). (‘pp’ e P) 1 (‘ph’ e K) Una representación sintética de las reglas referidas sería: PROPOSICIONES EXPOSTFÁCTICAS (‘pe’) (‘pe’ e V) 1 (‘pe’) ¿¿‘pe’ e V ?? ¿¿‘pe’ e P ? Tipos proposicionales ‘pe’: proposición expostfáctica ‘pr’: proposición representacional ‘ph’: proposición de hechos ‘pp’: proposición probatoria (‘pe’ e P) 1 [ (‘pr’ e P) 1 (‘ph’ e P1L)] P: El conjunto de las proposiciones probadas L: El conjunto de las ‘ph’ que corresponde a ‘pr’ (‘ph’ e P) 1 (‘ph’ e C) C: El conjunto de las ‘ph’ coherentes con ‘pp’e P (‘pp’ e P) 1 (‘pp’ e K) K: El conjunto de las ‘pp’ coherente entre sí 4. Proposiciones metailocusionarias Para explicar estas proposiciones es pertinente recordar que Lobsang no únicamente asistió a un caso penal (donde se esgrimían sólo enuncia-
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
129
dos expostfácticos) sino también a uno civil, en el que una persona presentaba demanda de divorcio por abandono. Determinar si la proposición en la que se afirma el abandono (proposición expostfáctica) pertenece al conjunto de los enunciados probados, presupone que un acto ilocusionario ha tenido lugar, pues para que alguien pueda afirmar que se tiene por probada la proposición “Roberto me abandonó sin causa justificada” presupone que primero tuvo lugar el acto ilocusionario emitido por el oficial del Registro Civil en el que formaliza la ceremonia expresando: “los declaro marido y mujer”. En este caso, a diferencia de lo que ocurría en materia penal, e incluso el acto de abandonar en el mismo juicio civil, el acto ilocusionario no se concreta en ningún dato empírico sobre el cual hacer la construcción perceptiva, pues aunque escuchemos decir: “los declaro marido y mujer”, dicha percepción no es suficiente para determinar si el acto ilocusionario tuvo lugar o no. A las proposiciones que afirman que un acto ilocusionario ocurrió (o niegan que ocurrió), Lobsang las denota con el término “proposición metailocusionaria” (“pm”), cuyo criterio de pertenencia a P será: que pm pertenece a P si y sólo si pertenece a A, donde A es el conjunto de proposiciones performativas afortunadas. PROPOSICIONES METAILOCUSIONARIAS (‘pm’) (‘pm’ e P) 1 (‘pm’ e A) A: Conjunto de las proposiciones performativas afortunadas Existe una relación entre las proposiciones metailocusionarias y las proposiciones representacionales, debido a que una pm puede formar parte de una proposición representacional pr, tal como sucede con el ejemplo referido. IV. BREVE REFERENCIA AL COHERENTISMO Y LA SISTEMATIZACIÓN COGNOSCITIVA
Como ha sido expuesto, la idea de coherencia juega un papel sumamente importante para la determinación de la pertenencia de una propo-
130
ENRIQUE CÁCERES
sición a P, que comprende tanto a las expostfácticas como a las metailocusionarias.
Debido a las limitaciones de tiempo no me puedo detener a hacer un análisis del sentido con que entiendo el término “coherencia” y creo que la manera más rápida de aludirlo es parafraseando a Umberto Eco. En el crucigrama se cruzan palabras, y las palabras deben cruzarse en una letra común a ambas, en nuestro juego (la decisión judicial)17, no cruzamos palabras sino conceptos y hechos, diríamos construidos, de modo que las reglas son diferentes. Son fundamentalmente tres, primera, los conceptos se vinculan por analogía, no hay regla para decidir en el comienzo, si una analogía vale o no vale, porque cualquier cosa guarda similitud con cualquier otra desde algún punto de vista. Segunda, en efecto, si al final “todo se tiene”, el juego es válido y por tanto, es correcto. Y tercera regla, las conexiones no deben ser inéditas, en el sentido que ya deben de haber aparecido por lo menos una vez, mejor si han aparecido muchas veces en otros contextos, sólo así los criterios parecen verdaderos, porque resultan obvios.18
Algo semejante ocurre cuando los jueces deciden y consideran las diferentes clases de proposiciones referidas, las conectan con sus representaciones de los hechos, a efecto de generar una estructura coherente que parte de esquemas cognitivos generados a lo largo de su experiencia profesional y emplean para analogar los nuevos casos que, a su vez, producirán nuevos esquemas. V. PROPOSICIONES PRESCRIPTIVAS Y CONSTRUCCIÓN SOCIAL DE LA REALIDAD (CONSTRUCCIÓN DE LOS HECHOS P’)
Después del análisis anterior, Lobsang reflexiona lo siguiente: “He generado explicaciones constructivistas que me han resultado satisfacto17 18
Lo que se encuentra entre paréntesis es nuestro. Véase Eco, Umberto, El péndulo de Foucault, Yesod, p. 118.
LA OBJETIVIDAD DE LAS PROPOSICIONES JURÍDICAS
131
rias acerca del funcionamiento del derecho y su relación con los procesos de construcción de la realidad por parte de los jueces, sin embargo, la nota más sobresaliente del derecho es su aspecto normativo, es decir la forma en que incide en la construcción de conductas sociales. ¿Qué lugar ocupa esto dentro de mi explicación constructivista?”. La respuesta que encuentra es la siguiente: Las proporciones normativas y las constitutivas del tipo x vale como y en el contexto c, son un presupuesto para la generación de representaciones sociales y las representaciones sociales son una condición para que las normas actúen como razones para la acción. Las acciones realizadas conforme a dichas razones constituyen los eventos susceptibles de contar como observables a partir de los esquemas cognitivos generados por el discurso jurídico, eventos que constituirán la materia prima sobre la que se realizará una construcción perceptiva, atencional y significativa jurídicas, a partir de las cuales los operadores toman sus decisiones.
V. AL FINAL DEL DÍA Al final del día, Lobsang está tranquilo, satisfecho por el ejercicio intelectual realizado. Cuando se prepara para descansar, esboza una sonrisa al recordar el carácter novedoso del constructivismo, y tener su último pensamiento del día: Somos lo que pensamos, todo lo que pensamos surge de nuestros pensamientos, con nuestros pensamientos construimos el mundo Siddartha Gautama (siglo VI a. C.)
!
TITULARIDAD DE LOS DERECHOS Juan Antonio CRUZ PARCERO* SUMARIO: I. Introducción. II. El concepto de persona y los derechos. III. El lenguaje de los derechos. IV. Representación.
I. INTRODUCCIÓN Este trabajo se inserta dentro de una investigación más amplia en torno al tema de la titularidad de los derechos.1 En esta investigación, por una parte, analizo los conceptos de “persona jurídica” y “persona moral”. El propósito es poder determinar si todos los seres humanos son “personas” o si sólo lo son ciertos seres humanos con determinadas capacidades de raciocinio, elección, o alguna otra característica. Si esto último es así, surgen entonces problemas con los seres humanos que quedan fuera del concepto de “persona” como los bebés, los niños, algunos enfermos mentales, los fetos, seres humanos en estado vegetativo o coma. Por otra parte, analizo la relación de estos conceptos con los derechos, mismo que se presenta en varias dimensiones. Para algunos autores el concepto de persona está conceptualmente relacionado con el de derechos, de modo que tener derechos y ser persona es lo mismo; para otros sólo las personas pueden tener derechos, lo que implica que hay que considerar persona a cualquier cosa de la que se predique un derecho. Si otros seres o entidades distintas a los seres humanos (como los animales y las plantas, o como las generaciones futuras, la naturaleza, las especies y las obras de arte) pueden ser titulares de derechos, ello implicaría tener que considerarlos como personas. Otra alternativa que yo defiendo es que, si bien *
Instituto de Investigaciones Filosóficas, UNAM, México. Cruz Parcero, Juan Antonio, “Personas y derechos”, en Platts, Mark (comp.), Conceptos morales fundamentales, en prensa. 1
133
134
JUAN ANTONIO CRUZ PARCERO
podemos aceptar que las personas y los seres humanos son de quienes predicamos normalmente que tienen derechos, la idea de tener derechos no tiene por qué asociarse exclusivamente con ellos; para ser titular de un derecho es necesario que lo que se diga sea inteligible y funcional, de modo que otras entidades podrían tener derechos. Esto no significa aceptar que cualquier cosa pueda tener derechos, pero sí implica aceptar que algunos animales, por ejemplo, podrían tener derechos sin que ello suponga de ningún modo que tengamos que considerarlos personas, ni moral ni jurídicamente. II. EL CONCEPTO DE PERSONA Y LOS DERECHOS En algunas definiciones del concepto de persona se alude a los derechos como elemento definitorio, por ejemplo, cuando se sostiene que son personas aquellas entidades a las que se les adscriben derechos y obligaciones, que persona, como sostiene Kelsen, “es esas obligaciones y derechos subjetivos”.2 La persona para Kelsen es “no un hombre, sino la unidad personificada de las normas jurídicas que obligan y facultan a uno y el mismo hombre. No se trata de una realidad natural, sino de una construcción jurídica creada por la ciencia del derecho; de un concepto auxiliar para la exposición de hechos jurídicamente relevantes”.3 En este caso lo que sea una persona está en función de la mera adscripción de derechos y deberes. Desde esta posición, si la pregunta sobre quiénes tienen (o deben tener) derechos, la respondemos diciendo que las personas, la respuesta resultará tautológica; igualmente tautológica resultaría la afirmación de que las personas tienen derechos y obligaciones. No me interesa tratar este tipo de identificación conceptual que, me parece, se separa de la forma en que solemos usar los conceptos. Me interesan otro tipo de afirmaciones de cómo se entiende la relación entre el concepto de persona y el de derechos, por ejemplo, cuando se afirma que a) sólo las personas (algunas o todas) son capaces de tener derechos o son merecedoras de derechos o son únicamente de quienes se puede pre2 Kelsen, Hans, Teoría pura del derecho, México, UNAM, 1986, p. 183. También en algunas definiciones de filósofos se alude a este requisito, véase por ejemplo Rescher, Nicholas, “What is a Person?”, Human Interests. Reflections on Philosophical Antropology, California, Stanford University Press, 1990, pp. 6-21, en especial p. 12. 3 Ibidem, p. 184.
TITULARIDAD DE LOS DERECHOS
135
dicar inteligiblemente que tienen derechos, y b) cuando se dice que las personas (algunas o todas) son capaces de tener derechos, pero no se descarta a otras entidades que no son personas. En estos casos, para que no resulte una tautología lo que se dice, lo que se entienda por persona no debe estar definido en términos de tener derechos.4 Es importante que nuestra definición de persona no coincida con la de ser portador de derechos para que podamos determinar si los portadores de derechos deben ser o no personas. Aquí me parece que es necesaria una precisión. En las discusiones sobre la relación del concepto de persona con el tema de los derechos hay que determinar no sólo el tipo de concepto de persona al que nos referimos, sino el tipo de derechos del que estamos hablando, si de derechos morales o de derechos jurídicos (o, en sentido más amplio, derechos institucionales).5 Esta aclaración es pertinente porque las relaciones entre estos conceptos es compleja. Se puede afirmar, por ejemplo, que sólo las personas (en sentido moral) tienen derechos (morales), pero que otros seres como los bebés, los fetos, los animales, pueden ser personas jurídicas (no morales) y tener derechos (jurídicos) (Tooley). Cuando en ocasiones se discute el tema de los derechos de los animales o de las futuras generaciones, etcétera, algunos autores afirman que tienen (o deben tener) derechos, pero esta afirmación es imprecisa porque no especifican si se re4 Hay una definición del concepto de persona que usa la idea de derechos y que no resulta tautológica como la de Kelsen, me refiero a la definición de Michael Tooley, quien sostiene que decir “X es una persona” es sinónimo de “X tiene un derecho moral (serio) a la vida”, este uso difiere de aquellos donde se dice “X es persona” es equivalente a “X tiene derechos”. Según Tooley, si todo lo que tiene derechos tiene derecho a la vida, esta interpretación sería extensionalmente equivalente, pero él no acepta que esto sea así, sino que sostiene que ciertos animales pueden tener derechos, aunque no tendrían un derecho serio a la vida porque no son personas. Cfr., “Abortion and Infanticide”, Philosophy &Public Affairs, vol. 2, núm. 1, 1972, pp. 37-65, en especial p. 40. 5 Sobre la existencia de los derechos morales y sobre la distinción con los derechos jurídicos existe una amplia literatura, entre otros, puede verse: Hart, H. L. A., “Are There Any Natural Rights?”, Philosophical Review, 64/2, 1955, pp. 175-191; Dworkin, Ronald, Los derechos en serio, Barcelona, Ariel, 1984; Feinberg, Joel, “The Social Importance of Moral Rights”, en Tomberlin, James E. (ed.), Philosophical Perspectives. Ethics, núm. 6, 1992, pp. 175-198; Páramo, Juan Ramón de, “Derecho subjetivo”, en Garzón Valdés, Ernesto y Laporta, Francisco (coords.), Enciclopedia Iberoamericana de Filosofía, Madrid, Trotta, 1996, t. II, El Derecho y la Justicia, pp. 367-394; Laporta, Francisco, “Sobre el concepto de derechos humanos”, Doxa, Alicante, núm. 4, 1985, pp. 23-46; Nino, Carlos, Ética y derechos humanos, Buenos Aires, Ariel, 1989; Cruz Parcero, Juan Antonio, “Derechos morales: concepto y relevancia”, Isonomía, núm. 15, 2001, pp. 55-79.
136
JUAN ANTONIO CRUZ PARCERO
fieren a derechos morales o jurídicos. Feinberg, por ejemplo, acepta la distinción entre derechos morales y derechos jurídicos, y su tesis de que los animales, las futuras generaciones, los fetos, y algunos enfermos mentales tienen derechos (ciertos derechos) me parece que hace referencia a ciertos derechos morales, como el derecho a vivir, el derecho a curarse, el derecho a nacer, etcétera, por estar apoyados en un criterio que para él resulta moralmente relevante, que es el de tener intereses y poder beneficiarse. Pero también afirma que estos seres, aunque carezcan de otras capacidades importantes, pueden tener otros derechos jurídicos (contratar, heredar, propiedad, etcétera), que al igual que sus derechos morales, podrían ejercer a través de representantes.6 La conocida tesis de Tooley7 de que “persona” es aquel ser que tiene un “derecho serio a la vida”, sin duda se refiere a un derecho moral a la vida y no al reconocimiento jurídico de tal derecho. La legislación ambiental de un país podría proteger la vida de ciertos animales cuya especie se encuentra en peligro de extinción, pero ello no significaría que tuvieran un derecho moral a vivir y que fueran personas (aunque no descarta que algunos animales tengan un derecho serio a la vida y por tanto sean personas). Su polémica tesis consiste en sostener que aunque la vida de los fetos y los bebés estuviera protegida legalmente no significa que tengan un derecho serio (moral) a la vida, porque no tienen capacidad (actual, y no potencial) de tener deseos ni intereses, es decir, desde el punto de vista de su concepción moral no son personas. La idea de un “derecho serio” parece referirse a la idea de derechos morales.8 Si ahora usamos estos conceptos y los combinamos, obtenemos cuatro casos en que pueden relacionarse: a) Cuando se afirma que una persona moral o metafísica tiene derechos morales. 6 Véase Feinberg, Joel, “The Rights of Animals and Unborn Generations”, op. cit., nota 5. 7 Tooley, Michael, “Abortion and Infanticide”, Philosophy and Public Affairs, 1972, vol. 2, núm. 1, pp. 37-65. 8 Esto nos lleva a otro problema relacionado con otro concepto: el de derechos humanos. Si los derechos humanos son derechos morales (véase supra nota 4), y si llegamos a aceptar que, por ejemplo, algunos animales son personas, tendríamos que aceptar que les aplican al menos algunos derechos humanos. Y a la inversa, si llegamos a aceptar que algunos seres humanos no son personas morales entonces no les podemos atribuir derechos humanos.
TITULARIDAD DE LOS DERECHOS
137
b) Cuando se afirma que una persona moral o metafísica tiene (o debe tener) derechos jurídicos. c) Cuando se afirma que una persona jurídica tiene derechos morales.9 d) Cuando se afirma que una persona jurídica tiene (o debe tener) derechos jurídicos. Si los conceptos de persona en sentido moral y en sentido jurídico difieren porque no toda persona moral es persona jurídica (aunque deba serlo) y no toda persona jurídica es persona moral, entonces es importante distinguir el tipo de enunciado que utilizamos. Se puede llegar incluso a decir con sentido que una persona moral o metafísica tiene derecho (moral) a ser persona en sentido jurídico, es decir, a que se le reconozca legalmente ese estatus. Podemos agregar otras dos posibilidades: e) Cuando se afirma que una no-persona tiene derechos morales (por ejemplo, cuando se afirma que ciertos animales tienen el derecho a no ser torturados). f) Cuando se afirma que una no-persona tiene derechos jurídicos (cuando se dice, según ciertas leyes, que un animal tiene derecho a una herencia). III. EL LENGUAJE DE LOS DERECHOS Como se dijo en el apartado anterior, tener derechos no puede ser el elemento definitorio de lo que es una persona. Alan R. White distingue primero entre preguntarse por las condiciones necesarias y suficientes para ser capaz de tener un derecho y el preguntarse por las condiciones necesarias y suficientes para tener un derecho.10 Dentro de 9
En este caso, el enunciado lo que querría significar es que un sujeto a quien se le reconoce personalidad jurídica es también persona moral y, por tanto, se afirmaría que posee derechos morales. 10 Sobre esta segunda cuestión no me voy a detener, pero no debe confundirse con la anterior. Si algo es necesario y suficiente para tener la capacidad de tener derechos eso no significa que sea también suficiente para tener un determinado derecho. Para White los derechos necesitan un fundamento, se tiene un derecho en virtud de algo, de una característica que poseemos o por que alguien que lo tenía nos lo otorga. De aquí que puedan hacerse dos tipos de preguntas: “¿qué te da derecho a hacer V?” y “¿quién te da de-
138
JUAN ANTONIO CRUZ PARCERO
la primera cuestión distingue a su vez entre el problema de las condiciones necesarias y suficientes para la capacidad para tener derechos en general y la capacidad para tener algunos derechos en particular. La relación entre el primer y el segundo tipo de condiciones es que cualquier cosa que se requiera en general para tener un derecho será una condición necesaria pero no suficiente para tener un derecho en particular, pero no a la inversa.11 Tentativamente, sostiene White, se puede decir, en primer lugar, que una característica puramente lógica que es necesaria, pero no suficiente, es que ser capaz de tener un derecho a V, implica ser capaz de hacer V. Aquello de lo que no tiene sentido decir que puede hablar, sonreír, casarse, ser alimentado, informarse, sentirse decepcionado, no puede tener derecho a ninguna de esas cosas. Aunque ésta no es una condición suficiente, ya que, en primer lugar, podemos decir que el viento sopla, la inflación crece, el tiempo pasa y ello no significa que tenga sentido decir que el viento, la inflación o el tiempo tengan derecho a hacer tales cosas. En segundo lugar, el hecho de que alguien pueda hacer ciertas cosas no implica que tenga derecho a hacerlas, si no son el tipo de cosas sobre las que se puede predicar inteligiblemente que se tiene un derecho. En tercer lugar, aun si V es el tipo de cosa sobre la cual se puede predicar que se tiene un derecho, el hecho de que A pueda V no es condición suficiente para considerar capaz a A de tener derecho a V.12 White se opone a la teoría del interés y para ello parte de distinguir entre decir que algo tiene o es capaz de tener un interés en algo y decir que algo puede ser en su interés. Que algo pueda ser en interés de alguien o algo no muestra que pueda tener derecho a ello o que sea el tipo de ser que puede tener derechos. Que alguien pueda tener un interés en algo tampoco es condición ni necesaria ni suficiente para decir que sea el tipo de ser que puede tener derechos. Podemos tener derechos a cosas sobre las cuales no tenemos ningún interés y podemos aceptar, por ejemplo, recho a hacer V?”. Véase White, Alan R., Rights, Oxford, Clarendon Press, 1984, pp. 93 y 94. Por ejemplo, una persona puede ser capaz en lo general de tener derechos y además reunir ciertos requisitos generales para ser capaz de heredar (ser hijo, pariente, cónyuge, no haber incurrido en alguna causa de desheredación, etcétera), pero eso no significa que en realidad sea un heredero, i. e. que tenga el derecho a una herencia, para ello se requiere, entre algunas cosas, que alguien lo nombre heredero y que tal persona muera. 11 Ibidem, pp. 76 y 77. 12 Ibidem, p. 78.
TITULARIDAD DE LOS DERECHOS
139
que un animal tiene interés en su alimento, pero no necesariamente que tiene derecho a él; nosotros mismos podemos tener muchos intereses en cosas a las que no tenemos derecho. Con estos argumentos refuta a los defensores de la teoría del interés y llega a la conclusión de que muchas teorías jurídicas fracasan porque no existe ninguna característica sustantiva que por sí misma sea una condición necesaria y suficiente para considerar a alguien capaz de tener derechos. La sugerencia de White es que las características que pueden resultar relevantes son a lo mucho una marca de ciertos sujetos respecto de los que tiene sentido usar lo que denomina “el leguaje completo de los derechos” (the full language of rights).13 Un posible poseedor de derechos es cualquiera de quien pueda hablarse correctamente en ese lenguaje, es decir, cualquiera de quien pueda decirse inteligiblemente que ejerce, gana, disfruta, demanda, afirma, cede, etcétera, un derecho; de quien pueda lógicamente decirse que tiene un derecho a tal variedad de cosas, a tener deberes, privilegios, poderes, responsabilidades, etcétera. En el lenguaje completo de los derechos, afirma White, sólo una persona puede lógicamente ser sujeto de tales predicados; los derechos no son el tipo de cosas que puedan predicarse de las no-personas.14 Para White, en la medida en que consideremos personas a los fetos, los bebés, los incapacitados, los pacientes en estado vegetativo, los animales, etcétera, podemos atribuirles derechos. Aun quienes son prácticamente incapaces de hacer cosas como reclamar, disfrutar, ejercer, etcétera, un derecho pueden ser considerados poseedores de derechos. Un animal, un feto, un árbol, no pueden demandar, ejercer u otorgar derechos, pero el que eventualmente sean considerados personas permite atribuirles derechos. El derecho siempre ha ligado el concepto de persona con el de titular de derechos, deberes, responsabilidades, etcétera.15 13 14 15
Ibidem, p. 89. Ibidem, p. 90. En el lenguaje jurídico hay dos tipos de personas jurídicas, las “personas físicas” y las “personas colectivas” (que extrañamente a veces no son colectivas y que extrañamente son llamadas también “personas morales”). Estas últimas son aquellas corporaciones, sociedades, grupos, que conforman una unidad jurídica y a la que se le atribuyen derechos y obligaciones. Se usa el término “persona” seguramente no por alguna analogía con características o capacidades de los seres humanos, sino porque a estas corporaciones y grupos se les trata como a un “individuo”, como a una entidad unificada sin importar el número de miembros que la componen y sin importar el tipo de relaciones que existen entre ellos. Convendría reflexionar sobre qué tanta distorsión se ha generado en
140
JUAN ANTONIO CRUZ PARCERO
Sin embargo, White no nos dice por qué razón los derechos no pueden afirmarse de no personas, es un tanto paradójico que a fin de cuentas podamos atribuir derechos a cualquier tipo de entidad si la consideramos persona; es más, parecería que por definición cualquier entidad de la que se predique que tiene derechos tendría que ser considerada una persona y eso nos pone en una situación semejante a la de Kelsen donde persona es cualquier entidad a la que se le imputan derechos y deberes. El problema para la teoría jurídica consiste en pensar el concepto jurídico de persona como un concepto exclusivamente pragmático y no normativo, desvinculado por completo de los conceptos morales. La idea de White del uso completo del lenguaje de los derechos puede salvarse si nos sirve para determinar para qué usamos la noción de tener un derecho, esto es, qué significa decir que se es titular de un derecho. Las condiciones que establece White para predicar con sentido que alguien o algo tiene un derecho es un buen comienzo, pero él en vez de profundizar en esta línea de análisis, la interrumpe y acude a la noción de persona creyendo que finuestra comprensión de este tipo de fenómenos jurídicos debido a la utilización del concepto de persona. Si bien es innegable que a través de este concepto se han logrado simplificar muchos problemas como la realización de ciertas transacciones y relaciones civiles y mercantiles de todo tipo, sin embargo, el ver a tales entidades como a una persona, oscurece el hecho de que los derechos, obligaciones y responsabilidades —lo cual implica beneficios y cargas—, sean distribuidos en muchos casos de manera no equitativa, ya que estas corporaciones tienen una organización y estructura interna que reparte esas cargas y beneficios. Lo que se oscurece es que la “unidad”, la “persona colectiva”, por sí misma ni gana ni pierde nada, ni ejerce nada, ni es responsable de nada, ni tiene ningún derecho, sino que son ciertos individuos, que actúan como representantes, socios, etcétera, los que ejercen funciones, los que ganan y pierden, los que son o no responsables, etcétera. Como ha sostenido Hart, lo importante de conceptos como el de “persona colectiva” es determinar qué funciones cumplen cuando los empleamos en distintos enunciados; si se procede así, se encontrará que tales frases son equivalentes a enunciados sobre la conducta de ciertos individuos en determinadas condiciones, otras son traducibles a enunciados que se refieren a sistemas normativos, etcétera. Cfr., Hart, H. L. A., “Definición y teoría en la ciencia jurídica”, Derecho y moral. Contribuciones a su análisis, trad. de Genaro Carrió, Buenos Aires, Depalma, 1962, pp. 93-138, en especial pp. 130 y ss. Cuando en otra parte de este trabajo he sostenido que conviene no confundir la discusión sobre quienes son personas con la de quienes son titulares de derechos, además de pensar en casos como el de los animales, pienso en este caso en las personas colectivas, ya que aquí el concepto de persona no significa que estemos ante una persona moral o metafísica, es decir, asignamos derechos a ciertos grupos u organizaciones que no son personas en sentido moral, aunque usemos la palabra “persona” para referirnos a dichos grupos. Sin embargo, quiero dejar abierto el tema de por qué usamos el concepto de persona en estos casos, si resulta o no, y hasta qué punto, justificado este uso.
TITULARIDAD DE LOS DERECHOS
141
nalmente aquí se resuelve todo problema en torno a la titularidad. Para White casi cualquier cosa puede ser considerada persona y por consiguiente tener derechos. Esta conclusión es muy parecida a la de Kelsen. La idea que considero conviene rescatar de White es la de preguntarnos qué sentido tiene hablar de derechos y cuándo tiene sentido decir que algo o alguien tiene un derecho. “Tener un derecho”, aunque haya muchos problemas para dar una definición, implica, como muchos autores lo han enfatizado de diversas maneras, tener una demanda, una pretensión justificada (Feinberg, Martín), un poder (Wellman), una libertad (Hart), o una expectativa (Dworkin) para hacer o abstenerme de hacer algo, para que alguien más haga o se abstenga de algo o nos proporcione algo. Ésta es la idea central de tener un derecho, desde luego que habrá que complementarla diciendo entre otras cosas que tales demandas, poderes, expectativas, etcétera, deben estar apoyadas en algún tipo de normas (reglas o principios morales o jurídicos o de otro tipo). Esta idea nos lleva a sostener que un poseedor de derechos es un demandante, alguien que pretende algo o tiene una expectativa. El análisis de estas ideas no resulta sencillo y de cómo entendamos estas nociones tendremos una noción de titular de derechos, pero si no queremos llevar al absurdo la idea de tener un derecho, habrá que aceptar que sólo quienes pueden hacer una demanda, plantear una pretensión, tener una expectativa, etcétera, serán titulares de derechos. Este pueden plantea algunos problemas precisamente porque podemos aceptar que no es necesario que los sujetos tengan ciertas capacidades para que por sí mismos realicen ciertas acciones para demandar, exigir, un derecho. Esto nos lleva entonces a tener que plantearnos el problema de la representación y sus límites. IV. REPRESENTACIÓN Feinberg reconoce que los animales y los bebés, por ejemplo, no pueden acudir a una corte para reclamar sus derechos, no pueden iniciar por sí mismos un procedimiento legal, no son capaces de entender sus derechos, ni de darse cuenta de cuándo son violados, o de distinguir cuándo se comete un ilícito, o de responder con indignación o con algún sentido de justicia, más que el mero enojo o furia. Los argumentos de Feinberg para defender que los animales, los bebés, las futuras generaciones y los fetos tienen derechos (y no así las plantas, las especies y los seres huma-
142
JUAN ANTONIO CRUZ PARCERO
nos en estado vegetativo) consisten en sostener que debido a que poseen intereses y pueden beneficiarse, pueden entonces ser representados. Feinberg acertadamente no enfoca el problema de la titularidad de los derechos como si se tratara de determinar simultáneamente el concepto de persona, no dice en ningún momento que los animales o las futuras generaciones sean personas. Lo que hace Feinberg es introducir un criterio que puede servir para determinar cuándo, al menos, no es irracional adscribir derechos a ciertas entidades, este criterio es el de la representación. Empero, habrá que admitir que la condición para que algo pueda ser representado, esto es, tener intereses, no parece suficiente, ya que si tener un interés implica que es posible pensar en su bienestar y protegerlo, tal cosa puede conseguirse sin necesidad de nombrarle representantes. Obrar en interés de alguien o algo, como vimos antes, no implica que tengamos que tener una actitud personal ni considerarlo persona. Moral y jurídicamente hablando, cuando asumimos una actitud objetiva en ciertos casos es porque, como sostiene Strawson, consideramos que están fuera de nuestras “relaciones personales ordinarias”, a los animales los solemos ver en varios aspectos, como inhabilitados permanentemente —a diferencia de los bebés— para entablar relaciones ordinarias con nosotros. No negamos que puedan sufrir, sentir, y que en algunos aspectos se parezcan a nosotros. Pero es un argumento fuerte el decir que no pueden entablar relaciones morales y jurídicas por sí mismos, y ese no pueden16 es definitivo. En el caso de los bebés, los fetos, pacientes con ciertas deficiencias mentales no severas y las futuras generaciones, el que no puedan entablar relaciones ordinarias con nosotros no es una cuestión definitiva. No es, como piensa Feinberg, porque tienen intereses 16 El no pueden se refiere a que son incapaces de realizar ciertas conductas o acciones, este no pueden se reduce a las posibilidades fácticas para hacer o no hacer algo. La afirmación de que los animales o los bebés no pueden por sí mismos entablar relaciones se refiere a que son incapaces de realizar ciertas acciones; en el caso de los animales esa incapacidad “física” se mantiene invariable, es decir, es definitiva; en el caso de los bebés, en condiciones normales, se supera con el crecimiento y el aprendizaje. Este “poder” hay que distinguirlo de otros dos tipos: los “poderes deónticos” y los “poderes anankásticos”. El primer tipo de poder se refiere a lo que está permitido, alguien puede hacer o no hacer algo cuando esa conducta le está o no permitida, independientemente de que fácticamente pueda o no llevarla a cabo. Los poderes anankásticos se refieren a lo que se puede hacer o no dentro de un marco de reglas técnicas o institucionales, sin las cuales no se podría decir que tales conductas se pueden realizar, por ejemplo, contraer matrimonio, divorciarse, hacer un testamento válido, testificar, etcétera.
TITULARIDAD DE LOS DERECHOS
143
o pueden llegar a tenerlos, sino porque además pueden llegar a tener relaciones ordinarias o, en el caso de algunos enfermos mentales no graves, de hecho pueden tener ya algunas relaciones ordinarias con nosotros. Si las cosas trascurren con normalidad, los bebés y los fetos crecerán y podrán asumir por sí mismos sus derechos, obligaciones y responsabilidades. En el caso de algunos enfermos mentales y de las generaciones futuras, se necesita no el transcurso “normal” de los hechos para que puedan llegar a existir o a superar su deficiencia mental, sino que hagamos algo para asegurar que ello pueda ocurrir. Pero suponemos que tenemos esperanzas fundadas en que lo que hagamos resulte eficiente. Eso hace distintos los casos anteriores de los casos de los enfermos mentales graves, pacientes en coma o en estado vegetativo, los animales (al menos la gran mayoría de ellos) y plantas. En estos últimos no tenemos esperanzas fundadas de que aun haciendo algo por ellos, ellos puedan entablar con nosotros relaciones ordinarias. Por ello, se justifica que adoptemos una actitud objetiva17 y nos neguemos a atribuirles la calidad de personas, y los veamos también como incapacitados para asumir responsabilidades y deberes. El adscribirles algún derecho puede tener sentido en los casos de los bebés, los fetos y quizá algunos animales, y habrá que decir entonces qué razones podría haber para ello, aunque desde luego, no será porque son personas en el sentido de agentes morales, sino en todo caso porque son seres humanos, o animales con ciertas capacidades semejantes hasta cierto punto a las nuestras. Pero en los otros casos de plantas, la mayor parte de los animales, seres humanos en estado vegetativo, etcétera, el adscribirles derechos no tiene mucho sentido. Aceptar esto no significa que tengamos que aceptar el maltrato de los animales o de otros seres humanos. Nuestros deberes morales pueden incluir la exigencia de no hacerlos sufrir y de darles un trato adecuado. Podemos tratarlos de manera semejante a las personas pero hasta cierto punto. La idea de la dignidad humana, a pesar de ser una idea bastante confusa, normalmente suele relacionarse con la idea de que nuestras voliciones y nuestro consentimiento sean tomados en cuenta y suele incluir también la idea del respeto a la integridad. A los animales, enfermos mentales graves, o pacientes en estado de coma debemos y podemos tratarlos bien, pero lo que no podemos es tomar en cuenta sus voliciones y su consentimiento (salvo que en el caso de los pacientes en coma 17
Véase nota 19.
144
JUAN ANTONIO CRUZ PARCERO
o los enfermos mentales, se trate de un consentimiento o voluntad manifestados con anterioridad al estado en cuestión). La mayoría de los partidarios de los derechos de los niños, de los animales, etcétera, ponen énfasis en la teoría del interés o del beneficiario, es decir, resaltan el lado pasivo y consideran ciertas características como relevantes para dicho estatus, tales como la capacidad de sentir placer y dolor, la capacidad de tener intereses.18 Dado que ciertos seres humanos, los animales u otras entidades como las generaciones futuras o las especies, no pueden por sí mismos realizar ciertas acciones que den sentido al lenguaje de los derechos, estas teorías tienen que recurrir a la idea de la representación. Tales sujetos y entidades pueden ser adecuadamente representados por otras personas capaces de realizar por ellos ciertas acciones para demandar, proteger y garantizar sus derechos. De este modo las cuestiones de la personalidad, la acción y la asignación de derechos quedan conectadas a través de una técnica específica que es la representación. La representación podemos dividirla en dos tipos básicos, por una parte, la representación de personas que pueden ejercer por sí mismas sus derechos pero que por distintas circunstancias no pueden o no desean ejercerlas por sí mismas y nombran para ello un representante. Estos son casos de representación voluntaria que deriva de un contrato como el mandato, la representación de una sociedad, o casos donde la ley ordena la asistencia de un representante, como en la curatela y la asesoría legal. Por otro lado, la representación legal incluye casos especiales como la tutela, la patria potestad, la administración de bienes que difieren de los anteriores porque en estos últimos casos se trata de sujetos incapaces de ejercer por sí mismas sus derechos (enfermos mentales, bebés, niños pequeños, fetos, personas en estado de coma, ausentes, animales, etcétera). Se trata, pues, de una representación necesaria. Es a través de la técnica de la representación que ciertas reglas establecen que ciertos actos de otros se los atribuyamos a un sujeto distinto a quien muchas veces el derecho lo termina reconociendo como persona, precisamente por esa idea tan arraigada entre los juristas de identificar persona con titular de derechos. Pero la diferencia entre la representación voluntaria y la necesaria es que en esta última la representación se vuelve un requisito necesario para el ejercicio de la personalidad. Sólo 18 Esta capacidad es pasiva porque para algunos autores como Feinberg sólo requiere que algo sea en interés de alguien y no que ese sujeto tenga o tome interés en algo.
TITULARIDAD DE LOS DERECHOS
145
en la medida en que alguien que por sí mismo es incapaz de ejercer o reclamar cualquier tipo de derechos tenga un representante, podemos decir con algo de sentido que es poseedor de derechos. Por ejemplo, podríamos considerar a los animales titulares de derechos, pero si no tuviesen un representante que hablara por ellos, no serviría de nada, en nada cambiaría su situación, sería tan sólo una manera retórica de hablar. Conviene distinguir dos casos de representación necesaria; la permanente y la transitoria. La representación necesaria-permanente es aquella que se refiere a casos en donde la persona depende en todo momento del representante, por tanto, el representado en ningún momento podrá llegar a ejercer por sí mismo sus derechos, ya sea porque se trate de un ser que no tiene tal capacidad, o porque la perdió (total o parcialmente, en este último caso en un grado considerable) y no es factible que la recupere. La representación necesaria-transitoria es aquella en la que el representando es un ser que por el momento (debido a circunstancias normales o accidentales) no tiene la capacidad o no la suficiente para ejercer por sí mismo sus derechos, pero que si todo transcurre normalmente o se realizan ciertas acciones, llegará a tenerla o a recuperarla. Esta distinción nos tiene que hacer pensar en la relevancia y las funciones de la representación. En los casos de frontera, es decir, los casos sujetos a debate sobre el estatus de persona, más allá de la discusión filosófica, conviene preguntarse qué sentido, qué función, qué ventajas y desventajas puede tener tanto la representación necesaria y permanente (animales, plantas, objetos inanimados, especies, seres humanos con enfermedades metales graves e irreversibles), como la representación necesaria pero transitoria (niños, bebés, fetos, algunos enfermos mentales, sujetos en estado de coma que eventualmente pueda revertirse). Los casos son distintos porque aunque en los últimos casos citados podríamos dejar abierta la cuestión de si se trata de personas desde el punto de vista moral, hay otras razones19 que pueden justificar tanto que los tratemos como personas desde el punto de vista jurídico, como que les atribuyamos derechos. En estos casos la representación legal es una técnica jurídica adecuada y útil. En los otros casos no hay buenas razones para considerarlos personas jurídicas, además, la técnica de la representación tampoco cum19 Son seres humanos, potencialmente serán personas, es decir, podrán desarrollar por sí mismos ciertas capacidades que actualmente no tienen o no en el grado suficiente, etcétera.
146
JUAN ANTONIO CRUZ PARCERO
pliría con fines racionales. Podemos aceptar que en ciertos casos donde una persona pierde sus capacidades de forma permanente, por cuestiones de seguridad jurídica que tienen que ver con sus bienes, sus deberes y responsabilidades, se justifique al menos temporalmente que un representante actúe “en su nombre”, pero eso sólo puede ser útil durante un periodo de tiempo y no a largo plazo. ¿Para qué querríamos que un animal o un ser humano en estado vegetativo o uno con un trastorno mental muy severo (sin esperanza de que saliera de su estado), pudieran realizar actos jurídicos a través de representantes?, ¿cómo esto podría ayudarles a ellos mismos?, ¿qué beneficios sociales podrían justificar la ficción de considerarlos titulares de derechos? Además, el hecho de que el derecho los pueda llegar a tratar como personas jurídicas no implica que necesariamente los demás los veamos y tratemos como personas. No encuentro, pues, ninguna razón importante para que se insista en estos casos en reconocerles personalidad y en quererles adscribir derechos. Su bienestar puede ser asegurado por otros medios más efectivos y racionales. Aunque la representación es una técnica jurídica que puede permitir muchas ficciones, no tenemos que caer en el absurdo de pensar que eso nos permite atribuir personalidad jurídica y derechos a cualquier cosa.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO Magdalena ESPINOSA GÓMEZ* SUMARIO: I. Nota introductoria. II. Génesis y características del derecho. III. Para qué sirve. IV. Conclusiones. V. Bibliografía.
I. NOTA INTRODUCTORIA De antemano se expresa la imposibilidad de resolver en unas cuantas líneas el contenido de la filosofía del derecho; sin embargo, este trabajo refleja la inquietud observada durante más de 25 años de docencia, respecto a lo que se considera conveniente diferenciar y delimitar sobre la materia. Para contestar ¿Qué es el derecho? se tienen que determinar sus cuatro causas: eficiente, material, formal y final. Esto es, poder identificar de dónde surge, qué es, cómo es y para qué sirve. En un inicio se parte del hecho de que el derecho no es un ser que se encuentra como dado en la naturaleza, sino que implica el ser creado. Su causa eficiente es el hombre, con lo cual queda asentado que es un producto humano. Para conocer qué es, es necesario identificar cómo y de qué está hecho; cabe entonces distinguir todos los elementos que le sirven de materia prima, integrados por los datos previos u ontológicos; así como por los datos axiológicos o ideales que también le anteceden, éstos son los valores que el grupo tiene y a los que aspira, como el orden, la seguridad y la justicia. Ambos datos, hechos y valores constituyen su causa material, ésta necesita ser delimitada por una forma que le brinde la estructura que la contenga. Habida ésta, quedará depositada como contenido dentro de ella. La causa formal será entonces la norma jurídica; misma que demanda ser * Facultad de Estudios Superiores Acatlán, UNAM, México. 147
148
MAGDALENA ESPINOSA GÓMEZ
construida mediante conceptos, proposiciones y argumentos expresados por la palabra escrita con la cual se le dará forma tangible al contenido intangible. En lo formulado mediante la norma jurídica queda inmersa, como una válvula de seguridad, la coercibilidad, entendida como la posibilidad, en el supuesto caso de ser violada, del uso legítimo de la fuerza. La norma, una vez plasmada, tiene que ser interpretada por el juez para poder aplicarla, él tendrá que desentrañar su sentido y con el mismo resolver el caso concreto de vida. Así, este derecho positivo se convierte en la herramienta idónea para ello. Pero es adecuado remarcar que es tan sólo eso, un instrumento, quien lo hace y el que lo utiliza es el hombre. Se considera importante delinear el campo lógico-lingüístico que corresponde al texto de las normas jurídicas, lo que corresponde al ordenamiento jurídico; y por otro lado a identificar al derecho en el valor a ser realizado, como contenido de ellas y de la conducta humana impregnada de intenciones, pensamiento y emociones, situaciones que corresponden a distintas categorías de ser. II. GÉNESIS Y CARACTERÍSTICAS DEL DERECHO 1. Ubicación del derecho Para identificar a ese ser que llamamos derecho se requiere conocer en qué contexto puede ser ubicado. Nicolai Hartmann1 se aboca a explicar la realidad, refiriéndose a la estructura estratificada del ser, misma que puede ser agrupada en distintos mundos o estratos. Comenta que estos diversos campos del ser se brindan apoyo y soporte recíprocamente, del primero a los subsiguientes. Dichos mundos pueden identificarse en su conformación como cuatro estratos: 1) el inorgánico, 2) él orgánico, 3) el psíquico y 4) el espiritual. Cada uno tiene sus leyes propias: la física y química inorgánica para el primero; la química orgánica y la biológica para el segundo, las psíquicas para el tercero y las espirituales para el cuarto, siendo éstas la lógica y la ética. Todas ellas conforman el principio de legalidad, por ello los estratos están estrechamente vinculados, no se dan aislados y se interrelacionan entre sí.
1
Hartmann, Nicolai, Ontología, 2a. ed., México, FCE, 1986, t. III y t. IV.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
149
El primero es la base, el apoyo y cimiento de los demás, sin él los otros no serían, éste es en relación de ellos independiente, puesto que no necesita de los demás para ser. Ellos a su vez son verticalmente dependientes: el segundo del primero y así sucesivamente, el tercero del segundo y el cuarto del tercero. De este modo, el más dependiente resulta ser el espiritual, pues para ser requiere de todos los demás. Más aún, a efecto de poder ser, siempre el estrato superior ha de respetar la ley o leyes del inferior (es) , bajo la pena y riesgo de su misma destrucción, así al mundo espiritual corresponde respetar tanto sus propias leyes: la lógica y la ética, como también la ley psíquica, la biológica, la química y la física. Se habla entonces de la dependencia que existe entre cada campo, paradójicamente, se consideraba al hombre como el ser libre. Sin embargo, visto así, resulta ser el ser más dependiente dado que al decir de Gibran: “El verdadero hombre libre es aquel que acepta, pacientemente, el peso de sus cadenas”;2 ¿puede el hombre violar las leyes en las que está inmerso? Si es parte del Universo, está sujeto a ellas. Recaséns dice que el hombre es “libre albedrío”, con esta frase se expresa rigurosamente la situación o inserción del hombre en su circunstancia, es decir, su situación en el Universo”,3 con lo cual se explica la violación del orden dado y sobre todo, el desorden creado. Por último, Hartmann comenta que la posibilidad que tiene cada estrato dentro de sí mismo de comportarse bajo sus propios principios se identifica horizontalmente como autonomía. Analógicamente, esto puede observarse con la evolución misma del planeta Tierra, pues de los 4 600 millones de años que los geólogos le dan de existencia, éstos se distribuyen así: 3 000 millones corresponden a la era Azoica o sin vida; hace 1 000 millones de años inicia la etapa Proterozoica con las primeras algas como organismos vivos; hace 600 millones surgen los primeros invertebrados; hace 500 se forman los arrecifes de coral, abundaron las esponjas y moluscos; hace 400 millones de años se dan las primeras plantas terrestres y los primeros peces; los anfibios emergen alrededor de los 350 millones de años; hace 270 millones de años surgen las primeras coníferas y los primeros reptiles; hacia los 220 millones aparecen los primeros mamíferos y dinosaurios, se forma la pangea y ésta se empieza a desgajar alrededor de los 180 millones de 2 3
Jalil, Gibran, Arena y espuma, Buenos Aires, La Salamandra, 1976, p. 39. Recaséns Siches, Luis, Introducción al derecho, México, Porrúa, 1970, p. 21.
150
MAGDALENA ESPINOSA GÓMEZ
años; hace 135 millones surgen las primeras plantas con flores y las primeras aves; los dinosaurios se extinguen hace 70 millones, se extienden los mamíferos modernos e inician los primeros primates; en los 60 millones se separa Sudamérica del sur de África; por los 40 millones surgen los primeros monos; aproximadamente a los 25 millones se forma el sistema montañoso himalayo-alpino y aparecen mamíferos herbívoros; hace 10 millones se encuentran los primeros homínidos; en el Pleistoceno se dan las glaciaciones alternadas con periodos cálidos, inicia la era Cuaternaria, cerca de los 3 millones de años aparece el homo hábilis, así como los australopithecus ; hace un millón 500 mil años el homo erectus y apenas hace 100 mil años el homo sapiens neanderthalensis.4 Esta relación tiene como propósito el poder identificar con claridad la ubicación temporal respecto del hombre, así como el poder brindarnos la compresión de lo que Hartmann explica en relación a esos cuatro mundos o estratos de la realidad: el inorgánico o sin vida; el orgánico o de los seres vivos; el psicológico o del conocimiento, y el espiritual correspondiente al ser humano. Como se vio en las líneas precedentes, en la naturaleza tuvo que pasar mucho tiempo para que pudiera darse la manifestación del estrato espiritual. Pues en relación de los 4 600 millones 5 de años de existencia de la Tierra ¿qué son los 100 mil años que corresponden a la presencia del homo sapiens? Para que el lenguaje apareciera, el esqueleto encorvado que se apoyaba sobre los puños, tuvo que transformarse hasta la posición erguida, indispensable para la maduración tanto del cerebro, como del órgano de la laringe, conformado hasta la cavidad del paladar para que como bóveda pudiera permitir la acústica del verbo. Por la mano humana el cultivo fue transformando el medio, y por aquella relación constante, gracias a la oposición del pulgar como ahora lo confirma la neurología, el córtex se desarrolló y, paralelamente, es en este momento cuando la facultad de abstracción está presente, es el mundo de la esencia captando esencias: el pensamiento.6 A partir de entonces, mediante la correlación sujeto-ob4 Leakey, Richard y Lewin, Roger, Los orígenes del hombre, Madrid, 1980, pp. 12-15 y 84-85. 5 Hay fuentes recientes que aceptan 4 700 millones de años. 6 Popper, Karl y Eccles, John, El Yo y su cerebro, Barcelona, Labor Universitaria, 1985, capítulo 1, pp. 257- 264.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
151
jeto y la retroalimentación objeto-sujeto, surgió la capacidad de conocer y de nombrar. Así, lentamente florecieron el arte, la técnica, la filosofía y la ciencia; en una palabra, la cultura con la que emerge el mundo civilizado. Pero para que esto se diera, fue necesario que el lenguaje se conformara, que las formas-pensamiento brotadas, no de un individuo sino de muchos, se estructuraran e integraran mediante el sonido o los signos impregnados de significado para la comunidad. Éste es el momento en el que se manifiesta el florecimiento del estrato espiritual, propio del hombre cuya esencia integrada por razón, voluntad y libertad; ella está regida por las leyes correspondientes: la lógica, cuyo fin es la verdad, y la ética, cuyo propósito es el bien. Sin embargo, en cuanto a la libertad Ovidio decía: “Veo lo que es mejor, lo apruebo como tal, pero hago lo peor”.7 Efectivamente: “Razón, voluntad y libertad, constituyen para el hombre un poder inmenso; son un honor y un riesgo”.8 Este es el gran reto de la humanidad, manifestar la esencia de su verdadero ser. El espíritu como tal es inmaterial, se expresa en el hombre a través de su cuerpo. El yo pensante usará de la voz en la palabra, o de sus manos o cara en gestos para comunicarse. La relevancia del lenguaje implica el que se haga énfasis en lo siguiente: en la comunicación es importante tener siempre presente el peso de sus componentes: así, a las palabras corresponde el 7%, al tono de voz el 38%, y al lenguaje corporal o analógico, es decir: la postura, los gestos y el contacto visual, el 55 % (Mehrabien y Ferris, 1967). Las manifestaciones del espíritu tienen que objetivarse, plasmarse en la dimensión física para que cobren sentido a los demás. Como producto de su creador, de igual manera el derecho posee un ser espiritual. Sólo el espíritu y por lo mismo sus productos logran trascender, ir más allá del tiempo y del espacio; así mismo pueden ser desentrañados y comprendidos en sus significados por otras personas en otro tiempo-espacio. Los productos espirituales pueden ser de dos clases: individuales y colectivos. Piénsese en los primeros, por ejemplo, en La piedad o la Quinta sinfonía de Beethoven, o en el Quijote, sus creadores han desapa7 Preciado Hernández, R., Lecciones de filosofía del derecho, 6a. ed., México, Jus, 1970, p. 114. 8 Ibidem, p. 89.
152
MAGDALENA ESPINOSA GÓMEZ
recido hace tiempo y sus obras permanecen más allá de la vida de aquéllos. En relación a los colectivos, son aquellos generados por un grupo. De esta manera, particular importancia cobra el lenguaje, dado que es el primer producto conjunto gracias al cual los integrantes de una colectividad se expresan y comunican con un código de conceptos-símbolos-palabras para identificar su realidad y manifestar también su interioridad. Así, el lenguaje constituye en el género humano el primer producto común objetivado. Puede afirmarse que antes de que exista un lenguaje estructurado no hay derecho, por lo que hacer referencia al origen del derecho lo implica, siendo el lenguaje el vehículo para lograr su construcción, expresión y aplicación. A su vez, es necesario recalcar que nuestra disciplina es también un producto del espíritu común, puesto que reúne los ideales y metas, las aspiraciones conjuntas que vinculan al grupo que pretende darse una forma organizada. Es entonces de este modo que su ser se conforma, gracias a ese otro fruto colectivo el lenguaje, quedando incorporado en sus enunciados el modo de ser, de pensar y de sentir de la comunidad comprometida en su realización. De manera que el derecho no es algo que se encuentra dado espontáneamente en la naturaleza, sino que gracias al hombre tiene que surgir, concretarse, formarse, elaborarse, hacerse. Se hace uso a todo propósito de la reiteración de sinónimos con el efecto de dejar bien sentado que: el ser del derecho tiene que ser “puesto” en la existencia, tiene que hacerse manifiesto, es decir, objetivarse, positivarse. El derecho es una creación humana y al usar los vocablos “derecho natural”, un término se contradice con el otro, puesto que lo natural es algo espontáneamente dado y el derecho siempre es creado. Todavía ahora es común que el alumno y no pocos profesores, acepten sin cuestionar la idea del “derecho natural” como algo que estuvo ahí desde siempre. Es importante señalar el orden natural, como Hartmann lo refiere, expresando las leyes propias de cada mundo, y ahí no aparece el derecho. Por otro lado, si ha de vérsele sistemáticamente integrado como ciencia, eso es algo sumamente reciente, pues es Hans Kelsen quien le da esta calidad apenas en 1911, hace menos de cien años.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
153
2. ¿Qué es el derecho? En la posmodernidad, su génesis ha de entenderse como la expresión conjunta de la impronta espiritual9 de un determinado grupo social cuyo propósito es conformarse adecuadamente, dándose una organización política y jurídica, a través de la norma construida ex profeso; en donde el poder constituyente, como representación nacional, logre plasmar esas aspiraciones colectivas sobre su determinación de ser como: poder constituido, institucionalizado, formalizado, establecido. Ello entonces, tiene que cobrar expresión. A ese conjunto de ideas, pensamientos de organización y de conformación, se les engloba bajo el término Constitución, siendo ésta el punto de partida y el fundamento del ulterior ordenamiento jurídico, al que se puede entender como: “El sistema de preceptos sustentados y determinados en su contenido por una (espacial y temporalmente delimitada) comunidad social (o por la clase dirigente de la misma), para la conducta externa de los miembros de dicha comunidad, cuya inobservancia es contrarrestada mediante apremios o penas”.10 Estando cohesionado al interior por la “impronta espiritual” y el exterior por el espacio y el tiempo. Los juristas escuchamos esto con naturalidad. Pero, ¿acaso nos hemos detenido a ver realmente qué es y cómo se gesta ese ser al que llamamos derecho?. En su origen hay un conjunto de anhelos, de ideas y propósitos que pueden incluirse en el concepto ideología. Ese modo de “sentir” —campo emocional— y de “pensar” —campo racional— corresponde dentro de los órdenes del ser a los entes inmateriales dado que su ser es incorpóreo. La conducta humana es su materia prima, pero a los abogados, poco o nada se nos enseña de ella, siendo que las relaciones humanas están impregnadas de emociones y pasiones. El hombre manifiesta en sus actos lo que piensa y lo que siente. A raíz de la fotografía lograda por Semyon Kirlian en Rusia en 1949,11 se pudo constatar que los pensamientos y las emociones, son expresiones que se manifiestan como campos electromagnéticos. La electricidad cerebral se midió por vez primera en 1917 en Alemania por el 9 10 11
Hans, Nawiasky, Teoría general del derecho, México, Editora Nacional, 1980, p. 49. Ibidem, p. 51. Davis, Mikol y Lane, Earle, Rainbows of Life, The Promise of Kirlian Photography, Nueva York, Harper Colophon Books, 1978, pp. 13 y 37.
154
MAGDALENA ESPINOSA GÓMEZ
doctor Hans Berger, en la Universidad de Jena,12 surgiendo así el electroencefalograma (EEG). En relación a las emociones, han sido estudiadas por la doctora Thelma Moss en el Instituto de Neuropsiquiatría en la Universidad de los Angeles, California, quien en los años setenta logró captar los diferentes estados de ánimo, de salud, la empatía en las relaciones y el consumo de substancias, como campos magnéticos en placas de fotografía kirliana.13 Así, el amor, el odio, la tristeza, la alegría o el enojo, el consumo de alcohol o de drogas se reconocen por el espectro que conforman y el color que emanan en la corona de luz que emana de la yema del dedo índice. Desde el magnetismo de Messmer, que entonces parecía una mera ilusión, hasta nuestros días, el avance de la tecnología y la ciencia permite ampliar el campo de conocimiento hacia esas realidades no materiales. En nuestra disciplina es importante identificar en relación a la conducta la intención, la buena o mala fe, la alevosía, etcétera. Así como lo que implica para la persona la justicia, la paz o la seguridad. Cuestiones todas ellas, que no pertenecen a las manifestaciones materiales. Al respecto Villoro Toranzo afirma: Cuanto más nos demos cuenta de las influencias que nos afectan, mejor podremos controlarlas y así hacer más válido y seguro nuestro avance. Los prejuicios contra lo metafísico deberán ser refrenados. En realidad, el hombre continuamente hace metafísica, es decir, pasa del mundo observado con los sentidos a conclusiones no observables; es lo que nos distingue de otras especies animales.
Como dice Kuhn: En el uso metafórico tanto como en el literal de “ver”, la interpretación empieza donde la percepción termina... No vemos los electrones, sino antes bien su recorrido, o bien burbujas de vapor en una cámara anublada. No vemos por nada las corrientes eléctricas, sino antes bien, la aguja de un amperímetro o de un galvanómetro.14
12 Eccles, John, “Bases neurofisiológicas del espíritu”, La Vida Enciclopedia, España, Salvat, 1961, t. V, p. 71. 13 Jeffrey, Mishlove, The Roots of Consciousness, Nueva York, Random House, 1975, t. V. 14 Kuhn, Thomas, La estructura de las revoluciones científicas, México, FCE, 1986, pp. 300-303.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
155
Análogamente podemos decir que no vemos al derecho ni a la justicia, pero sí situaciones que exigen su presencia u otras situaciones donde comprobamos sus efectos. Por eso podemos estudiar al derecho y a la justicia, y contra todos los prejuicios positivistas debemos defender la existencia de una ciencia del derecho y de la justicia. 15
Por su parte, el doctor Fix-Zamudio dice: La problemática en la investigación jurídica resulta muy complicada en la actualidad, ya que no sólo requiere del empleo de la técnica científica, sino de la metodología filosófica, pues el problema de la investigación no puede detenerse exclusivamente en la escala científica, sino que para llegar a ser sistemática, y por lo tanto fructífera, tiene que ascender hasta las esencias, hasta la metafísica.16
Paralelamente, esto “metafísico” que no puede tocarse por ser espiritual, constituye la fuerza de cohesión del grupo social, es lo que se siente, en lo que se cree y se valora colectivamente, transmitiéndose de generación en generación. Su importancia es tal que requiere ser plasmada para lograr ser conocida y captada en su significado por todos aquellos que no intervinieron directamente en su elaboración, la mayoría que delegó su confianza en sus representantes, con el deseo de poder ser organizada y ordenada, así como por los que aún no habían nacido y por los que nacerán en las futuras generaciones. Por ello corresponde a quienes lo crean dar a conocer los acuerdos constituidos y, a través de la promulgación adecuada, poder dejar en claro que los consensos tomados serán cumplidos al haber cobrado expresión y fuerza en la ley fundamental. Esto es la base del Estado de derecho. Dado que: “Nada humano es posible en la anarquía”;17 y habiendo señalado parte del contexto que brinda algunos de los aspectos para poder establecer lo jurídico, cabe preguntar: 3. ¿Cómo se conforma el ser del derecho? El de una casa, con varilla, cemento, tabiques; el de una flor, con pétalos de suave textura, aroma delicado, tallo y hojas; el de un animal, por 15 16
Villoro Toranzo, Miguel, Teoría general del derecho, México, Porrúa, 1989, p. 137. Fix-Zamudio, Héctor, Metodología, docencia e investigación jurídicas, 3a. ed., México, Porrúa, 1988, p. 69. 17 Maldonado, Adolfo, “Génesis espontánea del derecho y la unidad social”, Revista Facultad de Derecho, México, núm. 23, julio-septiembre de 1956, p. 11.
156
MAGDALENA ESPINOSA GÓMEZ
el conjunto armónico de millones de células organizadas, como un delfín, un águila, un caballo o nuestro fiel amigo, un perro. El hombre mismo se configura en estructura ósea, tejido muscular, sistema respiratorio, digestivo, nervioso, endocrino, como partes que integran su cuerpo físico. Mas su verdadero ser, el que piensa, quiere y siente, tiene una sustancia distinta, es incorpórea y espiritual, perteneciendo como tal al cuarto estrato que Hartmann refiere como espiritual, en donde se generan los productos culturales. Lo que denominamos derecho queda incorporado en la Constitución que tuvo que ser redactada, construida por conceptos, enunciados y argumentos con un sentido, con un propósito, con un fin cierto y determinado. Al manifestarse en un texto integrado y congruente, al usar papel y tinta, cobra manifestación externa en el mundo de la forma, por ello puede decirse que el derecho es un producto del espíritu común objetivado. Como objeto, su ser materializado, al ser inanimado pertenecerá al mundo inorgánico; pero si se quemaran todas las Constituciones y los códigos, el derecho como tal permanecería, pues por su carácter espiritual trasciende la materia en que quedó plasmado, al decir del maestro Recaséns es un “pensamiento convertido en cosa.18 Desaparece pues “la cosa”, el libreto, el código; pero permanece la impronta espiritual en la conciencia colectiva y en otro elemento muy importante —la conducta humana— que se conserva y guarda por los hábitos, en la memoria, tanto del grupo, como del individuo. El derecho como entidad espiritual y abstracta se hace concreto a través de la palabra, en sus inicios oral, hoy, generalmente, escrita. Para “su establecimiento sólo dispone del concepto. Pero para Engish, éste, al reasumir las características de fenómenos de la vida en una estructura de pensamiento o de sentido, es necesariamente abstracto, prescinde de las individualidades de los objetos aprehendidos o concebidos y “mata” con ello, forzosamente, la vida peculiar de lo que sólo una vez se hace realidad”.19 Ahora bien, el derecho, dice Recaséns, es “vida humana objetivada ” y como tal emerge de situaciones, de hechos reales, del vivir cotidiano.20 Se ha dicho que el derecho es hecho, valor y norma. El hecho es el fenómeno dado como tal en situaciones específicas, concretas en un sitio y en 18 19
Recaséns Siches, Luis, op. cit., nota 3, p. 25. Henkel, Heinrich, Introducción a la filosofía del derecho, Madrid, Taurus, 1980, p. 578. 20 Recaséns Siches, Luis, op. cit., nota 3, p. 26.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
157
un tiempo determinado. El valor es tanto lo que le da origen, como el cauce hacia donde pretenden dirigirse los hechos futuros como la meta ideal porque el grupo lo considera así conveniente; para cumplir con éste y prever aquél se crea la norma jurídica. Ella será la concretización en la que se integran tanto los hechos, es decir, los problemas surgidos de la realidad histórica, como la solución considerada adecuada de ellos. De tal modo, la norma adquiere su carácter de jurídica, al dársele la forma según el ordenamiento jurídico específico lo establezca. Vemos entonces que en la conformación del derecho se tienen que combinar y concordar varias especies y cosas de distintas categorías, tanto corpóreas como incorpóreas, como serían los hechos, los problemas y sus posibles soluciones, así como las conductas, intenciones, los ideales y las metas o propósitos valiosos para el grupo. Para explicar esto, Heinrich Henkel se refiere a cuatro momentos o etapas del derecho. Al primero lo denomina datos previos o reales: ontológicos, que constituirán el primer momento de aprehensión de la realidad para la conformación del derecho. Al segundo, el dato a cumplir, formado por lo que llama la idea de derecho, en donde se comprenden los aspectos axiológicos, integrada por los ideales de justicia, seguridad y orden. Al tercero, el momento de cotejo de las condiciones a ser consideradas para su creación, en donde se tienen que contrastar los hechos del primero y los valores del segundo. Es la etapa del proyecto para la formación o construcción de la ley, lo cual toca al legislador. Y un cuarto será la aplicación de ella, actividad que corresponde al juez tanto en su interpretación, como en su aplicación21 (véase la gráfica). Los datos previos, son los factores reales existentes antes de la creación del derecho. Son muy complejos, pues incluyen a la realidad misma. Él los relaciona de la siguiente forma: 1. La determinación antropológica del hombre, como la autodeterminación del comportamiento y su responsabilidad. La persona como titular de derechos y obligaciones con la pretensión de una esfera propia de libertad que le permita su integración vital. 2. Las cosas, objetos del mundo real con sus leyes naturales propias y sus distintas estructuras ontológicas, en el sentido de Hartmann. 3. El mundo social humano, las estructuras sociales; comunidad, sociedad, organización, relación de fuerza y relación de lucha y sus reglas de juego. 21
Henkel, Heinrich, op. cit., nota 19, partes 1a. a 3a.
158
MAGDALENA ESPINOSA GÓMEZ
4. La típica teleología de coactuación humana en el tráfico económico de intercambio se presenta en estructuras de fin e interés, condicionado mediante la ponderación y el control valorativos. 5. Usos y prácticas como modelos del comportamiento socialmente correcto, la moral social. 6. El orden social de valores, acervo de valores e ideologías de la sociedad como directrices del comportamiento social. 7. Las instituciones, productos pre-jurídicos con arraigo consuetudinario, más las exigencias de las ideas rectoras políticas. 8. Las estructuras lógico-reales que para la solución jurídica representan correspondencias permanentes y ontológicas: El orden social frente a un plan jurídico que le orienta y 9. Las realidades diversas y cambiantes de la vida social, como la economía, las condiciones técnicas, etcétera. Como puede verse, son muchos los aspectos de la realidad que brindan un punto de apoyo y que han de ser tomados en cuenta en la elaboración del derecho.22 En el segundo momento, el dato a cumplir por el derecho es llamado el dato ideal. En él se agrupan las ideas valorativas directrices del derecho, es lo que se ha de lograr y está integrado por: a) El principio de justicia; b) de equidad; c) La oportunidad; como la adecuada realización de fines para la práctica del derecho y d) La seguridad jurídica, que indicará el contenido jurídico a encontrar. Entre ellas suelen darse tensiones en relación a los problemas a resolver, a las que identifica como la polaridad. A veces ha de prevalecer y se ha de dar preferencia a una u otra de ellas, según lo requiera la ocasión.23 Todos estos puntos del dato real o previo, o del ideal o a cumplir del derecho, Henkel los agrupa bajo la palabra topoi. Este vocablo integra todo lo que se ha de tomar en cuenta por el legislador para obtener lo que él llama el derecho correcto y los pasos a lograrlo son: 1. El legislador ha de ver el problema material contemplado en la realidad de los hechos y la posibilidad de futura solución: sujetos, objetos, comportamientos, con el fin de orientar su plan jurídico. 2. Es raro que se use un sólo topoi, generalmente es necesaria una pluralidad para solucionar un problema. 22 23
Ibidem, pp. 267-470. Ibidem, pp. 489-553.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
159
3. Los posibles a resolverlo deberán ser puestos en mutua relación, seleccionando una preferencia jerárquica acorde con el problema material. Se procurará armonizar las tendencias en un adecuado reparto de influencias. Esta actividad de sopesar y ponderar se caracteriza como el arte del descubrimiento en el camino para obtener el derecho correcto. Por lo mismo y como se ve, su método de obtención es muy complejo. 4. La relación de los diversos topoi deja un espacio libre para elegir y decidir; la opción ha de sujetarse a la idea de bien común. Para Henkel el bien común es un fin directriz trascendente, es la idea promovedora y predominante; como ideal social, esta idea existe antes de toda conformación y es supratemporal por la constante exigencia de mejoramiento social. Actúa como una fuerza inmanente, es la meta que custodia la impronta espiritual y se convierte en un elemento constitutivo de toda positivación de derecho, tanto en la norma abstracta, como en la casuística. El bien común es la última interpretación de las normas jurídicas, no es ni principio jurídico, ni norma jurídica y la que lo niegue o contradiga no deberá aplicarse.24 La solución encontrada, que toma en cuenta tanto a topoi como al bien común puede calificarse de derecho correcto, que no debe equipararse a perfecto pues, como afirma Schiller, las ideas conviven apaciblemente, pero las cosas chocan duramente en el espacio.25 El derecho correcto incorpora la esencia del derecho verdadero, y el derecho positivo la vigencia existencial del derecho. De tal manera que el derecho correcto sin vigor es imperfecto, por lo cual tiene como meta el llegar a ser positivo, ésa es su tarea permanente. La positivación del derecho es necesaria a fin de lograr este derecho correcto.26 A este fenómeno de la positivación se le puede entender también, como la concretización del derecho. De igual manera, Villoro enfatiza el arte del derecho como la actividad que implica a la esencia humana del jurista al valorar y elegir los aspectos tanto ontológicos como axiológicos, logrando, al seleccionarlos e integrarlos en la construcción normativa, el propósito a ser realizado, tarea que incumbe al legislador.27
24 25 26 27
Ibidem, pp. 594 y ss. Ibidem, p. 690. Ibidem, p. 676. Villoro Toranzo, Miguel, Introducción al derecho, México, Porrúa, 1966, p. 142.
160
MAGDALENA ESPINOSA GÓMEZ
4. Formación de la norma jurídica. El ordenamiento jurídico La causa formal del derecho se plasma en la norma jurídica, llegando a este punto se ha de tener el cuidado de observar que materia y forma se confunden; una vez que los datos ontológicos y axiológicos que son su causa material se implantan —como contenido— mediante la palabra; si bien éste queda inmerso en el significado, al exterior lo que se muestra es la forma en un texto. Entonces será necesario que aquel que tenga la capacidad de hacerlo, descubriendo su sentido, vuelva a encontrarlo para poder apreciarlo más allá de las letras. Así, una vez que la Constitución ha determinando el modo en que han de surgir las normas de derecho obligatorias para los particulares, los actos en los que ellas adquieren existencia se denominan leyes. En ellas se indica cómo deben comportarse los ciudadanos, así como las consecuencias de su posible incumplimiento. La ley necesita una forma externa para que pueda ser reconocida como norma obligatoria, por ello se habla de ley formal; y sólo por medio de la leyes nacen las normas jurídicas vinculantes. De ese modo también se va integrando poco a poco el sistema jerárquico de esas normas jurídicas: el ordenamiento jurídico.28 Ahora bien, ello se necesita construir a través de los denominados esquemas jurídicos. En general se entiende por esquema, “la representación gráfica o simbólica de cosas materiales o inmateriales”.29 Villoro Toranzo dice que “Los esquemas jurídicos vienen a ser como unos hilos que religan la situación real concreta con la solución justa, esos hilos forman un verdadero tejido que es el sistema de derecho”.30 Para el autor hay siete clases de esquemas que abarcan como pequeñas piezas desde lo más sencillo hasta lo más complejo de la maquinaria jurídica y serían como las letras, las palabras, las frases, las oraciones y los argumentos en una obra literaria. Ellos son: 1) Los conceptos jurídicos que constituyen la estructura esencial de toda norma, de toda figura y de toda situación jurídica, son conceptos puros, ajenos a la experiencia, indispensables en toda realidad jurídica histórica o posible. Atienden la “esencia” y son condicionantes de todo pensamiento jurídico.31 28 29 30 31
Nawiasky, Hans, op. cit., nota 9, p. 73. Diccionario de la lengua española, 22 ed., 2001, t. 5, p. 667. Villoro, Toranzo, Miguel, op. cit., nota 27, p. 241. Ibidem, p. 242.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
161
2) Los cuerpos jurídicos atienden a la “naturaleza”, Von Ihering, a quien se debe su explicación, dice que éstos se definen atendiendo a su fin, función, a su utilidad. Son conceptos jurídicos proyectados en la vida jurídica, sirviendo de instrumentos para la consecución de determinados fines y exigiendo deberes jurídicos propios.32 3) Principios o aforismos jurídicos. También se les conoce como axiomas o “brocárdicos”; muchos se han tomado del derecho romano y se enuncian en latín: pacta sunt servanda, posesor pro domino habetur, etcétera. 4) Presunciones de derecho. Este esquema recibe el nombre de standard jurídico, como sería la conducta del “buen padre de familia”. 5) Ficciones de derecho. Como las presunciones, a veces se formulan en aforismos jurídicos como: “la carga de la prueba incumbe al actor”, “los hechos no negados no necesitan prueba”. También permiten, para uso práctico, fingir situaciones inexistentes en la realidad, pero necesarias en la ley. 33 6) Instituciones jurídicas. Son los esquemas más complejos y pueden comprender varios conceptos y varios principios valorativos, en ellos los esquemas menores están estructurados en una visión de conjunto que versa sobre un mismo tema, como la propiedad, el matrimonio, el divorcio, el delito o el Poder Ejecutivo, que les da unidad y sentido por tener como fin la realización de determinados valores en un campo determinado. 7) Los sistemas de derecho. La concentración final de los esquemas jurídicos se hace en un agregado muy complejo llamado sistema de derecho. Por tal hay que entender el conjunto de conceptos, principios e instituciones que animan y dan sentido a una legislación determinada. Un sistema de derecho implica además una filosofía jurídica que ligue entre sí a los sujetos de la comunidad a los cuales se aplicará. 34 Para poder hablar de un sistema de derecho expresado en la legislación positiva, ha sido necesario cierto grado de maduración jurídica, es decir, que el ordenamiento jurídico haya sido desarrollado, integrado y prácticamente terminado en todas las áreas del derecho, a fin de que puedan resolverse las situaciones de vida cotidiana de la mejor manera posible. Por otro lado, también pueden darse principios y explicaciones latentes en el sistema que todos dan por supuestos sin que estos prin32 33 34
Idem. Ibidem, p. 243. Ibidem, p. 244.
162
MAGDALENA ESPINOSA GÓMEZ
cipios y explicaciones lleguen a formularse en leyes escritas, como es el caso del sistema consuetudinario anglosajón. En México, ahora se puede hablar de un sistema de derecho, pero ha de tomarse en cuenta que éste se fue desarrollando paulatinamente a partir de la Constitución de 1917, cuando se elaboraron las normas secundarias en cada uno de los códigos necesarios para las distintas materias que lo integran y, evidentemente, las exigencias sociales exigen su constante revisión y adecuación. Sin embargo, aún puede decirse que la impronta espiritual permanece en lo que vincula a los mexicanos como propósito de ideal a realizar. Es urgente revivir el sentido que anima a nuestra nación, y no perderse en aspectos políticos de siglas partidistas. Para eso se cuenta con la herramienta de la norma jurídica que debe adaptarse sin dudar, con voluntad firme, a las exigencias que exige el momento actual. El ordenamiento jurídico merece ser revisado, sin perder el sentido del derecho que lo anima. El derecho se da en la vida, es la relación, el vínculo de lo que las personas esperan una de otra, así como el sentido, fin y propósito de su propia organización. Corresponde a los hombres conservarlo. Se ha visto cuan compleja es la tarea para aquel que va a elaborarlo, extrayendo de la realidad la problemática, y a su vez teniendo que salvaguardar los valores de justicia, oportunidad y seguridad jurídica que la colectividad demanda y espera. El legislador tiene que buscar las características coincidentes del hecho que en la vida se muestra polifacético para poder plasmar con palabras en la norma lo adecuado conforme a su fin y plan de regulación. Así, “La acuñación en el concepto lleva a conferir en la norma jurídica un perfil más acabado respecto a los límites indeterminados y fluctuantes de los fenómenos fácticos típicos”.35 Tiene que partir de los casos que se dan regularmente, examinar el material empírico pues ha de ordenar futuros aspectos de la vida que tendrán lugar cierta, probable o posiblemente. El orden jurídico será generalmente un orden abstracto, es decir, un orden que no se refiere a una situación determinada, única en tiempo y en el espacio, sino que regula en forma general casos típicos que se dan siempre, aunque irregularmente en la vida social. La norma se refiere a hechos abstractos, no a hechos concretos. Es éste un rasgo extraordinariamente esen35
Henkel, Heinrich, op. cit., nota 19, p. 578.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
163
cial. El orden jurídico no se interesa por individualidades, sino por lo típico. Lo que la ley contempla son relaciones típicas que se repiten.36
De esta manera: “La ley tiene la misión de clasificar, de modo muy claro, una cantidad enorme de fenómenos vitales, muy distintos entre sí y sumamente complejos, caracterizarlos por medio de notas distintivas fácilmente cognoscibles y ordenarlas de modo que siempre sean iguales para que puedan serles enlazadas iguales consecuencias jurídicas”.37 Así, se vale de conceptos abstractos que puedan subsumir los fenómenos vitales que muestren las notas distintivas del término; también se sirve de ellos para plantear las consecuencias jurídicas enlazadas al hecho y las hipótesis normativas. Quien codifica ha de integrar los conceptos formulándolos con un propósito; pero de entrada surge una limitante: no puede preverse en la ley lo que aún no ha sucedido. Es por ello que los principios jurídicos y una pauta de valoración subyacente en la ley son indispensables como guía a seguir. De tal manera que la separación de hecho y cuestión de derecho no puede ser tajante. Del primero, el hecho, se obtienen las constantes que constituyen un denominador común y que incluye a un amplio número de fenómenos, lo que brinda claridad y facilita la tarea de su conceptualización. Esto si bien garantiza plenitud al sistema, por otra parte limita la obligación de resolución que corresponde al juez. Sin embargo, la misma norma puede dejar la posibilidad prevista para que en el momento de su aplicación, sea manejada y adecuada al caso concreto conforme la intuición y perspicacia del juzgador. “Cuando el concepto abstracto-general y el sistema lógico de estos conceptos no son suficientes por sí solos para aprehender un fenómeno vital, o una conexión de sentido, en la plenitud del ser o del sentido, entonces se ofrece el tipo como forma de pensamiento”.38 Henkel nos dice que el derecho, para ordenar las relaciones de los hombres, las aprehende no en su “inconmensurable singularidad”, sino en su tipicidad vital; en las características que coinciden con las especies o grupos y que por ello se repiten. Así, “El instrumento predominante de 36 37
Coing, Helmut, Fundamentos de filosofía del derecho, Ariel, 1976, p. 33. Lorenz Karl, Metodología de la ciencia en derecho, 2a. ed., Barcelona, Ariel, 1980, p. 441. 38 Ibidem, p. 443.
164
MAGDALENA ESPINOSA GÓMEZ
que se sirve el legislador es la formación jurídica de tipos apoyada en la tipicidad previamente dada en la vida”.39 La tarea del constructor del ordenamiento jurídico es “hacer visibles las ideas jurídicas y las pautas de valoración generales que están por encima de los complejos de regulación particulares”.40 Así mismo: “la misión del sistema científico es hacer visible y mostrar la conexión de sentido inherente al orden jurídico como un todo con sentido”.41 “La ley no es un criterio en sí mismo absoluto; sino tan sólo el precipitado y la expresión de ideas sobre derecho, con las que nos hemos de familiarizar, si se quiere entender rectamente, y en su caso, limitar, completar o justificar la ley”, afirma Engish.42 El propio dador del derecho sabe la limitación de su tarea y delega al juez la posibilidad de adecuar lo genérico y abstracto de la norma al caso vivo y concreto. La rígida y fría regulación de lógica formal ha de transformarse ahora en una teleología, cálida, humana y vital. Más allá de lo conceptual emerge el pensamiento orientado hacia los valores. “La aplicación del derecho es una parte de la vida del mismo. No es posible racionalizar completamente lo viviente”. “El aparato de la autoridad sigue siendo un organismo que funciona de manera viva”.43 Cuando varios jueces en circunstancias similares llegan a resultados diferentes de lo funcional y de lo justo, consuela la idea de que el más severo ha sido quizá el más exacto y concienzudo en el examen de los fundamentos fácticos de decisión y que el más débil e inflexible ha sido más condescendiente en la consideración de todas las circunstancias secundarias.44
Hay líneas directrices que permiten al juez orientar sus sentencias hacia las ideas jurídicas directrices, pero ellas no le liberan del acto personal, intuitivo de valoración que cierra el proceso decisorio, así: Todo derecho y toda administración de justicia están determinados en aspectos formales por un conflicto dialéctico de dos tendencias opuestas: La 39 40 41 42
Henkel, Heinrich, op. cit., nota 19, p. 576. Lorenz Karl, op. cit., nota 37, p. 465. Ibidem, p. 479. Recaséns Siches, Luis, Experiencia jurídica, naturaleza de la cosa y lógica razonable. La Jurisprudencia según Engish, México, UNAM-FCE, 1971, p. 458. 43 Engish, Karl, Introducción al pensamiento jurídico, Madrid, Guadarrama, 1967, p. 168. 44 Idem.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
165
tendencia a la generalización y a la decisión de conformidad, con criterios objetivos, y por el otro, la tendencia a la individualización y a la decisión, a la luz de las valoraciones y apreciaciones subjetivas de la conciencia jurídica. Esto es la tendencia hacia la justicia formal y del otro polo hacia la equidad concreta.45
Quien aplica el derecho está llamado por el derecho de equidad que se encierra en los conceptos indeterminados y normativos, en las cláusulas de criterio libre y en las cláusulas generales, a encontrar el derecho en el caso singular no sólo mediante interpretación y subsunción, sino también mediante valoraciones de voluntad.46 El derecho ha de velar por un orden que sea sencillo, claro y determinado para quienes han de obedecerlo. La seguridad jurídica es indispensable como regla general; pero la justicia sólo se alcanza en la individuación. III. PARA QUÉ SIRVE Se ha dicho que el derecho es una herramienta construida por el hombre, de éste dependerá la calidad de lo elaborado, así como, al interpretar y encontrar su sentido, la solución dada. Es indispensable abrir el campo de esta disciplina, cada vez será más necesaria la interdisciplina en el auxilio y colaboración de todo lo que permita su mejor funcionamiento. El tener presente que la norma expresada en las palabras del texto ¡corresponde únicamente al 7% de la comunicación!, Tal vez podría explicar la ineficacia de su cumplimiento. Quedando restante el 93% de la comunicación analógica en donde podrían obtenerse otros resultados de comportamiento dado que aquí se implican: ideas, valores, propósitos, conducta, hechos, relaciones, objetos y sobre todo personas, esto es campo del derecho, que ahora requiere una visión holística, sistémica, como un orden pleno de vida. Quizá por ello algunos juristas, desde tiempo atrás, han hecho énfasis sobre la orientación teleológica del derecho; tanto en su creación en cuanto a la seguridad y oportunidad jurídica, como en su resolución respecto a la justicia. Engish, Larenz, Henkel, Hart, Alf Ross, Cossio, Reale, Coing, coinciden en el punto de vista que el maestro Recaséns Siches 45 46
Ross, Alf, Sobre el derecho y la justicia, 4a. ed., Buenos Aires, Eudeba, 1977, p. 274. Engish, Karl, op., cit., nota 43, p. 167.
166
MAGDALENA ESPINOSA GÓMEZ
denominó, lógica razonable” o “logos de lo humano”. Pues la lógica formal de la inferencia, calificada como “racional” es meramente explicativa, “el logos de lo razonable atiende a problemas humanos y, por tanto a los políticos y jurídicos, intenta “comprender” sentidos y nexos entre significaciones, así como realiza operaciones de valoración, y establece finalidades o propósitos”.47 La lógica formal es neutra en lo que atañe a los valores humanos, éticos, políticos, jurídicos, etcétera. En cambio, las normas jurídicas tienen una dimensión de intención, imperativa, estimativa la cual es totalmente desconocida por las leyes de la inferencia. Construir al derecho como un sistema lógico puro es imposible. Las leyes, aún en el grado máximo de claridad y previsión, nunca expresan la auténtica totalidad del derecho en relación a las, conductas. Las leyes implican el único lenguaje que pueden usar: un lenguaje genérico y abstracto.48 Pero sólo se puede saber que es derecho en la medida de como opera y por sus efectos producidos en la realidad humana: “Una norma jurídica es lo que ella hace.”49 Si no se aplica, se reduce a un mero pedazo de papel. La existencia humana como producto espiritual ha de ser comprendida en la plenitud de las leyes que la rigen. No puede ser sólo la lógica. La ética es indispensable, es quien da sentido al hombre y a su existencia, necesaria hoy más que nunca. Recaséns comenta que la vida es un hacerse a sí misma en sus sucesivos instantes, es tener que ir resolviendo su propio problema y afirma: La vida es tarea.50 Por otro lado, Engish dice que el derecho es en todas sus partes el resultado del espíritu viviente que aparece en forma orgánica vinculado a las personas. La personalidad de quien utiliza al derecho es un todo orgánico, lo mismo sucede con quien realiza su aplicación, con el derecho y con la vida jurídica. En la interpretación teleológica, se valoran los efectos que la decisión vaya a producir según el propósito de la ley. La consideración científica de la norma no es como dogma rígido sino como fuerza viva. No importa lo que significa una norma, sino como ésta vive, “como actúa, como se articula, en distintas relaciones y como éstas se separan de ella y como la siguen”. El derecho no puede reflejar enteramente la individualidad singular de ca47 48 49 50
Recaséns Siches, Luis, op. cit., nota 42, p. 519. Idem. Ibidem, p. 221. Ibidem, p. 225. Las cursivas son propias.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
167
da ser humano, a esto se le llama la dimensión de despersonalización del derecho. Ésta parece ser la tragedia del derecho, no poder alcanzar, ni de un modo ni de otro, el núcleo de la personalidad individual. El derecho puede estimar la personalidad, apoyarla e incluso en un cierto grado, fomentar su desarrollo, pero no articularla de modo inmediato. Y sin embargo, se ha manifestado siempre la tendencia de poner la individualidad al alcance del derecho, de lograr mediante el derecho una justicia y una equidad individualizadoras.51
Para finalizar, es necesario inquirir: ¿hasta dónde es la justicia una tarea exclusiva del derecho? Respecto a este punto es necesario tener cuidado, pues pareciera ser que se exige, exclusivamente al derecho, su cumplimiento. Hoy por hoy, en México por ejemplo, el clamor popular reclama la “injusticia sentida”, al exigir un Estado de derecho. Sin embargo, ya Platón sostenía: “No habrá sociedad justa, sin hombres justos”. En el diálogo de Las leyes, ellas dicen a Sócrates: “…si hoy te vas de aquí, te vas por injusticia de los hombres y no de nosotras las leyes”. El problema sigue siendo en la actualidad el mismo. Hans Kelsen comentaba la incapacidad de lograr una norma justa sin la existencia de otra injusta, puesto que la razón humana puede concebir sólo valores relativos, así, el juicio con que juzgamos algo justo no puede osar jamás excluir la posibilidad de un juicio de valor opuesto. Para él, el principio ético fundamental es la tolerancia, entendida como libertad de pensamiento.52 La ciencia sólo puede desarrollarse cuando es libre. Ser libre quiere decir no sólo no estar sometida a influencias externas, esto es, políticas, sino ser libre interiormente, que impere una total libertad en su juego de argumentos y objeciones. No existe doctrina que pueda ser eliminada en nombre de la ciencia pues el alma de la ciencia es la tolerancia, con ella todo puede florecer. Es en el hombre donde ha de darse el cambio, tener decisión para modificar lo que sea necesario, sin perder de vista que la letra congelada impide fluir al río de la realidad viva que siempre irá por delante. Necesita clarificar el sentido y delinear el rumbo para lograr la meta, sin olvidar que son los valores del espíritu los que cohesionan y vinculan. Es en 51 52
Engish Karl cfr. Recaséns, Siches, op. cit., nota 42, p. 465. Kelsen, Hans, ¿Que es la justicia?, Buenos Aires, Leviatán, 1981, pp. 109-120.
168
MAGDALENA ESPINOSA GÓMEZ
este punto en donde la tarea formativa para los futuros abogados puede ser definitiva mediante la filosofía del derecho, es necesario volver y retomar a la persona y a los valores como eje del derecho. Sin olvidar que: “El desorden no surge de la tolerancia, sino de la intransigencia”. IV. CONCLUSIONES 1. El derecho es un ser creado por el hombre para regular el orden del grupo social, dado que nada puede ser en el desorden. 2. Su causa eficiente es el hombre a través de los legisladores. 3. Su causa final busca la convivencia pacífica en el orden social. 4. La material comprende tanto los datos ontológicos, como los axiológicos; se encuentra en la “impronta espiritual” y en la conducta humana, los cuales preceden a su formación. 5. La formal corresponde al texto con el que cobra forma al volverse positivo. Se manifiesta por la norma jurídica, en cuyo enunciado se guarda el contenido de índole espiritual. 6. La norma, a su vez, tendrá que ser interpretada para su aplicación, entonces la intuición del juez desentrañará del texto el contenido valorativo para hacerlo. 7. Es importante dejar señalado que: uno es el ordenamiento jurídico, construido para ser aplicado en un tiempo y en un espacio determinado mediante la ley y 8. Otro es el derecho, éste es la “relación”, el vínculo dado entre las personas que esperan entre sí, es decir, la respuesta de la conducta adecuada; sea en el ámbito público o privado. El derecho expresa el sentir espiritual del grupo, podría entenderse, al decir de Villoro Toranzo: “como el mínimo de conducta ética que se requiere para vivir en sociedad”.53 9. Dentro de los órdenes del ser, el ser humano es una parte, por lo tanto está regido en ese sentido por leyes: físicas, químicas, psicológicas, lógicas y éticas. Las leyes son; las normas indican un deber ser, en cuanto expresan situaciones que no están siendo, es decir, que no son. 10. Respecto de las normas jurídicas, es necesario reconocer que su aplicación implica a dos categorías diferentes: una la palabra, otra la ac53 Villoro Toranzo, Miguel, Lecciones de filosofía del derecho, México, Porrúa, 1973, p. 481.
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
169
ción. En este punto, Bateson hace referencia a lo que se denominó principio dormitivo lo cual acontece cuando se toma como causa de una acción simple una palabra abstracta derivada del nombre de dicha acción; como cuando se explica la agresión diciendo que es causada por un “instinto agresivo”, o la sintomatología psicótica atribuyéndola a la “locura”, el autor comenta: Es imposible poner fin al delito mediante el castigo. Con ello todo lo que se consigue son delincuentes más eficaces, puesto que el delito no es una acción. El delito no es el nombre de una acción, sino una categoría o contexto de la acción. Y las cosas que son categorías de acción no obedecen a las reglas del refuerzo, como lo hacen las acciones .54
11. Existe la necesidad de ampliar el campo de aprendizaje, dado que se encuentran implicados seres de distintas cualidades, pertenecientes a mundos diferentes y, sin embargo, plenamente interpenetrados como en la mecánica cuántica lo están la partícula y la onda. Así, la norma jurídica sería la partícula observable, el derecho, la onda no manifiesta, pero que está ahí. Ambas se presuponen y están en correlación constante.
54 Bateson, Gregory, Pasos hacia una ecología de la mente, Planeta-Carlos Lohlé 1999, p. 19. Las cursivas son propias.
170
MAGDALENA ESPINOSA GÓMEZ
QUÉ ES Y PARA QUÉ SIRVE EL DERECHO
171
V. BIBLIOGRAFÍA BATESON, Gregory, Pasos hacia una ecología de la mente, Planeta-Carlos Lohlé, 1999. ENGISCH, Karl, Introducción al pensamiento jurídico, trad. de Ernesto Garzón Valdés, Madrid, Guadarrama, 1967. ECCLES John, “Bases neurofisiológicas del espíritu”, La Vida Enciclopedia, España, Salvat, 1961, t. V. DAVIS, Mikol y LANE, Earle, Rainbows of Life, The Promise of Kirlian Photography, Nueva York, Harper Colophon Books, 1978. DICCIONARIO DE LA REAL ACADEMIA ESPAÑOLA, 22a. ed., España, Mateu Cromo, 2001. GARCÍA MÁYNEZ, Eduardo, Ensayos filosófico-jurídicos, México, Universidad Veracruzana, 1959. GARCÍA MÁYNEZ, Eduardo, Ensayos filosófico-jurídicos 1934-1979, 2a. ed., México, Textos Universitarios, 1984. FIX-ZAMUDIO, Héctor, Metodología, docencia e investigación jurídicas, 3a. ed., México, Porrúa, 1988, núm. 63. HART H. L. A., El concepto de derecho, 2a. ed., trad. de Genaro R. Garrió, México, Editora Nacional, 1978. HARTMANN, Nicolai, Ontología, 2a. ed., trad. de José Gaos, México, FCE, 1986, ts. III y IV. HENKEL, Heinrich, Introducción a la filosofía del derecho, trad. de Enrique Gimbernat, Madrid, Taurus, 1968. KELSEN, Hans, ¿Qué es la justicia?, trad. de Leonor Cabrera, Buenos-Aires, Leviatán, 1981. KUHN, Thomas, La estructura de las revoluciones científicas, 7a. ed., trad. de Agustín Contín, México, FCE, 1986. LARENZ, Karl, Metodología de la ciencia del derecho, 2a. ed. definitiva, trad. de Marcelino Rodríguez Molinero, Barcelona, Ariel, 1980. LEAKEY, Richard y LEWIN, Roger, Los orígenes del hombre, Madrid, 1980. NAWIASKY, Hans, Teoría general del derecho, trad. de José Zafra Valverde, México, Editora Nacional, 1980. POPPER, Karl y ECCLES, John, El Yo y su cerebro, trad. de C. Solís Santos, Barcelona, Labor Universitaria, 1985.
172
MAGDALENA ESPINOSA GÓMEZ
PRECIADO HERNÁNDEZ, Rafael, Lecciones de filosofía del derecho, 6a. ed., México, Jus, 1970. RECASÉNS SICHES, Luis, Experiencia jurídica, naturaleza de la cosa y lógica “razonable”, México, FCE-UNAM-Publicaciones de Dianoia, 1971. ———, Nueva filosofía de la interpretación del derecho, 2a. ed., México, Porrúa, 1973. ———, Introducción al estudio del derecho, México, Porrúa, 1970. ———, Antología 1922-1974, México, FCE, 1976, col. Tezontle. ROSS, Alf, Sobre el derecho y la justicia, 4a. ed., trad. de Genaro Garrió, Buenos Aires, Eudeba, 1963. VILLORO TORANZO, Miguel, Lecciones de filosofía del derecho, México, Porrúa, 1973. ———, Teoría general del derecho, México, Porrúa, 1989.
¿ENSUEÑO, PESADILLA Y/O REALIDAD? OBJETIVIDAD E (IN)DETERMINACIÓN EN LA INTERPRETACIÓN DEL DERECHO Imer B. FLORES* SUMARIO: I. Hacia una jurisprudencia integrada o integral. II. Formalismo versus anti-formalismo III. Hart, Dworkin y Kennedy IV.Objetividad e (in)determinación. V. Conclusión: objetividad —por la vía de la intersubjetividad— e (in)determinación.
I. HACIA UNA JURISPRUDENCIA INTEGRADA O INTEGRAL Analizar los problemas contemporáneos de la filosofía del derecho resultaría inútil si además no procediéramos a examinar cuestiones metodológicas relativas a las posibilidades tanto de una teoría general del derecho —descriptiva y normativa— como de las diferentes teorías particulares del derecho, así como de los méritos de cada una de ellas. Así, consideramos que es imperativo trascender las limitaciones de las concepciones jurídicas particularistas —no sólo constreñidas por los límites teoréticos del iusnaturalismo, del iusformalismo y del iusrealismo sino también por los linderos del descriptivismo y del normativismo/prescriptivismo— y construir una filosofía jurídica general: una “jurisprudencia integrada” o “integral” (integrative or integral jurisprudence). El hecho de que al interior del positivismo jurídico podamos hablar de diferentes versiones del mismo y de distintas polémicas 4 —tales como entre positivistas duros y suaves, excluyentes e incluyentes, negativos y positivos— ilustra no solamente acerca de la imposibilidad de reducir al positivismo a una sola versión sino además sobre las diversas construcciones teóricas alternativas que se presentan y pueden llegar a presen* Instituto de Investigaciones Jurídicas, UNAM, México. 173
174
IMER B. FLORES
tarse. Al grado tal que el debate puede darse entre formalistas/positivistas, pero también entre éstos y sus archi enemigos los anti-formalistas/anti-positivistas. En este sentido, consideramos que toda propuesta que pretende ir más allá del positivismo, es decir, de la explicación del derecho a partir de los “hechos sociales” (social facts) al incluir referencias no secundarias sino primarias y relevantes a “hechos valorativos” (value facts) —como derechos, fines, funciones, intereses, principios o valores— tal y como lo hacen entre otros, Robert Alexy con la “pretensión de corrección”, Luigi Ferrajoli con el “garantismo”, Ronald Dworkin con el “modelo de los principios”, y Mark Greenberg con su “tesis emergentista” (emergentist), expuesta en este mismo Congreso, se inscriben de alguna forma en una tradición anti-formalista/anti-positivista, a la cual junto con autores como Jerome Hall podemos denominar “jurisprudencia integrada” o “integral”. Sobre la conveniencia, necesidad y posibilidad de una jurisprudencia integrada, hay infinidad de citas, de entre las cuales solamente reproducimos un par. Así, Joseph L. Kunz —el famoso internacionalista, perteneciente a la escuela jurídica vienesa y uno de los juristas más allegados a Hans Kelsen—, a mediados del siglo pasado, aclara:1 El positivismo jurídico podía solucionar el problema del derecho en un periodo de codificaciones, de seguridad y paz relativas, de optimismo filosófico y de fe en la ciencia, tal como el siglo decimonónico era. Sin embargo el positivismo jurídico no puede solucionar los problemas del derecho como éste debería ser; y estos problemas dominan el siglo veinte y lo que llevamos del veintiuno. Por ello el retorno del derecho natural, por ende las filosofías modernas en general, enfatizan el elemento ético y no el lógico. 1 Joseph L. Kunz, Latin American Philosophy of Law in the Twentieth Century, Nueva York, Law Institute, 1950, passim: “Legal positivism could solve the problem of the law in a period of codifications, of relative security and peace, of philosophical optimism and faith in science, as the nineteenth century was. But legal positivism cannot solve the problems of the law as it should be; and these problems dominate the twentieth century. Hence the revival of natural law, hence the modern philosophies in general, stressing the ethical not the logical element”. “In this spirit, they re-examine fundamental problems in order to arrive at satisfactory solutions which embrace the law in its totality”. “We are on the way toward a conception which will allow us to bring all the three aspects —logical, sociological and axiological— into one fundamental unity” (la traducción es nuestra) (hay versión en español: La filosofía del derecho latinoamericana en el siglo XX, trad. de Recaséns Siches, Luis, Buenos Aires, Losada, 1951).
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
175
En este sentido, ellas re-examinan los problemas fundamentales para poder llegar a soluciones satisfactorias que abarquen al derecho en su totalidad. Estamos en el camino hacia una concepción que nos permita integrar estos tres aspectos —lógico, sociológico y axiológico— en una unidad fundamental.
Por su parte, Harold J. Berman, en el “Prefacio” de su celebérrimo Law and Revolution. The Formation of the Western Legal Tradition, hace veinte años, advierte:2 Necesitamos superar la reducción del derecho a una serie de instrumentos técnicos para hacer las cosas; la separación del derecho de la historia; la identificación del derecho con el derecho nacional y de toda la historia jurídica con la historia jurídica nacional; las falacias de una jurispru dencia exclusivamente política y analítica (“po sitivismo”), o una jurisprudencia exclusivamente filosófica y moral (“teoría del derecho natural”), o una jurisprudencia exclusivamente histórica y socio-económica (“la escuela histórica”, “la teoría social del derecho”). Necesitamos una jurisprudencia que integre a las tres escuelas tradicionales y vaya más allá de ellas. Tal jurisprudencia integrada enfatizaría que debemos creer en el derecho o éste no va a funcionar; que implica no solamente razón y voluntad sino también emoción, intuición y fe. Implica un compromiso social total.
En este orden de ideas, una vez esbozada la conveniencia y las posibilidades de una jurisprudencia integrada o integral, a continuación consideraremos la coexistencia y convivencia de dos paradigmas: uno dominante y el otro crítico; al analizar la dicotomía formalismo/positivismo y anti-formalismo/anti-positivismo en general, y la polémica Langdell-Holmes en 2 Berman, Harold J., Law and Revolution. The Formation of the Western Legal Tradition, Cambridge, Harvard University Press, 1983, pp. vi-vii: “We need to overcome the reduction of law to a set of technical devices for getting things done; the separation of law from history; the identification of all law with national law and of all our legal history with national legal history; the fallacies of an exclusively political and analytical jurispruden ce (“po si ti vism”), or an ex clu si vely phi lo sop hi cal and mo ral ju ris pru den ce (“na tu ral law theory”), or an ex clu si vely his to ri cal and so cio-eco no mic ju ris pru den ce (“the historical school”, “the social theory of law”). We need a jurisprudence that integrates the three traditional schools and goes beyond them. Such an integrative jurisprudence would emphasize that law has to be believed in or it will not work; it involves not only reason and will but also emotion, intuition, and faith. It involves a total social commitment” (la traducción es nuestra).
176
IMER B. FLORES
particular. Acto seguido estudiaremos la construcción teórica de Hart, quien se posiciona entre la jurispru dencia analítica de Austin y la jurisprudencia sociológica de Pound, de un lado, y el movimiento del realismo estadounidense de Frank y Llewellyn, del otro; y después examinaremos cómo ésta —la construcción teórica de Hart— en lugar de constituir el término medio virtuoso entre los dos extremos viciosos del continuum —el noble sueño de Pound/Dworkin y la pesadilla de Frank-Llewellyn/Kennedy— es uno de los tres vértices de la teoría contemporánea del derecho. Así, exploraremos la viabilidad de conciliar estas posturas y para ello confrontaremos la teoría de la interpretación de Dworkin con los contra argumentos de uno de sus más fieros detractores: Fish. Finalmente, presentaremos algunas conclusiones sobre la objetividad y subjetividad, de un lado, y la determinación e indeterminación, del otro. II. FORMALISMO VERSUS ANTI-FORMALISMO De vez en cuando el formalismo/positivismo, el cual abarca desde las escuelas exegética e histórica hasta las jurisprudencias analítica y conceptual, es atacado por una especie de anti-formalismo/anti-positivismo, el que abraza desde las jurisprudencias finalista, de intereses y sociológica hasta los movimientos de la libre investigación científica en Francia, del derecho libre en Alemania y del realismo en los Estados Unidos de América. La objeción se centra en la excesiva confianza depositada en el pensamiento deductivo, formal, y abstracto, así como en el silogismo, i. e. premisa mayor, premisa menor y conclusión, o lo que es lo mismo, en la mecánica subsunción de normas en hechos a partir de los cuales derivan necesariamente ciertas consecuencias jurídicas. De esta forma, denuncian la reducción del papel de los jueces a la de aplicar de manera pasiva un derecho preexistente para todo caso por igual y en cambio sugieren que la función es la de crear —descubrir e inventar— de modo activo el derecho aplicable a cada caso concreto. Langdell vs. Holmes En los Estados Unidos de América, John Dewey y Thorsten Veblen encabezaron en la filosofía y en la economía, respectivamente, la “rebelión contra el formalismo”, en tanto que en el derecho sería Oliver Wen-
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
177
dell Holmes Jr. el primero en abrir fuego, y su principal objetivo sería el creador del método de casos, Christopher Columbus Langdell, quien había introducido este modelo en la enseñanza del derecho porque estaba convencido de que se debía acudir a las fuentes originales. En un país perteneciente al common law, éstas son las decisiones o resoluciones judiciales, pero con este mismo razonamiento si Langdell hubiera sido natural de un país perteneciente al sistema romano-canónico-germánico, sus fuentes originales habrían sido el código o la ley. De tal suerte que el método de enseñanza por casos es independiente del sistema o tradición jurídica y de la concepción del derecho que le dé cabida.3 Antes de proseguir, es imperativo recordar un par de referencias que hace el mismísimo H. L. A. Hart acerca del pensamiento de Holmes y de la relación de éste con la “pesadilla” (nightmare):4 Holmes ciertamente nunca cayó en estos extremos —representados por Llewellyn y Frank—. A pesar de que proclamaba que los jueces legislan y deben legislar en ciertos puntos, él admitía que una vasta área del derecho legislado y muchas de las doctrinas del common law firmemente establecidas... estaban suficientemente determinadas como para hacer absurda la visión del juez como, esencialmente, legislador. Así para Holmes, la función creadora de derecho de los jueces era “intersticial”. La teoría de Holmes no era una filosofía de “a toda máquina y olvidemos los silogismos”.
Y un poco más adelante:5 Tal vez la cita más erróneamente utilizada por cualquier jurista norteamericano sea la observación de Holmes de 1884 (sic) de que “La historia del derecho no ha sido lógica: ha sido experiencia”. Esto, en su contexto, era una protesta contra la superstición racionalista (como Holmes la concebía) 3 Flores, Imer B., “La concepción del derecho en las corrientes de la filosofía jurídica”, Boletín Mexicano de Derecho Comparado, nueva serie, año XXX, núm. 90, septiembre-diciembre de 1997, pp. 1001-1036. 4 Hart, H. L. A., “Una mirada inglesa a la teoría del derecho norteamericana: la pesadilla y el noble sueño”, trad. de José Juan Moreso y Pablo Eugenio Navarro, en Casanovas, Pompeu y Moreso, José Juan (eds.), El ámbito de lo jurídico. Lecturas de pensamiento jurídico contemporáneo, Barcelona, Crítica, 1994, p. 332. (Publicado originalmente en 1977 con el título de “American Jurisprudence through English Eyes: The Nightmare and the Noble Dream” y reproducido en Essays in Jurisprudence and Philosophy, Oxford, Oxford University Press, 1983, pp. 123-144. 5 Ibidem, p. 333.
178
IMER B. FLORES
de que el desarrollo histórico del derecho por los tribunales podía ser explicado como la extracción de las consecuencias lógicamente contenidas en el derecho en sus fases primarias...
Si bien Hart trata de minimizar el ataque frontal en contra de la “lógica”, o al menos del “uso excesivo de la lógica”, lo cierto es que todo el mundo conoce que el anti-formalismo/anti-positivismo y el movimiento del realismo estadounidense tienen como antecedente esta celebérrima frase: “La vida del derecho no ha sido la lógica: sino la experiencia.”6 Sin embargo, no todos saben que el origen de la misma es anterior a la publicación de The Common Law en 1881, ya que aparece por vez primera publicada en enero de 1880, en una reseña bibliográfica a la segunda edición de A Selection of Cases of the Law of Contracts with a Summary of the Topics covered by the Cases de C.C. Langdell:7 El ideal de Langdell en el derecho, el objetivo de toda su determinación, es la elegantia juris, o la integridad lógica del sistema como un sistema. Él es posiblemente el más grande teólogo viviente. Pero como un teólogo él está menos preocupado por sus postulados que por demostrar que las conclusiones se siguen necesariamente... tan enteramente está interesado en las conexiones formales de las cosas, o lógica, como algo diferente de los sentimientos que dan contenido a la lógica, los cuales en realidad dan forma a la sustancia del derecho. La vida del derecho no ha sido la lógica: sino la experiencia... La forma de continuidad ha sido mantenida por razonamientos que pretenden reducir cada cosa a una secuencia lógica; pero 6 Holmes Jr., Oliver Wendell, The Common Law, Nueva York, Dover, 1991, p. 1: “The life of the law has not been logic: it has been experience” (publicado originalmente en 1881) (la traducción es nuestra). 7 Holmes Jr., Oliver Wendell, “Book Notices”, American Law Review, núm. 14, enero de 1880, p. 234: “Mr. Langdell’s ideal in the law, the end of all his striving, is the elegantia juris, or logical integrity of the system as a system. He is perhaps the greatest living theologian. But as a theologian he is less concerned with his postulates than to show that the conclusions from them hang together... so entirely is he interested in the formal connection of things, or logic, as distinguished from the feelings which make the content of logic, and which actually shaped the substance of the law. The life of the law has not been logic: it has been experience… The form of continuity has been kept up by reasonings purporting to reduce every thing to a logical sequence; but that form is nothing but the evening dress which the new-comer puts on to make itself presentable according to conventional requirements. The important phenomenon is the man underneath it, not the coat; the justice and reasonableness of a decision, not is consistency with previously held views” (la traducción es nuestra).
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
179
esta forma no es nada excepto el traje de noche el cual el nuevo-rico se pone para hacerse presentable de acuerdo con los requisitos convencionales. El fenómeno importante es el ser humano debajo, no el abrigo; la justicia y lo razonable de la decisión, no su consistencia con medidas tomadas previamente.
Ciertamente la crítica de Holmes se enfoca en el excesivo logicismo de Langdell pero abarca también al método de casos. De hecho, unos cuantos años antes, en la segunda parte de la reseña bibliográfica a la primera edición, aunque confirmaba los elogios al libro como texto de clase, el cual había recomendado a los alumnos para su compra y su estudio en la primera parte, no dejaba de manifestar: “Sin embargo, no estamos de acuerdo con él, en su creencia aparentemente exclusiva en el estudio de casos.”8 Es conveniente matizar los alcances de la multicitada frase, que si bien constituye un ataque frontal a la lógica, de ninguna manera pretende abolir su uso. Baste recordar que, por un lado, en las líneas que la preceden Holmes explica: “El objetivo de este libro es el presentar una visión general del common law. Para alcanzar este propósito, otras herramientas son necesarias además de la lógica. Una cosa es demostrar que la consistencia del sistema requiere de un resultado particular, pero eso no es todo”.9 Así mismo, en las que le siguen:10 Las necesidades de una época, las teorías morales y políticas prevalecientes, las intuiciones de política pública, declaradas no inconscientes, 8 Holmes Jr., Oliver Wendell, “Book Notices”, American Law Review, núm. 6, enero de 1872, p. 354: “We do not agree with him, however, in his seemingly exclusive belief in the study of cases” (la traducción es nuestra). Cfr. Holmes Jr., Oliver Wendell, “Book Notices”, American Law Review, núm. 5, abril de 1871, p. 540: “At all events we advise every student of the law to buy and study the book”. 9 Holmes Jr., Oliver Wendell, The Common Law, cit. en la nota 6, p. 3: “The object of this book is to present a general view of the Common Law. To accomplish the task, other tools are needed besides logic. It is something to show that the consistency of a system requires a particular result, but it is not all” (la traducción es nuestra). 10 Idem.“The felt necessities of the time, the prevalent moral and political theories, intuitions of public policy, avowed or unconscious, even the prejudices which judges share with their fellow-men have had a good deal more to do than the syllogism in determining the rules by which men should be governed. The law embodies the story of a nation’s development through many centuries, and it cannot be dealt with as if it contained only the axioms and corollaries of a book of mathematics. In order to know what it is, we must know what it has been, and what it tends to become” (la traducción es nuestra).
180
IMER B. FLORES
incluso los prejuicios que los jueces comparten con sus compatriotas tienen mucho más que ver que el silogismo a la hora de determinar las reglas bajo las cuales los hombres deben ser gobernados. El derecho personifica la historia del desarrollo de una nación a través de varios siglos, y no puede ser vista como si tuviera solamente los axiomas y los corolarios de un libro de matemáticas. Para saber qué es, debemos saber qué ha sido y a qué tiende a convertirse.
Aunado a lo anterior, en su también clásico artículo “The Path of Law” de 1897, Holmes denuncia “La falacia... de que la única fuerza que trabaja en el desarrollo del derecho es la lógica”.11 Así, aun cuando reconoce que la lógica tiene un papel central, cínicamente nos dice que no lo es todo:12 Esta forma de pensar es natural enteramente. La formación de los abogados es una formación en lógica. Los procesos de analogía, discriminación y deducción son aquellos con los que se siente como en su casa. El lenguaje de la decisión judicial es principalmente el lenguaje de la lógica. Y el método y la forma lógica aumentan el deseo de certeza y reposo que está en toda mente humana. Sin embargo la certeza es generalmente una ilusión, y el reposo no es el destino del hombre. Detrás de la forma lógica descansa un juicio acerca de la relativa valía e importancia de diferentes fundamentos legislativos, con frecuencia un juicio inarticulado e inconsciente, es en verdad, y así la mera raíz y espíritu de todo el procedimiento. Uno puede dar a cualquier conclusión una forma lógica.
En este sentido, podemos caracterizar prima facie al formalismo/positivismo con una fe ciega en la lógica y al anti-formalismo/anti-positivis11 Holmes Jr., Oliver Wendell, “The Path of Law”, Harvard Law Review, vol. 110, núm. 5, 1997, p. 997: “The fallacy... that the only force at work in the development of the law is logic” (publicado originalmente en 1897) (la traducción es nuestra). 12 Ibidem, p. 998: “This mode of thinking is entirely natural. The training of lawyers is a training in logic. The processes of analogy, discrimination, and deduction are those in which they are most at home. The language of judicial decision is mainly the language of logic. And the logical method and form flatter that longing for certainty and for repose which is in every human mind. But certainty generally is illusion, and repose is not the destiny of man. Behind the logical form lies a judgment as to the relative worth and importance of competing legislative grounds, often an inarticulate and unconscious judgment, it is true, and yet the very root and nerve of the whole proceeding. You can give any conclusion a logical form” (la traducción es nuestra).
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
181
mo con la duda o escepticismo ante ella. Así, el primero está caracterizado por una confianza excesiva en la lógica y en las reglas, en tanto que el segundo por la desconfianza extrema. Al grado tal que ambos extremos pueden ser caricaturizados como la “jurisprudencia mecánica” que contiene una respuesta predeterminada para cada caso y la “jurisprudencia no-mecánica” —o “gastronómica”— donde no hay una respuesta para cada caso ni mucho menos ésta está predeterminada, sino donde hay una infinidad de posibles respuestas: tantas como jueces o estados de ánimo hay. III. HART, DWORKIN Y KENNEDY Antes de proceder a recaracterizar el spectrum que según Hart lo tiene a él en el centro y que va de un extremo vicioso a uno demasiado virtuoso para ser realidad, i. e. de la “pesadilla” —personificada por Frank/Llewellyn, en la década de los treinta, y por Kennedy, en la de los ochenta— al “noble sueño” —protagonizado por Pound, primero, y Dworkin, después— cabría recordar algunas generalidades y genialidades de la postura del propio Hart, así como de las de Dworkin y Kennedy. Aun cuando Hart pertenece a la jurisprudencia analítica, comienza por criticar el modelo de los mandatos de Austin y ante los embates tanto de la jurisprudencia sociológica como del movimiento del realismo estadounidense, se posiciona con gran habilidad en el centro. De hecho su estrategia es auto evidente como se desprende del título que lleva el capítulo VII. “Formalismo y escepticismo ante las reglas” de su El concepto del derecho.13 Así, a partir de la introducción de la noción de la “textura abierta del derecho ” (open texture of law), así como de la distinción entre el centro, corazón o núcleo de significado (core) y la zona de penumbra (penumbra), podemos afirmar que para Hart aquellos casos que caen dentro del núcleo de significado la respuesta es determinada para cada uno; en tanto que cuando entran en la zona de penumbra la respuesta será indeterminada y por ello el juez deberá ejercer su discreción para optar de entre las 13 Hart, H. L. A., The Concept of Law, Oxford, Oxford University Press, 1961 (hay versión en español: El concepto del derecho, trad. de Genaro R. Carrió, Abeledo Perrot, 1963; hay una edición con un “Postscript”: 1994; hay versión en español: Post scriptum a El concepto de derecho, trad. de Rolando Tamayo y Salmorán, México, Instituto de Investigaciones Jurídicas, 2000.
182
IMER B. FLORES
posibles respuestas por una, pero de ninguna manera es posible que haya tantas respuestas como jueces ni tampoco que la indeterminación alcance a todos los casos. Dworkin en su “¿Es el derecho un sistema de reglas?” cuestiona el modelo de las reglas de Hart y propone uno alternativo, a la sazón: el modelo de los principios.14 Al insistir que el derecho no se reduce a las reglas sino que abarca además a los derechos/principios, en su “Casos difíciles” critica las tesis tanto de la indeterminación como de la discrecionalidad judicial, al grado tal que para él es posible encontrar respuestas correctas e inclusive una respuesta correcta aún para los casos más difíciles.15 Por su parte, para Kennedy la indeterminación no es solamente para unos cuantos casos difíciles sino que en cualquier caso, sea fácil o difícil, está ésta o puede estar presente.16 Este tipo de indeterminación es descrita como “radical” en contraposición a la de tipo hartiano —o kelseniano— que es detallada como “moderada”. Ahora bien, en su ponencia (recogida en este mismo volumen) aclara que la indeterminación que él tiene en mente no es ni puede ser tan radical: si bien es cierto que el juez tiene libertad para escoger entre una infinidad de posibilidades la sentencia a la que él quiere llegar, al punto de “dar —como dice Holmes— a cualquier conclusión una forma lógica”, también está claro que ante la existencia de toda una gama de restricciones no es absolutamente libre. De hecho, en la medida en que se limita la libertad del juez es más o menos posible hablar de cierta determinación e incluso de respuestas correctas únicas.
14 Dworkin, Ronald, “The Model of Rules”, University of Chicago Law Review, vol. 35, núm. 14, 1967 (hay versión en español: “¿Es el derecho un sistema de reglas?”, trad. de Javier Esquivel y Juan Rebolledo G., Cuadernos de Crítica, núm. 5, 1977, pp. 5-54). 15 Dworkin, Ronald, “Hard Cases”, Taking Rights Seriously, Cambridge, Harvard University Press, 1977, pp. 81-130 (hay versión en español: Los derechos en serio, trad. de Marta Guastavino, Barcelona, Planeta-Agostini, 1993. Publicado originalmente en: Harvard Law Review: 1975. Hay versión en español: “Casos difíciles”, trad. de Javier Esquivel, Cuadernos de Crítica, núm. 5, 1981, pp. 5-82). 16 Kennedy, Duncan, “Freedom and Constraint in Adjudication: A Critical Phenomenology”, Journal of Legal Education, núm. 36, 1986 (hay versión en español: Libertad y restricción en la decisión judicial, trad. de Diego Eduardo López Medina y Juan Manuel Pombo, Santafé de Bogotá, Siglo del Hombre editores et al., 1999. A Critique of Adjudication (fin de siècle), Cambridge-Londres-England, Harvard University Press, 1996.
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
183
1. Tres jueces: Herbert, Hércules y ¿Heráclito? En resumidas cuentas, el espectro tiene en un extremo a Dworkin con la tesis de la determinación y en el otro a Kennedy con la tesis de la indeterminación, entre tanto Hart ocupa el centro con la tesis mixta: determinación en unos casos e indeterminación en otros. Cabe señalar que a cada una de estas posturas le corresponde un tipo de juez:
A) El de Hart se denomina —como él— “Herbert”, cuyo significado es “brillante, excelente guerrero o gobernante” (ruler), i. e. gobierna conforme a las reglas, e implica que el juez de forma no-arbitraria u objetiva aplica la regla a los casos fáciles y es capaz de ejercer su discreción para elegir una de las posibles respuestas para los casos difíciles sin dejarse llevar necesariamente por sus propios prejuicios; B) El de Dworkin se llama “Hércules”, en alusión al “semidiós romano, hombre fuerte y robusto que tuvo que completar doce tareas para convertirse en un Dios” e indica que el juez tiene capacidades sobrehumanas que le permiten encontrar de manera no-arbitraria u objetiva, a partir de la correlación entre derecho y moral, una respuesta correcta en casos fáciles y difíciles por igual; y C) El de Kennedy, aun cuando no tiene nombre, bien podría ser bautizado: a) “Heracles”, como el equivalente griego del Hércules romano; b) “Heráclito”, como el filósofo presocrático antidogmático y materialista que aboga por la doctrina del cambio y la unidad de los opuestos; c) “Herder”, como el filósofo crítico e idealista alemán que patrocina la preeminencia de la intuición sobre la razón y que considera que el lenguaje determina el pensamiento; d) “Hermes”, como el dios griego asociado con la velocidad y la buena suerte, quien servía de mensajero de los dioses y es patrón entre otros de viajeros, escritores, atletas, comer-
184
IMER B. FLORES
ciantes, ladrones y oradores; e) “Hermokrates”, cuyo significado es literalmente “el poder de Hermes”; y f) en general como algún filósofo crítico, retórico o sofista.17 En todo caso, involucra la noción de un juez que de modo arbitrario o subjetivo puede escoger entre una infinidad de posibles respuestas la que a él más le gusta incluso en los casos más fáciles. 2. Del continuum al triángulo Como ya lo hemos adelantado, la construcción teórica de Hart en lugar de constituir el término medio virtuoso entre los dos extremos viciosos del continuum, a saber el noble sueño de Dworkin y la pesadilla de Kennedy, es uno de los tres vértices de un triangulo equilátero.
17 Como Kennedy ha sido renuente a ponerle un nombre a su juez, Diego E. López Medina ha sugerido que éste bien podría llamarse simplemente “Duncan”. Nosotros, en cambio, preferimos alguno que comience con el prefijo “Her” para mantener cierto paralelismo con “Herbert” y “Hércules”. Toda vez que Kennedy pertenece al movimiento de Critical Legal Studies cuyo slogan es “todo es política” (“it’s all politics”), así como a una tradición filosófica materialista que enfatiza el discurso y el arte de la persuasión, consideramos que “Heráclito” es una excelente alternativa y que tanto “Hermes” como “Hermokrates” son muy buenas opciones. Ahora bien, aunque en principio “Herder” era una buena idea tiene el problema de que su significado literal en inglés es el de ‘pastor’, i. e. la persona que cuida o guía a un rebaño, y por ello podría dar lugar al sentido negativo de que las ovejas lo siguen meramente por ser borregos; y, finalmente, ‘Heracles’, tendría la ventaja de evidenciar que se necesita de otro Hércules para poder hacerle frente, pero tiene la desventaja de que no sería posible diferenciar uno del otro más allá de que uno sea griego y el otro romano. En conclusión, optamos por “Heráclito” toda vez que representa mejor, como veremos en el próximo apartado, las tres tesis que caracterizan a Kennedy: indeterminación, conexión derecho y moralidad política, y subjetividad.
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
185
Una vez que el espectro se convierte en un triángulo, es posible identificar tres controversias en lugar de nada más una: A) El debate Dworkin versus Hart-Kennedy, acerca de la determinación o indeterminación del derecho: es plausible o no encontrar una respuesta correcta para todo caso, inclusive los más difíciles; B) La discusión Hart versus Dworkin-Kennedy, relativa a la separación o conexión entre derecho y moralidad política: es posible establecer que hay o no una relación necesaria entre ambos; y C) La disputa Kennedy versus Hart-Dworkin, sobre la subjetividad u objetividad en el derecho: es viable o no erradicar los elementos arbitrarios del juez en cualquier decisión judicial. En este orden de ideas, claro está que para Hart no hay una relación necesaria entre derecho y moral,18 mientras que tanto para Dworkin como para Kennedy sí la hay. Sin embargo, la diferencia entre ambos es que para el primero a partir de la conexión con la moralidad política el derecho es determinado y objetivo, en tanto que para el segundo por esa misma vinculación el derecho es indeterminado y subjetivo. El análisis de este nuevo dilema —determinación-objetividad e indeterminación-subjetividad— será objeto del próximo apartado. Cabe adelantar que es posible hablar de objetividad en el derecho y en su interpretación, porque independientemente de cierta indeterminación —en el mundo de lo posible puede haber una infinidad de respuestas— el derecho requiere de determinación —en el mundo de lo deseable debe haber solamente una respuesta correcta— para poder funcionar como tal. Así, aunque el derecho es en principio indeterminado, también es determinado —o mejor dicho determinable— dadas todas las limitaciones y restricciones a la libertad del juez. IV. OBJETIVIDAD E (IN)DETERMINACIÓN Antes de proseguir cabe recordar que Dworkin critica no sólo a las dos partes de la teoría jurídica dominante, la teoría del positivismo jurídico —descriptiva de qué el derecho es (is)— y la teoría del utilitarismo —prescriptiva de qué el derecho debe ser (ought to be)—, sino también a 18 Hart, H. L. A., “Positivism and the Separation of Law and Morals”, Harvard Law Review, núm. 71, 1958, pp. 593-629, y Law, Liberty, and Morality, Stanford, Stanford University Press, 1963.
186
IMER B. FLORES
la pretensión de que ambas son independientes entre sí. De tal guisa, su juicio se centra en tres aspectos: 1) la reducción del derecho a las reglas; 2) la identificación de éstas no por su contenido sino por la forma en que son creadas o aplicadas; y 3) la caracterización de que cuando hay un caso que no está cubierto claramente por una regla, no resta sino permitir que el juez ejerza su discreción. Para los efectos de este artículo, es menester destacar las razones principales por las que Dworkin está en contra de esta última tesis, i. e. la discrecionalidad judicial. En primerísimo lugar, él alega que la discreción judicial violenta principios fundamentales del Estado de derecho (rule of law) y presenta el siguiente argumento:19 Decir que alguien tiene una ‘obligación jurídica (legal obligation) equivale a afirmar que su caso se incluye dentro de una “regla jurídica válida” (valid legal rule) que le exige hacer o dejar de hacer algo. (Decir que alguien tiene un “derecho jurídico” (legal right) implica que otro u otros tienen actual o hipotéticamente una obligación jurídica para actuar o no.) En ausencia de una regla jurídica válida no hay una obligación jurídica —y tampoco un derecho jurídico—. Por consiguiente cuando un juez decide un caso al ejercer su discreción no aplica un derecho jurídico —ni una obligación jurídica— a ese conflicto.
Lo anterior implica que el juez, al ejercer su discreción, no aplica el derecho existente sino que como si fuera un legislador crea derecho y peor aún lo hace ex post facto, lo cual es contrario tanto al principio de división y/o separación de poderes como al principio de la irretroactividad de la ley. Al respecto, Dworkin simplemente tendría que alegar —y además convencernos o persuadirnos— que el juez no actúa como legislador ni crea derecho y que mucho menos lo hace ex post facto sino que aplica un derecho —o una obligación— preexistente o al menos ya existente. Por ende, al enfilar su propuesta teórico-práctica contrapone a la teoría jurídica dominante su teoría liberal del derecho fundada en los derechos y/o principios. De este modo, presenta: 1) la tesis de los derechos y/o principios; 2) la tesis de la conexión y/o vinculación del derecho y la moral; y 3) la tesis de la determinación del derecho. Por supuesto que las tres tesis son muy controvertidas y han sido duramente criticadas por 19
Dworkin, Ronald, Taking Rights Seriously, cit. en la nota 15, p. 66.
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
187
los representantes del positivismo jurídico porque abiertamente ponen en duda y rechazan algunos de sus aspectos centrales, tales como: la primacía y prioridad de las reglas, la separación del derecho y la moral, y la indeterminación del derecho y la discrecionalidad judicial. De las réplicas de Dworkin a sus críticos se desprenden tesis reforzadas: 1) la preexistencia y preeminencia de los derechos y/o principios; 2) la objetividad tanto del derecho como de la moral; y 3) la existencia de una respuesta correcta e incluso de una única respuesta correcta para cada caso. Con relación a la primera, cabe recordar que los derechos y/o principios no sólo existen con anterioridad —preexistencia— tal como queda de manifiesto tanto en el caso Riggs vs. Palmer como en el juego del ajedrez sino también cuentan con una primacía sobre las reglas —preeminencia— que permite considerarlos como ‘trumps’, i. e. la carta o juego que “mata todo”. En lo referente a la segunda y a la tercera solamente nos resta por el momento sentar dos precedentes. Por un lado, la creación de Hércules en el centro de su hard cases, el capítulo central de su Taking rights seriously:20 [H]e inventado un abogado con habilidades, aprendizaje, paciencia y agudeza intelectual sobrehumanos, al cual llamaré Hércules... un juez en alguna jurisdicción estadounidense representativa... que acepta las principales reglas constitutivas y regulativas en su jurisdicción... esto es, que las leyes tienen el poder general de crear y extinguir derechos jurídicos, y que los jueces tienen el deber general de acatar las decisiones anteriores de su tribunal, o de tribunales superiores, cuando sus justificaciones racionales (rationale)... se extienden al caso en cuestión.
Por otro lado, la defensa de la tesis de la respuesta correcta en el corazón del capítulo último “Can rights be controversial?” del citado libro:21
20 Ibidem, pp. 105 y 106: “[A] lawyer of superhuman skill, learning, patience and acumen, whom I shall call Hercules… a judge in some representative American jurisdiction… [who] accepts the main uncontroversial constitutive and regulative rules of the law in his jurisdiction… that is, that statutes have the general power to create and extinguish legal rights, and that judges have the general duty to follow earlier decisions of their court or higher courts whose rationale… extends to the case at bar”. 21 Ibidem, p. 279: “My arguments suppose that there is often a single right answer to complex questions of law and political morality. The objection replies that there is sometimes no single right answer, but only answers”.
188
IMER B. FLORES
[H]e de defender los argumentos de este libro contra una objeción de amplio alcance y que, si no se refuta, puede ser destructiva. Mis argumentos suponen que frecuentemente hay una sola respuesta correcta a complejas cuestiones de derecho y moralidad política. La objeción responde que en ocasiones no hay una sola respuesta, sino solamente respuestas.
En el proceso de defender sus tesis originales y reforzadas, Dworkin ha tenido que reconstruir su teoría liberal del derecho fundada en los derechos y/o principios a la cual le ha dado un giro interpretativo al acercar el análisis del derecho a la literatura y confrontar la interpretación jurídica con la literaria. Antes de proceder con nuestra exposición, cabe aclarar que no se trata de nuevas tesis sino de desarrollos mejores y más profundos de las mismas al poner mayor énfasis en su teoría de la interpretación, la cual esboza en su A Matter of Principle: “el derecho como interpretación”22 y detalla en su Law’s Empire “el derecho como integridad”.23 A continuación procedemos a abrir un paréntesis, para señalar que hay un acuerdo bastante general de que la interpretación comprende dos elementos principales: 1) un texto —elemento objetivo—; y 2) un intérprete —elemento subjetivo—. Sin embargo, la correlación entre ambos se caracteriza por una serie de preguntas abiertas: ¿Cuánto peso tiene el texto y cuánto el intérprete en el proceso interpretativo? ¿Cuánta restricción (constraint) impone el texto al intérprete y cuánta libertad (freedom) tiene el intérprete para alejarse del texto? Ciertamente, hay un desacuerdo significativo entre las diferentes teorías jurídicas formalistas/positivistas y las anti-formalistas/anti-positivistas, acerca del papel más o menos activo-pasivo y deferente-descortés del intérprete jurídico por excelencia: el juzgador, hacia el texto jurídico y a su creador; el legislador. Una vez cerrada nuestra digresión, debemos aludir a dos textos de Dworkin: 1) “Is There Really No Right Answer in Hard Cases?”24 y 2) “Law as Interpretation”.25 El primero constituye una versión revisada 22 23
Dworkin, Ronald, A Matter of Principle, Cambridge, Harvard University Press, 1985. Dworkin, Ronald, Law’s Empire, Cambridge, Harvard University Press, 1986 (hay versión en español: El imperio de la justicia, Barcelona, Gedisa, 1988). 24 Dworkin, Ronald, “Is There Really No Right Answer in Hard Cases?” A Matter of Principle, cit. en la nota 22, pp. 119-145 (hay versión en español: “¿Realmente no hay respuesta correcta en los casos difíciles?”, trad. Maribel Narváez Mora, en Casanovas, Pompeu y Moreso, Jose Juan (eds.), El ámbito de lo jurídico..., cit. en la nota 4, pp. 475-512. 25 Dworkin, Ronald, “Law as Interpretation”, Texas Law Review, vol. 60, 1982, pp. 527-550 (también publicado en Critical Inquiry vol. 9, núm. 1, septiembre de 1982; re-
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
189
del texto que apareció originalmente en el libro en homenaje a H. L. A. Hart, bajo el título de “No Right Answer?”.26 El segundo constituye la ponencia presentada en un evento sobre Politics of Interpretation y una versión previa del texto incluido en A Matter of Principle como capítulo 6 “How Law Is Like Literature”. De esta forma, ambas tesis —la respuesta correcta y la relación derecho-literatura— han dado lugar a un cálido debate entre el propio Dworkin y el crítico literario Stanley Fish, quien en aquel evento fuera su comentarista. Cabe aclarar que aquél tiene presente el celebérrimo libro de éste —Is There a Text in This Class? The Authority of Interpretative Communities—27 y le reconocía el mérito de “habernos familiarizado con la idea de una política de la interpretación” al “promover una teoría de la interpretación que supone que las contiendas entre escuelas rivales de interpretación literaria son más políticas que argumentativas: profesorados rivales en búsqueda de dominio”.28 Desde aquel entonces el debate ha sido caracterizado no sólo por ires y venires sino también por ser cada vez más irrespetuosos. En resumidas cuentas, Fish comentó la ponencia original y su comentario fue publicado como “Working on the Chain Gang: Interpretation in Law and Literature”.29 Dworkin respondió a las críticas en “My Reply to Stanley Fish (and Walter Benn Michaels): Please Don’t Talk about Objectivity Any More”.30 Fish, a su vez, profundizó su criticismo en “Wrong Again”;31 y, Dworkin, por su parte, su defensa en el capítulo 7 “On Interpretation and producido en Mitchell, W. J. T. (ed.), The Politics of Interpretation, Chicago-Londres, Chicago University Press, 1983, pp. 249-270; y revisado como “How Law Is Like Literature”, A Matter of Principle, cit. en la nota 22, pp. 146-166. 26 Dworkin, Ronald, “No Right Answer?” en Hacker, P. M. S., y Raz, J. (eds.), Law, Morality and Society: Essays in Honour of H. L. A. Hart, Londres, Oxford University Press, 1977, pp. 58-84. 27 Fish, Stanley, Is There a Text in this Class? The Authority of Interpretative Communities, Cambridge, Harvard University Press, 1980. 28 Dworkin, Ronald, “Law as Interpretation”, cit. en la nota 25, p. 549. 29 Fish, Stanley, “Working on the Chain Gang: Interpretation in Law and Literature”, Texas Law Review, vol. 60, 1982, pp. 551-567 (publicado también en Critical Inquiry, vol. 9, núm. 1, septiembre de 1982 y reproducido en Mitchell, W. J. T. (ed.), The Politics of Interpretation, cit. en la nota 25, pp. 271-286. 30 Dworkin, Ronald, “My Reply to Stanley Fish (and Walter Benn Michaels): Please Don’t Talk about Objectivity Any More”, en Mitchell, W. J. T. (ed.), The Politics of Interpretation, cit. en la nota 25, pp. 283-313. 31 Fish, Stanley, “Wrong Again”, Texas Law Review, vol. 62, 1983, pp. 299-316.
190
IMER B. FLORES
Objectivity” de A Matter of Principle, el cual contiene material alterado y abreviado de su réplica previa.32 Claramente, Fish representa —como Kennedy— las tesis de la subjetividad e indeterminación: “no hay una sola respuesta, sino respuestas”, mientras que Dworkin simboliza las tesis de la objetividad y determinación: “no solamente hay una respuesta correcta sino que además es posible hablar de la única respuesta correcta”, al grado que en su artículo “No Right Answer?” concluye: “Para todos los efectos prácticos, siempre habrá una respuesta correcta en la trama entretejida de nuestro derecho”.33 A pesar de que esta conclusión no aparece en la versión revisada, no hay ninguna razón para pensar que Dworkin ha cambiado de opinión. De hecho, cuando reinició la contraofensiva con su “Objectivity and Truth: You’d Better Believe It”, insistió: “Esta tesis de la «no respuesta correcta» no puede ser verdadera por default en derecho más que en ética, estética o moral...”.34 Por su parte, Fish toma parte con aquellos que están en contra de la adherencia a los principios: “El problema con los principios es, primero, que no existen, y, segundo, que hoy día muchas cosas malas son hechas en su nombre.” Así mismo, “no hay principios neutrales, solamente principios así llamados, los cuales ya están informados por el contenido sustantivo al que están retóricamente opuestos”.35 Ciertamente, el desacuerdo entre Dworkin y Fish es un reflejo hasta cierto punto de la idea de “profesorados rivales en búsqueda de dominio”. Sin embargo, no por ello diría que es “más político que argumenta32 Dworkin, Ronald, “On Interpretation and Objectivity”, A Matter of Principle, cit. en la nota 22, pp. 167-177. 33 Dworkin, Ronald, “No Right Answer?”, cit. en la nota 26, p. 84: “For all practical purposes, there will always be a right answer in the seamless web of our law” (la traducción es nuestra). 34 Dworkin, Ronald, “Objectivity and Truth: You’d Better Believe It”, Philosophy and Public Affairs, vol. 25, núm. 2, primavera de 1996, p. 38: “This «no right answer» thesis cannot be true by default in law any more than in ethics or aesthetics or morals…” (La traducción es nuestra). 35 Fish, Stanley, The Trouble with Principle, Cambridge, Harvard University Press, 1999, p. 2: “The trouble with principle is, first, that it does not exist, and, second, that nowadays many bad things are done in its name”. (La traducción es nuestra.) Ibidem, p. 4: “there are no neutral principles, only so-called principles that are already informed by the substantive content to which they are rhetorically opposed…” (La traducción es nuestra).
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
191
tivo”. Ni mucho menos que no existe la posibilidad de conciliar, hasta cierto punto, las dos posturas. Cabe recordar que Fish cuestiona: “¿Es el lector —intérprete— o el texto la fuente de su significado?” En su respuesta afirma de manera explícita “el texto no es el único o suficiente repositorio del significado” y de modo implícito el lector —intérprete— tampoco es el único o suficiente depositario del significado. De igual forma, “las actividades del lector —intérprete— no son meramente instrumentales o mecánicas, sino esenciales” pero también el texto es esencial. Así, “el lector —intérprete— es corresponsable por la producción de un significado... que es redefinido como un evento más que como una entidad” pero en ese caso el texto también sería corresponsable. De tal guisa, “el significado no es propiedad del texto”, pero tampoco lo es del lector —intérprete—. Por el contrario, “uno puede observar o seguir su emergencia gradual en la interacción entre el texto y el lector —intérprete—”. Por lo pronto parece claro que la fuente del significado no es el lector —intérprete— ni el texto sino la interacción entre ambos. De hecho, coinciden en que es posible contraponer dos modelos de interpretación de textos: el persuasivo al demostrativo (Fish) y el constructivo-interpretativo al descriptivo-evaluativo (Dworkin). Nuestra corazonada es que hasta este punto los dos están de acuerdo. Sin embargo, al final del día, el primero acentúa que la interpretación es intersubjetiva y perspectiva al grado de que no hay respuestas correctas, solamente respuestas; entre tanto el segundo enfatiza que la interpretación es objetiva y neutral al punto que hay respuestas correctas e incluso una respuesta correcta. Para Fish —y al aparecer también para Dworkin— las “estrategias interpretativas” no son puestas en efecto después de leer —interpretar— el texto, sino que le dan forma a la lectura —interpretación— y como le dan a los textos su forma, los hacen más que derivar de ellos. Así, parece como si el texto fuera desplazado del centro de autoridad a favor del lector —intérprete— cuyas estrategias interpretativas le dan un significado, pero tales estrategias no son suyas, sino que proceden de la “comunidad interpretativa” de la cual él es un miembro. Por consiguiente, son las “comunidades interpretativas” las que producen los significados, al imponer ciertas restricciones a la libertad del lector —intérprete— para interpretar el texto, tales como la necesidad de que la interpretación como sugiere Dworkin no sólo encuadre o enmar-
192
IMER B. FLORES
que sino también de cohesión e integre. Tal y como lo ilustra con la metáfora de “la novela en cadena o en serie” (chain novel) a la cual Fish se refiere como “la pandilla en cadena o en serie” (chain gang). Cabe señalar que las “comunidades interpretativas” están conformadas por todos aquellos que comparten las mismas “estrategias interpretativas”. Por supuesto que al interior de una “comunidad interpretativa” puede haber “subcomunidades interpretativas”. Ahora bien, para Fish:36 Una comunidad interpretativa no es objetiva porque como un ramillete de intereses, de objetivos y propósitos particulares, su perspectiva es interesada en lugar de neutral; pero con el mismo razonamiento, los significados y los textos producidos por una comunidad interpretativa no son subjetivos porque no proceden de un individuo sino de un punto de vista público y convencional.
Aun cuando tiene razón cuando dice que toda interpretación es intersubjetiva y perspectiva en lugar de objetiva y neutral, no por ello creemos que a partir de la noción de “comunidad interpretativa” y de sus “estrategias interpretativas” sea imposible alcanzar un cierto grado de objetividad, claro está que a partir de la intersubjetividad de dicha comunidad interpretativa y con las limitantes de sus propias estrategias interpretativas. Es preciso aclarar que la objetividad no implica ni tiene porqué implicar neutralidad. Ciertamente el juez tiene que ser imparcial además de objetivo, pero no neutral ya que tiene que darle la razón a alguna de las partes ó lo que es lo mismo, optar por una interpretación sobre las demás. En pocas palabras: no puede permanecer indefinido e indiferente. V. CONCLUSIÓN: OBJETIVIDAD —POR LA VÍA DE LA INTERSUBJETIVIDAD— E (IN)DETERMINACIÓN Una vez que el continuum —que según Hart lo tiene a él en el centro como el término medio virtuoso entre los dos extremos viciosos de un espectro, a saber el noble sueño de Pound/Dworkin y la pesadilla de Frank-Llewellyn/Kennedy— se convierte en un triángulo equilátero, es posible identificar tres controversias en lugar de nada más una: 1) deter36
Fish, Stanley, Is There a Text in this Class?, cit. en la nota 27, p. 5.
¿ENSUEÑO, PESADILLA Y/O REALIDAD?
193
minación e indeterminación del derecho; 2) conexión y separación entre derecho-moral; y 3) objetividad y subjetividad en el derecho. Toda vez que el artículo implica una crítica abierta al formalismo-positivismo jurídico y a una de sus tesis principales, a saber: la separación entre derecho y moral, procedimos a analizar desde la perspectiva de la conexión entre derecho y moralidad política un doble dilema: determinación-indeterminación, de un lado, objetividad-subjetividad, del otro. De esta forma, de las posibles conclusiones que podrían derivar de este artículo es imperativo subrayar dos: 1) La primera parte del dilema es falsa, porque independientemente de cierta indeterminación —en el mundo de lo posible puede haber una infinidad de respuestas— el derecho requiere de determinación —en el mundo de lo deseable debe haber solamente una respuesta correcta— para poder funcionar como tal, si no fuera así privaría la incertidumbre e inseguridad y con ellas la anarquía; y, 2) La segunda parte del dilema también es falsa, puesto que en el derecho y su interpretación hay al menos dos elementos: uno objetivo —el texto— y otro subjetivo —el intérprete—, pero además de estos encontramos a la “comunidad interpretativa” a la que pertenece el intérprete, así como las “estrategias interpretativas” que emplea, mismas que lo limitan pero que le permiten alcanzar cierta objetividad por la vía de la intersubjetividad. A este tipo de objetividad, en contraposición a la tradicional que podemos denominar “objetividad”, la podríamos llamar “objetividad” o bien tendríamos que acuñar un nuevo término: “sobjetividad”.37 Así, aunque es cierto que el derecho es en principio indeterminado, también está claro que es determinado o mejor dicho determinable; asimismo es objetivo, pero no en la forma típica —independiente de las valoraciones subjetivas— sino precisamente por la vía de la intersubjetividad, i. e., de confrontar las diferentes interpretaciones, al tener presentes y tomar en consideración todas las limitaciones y restricciones a la libertad del intérprete impuestas no solamente por el texto mismo sino —y 37 En una plática informal con Robert Alexy, al concluir una de las sesiones sobre Law and Objectivity en el Congreso del IVR en Lund, Suecia, el 15 de agosto de 2003, comentábamos sobre la necesidad y conveniencia de estipular dicho vocablo, el cual de pasada ofrece la ventaja de diferenciar dos sentidos de ‘intersubjetividad’: un sentido fuerte, ‘intersubjetividad’1 como un mero acuerdo o consenso intersubjetivo; y, un sentido débil, ‘intersubjetividad’2 como la búsqueda de la objetividad por la vía de una deliberación o discusión intersubjetiva.
194
IMER B. FLORES
sobre todo— por la “comunidad interpretativa” a la que pertenece y las estrategias interpretativas propias de ésta. En resumidas cuentas, es posible la indeterminación al haber una infinidad de respuestas correctas tantas como “comunidades interpretativas” y “estrategias interpretativas”, pero al mismo tiempo es deseable la determinación para poder llegar a una respuesta correcta, al incorporar cierta objetividad en el derecho por la vía de la intersubjetividad —entendida ésta no como un mero acuerdo o consenso sino como la deliberación o discusión— o “sobjetividad”.
ENTRE EL DISCURSO PRÁCTICO GENERAL Y LA ARGUMENTACIÓN JURÍDICA: LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA* Joaquín GARCÍA-HUIDOBRO** SUMARIO: I. Introducción. II. ¿Qué racionalidad se utiliza en política? III. Algunos argumentos frecuentes en la discusión política. IV. La racionalidad en la argumentación política.
I. INTRODUCCIÓN Robert Alexy ha puesto de relieve una idea que es bien conocida, a saber, que “el discurso jurídico es un caso especial del discurso práctico general.”1 Este discurso práctico general admite formas muy diversas. Como el resto de las presentaciones ya se referirán al discurso jurídico, aquí se pretende reflexionar sobre otra forma del discurso práctico: la argumentación política. Ella está, en cierta medida, antes y después del derecho. Antes, en cuanto muchas veces se dirige a conseguir que se establezcan ciertas normas jurídicas o incluso que se pronuncien determinadas decisiones judiciales para producir un estado de cosas que se estima deseable. Pero también viene después del derecho, y busca mantener aquellas regulaciones sociales que se consideran justas. He dividido esta exposición en tres partes. En la primera planteo algunas dificultades que presenta el modo en que hoy se argumenta en política. En la segunda analizaré algunos tipos de argumentos que hoy son uti* Este trabajo ha sido realizado con el apoyo de Fondecyt (Chile, proyecto 1010182). ** Universidad de los Andes, Chile. 1 Alexy, R., Teoría de la argumentación jurídica. La teoría del discurso racional como teoría de la fundamentación jurídica, Madrid, Centro de Estudios Constitucionales, 1997, 35, cfr. 208 y ss. También, del mismo autor, Derecho y razón práctica, México, Fontamara, 1993, pp. 23-35, y “La institucionalización de la razón”, Persona y Derecho, núm. 43, 2000, pp. 217-249. 195
196
JOAQUÍN GARCÍA-HUIDOBRO
lizados en la discusión pública. En la tercera volveré sobre las dificultades enunciadas al principio y trataré de darles una respuesta. II. ¿QUÉ RACIONALIDAD SE UTILIZA EN POLÍTICA? Lo propio del político, a diferencia del dictador, es que requiere no sólo decidir sino también convencer. En un régimen totalitario, en cambio, aunque siempre se procure respaldar las decisiones con una batería de argumentos, lo cierto es que el convencimiento de los ciudadanos, aunque deseable, no es imprescindible. Más bien lo que lo define es que en él los ciudadanos obedecen aunque no están convencidos. O sea, que de ciudadanos tienen poco, si le creemos a Rousseau, que dice que somos legisladores y súbditos al mismo tiempo, esto es, que al obedecer a las leyes nos estamos obedeciendo a nosotros mismos. En una democracia, para acceder al poder es necesario participar en las elecciones y ganarlas. El voto, por otra parte, es libre, de modo que se hace necesario convencer a los votantes. Hasta ahí no hay problemas. Con todo, cuando examinamos las formas del discurso que permite ganar las elecciones, nos encontraremos con una sorpresa. La publicidad política no se diferencia de la publicidad propia de las bebidas gaseosas o las zapatillas deportivas. A primera vista, esto no debería llamar la atención: si la publicidad que permite vender una bebida cola es eficaz, no se ve por qué no pueda seguirla para conseguir que los ciudadanos voten por mí. Sin embargo, todos reconocemos que la decisión de consumir una u otra bebida no es precisamente el modelo de decisión racional. Fue famosa, años atrás, la guerra de las colas, en donde la estrategia publicitaria de una de las compañías fue mostrar que, en una elección a ojos cerrados, la gente prefería su bebida, que era la minoritaria en ventas en el mundo. Si la otra era la mayoritaria y al mismo tiempo la más mala, eso significa que el público consumidor de bebidas no es racional, salvo que esta no sea una de aquellas materias que se deciden ejerciendo la razón. ¿Por qué elegimos una bebida sobre otra? Porque la publicidad nos ha convencido para que procedamos así. ¿Y cómo nos ha convencido? Primero, repitiendo una y otra vez que debemos tomar tal cosa, y, segundo, asociando a ese producto una serie de atributos, como la felicidad y el sentido de la vida, que manifiestamente nada tienen que ver con una mezcla de agua, azúcar, gas y colorantes.
LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA
197
Si examinamos la propaganda política de cualquier candidato de cualquier partido político de cualquier país, veremos que se cumple el primero de esos factores. Ella se basa en la repetición, un mecanismo no precisamente racional. Cuando veo en las calles de mi ciudad 45 veces la misma cara, una al lado de otra, en una pared de apenas 15 metros, me dan ganas de decirle: “ya conozco su cara, me bastaría con una foto y que dedicara ese dinero a cosas más productivas o bellas”. Queda la segunda característica de la publicidad, a saber, la de asociar a un producto determinados atributos. Aquí debemos reconocer que la propaganda política es más modesta. Ningún candidato se presenta como “la chispa de la vida”. Sin embargo, los atributos que se vinculan a cada candidato son tan vagos que perfectamente se podrían aplicar al oponente. Además, en ningún caso se explica por qué ese hombre es alguien que hace cosas, que da confianza, que está con la gente y un buen número de cosas semejantes. Dicho brevemente: parece que no hay coherencia entre la afirmación de que la política es una actividad racional y una propaganda que se muestra como si la decisión más importante, la de elegir, no fuese racional. III. ALGUNOS ARGUMENTOS FRECUENTES EN LA DISCUSIÓN POLÍTICA
Si lo que se ha dicho es efectivo, entonces la decisión de elegir a un candidato no es una decisión racional, sino meramente emotiva. Con todo, y antes de responder a esta objeción, conviene recordar que la política no se agota en el acto electoral. Después de él, tanto los electores como los elegidos tienen mucho que hacer. Aquí, entonces, podría haber un espacio para la racionalidad, al menos en teoría. De partida, en los parlamentos o en los foros televisivos es necesario emplear argumentos, y no basta con poner una foto varios miles de veces con la apelación a que se vote por el fotografiado. Los argumentos que se emplean en política son tan variados como la vida misma. Sin embargo, resulta posible hacer un cierto catálogo de ellos. Veamos algunos, tratando de explicitar, al mismo tiempo, sus supuestos y sus eventuales debilidades. Hago presente que estos argumentos son muy habituales en la política actual y quizá de todo tiempo, de modo que lo que se diga no debe entenderse como referido a una sola corriente política. Se utilizará la expresión “argumento”
198
JOAQUÍN GARCÍA-HUIDOBRO
en un sentido muy amplio, que comprende todo lo que sea apto para convencer a los demás. 1. Argumentos sobre la base de la dialéctica amigo-enemigo Una primera serie de argumentos son los que se basan en la concepción de que la política es un juego de suma cero, es decir, que uno gana precisamente en la medida en que otro pierde. Naturalmente hay ocasiones en que esto sucede así, como en el caso de las elecciones, pero está por demostrarse que tal sea necesariamente la índole del juego político. Veamos algunos ejemplos. En la década de los sesenta y comienzos de los setenta era frecuente oír en Chile la afirmación “cuando se gana con la derecha es la derecha la que gana”. Con ella se pretendía desalentar cualquier alianza del centro político con las fuerzas conservadoras, y conseguir, en cambio, su apoyo para la causa de la izquierda. Por supuesto que si gana una coalición de la que forman parte fuerzas de derecha ellas serán ganadoras. Esto sucede por definición. También vale para cuando se gana con la izquierda o con el centro. Sin embargo de ahí no se deriva que sólo ella sea la que gane. Incluso en el caso de que una fuerza obtenga más que sus asociados en una coalición, eso no significa que los que obtienen menos hayan necesariamente perdido. Como en los negocios, en política lo relevante es ir mejorando posiciones. Si se gana menos que otro pero se ha mejorado sustancialmente la propia posición, la alianza habrá valido la pena. Los ganadores aquí no siempre son los socios mayoritarios. Conocido es el caso del Partido Liberal alemán, que por años desempeñó el papel de una pequeña fuerza que tenía el número de votos suficientes como para decidir si gobernaban los socialdemócratas o los demócratacristianos. Como se hacían pagar caro por su colaboración, suscitaban las iras de los socialcristianos bávaros, los otros aliados de la democracia cristiana, que con más votos recibían menos. La diferencia estaba en que los socialcristianos eran aliados cautivos, mientras que los liberales era una fuerza que había que conquistar. Triunfar con el apoyo de un pequeño partido que se hace pagar caro no es una derrota, sino una victoria. Si no se consigue en ella todo lo que se quería, habrá que recordar que el término de comparación no es lo que se quiere, sino lo que se puede, y tener presente que —de no haber mediado ese apoyo—, los que ahora están en el gobierno deberían sentarse en las bancas de la oposición.
LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA
199
Después del atentado a las Torres Gemelas se difundió en parte del mundo árabe la teoría de que el organizador de ese acto terrorista era el servicio secreto de Israel. El argumento era tan simple como preguntar ¿a quién le conviene este acto? La respuesta aparentemente clara para ellos es que le convenía a Israel, pues así tenía una excusa para negar permanentemente a los palestinos el derecho a fundar un Estado. No le convenía este acto, en cambio, a los países árabes o al mundo islámico, que se vería perjudicado en su imagen internacional e incluso se exponía a sufrir represalias. Este argumento reposa sobre innumerables supuestos que es difícil que se den. Por ejemplo, supone unos criterios de racionalidad que deberían ser aplicados de hecho por todos los hombres, de modo que ni siquiera un terrorista haría algo que a nosotros nos parezca disparatado, como poner en peligro los avances realizados por la propia causa. Lamentablemente hay demasiados ejemplos disponibles que hacen pensar que la lógica que mueve a los terroristas no es la misma que aquella que impulsa a los sectores pacíficos que hay en los distintos bandos. Además, el determinar en qué consiste la conveniencia es algo muy difícil. Pocos días después del atentado se pudo observar que, en su necesidad de contar con el apoyo del mayor número posible de países árabes, Estados Unidos hizo concesiones y afirmaciones muy contrarias a los intereses de Israel. Un caso parecido sucedió hace muchos años, cuando en la ciudad de Washington fue asesinado el socialista chileno Orlando Letelier. Los partidarios del régimen militar y muchos observadores imparciales señalaron que al único que no le convenía este acto era al gobierno del presidente Pinochet. Por tanto, pensaban que era imposible que hubiese sido ejecutado por sus servicios de inteligencia. Efectivamente, hay buenas razones para considerar que ese gobierno fue el principal perjudicado por el desprestigio derivado de ese asesinato, sin embargo, el argumento en cuestión supone que hay una perfecta coherencia entre lo que desea un gobierno y lo que realizan los servicios de seguridad que de él dependen, cosa poco probable. Hasta el día de hoy no existe absoluta claridad sobre este episodio, pero el hecho de que el director de esos servicios de seguridad haya terminado en la cárcel hace pensar, al menos, que éste es un caso más en donde esa lógica y coherencia perfectas no se dan, y los cuidados del sacristán terminan matando al señor cura. En la misma línea, a veces una corriente política se felicita por el daño que ha provocado en las filas de otra, sin cuestionarse si, al hacerlo, no
200
JOAQUÍN GARCÍA-HUIDOBRO
ha producido un deterioro en ciertos activos, como la confianza y la respetabilidad, que son fundamentales ante el electorado. Porque así como no todo lo que beneficia a los demás me perjudica a mí, tampoco todo lo que los perjudica me beneficia. Esto es especialmente importante a la hora de evaluar las pugnas que se dan entre partidos políticos rivales que, por circunstancias electorales, se ven obligados a entrar en una coalición si quieren acceder al gobierno. Las pugnas entre esos partidos y las victorias que temporalmente uno pueda obtener sobre otro terminan afectando su confiabilidad ante electorado, que los ve como incapaces de constituir una alternativa viable de gobierno. Dentro de esta familia de argumentos están los de índole conspirativa. Siempre es útil explicar los ataques de que se es objeto como si fueran fruto de un plan en contra de quien los sufre. En muchos casos se busca construir a posteriori una interpretación de los hechos de modo tal que aparezcan como formando parte de un plan perfectamente diseñado. Lo dicho no significa que no existan conspiraciones, pero su prueba es difícil y siempre será preferible una explicación que dé cuenta de un hecho sin necesidad de recurrir a estas teorías. Un personaje público argentino reconocía una vez en privado: “yo, que he participado en muchas conspiraciones, sé lo difícil que resulta que tengan éxito”. En muchos casos, se llega a atribuir al adversario un poder y un conocimiento tan amplios que nada de lo que ocurre es ajeno a su querer o permisión. Es la idea de la responsabilidad total, que ha causado no pocas tragedias en la historia. Frente a esta tendencia, hay que reconocer que los gobiernos y las oposiciones son imperfectos, que no disponen de información suficiente y que gran parte de las cosas que ocurren son fruto de numerosos hechos fortuitos, imposibles de predecir o de políticas en las que la improvisación y la intuición juegan un papel mucho más importantes que los estudios de los expertos. Una variante del argumento conspirativo consiste en atribuir a la resistencia de ciertos grupos sociales el fracaso de las propias políticas. Es típico de las economías más populistas el culpar a los empresarios o a los capitalistas del fracaso econó mico. El país está mal, se dice, porque los empresarios no invierten. No se advierte que los empresarios, como cualquier persona razonable, sólo están dispuestos a invertir cuando hay seguridades suficientes de que no perderán el fruto de sus esfuerzos. Los empresarios, más que grandes conspiradores, son personas que quieren maximizar sus beneficios y disminuir sus costos. Si el gobierno no es de
LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA
201
su agrado no tendrán problemas en seguir invirtiendo mientras se respeten ciertas reglas de juego fundamentales. Ningún empresario demócrata dejará de invertir porque haya un republicano en el gobierno. Jamás pensará que al invertir generará empleo y, con esto, prestará una ayuda al presidente cuyas ideas no comparte. Simplemente invertirá porque quiere conseguir una ganancia. En los países en que esto no sucede, las razones tienen que ver mucho más con las políticas económicas erradas o erráticas que con supuestas conspiraciones empresariales.2 Los argumentos que se han reseñado son típicos de situaciones de conflicto. Ellos surten gran efecto cuando hay pocos puntos en común con el adversario y particularmente cuando se ha logrado hacer una caricatura del mismo. Son argumentos que presuponen normalmente que no hay un contacto personal entre los bandos en pugna y que en buena medida se desarman cuando ese contacto y conocimiento se produce. Aquí se aplica el dicho de Tertuliano acerca de la actitud agresiva de los romanos en contra del entonces naciente cristianismo, al que se atribuían las prácticas más inverosímiles: dejan de odiar cuando dejan de ignorar. 2. Argumentos basados en los principios del régimen democrático Junto a los anteriores hay otros modos de razonar que no presentan o presuponen un carácter conflictivo, sino que se dirigen a poner la propia postura en un lugar privilegiado frente a los demás. Esto se logra a través de su identificación con los principios del régimen o con ciertos valores especialmente apreciados por el auditorio. El recurso más habitual consiste en mostrar cómo la propia posición se halla en el medio, frente a dos extremos. Este procedimiento es particularmente útil en una democracia, en donde resulta necesario obtener votos que son patrimonio de aquellas posturas que están más cercanas a la propia en el espectro político. El centro parece tener un valor particularmente privilegiado en el debate político. ¿Cuánto valen realmente es2 Naturalmente, la historia muestra casos en donde los empresarios se han propuesto desestabilizar ciertos gobiernos. Así, por ejemplo, en el paro de octubre de 1972 contra Salvador Allende o en las protestas que derivaron en la caída del régimen de Marcos, en Filipinas. Sin embargo, no constituyen la regla de toda la actividad empresarial, ni se trata de operaciones en que los empresarios hayan actuado encubiertos ni de movilizaciones en las que ellos hayan actuado solos o tenido la iniciativa.
202
JOAQUÍN GARCÍA-HUIDOBRO
tos argumentos? Ya desde Aristóteles sabemos que la virtud ocupa una posición intermedia entre dos extremos viciosos, pero que este principio sea automáticamente aplicable a la praxis política es más que discutible. De partida, el propio Aristóteles enseña que, desde otro punto de vista, el del bien, la virtud no es un medio sino un extremo. La teoría del justo medio está lejos de ser un pretexto para la mediocridad. No podríamos decir, por ejemplo, que lo más deseable es un estado intermedio entre la guerra o la paz, o que es preferible un respeto medio, y no muy exagerado, de los derechos humanos o de las normas contrarias a la corrupción. Por tanto, hay que tener cuidado con el recurso a este procedimiento, no sea que se termine por caer en lo que un autor ha denominado el “extremismo de centro”, que consiste en definir la propia postura política no en términos de lo que es mejor sino siempre de modo espacial, es decir, tratando de ponerse en una postura equidistante de las otras en pugna. Además, la receta de colocarse en el medio no es infalible: de ser así, ni Reagan ni Tatcher habrían llegado nunca al gobierno. A veces, más que una opinión intermedia, de lo que se trata es de mostrar posturas claras, de hacer ver cuáles son las necesidades del país. Gran parte de las argumentaciones que hoy se escuchan están destinadas a mostrar como la propia postura es la más pluralista, tolerante, liberal, etcétera. Es la identificación con los principios que todos compartimos. Ya Marx y Burke denunciaban cómo detrás de la Declaración de Derechos del Hombre y el Ciudadano no estaba el hombre puro y simple, sino el burgués, que revestía de universalidad lo que en el fondo no era más que su propio interés. Los lectores de Animal Farm, de Orwell encontrarán multitud de ejemplos acerca de cómo las invocaciones a la universalidad no siempre son tan universales como parecen. Efectivamente es muy importante que una postura política sea tolerante o tenga cualquiera de las otras características. Sin embargo hay que tener siempre presente qué se está entendiendo por tolerancia, quiénes la entienden y qué alcance le dan. Una variante del argumento anterior consiste en presentarse ante uno de los supuestos extremos como la alternativa para que no gane la posición que está más alejada del mismo. “Si no vota por el centro, se le dice a los partidarios de la derecha, terminará ganando la izquierda”, o al revés.
LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA
203
3. Invocación al progreso Otro modo frecuente de argumentar consiste en presentar la propia postura como progresista y la contraria como retrógrada. Este tipo de argumento probablemente no habrían hecho mella en las sociedades premodernas, pero tiene gran eficacia allí donde se ha aceptado la idea del progreso indefinido y se considera que la tecnociencia es el medio para lograrlo. Se basa en la idea de que todo progreso particular es al mismo tiempo un progreso para el hombre entero, lo que es más que discutible. Por otra parte, estos argumentos distan de ser neutrales, pues suponen un determinado concepto del progreso y una idea del bien humano particular. Es progreso lo que lleve a realizar el propio ideal y es retrógrado lo que lo obstaculice. Este tipo de argumentos tiene un gran valor retórico pero poca consistencia, ya que bien podrían ser utilizados en el sentido exactamente contrario, pues muchos pensarán que lo que nosotros llamamos progreso no es precisamente un avance. Debemos ser conscientes que en una sociedad plural las ideas de hombre y progreso son muy diversas, y no es lícito argumentar como si este problema estuviese ya solucionado y un grupo social tuviese el monopolio de la determinación de qué constituye un progreso y qué cosas no lo son. Cuando se invoca el avance o progreso de una sociedad es necesario pedir más explicaciones. La idea de progreso depende, a su vez, de la idea de hombre y de bien que se tiene. Según sea ésta, se llamará progreso a una u otra cosa. Aquí no hay neutralidad posible. En la misma línea discurren las argumentaciones que apoyan una determinada política sobre la base de que ella ha sido aplicada o está siéndolo en los países más desarrollados. Una cosa es que los países más desarrollados suelan aplicar políticas más sensatas que los de menor desarrollo, y otra muy distinta es atribuirles la infalibilidad o argumentar como si esa imitación llevara por sí sola al desarrollo. El ejemplo de otros países, supuesto que sea trasladable (en muchos casos no lo será), constituye únicamente una presunción digna de tener en cuenta, pero no es un argumento definitivo cuando se trata de determinar qué es lo mejor para una nación. También está el argumento inverso, es decir, el nacionalista, que mira con malos ojos todo lo que venga de afuera. Vale para él lo que se señaló antes: el hecho de que algo venga de afuera no es de por sí ni bueno ni
204
JOAQUÍN GARCÍA-HUIDOBRO
malo. Habrá que ver qué es lo que viene, de dónde viene y en qué medida es aplicable al caso propio. El argumento nacionalista ha sido empleado con frecuencia en el campo económico. No me gusta que las grandes empresas despidan a sus empleados, pero no me parece correcto que, cuando se trate de una empresa extranjera, se destaque, por ejemplo, que la transnacional Telefónica ha despedido a 2.600 chilenos. Con esto se da a entender que la razón del despido tiene más que ver con un choque de nacionalidades que con la racionalidad económica (en este caso, una racionalidad muy discutible). Otro tanto sucede con las discusiones que provoca la compra de grandes territorios ocupados por bosques nativos, por parte de conservacionistas que son extranjeros. La discusión en estos casos se centra en la lesión a la soberanía que supone la posesión de esas grandes extensiones de terrenos por parte de un extranjero. En un régimen de igualdad ante la ley, en cambio, la nacionalidad del adquirente debería ser considerada irrelevante.3 4. Argumentos conservadores Si en algunos casos, la invocación al progreso y a la apertura es un argumento particularmente eficaz, en otros tiene éxito precisamente lo contrario. La invocación a la tradición o al estado de cosas vigente puede tener gran eficacia. “Keine Experimente”, decía Adenauer a sus electores. Y ellos lo mantuvieron en el poder por largos años. Se trata, en definitiva, de mostrar que las cosas andan bien, que en otros países hay caos y desorden, y que no vale la pena experimentar cuando se trata de cosas tan importantes como la paz, el respeto a la propiedad o la seguridad ciudadana. Con todo, este argumento tiene una duración limitada, y llega un momento en que la gente quiere simplemente cambiar. En ese momento no basta con señalar que la economía funciona y que no hay guerras, sino que hay que encontrar maneras más persuasivas de defender el estado de cosas vigente. Por ejemplo, hacer ver que la mantención de un cierto orden es precisamente lo que permite innovar, pero que el cambio debe provenir de las iniciativas individuales y no de la acción de los gobiernos. 3 Salvo en contadas excepciones, como la adquisición de tierras en zonas fronterizas por parte de connacionales de un Estado vecino cuando éste prohibe ese acto a los connacionales nuestros. Pero en este caso se trata de una aplicación del principio de la reciprocidad.
LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA
205
5. Argumentos estratégicos Hay toda una serie de argumentos que tienen interés no en sí mismos sino por el contexto en que son utilizados. El más típico de esos contextos es el que consiste en desviar la atención del público hacia un problema que no es el fundamental. Hace un tiempo, en Chile, se incautaron los aviones de una compañía aérea acusada de lavado de dinero. La compañía reaccionó haciendo ver a la opinión pública que esa acción constituía un atentado a la libre competencia (pues favorecía a las compañías rivales) y una lesión del derecho al trabajo de los empleados de la compañía, pues producía desempleo. A eso se agregó el hecho de que la compañía era extranjera, lo que motivó una fuerte ola de protestas en ese país y diversos intentos por afectar los intereses chilenos en él. Se trata de un caso típico de desviación de atención. Si una compañía participa en operaciones de lavado de dinero y está vinculada al narcotráfico, es irrelevante que la suspensión de sus servicios beneficie o perjudique a otra empresa o a un grupo de personas. Lo fundamental de la discusión es si ese cargo es verdadero o falso. La compañía, como cualquier persona natural y jurídica, goza de una presunción de inocencia y en este caso la justicia determinó que no había fundamento plausible para los cargos que se le habían formulado. La compañía, entonces, tendrá derecho a reclamar del Estado chileno las indemnizaciones que correspondan y todo seguirá su curso ordinario. Pero eso no significa que no haya empleado una típica estrategia de distracción de la opinión pública. A veces, no son procedimientos voluntarios los que desvían la atención pública, sino ciertos acontecimientos salvadores, como triunfos deportivos o grandes tragedias, los que permiten a los gobiernos escapar de situaciones apuradas. Otras veces, las conmociones públicas son el momento propicio para introducir ciertas medidas o dar determinadas noticias que interesa que pasen inadvertidas. O al revés, la falta de noticias y el sopor veraniego puede ser el momento oportuno para realizar determinadas acciones sin que haya la protesta u oposición que se produciría en circunstancias normales. Un caso muy interesante, aunque difícil de utilizar con éxito, es la forma de argumentar que consiste simplemente en no responder. En un determinado país un candidato presidencial fue acusado de ciertas irregularidades en la época en que había sido ministro, un tiempo antes. Aquí la estrategia consistió en actuar como si la acusación no existiera. Lo hizo
206
JOAQUÍN GARCÍA-HUIDOBRO
con tal seguridad y aplomo que la acusación se desvaneció. Los intentos periódicos por recordar esos hechos se han estrellado con la barrera de la indiferencia, que se ha mostrado notablemente eficaz. Los ejemplos de argumentos podrían multiplicarse. Lo reseñado hasta aquí nos muestra que los argumentos no son, en sí mismos, buenos o malos, pues su justicia depende en buena medida de la situación. Este hecho, su contingencia, no los priva de racionalidad: podrán tenerla si se ajustan a las circunstancias. La tarea de calibrar y sopesar las circunstancias no es algo caprichoso o arbitrario, sino estrictamente racional, aunque con una racionalidad no especulativa, sino práctica, es decir, cuya exactitud no es absoluta.4 IV. LA RACIONALIDAD EN LA ARGUMENTACIÓN POLÍTICA Es el momento de volver al problema del que partimos, a saber, si el modo en que se utilizan las actuales técnicas publicitarias constituye una demostración de que la racionalidad no tiene lugar en la vida política. Comencemos por una opinión muy respetable, la de Popper, que piensa que sería relativamente fácil superar las dificultades tecnológicas que obstruyen el camino hacia metas tales como la conducción de las campañas electorales mediante la apelación, no a las pasiones, sino a la razón. No veo ninguna razón, por ejemplo, para que no se imponga un tamaño, aspecto, etcetera. uniforme a los panfletos electorales, eliminándose todo cartel (esto no tiene por qué hacer peligrar la libertad, así como no la perjudican, sino más bien la benefician, las limitaciones razonables impuestas a los litigantes ante un tribunal de justicia). Los actuales métodos de propaganda constituyen un insulto al público y también a los candidatos. Jamás debiera utilizarse una propaganda apta quizá para vender jabón, pero no para cuestiones de tal magnitud.5
4 Los argumentos reseñados son empleados por los actores políticos más relevantes. Habría que desarrollar también aquéllos que son fruto de la iniciativa de los propios ciudadanos. El más notable es el voto de protesta, que ha adquirido un protagonismo especial en las elecciones legislativas de Argentina en 2001. 5 Popper, K. R., La sociedad abierta y sus enemigos, Barcelona, 1982, p. 625, nota 27 (traducción de la segunda edición revisada, Londres, 1945).
LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA
207
La idea es interesante, pero presenta múltiples debilidades. De partida, no sé si estaremos de acuerdo en entregarle un nuevo poder al Estado, en este caso, el de controlar la propaganda política. Además, supuesto que se consiguiera lo que Popper pretende, habría mil formas de burlar esas reglamentaciones. En la época en que Popper escribió La sociedad abierta y sus enemigos la actividad de un candidato consistía fundamentalmente en aparecer en ciertos afiches en las calles y reunirse con sus potenciales votantes en teatros o, si las cosas iban mejor, en grandes manifestaciones. Hoy el panorama es mucho más complicado y me temo que no es posible intentar regulaciones semejantes. Quizá la objeción en contra de la presunta irracionalidad que la propaganda pone en la política, se diluya un poco si atendemos más de cerca a su papel. Si consideramos que los afiches que inundan nuestras ciudades son una forma de argumentación política, el resultado será desalentador. Sin embargo, es posible que esos carteles no sean ni deban ser considerados argumentos. Su papel es mucho más modesto: tan sólo pretenden recordar que un candidato existe, atraer sobre él la atención. Sin ese cautivar la mirada nunca se producirá el proceso de análisis de los contenidos de los distintos proyectos en disputa. Pensemos seriamente en la gente que nos rodea: ¿conocemos a una persona que haya votado en las últimas elecciones sólo porque le gustaba la sonrisa del candidato en los carteles? Detrás de cada voto hay un análisis que es, o puede ser, racional, aunque lógicamente admite muchos grados. La mayoría de los que votaron por un candidato sabían perfectamente lo que estaban haciendo y por qué lo hacían. Es posible que después hayan descubierto que estaban equivocados, pero eso no transforma a la decisión en irracional, sino, en el peor de los casos, en errónea. Si la gente decidiera sobre la base exclusiva o principal de la publicidad, probablemente votaría en blanco, porque esas imágenes muchas veces nos dejan perplejos. Nos dan ideas muy parecidas en una estética también muy similar. Si esto es así, si la racionalidad opera después de que se ha visto la propaganda, y si ésta en gran medida permite no convencer al elector sino tan sólo ser considerado por él al momento de elegir, no ser excluido de las opciones que sopesa, ¿no podríamos ahorrarnos ese gasto?, ¿no hay forma de destinar esos cuantiosos recursos a cosas más productivas?
208
JOAQUÍN GARCÍA-HUIDOBRO
La respuesta no es sencilla. En algún caso se ha intentado, y con éxito, prescindir de la propaganda electoral. Pero se trata de personas que ya ocupaban un lugar en el parlamento y eran ampliamente conocidas por la opinión pública. Su campaña consistió en hacer como si no hiciera campaña. Eso le dio un enorme atractivo y le permitió canalizar la indignación de los electores cada vez que veían las murallas de su ciudad ensuciadas por la propaganda electoral. Otras veces ha sucedido que la enorme desventaja en el caudal publicitario de uno y otro candidato ha terminado por favorecer al más débil. El caso más típico es el de la derrota del bien acaudalado Vargas Llosa en manos del entonces casi desconocido y completamente desprovisto de recursos Fujimori. Era tal la diferencia, que se produjo la natural compasión que todos sentimos por David cuando enfrenta al gigante Goliath. Otro tanto sucedió con una candidata independiente, que en la franja electoral no tenía más de dos segundos y sólo alcanzaba a decir el nombre de su ciudad. Era tan injusta la marginación frente al sistema establecido, que consiguió una cantidad de votos y una fama que no habría obtenido quizá si hubiese tenido más medios. El drama que estamos viviendo es la necesaria consecuencia de estar intentando algo que en otros tiempos parecía imposible. Aristóteles dice que no resulta posible gobernar una polis con 100 mil habitantes, dado que es imposible mantener el mínimo de contacto personal que hacen que sea físicamente posible. Hoy día, a través de los mecanismos de representación y gracias a los medios de comunicación podemos darnos el lujo de tener democracias en donde son gobernados 200 veces más seres humanos que la cifra que Aristóteles, en un ejercicio de imaginación, consideraba como un límite ridículo e imposible. Eso es algo notable, que habría llenado de admiración al Estagirita, pero que indudablemente implica muchos costos y distorsiones. La distorsión más grave, con todo, no es la que deriva del espectáculo al que deben someterse los políticos en su necesidad de ser mínimamente conocidos, sino los recursos económicos que, por lo general, hay que movilizar para obtener un lugar en un Parlamento contemporáneo. Porque los casos que he señalado son una contada minoría, y los traigo a colación precisamente porque constituyen una excepción. En buena medida, nuestras democracias mantienen una inevitable tendencia plutocrática, no en el sentido en que sean los ricos los que gobiernan o le-
LAS FORMAS DE LA ARGUMENTACIÓN POLÍTICA
209
gislan, pero sí en cuanto, si no las personas, al menos los partidos requieren contar con enormes recursos. Las soluciones que se han dado para resolver esta distorsión resultan en muchos casos peores que la enfermedad. Al menos después del Affaire Kohl y los pagos indebidos a la Democracia Cristiana alemana, resulta difícil creer que el financiamiento estatal de la propaganda política pueda ser una solución de fondo.6 La tentación de desequilibrar la balanza poniendo en ella fondos distintos de los estatales es demasiado grande como para que pueda resistirse mucho tiempo por muchas personas. Sucede que no podemos comunicarnos a menos que recurramos a los medios de comunicación, pero éstos tienen un formato tal que terminan condicionando el mensaje mismo que se quiere transmitir. Al menos podemos conformarnos que con las nuevas tecnologías de comunicación siempre queda el consuelo de que una modesta página en Internet puede ser tan visitada como la de la compañía más poderosa: al menos en teoría. Sirva también de consuelo el hecho de que hoy no estamos condenados a asistir a esas grandes concentraciones de masas en donde la demagogia y una retórica ampulosa estaban como en su casa. No se puede decir que cualquiera tiempo pasado haya sido mejor. Es posible que las decisiones de los electores no sean las mejores, pero hay que reconocer que en muchos países la demagogia tradicional es el mejor modo de perder una elección. Este hecho habla muy bien de nuestros conciudadanos. Así, por ejemplo, un tiempo antes de la elección presidencial en un determinado país, el Frankfurter Allgemeine Zeitung anticipó que un cierto candidato iba a ser el ganador porque era aburrido y no hacía grandes promesas, cosa que a los ojos de sus conciudadanos tenía un valor especial. Por otra parte, la mediación de los medios de comunicación ha ido acompañada por una considerable disminución de la violencia, no sólo física sino incluso verbal. Si es una consecuencia de la lógica que imponen los medios o un fenómeno paralelo, que no conoce relación causal, es una cuestión que no estoy en condiciones de resolver, aunque me inclino más bien por la primera posibilidad. Una persona enojada se ve particularmente mal en la televisión. Una salida de tono puede significar que un candidato sea puesto en ridículo tantas veces como las que se re6 Además, en la medida en que se basa en las votaciones históricas desalienta a los candidatos independientes y tiende a consolidar el estado de cosas vigentes, lo que no siempre es una ventaja.
210
JOAQUÍN GARCÍA-HUIDOBRO
pite un gol o una falta en una transmisión deportiva. Los actos de violencia pueden ser juzgados sin pasión por el televidente que está cómodamente sentado en su casa, y que conserva la cabeza fría, a diferencia de los que están involucrados en una manifestación callejera, que pueden sentirse justificados por el fervor de los que los rodean. Todo eso, naturalmente, no es suficiente para producir actitudes pacíficas, pero sí permite que se den con mayor facilidad. Muchos se quejan en los países más desarrollados en que las imágenes de los diversos contendores apenas se diferencian. Pelo corto, ropa cuidada, aspecto ligeramente informal y una sonrisa, son los componentes necesarios de toda campaña política. Sin embargo, también puede verse esa homogeneidad de otra manera, y decirse que las diferencias se expresan hoy con lenguajes más sutiles. Además, aunque no fuera así, ¿no está reflejando ese parecido estético el hecho de que los contenidos de los diferentes programas son mucho más semejantes que antaño?, ¿y no es ése un hecho positivo? Los Tupamaros y Bordaberry, Aldo Moro y las Brigadas Rojas, los Montoneros y Videla, parecían extraordinariamente diferentes simplemente porque lo eran. En cambio, cuando los contenidos se asemejan, no debe extrañarnos que los envases también. Esto va inevitablemente acompañado por una cierta apatía política, que es una enfermedad que sólo se da en cuerpos saludables. Sólo los que tienen todo perdido y los que no se juegan la vida en una elección pueden darse el lujo de la apatía. El hecho de que, salvo excepciones, en los países llamados democráticos se haya producido una renuncia generalizada a la violencia es un avance que no deberíamos dejar de aquilatar. Es la condición necesaria para que puedan oírse los argumentos. Si no se oyen es porque no los damos. No culpemos a la política actual ni a sus formas estéticas, sino a nuestra falta de imaginación. La tarea que tenemos por delante es, en buena medida, encontrar lenguajes y modos de expresión que sean adecuados a las nuevas vías de comunicación y a las sensibilidades actuales. No todos las encontrarán, y habrá sectores políticos o grupos dentro de ellos que están condenados a desaparecer. Pero eso es la regla general de la historia. La diferencia es que hoy desaparece el que quiere, es decir, aquel que no quiere desarrollar un lenguaje que sea comprensible en la nueva situación, y en otras épocas de la humanidad desaparecía el que no contaba con la aptitud física para seguir adelante. La diferencia no es pequeña.
HOW FACTS MAKE LAW* Mark GREENBERG** SUMMARY: I. Introduction. II. The Premises. III. Is there a Distinctively Legal Problem of Content? IV. Can Law Practices Themselves Determine how they Contribute to the Content of the Law? V. Objections. VI. The Need for Substantive Factors, Independent of Law Practices. VII. Conclusion.
I. INTRODUCTION Nearly all philosophers of law agree that non-normative, non-evaluative, contingent facts — descriptive facts, for short— are among the determinants of the content of the law. In particular, ordinary empirical facts about the behavior and mental states of people such as legislators, judges, other government officials, and voters play a part in determining that content. It is highly controversial, however, whether the relevant descriptive facts, which we can call law-determining practices, or law practices (or simply practices) for short,1 are the only determinants of * For helpful comments on ancient and recent predecessors of this paper, I am very grateful to Larry Alexander, Andrea Ashwoth, Ruth Chang, Jules Coleman, Martin Davies, Ronald Dworkin, Gil Harman, Scott Hershovitz, Kinch Hoekstra, Harry Litman, Tim Match, Tom Ángel, Ram Neta, Jim Prior, Stephen Perry, Joseph Raz, Gideon Rosen, Scout Shapiro, Seana Shiffrin, Ori Simchen, Martin Stone, Enrique Villanueva, and two anonymous referees for Legal Theory. Special thanks to Susan Hurley and Nicos Stavropoulos for many valuable discussions. I would also like to thank audiences at the University of Pennsylvania, Ney York University, University of California, Los Angeles, Yale University, the 2002 Annual Analitic Legal Philosophy Conference, and the 2003 International Congress in Mexico City, where versions of this material were presented. Finally, I owe a great debt to the work of Ronald Dworkin. ** University of California, USA. 1 For the moment, I will be vague about the nature of law practices. For more precision, see section II,.2 below. 211
212
MARK GREENBERG
legal content, or whether legal content also depends on normative or evaluative facts – value facts,2 for short. In fact, a central —perhaps the central— debate in the philosophy of law is a debate over whether value facts are among the determinants of the content of the law (though the debate is not usually characterized in this way). A central claim of legal positivism is that the content of the law depends only on social facts, understood as a proper subset of descriptive facts. As Joseph Raz says, “H. L. A. Hart is heir and torch-bearer of a great tradition in the philosophy of law which regards the existence and content of the law as a matter of social fact whose connection with moral or any other values is contingent and precarious.”3 In contemporary philosophy of law, there are two distinct ways of developing this tradition, hard and soft positivism. Hard positivism denies that value facts may play any role in determining legal content.4 Soft positivism allows that the relevant social facts may make value facts relevant in a secondary way. For example, the fact that a legislature uses a moral term – “equality”, say – in a statute may have the effect of incorporating moral facts – about equality, in this case – into the law.5 On this soft positivist view, however, it is still the social facts that make the value facts relevant, and the social facts need not incorporate value facts into the law. Hence, according to both hard and soft positivism, it is possible for social facts alone to determine what the law is, and, even when they make value facts relevant, social facts do the fundamental work in making the law what it is – work that is explanatorily prior to the role of value facts. To put things metaphorically, hard and soft positivism hold that there could still be law if God destroyed all value facts. Ronald Dworkin is the foremost contemporary advocate of an anti-positivist position. According to Dworkin, a legal proposition is true in a given legal system if it is entailed by the set of principles that best 2 3
For some explanation of what I mean by “value facts”, see note 23 below. Raz, Joseph, Ethics in the Public Domain, Oxford, Oxford University Press, 1994, p. 210. Raz also puts the point epistemically: the content of the law “can be identified by reference to social facts alone, without resort to any evaluative argument”. Ibidem, p. 211. 4 See, for example, Raz, Joseph, Ethics in the Public Domain, ch. 10; Raz, Joseph, The Authority of Law, Oxford, Clarendon Press, 1979, ch. 3. 5 See, for example, Coleman, Jules, “Negative and Positive Positivism”, The Journal of Legal Studies, 11, 1982, pp. 139-164; Hart, H. L. A., The Concept of Law, 2nd. ed., New York, Oxford University Press, 1997, postscript.
HOW FACTS MAKE LAW
213
justify the practices of the legal system.6 Since the notion of justification on which Dworkin relies is a normative notion, a consequence of Dworkin’s view is that the content of the law depends on value facts. Understanding and resolving the debate between positivists and anti-positivists requires understanding the nature of the relevant determination relation – the relation between determinants of legal content and legal content. The debate, as noted, concerns whether law practices are the sole determinants of legal content. It is difficult to see how one can systematically address the question whether A facts are the sole determinants of B facts without understanding what kind of determination is at stake. But the positivist/anti-positivist debate has so far been conducted with almost no attention to this crucial issue. A preliminary point is that the determination relation with which we are concerned is primarily a metaphysical, or constitutive, one, and only secondarily an epistemic one: the law-determining practices make the content of the law what it is. To put it another way, facts about the content of the law (“legal-content facts”) obtain in virtue of the law-determining practices. It is only because of this underlying metaphysical relation that we ascertain what the law is by consulting those practices. A second preliminary point, which should be uncontroversial, is that no legal-content facts are plausibly metaphysically basic or ultimate facts about the universe, facts for which there is nothing to say about what makes them the case. Legal-content facts, like facts about the meaning of words or facts about international exchange rates (e. g., that, at a particular time, a UK pound is worth 1.45 U. S. dollars), hold in virtue of more basic facts. The important implication for present purposes is that the full story of how the determinants of legal content make the law what it is cannot take any legal content as given. It will not be adequate, for example, to hold that law practices plus some very basic legal-content facts (for example, legal propositions concerning the relevance of law practices to the content of the law) together make the law what it is, for such an account fails to explain what it is in virtue of which the very basic legal-content facts obtain. Descriptive facts about what people said and did (and thought) in the past are among the more basic facts that determine the content of the law. I claim that the content of the law depends not just on descriptive facts, 6
See Dworkin, Ronald, Law’s Empire, Cambridge, Belknap Press, 1986.
214
MARK GREENBERG
but on value facts as well. Given the plausible assumption that fundamental7 value facts are necessary rather than contingent, there is, however, a difficulty about expressing my claim in terms of counterfactual theses or theses about metaphysical determination. Even if the value facts are relevant to the content of the law, it is still true that the content of the law could not be different from what it is without the descriptive facts being different (since it is impossible for the normative facts, being necessary, to be different from what they are). Necessary truths cannot be a non-redundant element of a supervenience base. Hence, both positivists and anti-positivists can agree that descriptive facts alone metaphysically determine the content of the law.8 In order to express the sense in which the content of the law is claimed to depend on value facts, we therefore need to employ to a notion different from, and richer than, metaphysical determination. We can say that the full metaphysical explanation of the content of the law (of why certain legal propositions are true) must appeal to value facts. I earlier put the point metaphorically by saying that if God destroyed the value facts, the law would have no content. The epistemic corollary is that working out what the law is will require reasoning about value. As we will see, a full account of what it is in virtue of which legal-content facts obtain has to do more than describe the more basic facts 7 The point of the qualification “fundamental” is to distinguish basic or pure value facts–that, say, harm is a relevant moral consideration – from applied or mixed value facts–that returning the gun to John tomorrow would be wrong. The fundamental value facts are plausibly metaphysically necessary, while the applied value facts obviously depend on contingent de scriptive facts as well as on funda mental value facts. This qual i fi ca tion does not affect the point in the text since the contingent facts are encompassed in the supervenience base of descriptive facts. That is, if the fundamental value facts supervene on the descriptive facts, the applied value facts will do so as well. 8 The term “metaphysical determination” is typically used in a way that implies nothing about the order of explanation or about relative ontological basicness. In this sense, that the A facts metaphysically determine the B facts does not imply that the B facts obtain in virtue of the obtaining of the A facts. Positivists and anti-positivists can agree not only that descriptive facts alone metaphysically determine the content of the law, but also that the obtaining of the relevant descriptive facts is part of the explanation of the obtaining of legal—content facts. In this paper, we will be concerned only with cases in which the putative determinants are more basic than and part of the explanation of the determined facts. For convenience, I will therefore say that the A facts metaphysically determine the B facts only when the B facts obtain at least in part in virtue of the obtaining of the A facts.
HOW FACTS MAKE LAW
215
that are the metaphysical determinants of legal content. The relevant determination relation is not bare metaphysical determination. (As we have just seen, if that were the relevant relation, there would be no debate between the positivists and the anti-positivists. Positivists would win the debate trivially, since the descriptive facts alone fix the content of the law.) I argue for a particular understanding of the metaphysical relation (between the determinants and the legal content that they determine), which I call rational determination. Rational determination, in contrast with bare metaphysical determination, is necessarily reason-based (in a sense that I elaborate in section II.2). A quick way to grasp the basic idea is to consider the case of aesthetic facts. Descriptive facts metaphysically determine aesthetic facts. A painting is elegant in virtue of facts about the distribution of color over the surface (and the like). But arguably there need not be reasons that explain why the relevant descriptive facts make the painting elegant. We may be able to discover which descriptive facts make paintings elegant (and even the underlying psychological mechanisms), but even if we do, those facts need not provide substantive aesthetic reasons why the painting is elegant (as opposed to causal explanations of our reactions). On this view, it may just be a brute fact that a certain configuration of paint on a surface constitutes or realizes a painting with certain aesthetic properties (as noted below, facts about humor provide an even clearer example). In contrast, if it is not in principle intelligible why the determinants of legal content —the relevant descriptive facts— make the law have certain content, then it does not have that content. Rational determination is an interesting and unusual metaphysical relation because it involves the notion of a reason, which may well be best understood as an epistemic notion. If so, we have an epistemic notion playing a role in a metaphysical relation. (Donald Davidson’s view of the relation between the determinants of mental content and mental content is plausibly another example of this general phenomenon).9 For this reason, I believe that the rational-determination relation is of independent philosophical interest. My main goal in this paper, however, is to show that given the nature of the relevant kind of determination, law practices-understood as descriptive facts about what people have said and done-cannot themselves 9
See notes 18 and 19 below.
216
MARK GREENBERG
determine the content of the law. Value facts are needed to determine the legal relevance of different aspects of law practices. I therefore defend an anti-positivist position, one that is roughly in the neighborhood of Dworkin’s, on the basis of very general philosophical considerations unlike those on which Dworkin himself relies.10 We have two domains of facts, a higher-level legal domain and a lower-level descriptive domain. It is, I claim, a general truth that a domain of descriptive facts can rationally determine facts in a dependent, higher-level domain only in combination with truths about which aspects of the descriptive, lower-level facts are relevant to the higher-level domain and what their relevance is. Without the standards provided by such truths, it is indeterminate which candidate facts in the higher-level domain are most supported by the lower-level facts. There is a further question about the source or nature of the needed truths (about the relevance of the descriptive facts to the higher-level domain). In the legal case, these truths are, I will suggest, truths about value. The basic argument is general enough to apply to any realm in which a body of descriptive facts is supposed to make it the case by rational determination that facts in a certain domain obtain. For example, if the relation between social practices, understood purely descriptively, and social rules is rational determination, the argument implies that social practices cannot themselves determine the content of social rules. (At that point, we reach the further question of the source of the truths needed in the case of social rules; the answer may differ from that in the legal case). Hence, the argument is of interest well beyond the philosophy of law. In this paper, I will largely confine the discussion to the legal case. In section II, clarify the premises of the argument and explain that they should not be controversial. In section III, examine why there is a problem of how legal content is determined. The content of the law is not simply the meanings of the words (and the contents of the mental 10 Dworkin’s theory of law depends on a view about the nature of “creative interpretation”. In particular, he argues that to interpret a work of art or a social practice is to try to display it as the best that it can be of its kind. See Dworkin, Law’s Empire, cit., footnote 6, pp. 49-65. Dworkin’s central argument for the position that legal interpretation is an instance of this general kind of interpretation is that this position is the best explanation of “theoretical disagreement” in law. Ibidem, pp. 45-96; see also Dworkin, “Law as Interpretation,” in The Politics of Interpretation, Mitchell, W. J. T. (ed.), Chicago, University of Chicago Press, 1983.
HOW FACTS MAKE LAW
217
states) that are uttered in the course of law practices. Something must determine which elements of law practices are relevant and how they combine to determine the content of the law. Next, in section IV, argue that law practices themselves cannot determine how they contribute to the content of the law. In section V, consider and respond to three related objections. Finally, in section VI, examine what the argument has established about the relation between law and value.11 II. THE PREMISES In this section, I set out the two premises of the argument and make a number of clarifications. The second premise will require a great deal more discussion than the first. I take both premises to be relatively uncontroversial in many contemporary legal systems, including those of, for example, the United States and the United Kingdom. 1. Premise 1: Determinate Legal Content The first premise of the argument is the following: (D) In the legal system under consideration, there is a substantial body of determinate legal content. My use of the term ‘determinate’ (like my use of ‘determine’) is metaphysical, not epistemic. That is, for the law to be determinate on a given issue is not for us to be able to ascertain what the law requires on that issue (or still less for there to be a consensus), but for there to be a fact of the matter as to what the law requires with respect to the issue. Thus, when I say that there is a substantial body of determinate legal content, I mean roughly that there are many true legal propositions (in the particular legal system). What do I mean by “legal propositions”? 12 A legal proposition is a legal standard or requirement. An example might be the proposition that any person who, by means of deceit, intentionally deprives another person of property worth more than a thousand dollars shall be imprisoned for not more than six months. For a legal proposition 11 There are interesting connections between this paper and G. A. Cohen’s recent “Facts and Principles,” Philosophy and Public Affairs, 31, 2003, pp. 211-245. Cohen’s paper came to my attention too late for me to explore the connections here, however. 12 The term is Dworkin’s. See Dworkin, Law’s Empire, cit., footnote 6, p. 4.
218
MARK GREENBERG
to be true in a particular legal system is for it to be a true statement of the law of that legal system.13 D is consistent with the law’s being indeterminate to some extent, and it is deliberately vague about how much determinacy there is. I think it is obvious that D is true in the legal systems of many contemporary nations. 2. Premise 2: The Role of Law-Determining Practices The second premise is: (L) The law-determining practices in part determine the content of the law. The basic idea behind L is that the law depends on the law practices. L thus rules out, for example, the extreme natural law position that the law is simply whatever morality requires. I take it, however, that very few contemporary legal theorists would defend this position or any other position that makes law practices irrelevant to the content of the law. By the term “aw practices”(or, more fully, “Law—determining practices” I mean to include at least constitutions, statutes, executive orders, judicial and administrative decisions, and regulations. Although it is unidiomatic, I will refer to a particular constitution, statute, judicial decision (etcetera) as a law practice. Hence, a practice, in my usage, need not be a habitual or ongoing pattern of action. I need to clarify what I mean by saying that a practice can be, for example, a statute. Lawyers often talk as if a statute (or other law practice) is simply a text. It is of course permissible to use the word “statute” (or “Constitution”, “judicial decision”, etcetera) to refer to the corresponding text, and I will occasionally write in this way. But if law practices are to be determinants of the content of the law, the relevant practice must be, for example, the fact that a majority of the members of the legislature voted in a certain way with respect to a text (or, alternatively, the event of their having done so), not merely the text itself. So as I will generally use the term, “statute” (“Constitution”, etcetera) is shorthand for a collection of facts (or events),14 not a text. In general, then, law practices consist of ordinary empirical facts about what people thought, said and did in various circumstances.15 For 13 14
I will usually omit the qualification about a particular legal system. I will hereafter ignore the possibility of taking law practices to be composed of events rather than facts. 15 Hypothetical decisions arguably play a significant role in determining the content of the law, but for purposes of this paper they will largely be ignored. Susan Hurley charac-
HOW FACTS MAKE LAW
219
example, law practices potentially include the facts that, in a particular historical context, a legislative committee issued a certain report, various speeches were made in a legislative debate, a bill that would have repealed a statute failed to pass, a concurring judge issued a certain opinion, and an executive official announced a particular view of a statute.16 Once I have clarified the claim that law practices partially determine the content of the law, I will be able to say something more precise about what counts as a law practice. When L says that law practices determine (in part) the content of the law, what sense of “determine” is involved? As noted above, a preliminary point is that L’s claim is constitutive or metaphysical, not epistemic. That is, it is not a claim that we use law practices to ascertain what the content of the law is, but that such practices make it the case that the content of the law is what it is. I maintain that the relevant kind of determination is not bare metaphysical determination, but what we can call rational determination. The A facts rationally determine the B facts just in case the A facts metaphysically determine the B facts and the obtaining of the A facts makes intelligible or rationally explains the B facts’ obtaining. Thus, L is the conjunction of two doctrines, a metaphysical-determination doctrine and a rational-relation doctrine. Let me elaborate. I will make the (uncontroversial, I hope) assumption that there are facts that 1) are ontologically more basic than facts about legal content and 2) metaphysically determine that the content of the law is what it is. The metaphysical-determination doctrine is that these more basic facts that determine the content of the law non-redundantly include law practices. Metaphysical determination can be brute. If the A facts are more basic facts that metaphysically determine the B facts, there is a sense in which terizes hypothetical decisions as hypothetical cases that have a settled resolution. See Hurley, S. L., “Coherence, Hypothetical Cases, and Precedent,” Oxford Journal of Legal Studies, 10, 1990, pp. 221-251. Another possibility is to include any hypothetical case that has a determinate right answer, even if there is disagreement on its resolution. There would be disagreement about which hypothetical cases had determinate right answers and therefore about which were determinants of legal content. 16 Nothing turns on how we individuate practices, at least in the first instance. For example, a legislative committee’s issuance of a report could be considered part of the circumstances in which a majority of the legislature voted for a statute or could be considered a separate practice. Once the roles of different elements of law practices are determined, there may be a basis for individuation.
220
MARK GREENBERG
the A facts explain the B facts. For the A facts are more basic facts, the obtaining of which entails that the B facts obtain. But there need be no explanation of why the obtaining of particular A facts has the consequence that it does for the B facts. To dramatize the point, even a perfectly rational being may not be able to see why it is that particular A facts make particular B facts obtain. The metaphysical-determination doctrine is not enough to capture our ordinary understanding (which L attempts to articulate) of the nature of the determination relation between the law practices and the content of the law. We also need the rational-relation doctrine, which holds that the relation between the determi nants of legal con tent and legal con tent is reason-based. In the relevant sense, a reason is a consideration that makes the relevant explanandum intelligible.17 Here is one way to put the point. There are indefinitely many possible mappings, from complete sets of law practices to legal content (to complete sets of legal propositions). As far as the metaphysical-determination doctrine goes, it could simply be arbitrary which mapping is the legally correct one. In other words, the connection between a difference in the practices and a consequent difference in the content of the law could be brute. For example, it is consistent with the truth of the metaphysical-determination doctrine that, say, the deletion of one seemingly unimportant word in one sub-clause of one minor administrative regulation would result in the elimination of all legal content in the United States – in there being no true legal propositions in the U. S. legal system (though there is no explanation of why it would do so). By contrast, according to the rational-relation doctrine, the correct mapping must be such that there are reasons why law practices have the consequences they do for the content of the law. To put it metaphorically, the relation between the law practices and the content of the law must be transparent.18 (For the relation to be 17 I will not attempt to spell out the relevant notion of a reason more fully here. One possibility is that the best way to do so is in terms of idealized human reasoning ability. For example, the idea might be that practices yield a legal proposition if and only if an ideal reasoner would see that they do. The notion of a reason would thus be an epistemic notion. In that case, L would imply that the metaphysics of law involves an epistemic notion. That is, what the law is would depend in part on what an ideal human reasoner would find intelligible. 18 A useful comparison can be made to certain well—known positions in the philosophy of mind. Donald Davidson’s radical interpretation approach to mental and linguistic content presupposes that behavior determines the contents of mental states and the mean-
HOW FACTS MAKE LAW
221
opaque would be for it to be the case that any change in law practices could have, so far as we could tell, any effect on the content of the law. The effects on the content of the law could be unfathomable and unpredictable, even if fully determinate). It bears emphasis that what must be rationally intelligible is not the content of the law but the relation between determinants of legal content and legal content. Thus, L holds not that the content of the law must be rational or reasonable, but that it must be intelligible that the determinants of legal content make the content of the law what it is. For example, there must be a reason that deleting a particular word from a statutory text would have the impact on the law that it would in fact have. In some cases in which more basic facts metaphysically determine higher-level facts, the more basic facts a priori entail the higher-level facts. Such cases provide a clear example of rational determination, for if the relation between the more basic facts and the higher-level facts is a priori, then a fortiori it is rationally intelligible (the converse may not be true. It may be that the way in which the A facts determine the B facts can be intelligible without its being the case that the B facts are an a priori consequence of the A facts). Before Saul Kripke showed that there are necessary a posteriori truths,19 philosophers assumed that all necessary truths were a priori. If that assumption were correct, the metaphysical-determination doctrine would imply the rational-relation doctrine. Once we grant, however, that there are necessary truths that are not a priori, the rational-relation doctrine is a further premise. (I think it is plausible that law practices a priori entail the content of the law. But for the purposes of my argument, I need only the arguably weaker claim that law practices rationally determine the content of the law). The rational-relation doctrine does not build in any assumption that there must be normative (or evaluative) reasons for the law’s content —that it must be good for the law to have particular content—. This is important because otherwise L would build in the conclusion of my aring of linguistic expressions in a way that must be intelligible or transparent. Davidson, “Radical Interpretation” and “Belief and the Basis of Meaning,” in his Inquiries into Truth and Interpretation, Oxford, Clarendon Press, 1984. Similarly, Saul Kripke’s “Kripkenstein” discussion presupposes that we must be able to “read off” the contents of mental states from the determinants of content. Kripke, Wittgenstein on Rules and Private Language, Oxford, Blackwell, 1982, pp. 24, 29. See note 26 below. 19 Kripke, Saul, Naming and Necessity, Oxford, Blackwell, 1972.
222
MARK GREENBERG
gument. I have used the term “reason” in explaining L, but the reasons in question are considerations that make it intelligible why the law practices have certain consequences for legal content; the rational-relation doctrine leaves it open what kinds of considerations can make a conclusion intelligible. That a priori entailment is an example of the necessary kind of rational relation makes clear that the rational—relation doctrine does not assume that the reasons in question must be normative. Premises can a priori entail a conclusion without providing normative reasons. For example, conceptual truth is capable of providing reasons in the relevant sense. (That John is walking entails that John is moving. This entailment is rationally intelligible in virtue of the conceptual truth that one who is walking is moving). Hence, L is consistent with the possibility that conceptual truths that are not value facts determine which mappings or kinds of mappings from law practices to legal content are acceptable. For example, it might be claimed that it follows from the concept of law that a validly enacted statute makes true those propositions that are the ordinary meanings of the sentences of the statute. On this view, that a statutory text says that any person who drives more than sixty-five miles an hour commits an offense makes it intelligible —in virtue of the concept of law— that the law requires that one not drive more than sixty-five miles an hour. The general point, again, is that it is a matter for argument, not something presupposed by L, what kinds of considerations make it intelligible that one legal proposition is more supported than another by the determinants of legal content. In particular, L does not presuppose that one mapping from law practices to legal content can be better than another only to the extent that it better captures our reasons for action or only to the extent that it is morally better or better in some other dimension of value.20 Why have I made the qualification that law practices partially determine the content of the law? Law practices must determine the content of the law. But, my argument continues, there are many possible ways in which practices could determine the content of the law. (Put another way, there are many functions that map complete sets of law practices to 20 At a later stage of analysis, we might find that there are restrictions on what kind of reasons law practices must provide. For example, it might turn out that legal systems have functions and that in order for a legal system to perform its functions properly, the reasons provided by law practices must provide reasons for action. See the last paragraph of section VI, 1 below. L does not presuppose any such restrictions, however.
HOW FACTS MAKE LAW
223
legal content.) Something other than law practices —X, for short— must help to determine how practices contribute to the content of the law (that is, to determine which mapping is the legally correct one). So a full account of the metaphysics of legal content involves X as well as law practices. This conclusion can be expressed in two equivalent ways. We could say that practices are the only determinants of legal content but that an account of legal content must do more than specify the determinants. This formulation is particularly natural if X consists of necessary truths.21 (A related advantage is that this way of talking highlights that practices are what typically vary, producing changes in the content of the law.) The second formulation would say that X and law practices are together the determinants of the content of the law. Because it is convenient to express the paper’s thesis by saying that X plays a role in determining legal content (and because I want to leave open the possibility that X may vary), this formulation seems preferable, and I will adopt it as my official formulation.Accordingly, I will say that law practices are only some of the determinants of the content of the law. (For brevity, however, I will sometimes omit the qualification ‘partially’ and write simply that law practices determine the content of the law.) 3. Law Practices as Descriptive Facts Let me now return to the question of what counts as a law practice. I have said that law practices consist of ordinary empirical facts about what people have thought, said, and done, including paradigmatically facts about what members of constitutional assemblies, legislatures, courts, and administrative agencies have said and done. I want to be clear about the exclusion of two kinds of facts. First, law practices do not include legal-content facts. Second, law practices do not include facts about value, for example, facts about what morality requires or permits.22 21 22
See text accompanying notes 8 and 9 above. By “facts”, I mean simply true propositions. Thus, facts about value, or value facts, are true normative or evaluative propositions, such as true propositions about what is right or wrong, good or bad, beautiful or ugly. The fact that people value something or believe something is valuable is not a value fact, but a descriptive fact about people’s attitudes. For example, the fact, if it is one, that accepting bribes is wrong, is a value fact;
224
MARK GREENBERG
The law practices thus consist of non-legal-content, descriptive facts. (For convenience, I will generally write simply ‘descriptive facts’ rather than “non-legal-content, descriptive facts”. This shorthand does not reflect a presupposition that legal-content facts are value facts.) Let me explain the reasons for the two exclusions. As I said, I am assuming that the content of the law is not a metaphysically basic aspect of the world but is constituted by more basic facts. The reason for the first exclusion —of legal-content facts— is that law practices are supposed to be the determinants of legal content, not part of the legal content that is to be determined. Suppose an objector maintained that the law practices that determine legal content are themselves laden with legal content. It is certainly natural to use the term “law practices” in this way. After all, the fact that the legislature passed a bill is legal-content laden: it presupposes legal-content facts about what counts as a legislature and a bill. Since legal-content facts are not basic, however, there must be non-legal-content facts that constitute the legal-content-laden practices. At this point, we will have to appeal to descriptive facts about what people thought, said, and did – the facts that I am calling “law practices”. For example, the fact that a legislature did such and such must hold in virtue of complex descriptive facts about people’s behavior, and perhaps also value facts. (If, in order to account for legal-content-laden practices, we have to appeal not merely to descriptive facts, but also to value facts, so much the worse for the positivist thesis that the content of the law depends only on descriptive facts.) The convenience of talking as if law practices consisted in legal-content-laden facts about the behavior of legislatures, courts, and so on should not obscure the fact that there must be more basic facts in virtue of which the legal-content facts obtain. To build legal-content facts into law practices would beg the question at the heart of this paper – the question of the necessary con di tions for law practices to determine the content of the law. (For ease of exposition, I will continue to use legal-content-laden characterizations of the law practices, but the law the fact that people value honesty is a descriptive fact. The paper does not attempt to address a skeptic who maintains that there are no true propositions about value. One could use an argument of the same form as mine to argue that there must be value facts – for without them there would not be determinate legal requirements. But a skeptic about value facts would no doubt take such an argument to be a case of the legal tail wagging the value dog.
HOW FACTS MAKE LAW
225
practices should, strictly speaking, be understood to be the underlying descriptive facts in virtue of which the relevant legal-content facts obtain). It is uncontroversial that certain kinds of facts are among the supervenience base for legal content: roughly speaking, facts about what constitutional assemblies, legislatures, courts, and administrative agencies did in the past. Of course, as just noted, such characterizations are legal-content-laden and are thus shorthand for non-legal-content characterizations of the law practices. (I do not mean, of course, that it is uncontroversial exactly which facts of these kinds are relevant; I’ll return to this point shortly). There are at least two kinds of controversy, however, about the determinants of legal content. First, it is controversial whether value facts are among the determinants of content. The reason for the second exclusion —the exclusion of value facts— is that the paper tries to argue from the uncontroversial claim that law practices are determinants of the content of the law to the conclusion that value facts must play a role in determining the content of the law. If law practices were taken to be value-laden, it would no longer be uncontroversial that they are determinants of legal content. (On the other hand, even those theorists who think that value facts are needed to determine the content of the law can accept that descriptive facts also play a role). Moreover, unless we separate the descriptive facts from the value facts, we cannot evaluate whether the descriptive facts can themselves determine the content of the law. In sum, by understanding law practices to exclude value facts, I ensure that L is uncontroversial, and I prepare the way for my argument that descriptive facts alone cannot determine the content of the law. The second kind of controversy about the determinants of legal content is controversy over precisely which descriptive facts are determinants. I have mentioned some paradigmatic determinants of legal content. But there are other kinds of descriptive facts, for example, facts about customs, about people’s moral beliefs, about political history, and about law practices in other countries that are arguably among the determinants of legal content. Also, somewhat differently, it is controversial which facts about judicial, legislative, or executive behavior are relevant. There can be debate, for example, about the relevance of legislative history, intentions of legislators and of drafters of statutes, legislative findings, judicial obiter dicta, and executive interpretations of statutes. I propose to
226
MARK GREENBERG
deal with this second kind of controversy by leaving our understanding of law practices open and non-restrictive. There are several reasons for this approach. First, my argument is that practices, understood as composed of descriptive facts, cannot themselves determine the content of the law. If I begin with a restrictive understanding of practices, my argument will be open to the reply that I failed to include some of the relevant facts. For this reason, I want to be liberal about which descriptive facts are part of law practices. Second, my argument will not depend on exactly which descriptive facts make up law practices. Rather, I will make a general argument that descriptive facts —in particular, facts about what people have done and said and thought— cannot by themselves determine the content of the law. Therefore, it will not matter precisely which such facts are included in law practices. Third, my view is ultimately that the question of which facts are part of law practices is-like the question of how different aspects of law practices contribute to the content of the law-dependent on value facts. (Indeed, I will often treat the two questions together as different aspects of the general question of the way in which law practices determine the content of the law.) As we will see, that we cannot in an uncontroversial way specify which are law practices and which are not is one consideration in support of my argument for the necessary role of value. All we need to begin with is some rough idea of law practices, which can be over-inclusive. In sum, let law practices include, in addition to constitutions, statutes, and judicial and administrative decisions, any other non-legal-content descriptive facts that turn out to play a role in determining the content of the law.23 Which facts these are and what role they play is controversial, so we can begin with a rough and inclusive understanding of law practices. One aspect of figuring out how law practices contribute to the content of the law will be figuring out which facts make a contribution and which do not. But there is no reason to expect a clean line between law practices and other facts.24 23 This proviso does not make L the tautological claim that the determinants of legal content determine legal content. L says that constitutions, statutes, judicial decisions, and so on are (non—redundantly) among the determinants of content. 24 One natural understanding of “law practices” is more restrictive than the way I use the term. According to this understanding, law practices are limited to (facts about) what legal institutions and officials do in their official capacities. If we used the term “law
HOW FACTS MAKE LAW
227
The exclusion of value facts should not be taken to suggest that law practices are to be understood in solely physical or behavioral terms. To the contrary, as I explain in the next section, I take for granted the mental and linguistic contents involved in law practices. In other words, law practices include the facts about what the actors believe, intend, and so on, and about what their words mean. 4. Why L Should be Uncontroversial The metaphysical-determination doctrine should be relatively uncontroversial, certainly for those who accept that there are determinate legal requirements. Positivists, Dworkinians, and contemporary natural law theorists, as well as practicing lawyers and judges, accept that constitutions, statutes, and judicial and administrative decisions are (non-redundant) determinants of the content of the law. That law practices also may include other descriptive facts to the extent that those facts are determinants of the content of the law obviously cannot make the metaphysical-determination doctrine controversial. More generally, we began with the premise that there are determinate legal requirements. What makes them legal requirements is that they are determined, at least in part, by law practices. Contrast the requirements of morality (or, to take a different kind of example, of a particular club). If law practices did not determine legal content, there could still be moral requirements and officials’ whims, but there would be no legal requirements. In order to think differently, one would have to hold a strange view of the metaphysics of law according to which the content of the law is what it is independently of all the facts of what people said and did that make up law practices, and law practices are at best evidence of that content. So I think it should be uncontroversial that law practices are among the determinants of the content of the law. As to the rational-relation doctrine, it is fundamental to our ordinary understanding of the law and taken for granted by most legal theory, though seldom articulated. The basic idea is that the content of the law is in principle accessible to a rational creature who is aware of the relevant practices” in this natural way, we would need, in addition to the category of law practices, a category of other descriptive facts that play a role in determining the content of the law.
228
MARK GREENBERG
law practices. It is not possible that the truth of a legal proposition could simply be opaque, in the sense that there would be no possibility of seeing its truth to be an intelligible consequence of the law practices. In other words, that the law practices support these legal propositions over all others is always a matter of reasons – where reasons are considerations in principle intelligible to rational creatures. (A corollary is that, to the extent that the law practices do not provide reasons supporting certain legal propositions over others, the law is indeterminate.) I will not attempt to defend the rational-relation doctrine fully here, but will mention a few considerations. Suppose the A facts metaphysically determine the B facts, but the relation between the A facts and the B facts is opaque. In that case, how could we know about the B facts? One possibility is that we have access to the B facts that is independent of our knowledge of the A facts. An example might be the relation between the microphysical facts about someone’s brain and the facts about that person’s conscious experience. Suppose that the microphysical facts metaphysically determine the facts about the person’s conscious experience, but that the relation is opaque. The opaqueness of the relation does not affect the person’s ability to know the facts about his conscious experience because we do not, in general, learn about our conscious experience by working it out from the microphysical facts. (Moreover, since we have independent knowledge of conscious experience, we might be able to discover correlations between microphysical facts and conscious experience, even if those correlations were not intelligible even in principle.) To take a different kind of example, the microphysical facts may metaphysically determine the facts about the weather, and the relation may be opaque, but, again, we do not learn about the weather by working it out from the microphysical facts. A second possibility is that we do work out the B facts from the A facts, but that we have a non-rational, perhaps hard-wired, capacity to do so. For example, it is plausible that the facts about what was said and done (on a particular occasion, say) determine whether what was said and done was funny (and to what degree and in what way). And we do work out whether an incident was funny from the facts about what was done and said. It is plausible, however, that the relation between what was said and done and its funniness is not necessarily transparent to all rational creatures; our ability to know what is funny may depend on species-specific tendencies. That is, there may not be reasons that make the
HOW FACTS MAKE LAW
229
humor facts intelligible; it may just be a brute fact that humans find certain things funny.25 Law seems different from both of these kinds of cases. First, our only access to the content of the law is through law practices. It is not as if we can find out what the law is directly or through some other route. And the whole enterprise of law-making is premised on the assumption that the behavior of legislators, judges, and other law-makers will have understandable and predictable consequences for the content of the law. Second, we are able to work out what the law is and to predict the effect on the law of changes in law practices through reasons, not through some non-rational human tendency to have correct law reactions to law practices. When lawyers, judges, and law professors work out what the law is, they give reasons for their conclusions. Indeed, if we find that we cannot articulate reasons that justify a provisional judgment about what the law is in light of law practices, we reject the judgment. By contrast, it is notoriously difficult to explain why something is or is not funny, and we do not generally hold our judgments about humor responsible to our ability to articulate reasons for them. A related point is that we believe that we could teach any intelligent creature that is sensitive to reasons how to work out what the law is. It might be objected that although the epistemology of law is reason-based, the metaphysics might not be. It is difficult to see how such an objection could be developed. For present purposes, I will simply point out that when legal practitioners give reasons for their conclusions about what the law is they believe that they are not merely citing evidence that is contingently connected to the content of the law; rather, they believe that they are giving the reasons that make the law what it is. The point is not that lawyers believe themselves to be infallible. Rather, they believe that, when they get things right, the reasons that they discover are not merely reasons for believing that the content of the law is a 25 Compare the issue of how facts about our use of words determine their meaning. Natural languages are a biological creation. Although many philosophers have thought differently (see note 19 above), we cannot take for granted that the correct mapping from the use of words to their meaning will be based on reasons. How, it may be objected, would we then be able to work out, from their use of words, what others mean? The answer may simply be that we have a species—specific, hard—wired mechanism that rules out many incorrect mappings that are not ruled out by reasons. In that case, an intelligent creature without that mechanism would not be able to work out what words mean.
230
MARK GREENBERG
particular way, but the reasons that make the content of the law what it is. Although they would never put it this way, lawyers take for granted that the epistemology of law tracks its metaphysics. And the epistemology of law is plainly reason-based. Legal theorists generally take for granted some version of the claim that the relation between law practices and the content of the law is reason-based. An example is H. L. A. Hart’s argument that the vagueness and open texture of legal language have the consequence that the law is indeterminate.26 If bare metaphysical determination were all that was at issue —if it were not the case that the relation between practice and content were necessarily intelligible— the vagueness of language would in no way support the claim that law was indeterminate. Similarly, when legal realists or Critical Legal Studies theorists argue that the existence of conflicting pronouncements or doctrines in law practices results in underdetermination of the law, their arguments would be beside the point if what was at stake were not rational determination.27 In general, the large body of legal theory that has explored the question of whether law practices are capable of rendering the law determinate (and, if so, how determinate) presupposes that law practices determine the content of the law in a reason-based way. If the relation between law practices and the content of the law could be opaque, any set of law practices would be capable, as far as we would be able to judge, of determining any set of legal propositions. (As long as there are as many possible sets of law practices as there are possible sets of legal propositions, there is no barrier to the content of the law’s being fixed by the practices, and we would have no warrant to rely on our assessment of other putative prerequisites for practices to determine the content of the law.) In sum, the doctrine that law practices rationally determine the content of the law captures a basic conviction about the law that is shared by law-makers, lawyers, and legal theorists and supported by the epistemology of law. Why does it matter to my argument that the relation between law practices and the content of the law is reason-based? The paper explores 26 27
Hart, The Concept of Law, cit., footnote 5, ch. 7. See, e. g., Andrew Altman, “Legal Realism, Critical Legal Studies, and Dworkin,” Philosophy and Public Affairs, 15, 1986, pp. 205-235; Mark Kelman, “Interpretive Construction in the Substantive Criminal Law,” Stanford Law Review, 33, 1981, pp. 591-673.
HOW FACTS MAKE LAW
231
the necessary conditions for law practices’ making the content of the law what it is. The central argument is that descriptive facts cannot determine their own rational significance – what reasons they provide. The argument therefore bdepends on the claim that the descriptive facts determine the content of the law in a reason—based way. It turns out that value facts are needed to make it intelligible that law practices support certain legal propositions over others.28 5. The Scope of the Argument Premises D and L tell us something about the scope of my argument. The argument is sound only for legal systems in which D and L are true. So my conclusions are limited to legal systems in which there are legal requirements that are determined in part by law practices. If there is a legal system in which there are no determinate legal requirements, my argument would not apply to it. Similarly, if there is a legal system in which law practices, understood as (facts about) various people’s sayings and doings, do not play a role in determining the content of the law, my argument would not apply to it. For example, perhaps there could be a legal system in which the content of the law is determined exclusively by the content of morality or exclusively by divine will. In this paper, I do not address questions of the necessary conditions for something’s counting as a legal system. It might be argued that a substantial body of legal requirements that are determined by practices of various officials or institutions is a necessary condition for the existence of a legal system, but I do not intend to pursue such an argument. III. IS THERE A DISTINCTIVELY LEGAL PROBLEM OF CONTENT? We begin with our two premises: that the law has determinate content and that law practices in part determine that content. Our question is: What conditions must be satisfied in order for law practices to determine legal propositions? 28 Suppose that the relation between law practices and the content of the law were necessarily intelligible only in a way that depends on some human—specific tendency. As long as practices must provide considerations that are intelligible (even if only to humans), a version of my argument should still go through.
232
MARK GREENBERG
As I said above, since we are interested in problems of the determination of content only to the extent that they are peculiarly legal, we can take for granted the content of sentences and propositional attitudes.29 So the question is: How a collection of facts about what various people did and said (including the facts about what they intended, believed, preferred, and hoped, and about what their words meant) determine which legal propositions are true? At this point, however, it must be asked whether there is a peculiarly legal problem of content. Once we take for granted the relevant mental and linguistic content, it may seem that no problem of legal content remains. Legal content is simply the content of the appropriate mental states and texts. In this section, I consider this possibility and argue that it is not at all plausible. The ordinary mental and linguistic content of utterances and mental states of participants in law practices —non-legal content, for short— does not automatically endow the law with legal content. Something must determine which aspects of law practices are relevant and how they together contribute to the content of the law. In the next section, I consider the possibility that, given the content of the relevant utterances and attitudes, law practices themselves determine how they contribute to the content of the law and thus can unilaterally determine the content of the law. But before we turn to whether law practices can solve the problem of legal content, we need to see what the problem is – why the non-legal content of law practices does not provide the content of the law. That is the topic of this section. In legal discourse, both ordinary and academic, constitutional or statutory provisions and judicial decisions are often conflated with rules or legal propositions. For example, lawyers will sometimes talk interchangeably of a statutory provision and a statutory rule, or of a judicial decision and the rule of that case. In non-philosophical contexts, there is generally no harm in this kind of talk. Since our question, however, is how law practices determine the content of the law, it is crucial not to confuse law practices with legal propositions. For example, if one assumed that a statute was the rule or proposition expressed by the words 29 There is no practical problem with taking these matters for granted and proceeding without a solution to basic problems concerning how linguistic and mental content are possible. These problems do not concern difficulties we encounter in practice in attributing linguistic and mental content; the difficulty is in saying what it is in virtue of which a linguistic expression or mental state has its content.
HOW FACTS MAKE LAW
233
of the statute, one might think that there was no problem of how law practices could determine legal content, or one might think that the only problem was how to combine or amalgamate a large number of rules or propositions. Although it would beg the question to take legal propositions for granted, we do have the propositions that are the content of the utterances and mental states of participants in law practices. What is wrong with the idea that those propositions constitute legal content, so that law practices, once they are understood to include facts about mental and linguistic content, automatically have legal content? I will begin with the least serious problems -those concerning the attribution of non-legal content. Although we are normally able to attribute attitudes to people based on what they say and do and to attribute standard meanings to a large number of sentences of a language we speak, there are difficulties in attributing non-legal content to aspects of a putative law practice. Here are a few examples. First, when I say that we can take for granted mental and linguistic content, I mean that we need not ignore the mental and linguistic content that is available. We should not, however, assume that all of the contents of the mental states of all of the people involved in law practices are available. That would obviously be false. In general, what is available in the standard reports of law practices is not sufficient to attribute much in the way of attitudes to the people who actually performed the actions and made the utterances; the fact that a particular legislator voted for a bill or a certain judge signed an opinion is not in general sufficient to attribute beliefs, intentions, hopes, and so on to her. Moreover, the law restricts what evidence of the intentions and beliefs of legislators and judges is acceptable to determine the content of the law. Even when the intentions of a legislator or judge are relevant to the content of the law, it is not the case that, say, her private letters or diary may be a source of that intention. Something must determine which evidence of legally relevant attitudes is legally acceptable. Second, though many sentences of natural languages have standard meanings, it is notorious that this is not true of some of the sentences uttered by those engaged in making law practices. The point here is not that, in legal contexts, linguistic expressions often have specialized meanings that are not straightforwardly connected to their ordinary meanings.
234
MARK GREENBERG
Rather, some of the contorted sentences in the law books have no standard meaning in a natural language. Third, even when sentences taken alone have standard meanings, collections of those sentences may fail to do so. In other words, the property of having a standard meaning (on a notion of standard meaning appropriate for present purposes) is not closed under conjunction (for example, because context may introduce ambiguity into an otherwise unambiguous sentence). Setting aside these problems with ascertaining non-legal content, we can turn to the more important question of the bearing of non-legal content on legal content. One problem is that the non—legal content of some elements of law practices has, or arguably has, little or nothing to do with the legal content determined by those practices. Consider sentences in statutory preambles, sentences in presidential speeches at bill-signing ceremonies, and sentences in judicial opinions that are not necessary to the resolution of the issue before the court. Another example is the actual, but unexpressed, hopes of the members of the legislature as to how the courts would interpret a statute. Countless sentences are written and spoken at different stages of law practice-making by people with myriad attitudes.30 Something must determine which sentences’ and attitudes’ contents are relevant. Another problem is that the contribution of a particular law practice to the content of the law may not be the meaning of any text or the content of any person’s mental state. The actual attitudes of appellate judges may be irrelevant; instead the relevant question may be what a hypothetical reasonable person would have intended by the words uttered by the judges or what would be the best, or the narrowest, explanation of the result reached. Another possibility is that aspects of law practices that contribute to non-legal content in one way contribute to legal content in an entirely different way; facts about what was said and done may have peculiarly legal significance. An obvious example is that common words such as “malice” and “fault”are often used in legal dis30 In the case of a judicial decision, for example, the possibly relevant sentences include sentences uttered by the parties to the controversy, by lawyers, and by judges to lawyers and other judges. They include sentences written by judges in orders and judicial opinions. Judicial opinions alone include a large number and variety of sentences: they state facts, give reasons, summarize, make general claims about the content of the law, state holdings; moreover, there are concurring and dissenting as well as majority opinions.
HOW FACTS MAKE LAW
235
course in a technical sense. To take a more subtle instance, when a panel of several judges is badly split, it can be a complex and tricky matter to ascertain the relevance to legal content of the meanings of the words of the different judicial opinions. Similarly, facts about the circumstances in which sayings and doings occurred that have little to do with the non-legal content of the people’s attitudes and words may significantly affect the content of the law. For example, in a judicial decision, the fact that an issue is not in controversy arguably prevents the court’s statements on that issue from making any contribution to the content of the law. Even when the content of sentences and mental states is relevant to the content of the law, there can be no mechanical derivation of the content of the law. For example, how are conflicting contents to be combined? In general, there remains the problem of how the non-legal contents associated with different law practices interact with each other (and with other relevant aspects of law practices) to determine the content of the law. We have surveyed a number of reasons why non-legal content —e meanings of sentences and contents of mental states— does not simply constitute legal content. But this way of thinking about the problem will have an artificial quality for those familiar with legal reasoning. The idea that the non-legal content of law practices constitutes their legal content presupposes roughly the following picture. Associated with each law practice is a text (and perhaps some mental states). Once we have the meanings of the texts and the contents of the mental states, each law practice will be associated with a proposition or set of propositions. Ascertaining the law on a particular issue is just a matter of looking up the propositions that are applicable to the issue. Even if this picture were accurate, we have discussed a number of reasons why non-legal content would not automatically yield legal content. But the problem is worse than these reasons would suggest. As I will now suggest, the whole picture is wrong-headed. Law practices do not determine the content of the law by contributing propositions, which then get amalgamated. Here is the real problem of legal content. There are many different law practices with many different aspects or elements. There is an initial question of which facts are parts of law practices and which are not. Are preambles of bills, legislative findings, legislative committee reports, dissenting opinions, unpublished judicial decisions, customs, the Federalist Papers, and so on to be included in law practices?
236
MARK GREENBERG
In my view, this question is really just part of a second question: which aspects of, for example, judicial or legislative practices are relevant to the content of the law? Just to suggest the dimensions of the problem, here are some candidates for the relevant elements or aspects of practices. With respect to a judicial decision: the facts of the case, the judgment rendered, the words used by the court in the majority opinion, the reasons given for the outcome, the judges’ beliefs, the judges’ identities, the level and jurisdiction of the court; with respect to a legislative action: the words of the statute, the legislature’s actual intention (if there is such a thing), the purposes that the words of the statute could reasonably be intended to implement, statements by the person who drafted the statute, speeches made during the legislative debate preceding passage, the circumstances in which the legislature acted, subsequent decisions not to repeal the statute. Third, once we know which elements of practices are relevant, the problem of determining the content of the law is not simply a problem of adding or amalgamating the various relevant aspects of practices. One obvious point is that some elements of practices are far more important than others, and elements of practices matter in different ways. But, more fundamentally, as anyone familiar with legal reasoning knows, the content of the law is not determined by any kind of summing procedure, however complicated. For example, judicial decisions, constitutional provisions, and legislative history can affect what contribution a statute makes. It is not that those practices contribute propositions that are conjoined to a proposition contributed by the statute. The statute’s correct interpretation may be determined by a potential conflict with a constitutional provision or by the outcome of cases in which courts have interpreted the same or related statutes. To take a different kind of example, constitutional provisions, statutes, and judicial decisions can have an impact on the contribution of judicial and administrative decisions to the content of the law by affecting our understanding of the proper role of courts and administrative agencies. Or, differently, statutes can have an impact on what judicial decisions mean by making clear what the legislature cares about, thus affecting which differences between cases matter and consequently whether past precedents control the present issue. A final example is that the principle that a series of cases stands for is not the conjunction of the propositions announced in each case.
HOW FACTS MAKE LAW
237
It is safe to conclude that the law does not automatically acquire content when actions, utterances, and sentences involved in law practices are attributed content. It is a mistake even to think that the issue is how to convert non-legal content into legal content. We need to reject the simplistic picture on which each law practice contributes to the content of the law a discrete proposition (or set of propositions), which is the result of converting the non-legal content of sentences and mental states into legal content. The bearing of non—legal content on the content of the law is not mechanical. Once we root out any idea of a mechanical conversion of non—legal content to legal content, it is clear that something must determine which aspects of law practices are relevant to the content of the law and what role those relevant aspects play in contributing to the content of the law. IV. CAN LAW PRACTICES THEMSELVES DETERMINE HOW THEY CONTRIBUTE TO THE CONTENT OF THE LAW? In this section, I consider the possibility that law practices can themselves determine how they contribute to the content of the law. I will argue that, without standards independent of practices, practices cannot themselves adjudicate between ways in which practices could contribute to the content of the law. For convenience, let me introduce a term for a candidate way in which practices could contribute to the content of the law. I will call such a way a model (short for a model of the role of law—determining practices in contributing to the content of the law).31 The rational—relation doctrine tells us that there are systematic, intelligible connections between practices and the content of the law. It thus guarantees that there are rules that, given any pattern of law practices, yield a total set of legal propositions. A model is such a rule or set of rules. A model is the counterpart at the metaphysical level of a method of interpretation at the epistemic level. (A model’s being correct in a given legal system is what makes the corresponding theory of interpretation true). Although the term is not ideal, I use “model” rather than ‘method of interpretation’ to signal that my concern is constitutive or metaphysical, not epistemic; that is, the issue is how practices make it the case that the 31
My thanks to Nicos Stavropoulos for suggesting this term.
238
MARK GREENBERG
law’s content is what it is, not how we can ascertain the law’s content from law practices. Because it is more idiomatic, however, I will sometimes write in epistemic terms when discussing models. (By way of analogy, it may be helpful to compare, on the one hand, the relation between practices and the content of the law with, on the other, the relation between words and the meaning of a sentence (or group of sentences). The meaning of a sentence depends in a systematic, intelligible way on the arrangement of constituent words; analogously, the content of the law —in a given legal system at a given time— depends on the pattern of law practices. A specification of the meanings of individual words and of the compositional rules of the language is a specification of the rules by which the words determine the meaning of the sentence. Analogously, a specification of a model is a specification of the rules by which law practices determine the content of the law. In this sense, a model is the analogue of the meanings of individual words and the compositional rules for the language). I will use the term ‘model’ sometimes for a partial model – a rule for the relevance of some aspect of law practices, e. g., of legislative findings or of dissenting judicial opinions, to the content of the law —and sometimes for a complete model— all of the rules by which law practices determine the content of the law. The context should make clear whether partial or complete models are in question. The legally correct (or, for short, correct) model in a particular legal system at a particular time is the way in which practices in that legal system at that time actually contribute to the content of the law (not merely the way in which they are thought to do so). Which model is correct varies from legal system to legal system and from time to time within a legal system since, as we will see, which model is correct depends in part on law practices. Models come at different levels of generality. More specific ones include the metaphysical counterparts of theories of constitutional, statutory, and common-law interpretation. Models also can be understood to include very general putative ways in which law practices determine what the law requires. Thus, Hart’s rule-of-recognition-based theory of law and Dworkin’s “law as integrity” theory are accounts of very general models. Very general models give rise to more localized models of the contributions made by specific elements of practices.
HOW FACTS MAKE LAW
239
Candidate models are candidate ways in which practices contribute to the content of the law. Since the issue of how practices contribute to the content of the law has several components, models have several, closely related roles: they determine what counts as a law practice; which aspects of law practices are relevant to the content of the law; and how different relevant aspects combine to determine the content of the law, including how conflicts between relevant aspects are resolved. The question of what determines how practices contribute to the content of the law can thus be reformulated as the question of what determines which models are correct. What settles, for example, the question whether the original—intent theory of constitutional interpretation is true? We can now turn to the main topic of this section: whether law practices can themselves determine which model is correct. Certainly, the content of the law, as determined by law practices, concerns, in addition to more familiar subjects of legal regulation, what models are correct. That is, the content of the law includes rules for the bearing of law practices on the content of the law. For example, it is part of the law of the United States that the Constitution is the supreme law, that bills that have a bare majority of both houses of Congress do not contribute to the content of the law unless the President signs them, and that precedents of higher courts are binding on lower courts in the same jurisdiction. The content of the law cannot itself determine which model is correct, however, for the content of the law depends on which model is correct. If, for example, statutes contributed to the law only the plain meaning of their words, the content of the law would be different from what it would be if the legislators’ intentions made a difference. Obviously, which legal propositions are true depends on which model is correct. But, as we have just seen, which model is correct depends in part on the legal propositions. The content of the law and the correct model are thus interdependent. This interdependence threatens to bring indeterminacy. Consider the law practices of a particular legal system at a particular time and ask what the content of the law is. Suppose that if candidate model A were legally correct, a certain set of legal propositions would be true, according to which model A would be correct. And if candidate model B were correct, a different set of legal propositions would be true, according to which model B would be correct. And so on. Without some other stan-
240
MARK GREENBERG
dard, each mutually supporting pair of model and set of legal propositions is no more favored than any other pair.32 Can law practices determine which model is correct? The prima facie problem is that we cannot appeal to practices to determine which model is correct because which model a set of practices supports itself depends on which model is correct. But let us consider the matter in more depth. If practices are to determine which model is correct, there are two possibilities. First, a privileged foundational practice (or set of foundational practices) could determine the role of other practices. This possibility encounters the problem of how practices themselves can determine which practices are foundational. For example, the fact that a judicial opinion states that only the rationale necessary to the decision of a case is contributed to the content of the law cannot determine that that is a correct account of the contribution of judicial decisions to the content of the law. Something must determine that the judicial opinion in question is relevant and trumps other conflicting practices. A putatively foundational practice cannot non-question-beggingly provide the reason that it is foundational. Moreover, it is unwarranted to assume that the significance of a putatively foundational practice is simply its non-legal content. Its significance depends on which model is correct – the very issue the practice is supposed to resolve. In sum, a foundationalist solution is hopeless because it requires some independent factor that determines which practices are foundational (and what their contribution is). 32 This footnote registers a rather technical qualification, and can be skipped without losing the main thread of the argument. A candidate model, given the law practices, may yield a set of legal propositions that lends support to a different, inconsistent model. To the extent that this is the case, we can say that the model is not in equilibrium (relative to the law practices). Models that are in equilibrium (or are closer to it) are plausibly favored, others things being equal, over those that are not (or are further from it). There is no reason to expect, however, that there will be typically be only one model that is closer to equilibrium than any other model. In fact, indefinitely many models are guaranteed to be in perfect equilibrium (yet yield different sets of legal propositions). For example, any model that includes a rule that practices (and thus the true legal propositions) have no bearing on which model is correct is necessarily in perfect equilibrium. Without some independent standard for what models are eligible, there is no way to rule out such models. Thus, the varying degree to which different candidate models are in equilibrium does not ensure a unique correct model and determinate legal content. See also the discussion of a coherentist solution in the text below.
HOW FACTS MAKE LAW
241
Second, if no practices can be assumed to have a privileged status, the remaining possibility is that all law practices together can somehow determine their own role. Such a coherentist solution might at first seem to have more going for it than the foundationalist one. The idea would be, roughly speaking, that the (total) law practices support the model that, when applied to the practices, yields the result that the practices support that very model. If no model is perfectly supported in this way, the one that comes closest is the correct one. The problem with this suggestion, crudely put, is that without substantive standards that determine the relevance of different aspects of law practices, the (total) law practices will support too many models. For any legal proposition, there will always be a model supported by the practices that yields that proposition. Or to put it another way, the formal requirement that a model be supported by or cohere with, law practices is empty without substantive standards that determine what counts as a relevant difference. Suppose a body of judicial decisions seems to support the proposition that a court is to give deference to an administrative agency’s interpretation of a statute. It is consistent with those decisions for an agency’s interpretation of a statute not to deserve deference when there is a reason for the different treatment. Such a reason could be, for example, that the agency in the earlier cases, but not in the present case, had special responsibility for administration of the relevant statutory scheme. But, since the facts of every case are different, if a model can count any difference as relevant, there will always be a model that is consistent with all past practices yet denies deference to agency interpretations of statutes. As I have argued more fully elsewhere, such considerations show that practices cannot determine legal content without standards, independent of the practices, that determine which differences are relevant and irrelevant.33Hence law practices alone cannot yield determinate legal requirements. The point is a specific application of a familiar, more general point that Susan Hurley has developed.34 Formal requirements 33 See Greenberg, Mark and Litman, Harry, “The Meaning of Original Meaning”, Georgetown Law Journal, 86, 1988, pp. 614-617. 34 See Hurley, S. L., Natural Reasons, New York, Oxford University Press, 1989, pp. 26, 84-88. Hurley credits Ramsey’s and Davidson’s uses of arguments with similar import. See, e. g., Davidson, Donald, “The Structure and Content of Truth”, Journal of Philosophy, 87, 1990, pp. 317-320.
242
MARK GREENBERG
such as consistency are meaningful only in the light of substantive standards that limit which factors can provide reasons. It would miss the point to suggest that law practices themselves can determine the appropriate standards. Without such standards, a requirement of adherence to practices is empty. In epistemic terms, we cannot derive the standards from the practices because the standards are a prerequisite for interpreting the practices. It may be helpful to notice that the problem has a structure similar to that of two famous philosophical puzzles, Nelson Goodman’s problem about green and grue and Saul Kripke’s problem about plus and quus.35 In order for there to be legal requirements, it must be possible for someone to make a mistake in attributing a legal requirement (if just any attribution of a legal requirement is correct, the law requires that P and that not P and so does not require anything). One makes a mistake when one attributes a legal requirement that is not the one the law practices yield when interpreted in accordance with the correct model. For any candidate legal requirement, however, there is always a non-standard or “bent” model that yields that requirement. It is therefore open to an interpreter charged with a mistake to claim that, in attributing the legal requirement in question, she has not made a mistake in applying one model but is applying a different model. The proponent of the coherence solution will respond that law practices themselves sup port cer tain mod els. For ex ample, in ap pealing to practices to decide cases, courts have developed well-established ways of understanding the relevance of those practices to legal content. The problem is that there will always be bent models according to which the judicial decisions (and other practices) support the bent models rather than the purportedly well-established ones. This kind of point shows that there must be factors, not themselves derived from the practices, that favor some models over others.
35 See Goodman, Nelson, Fact, Fiction, and Forecast, 3d. ed., Indianapolis, Bobbs-Merrill, 1973, pp. 72-81; Kripke, Saul, Wittgenstein on Rules and Private Language, Oxford, Blackwell, 1982, pp. 7-32. These puzzles involve concepts that seem bizarre and gerrymandered. One challenge is to determine what it is that rules such concepts out (at least in particular contexts), for, if they are not ruled out, unacceptable results follow.
HOW FACTS MAKE LAW
243
Here is an example.36 Suppose that on february 1, 2005, a judge in a state court in the United States must decide whether a woman has a federal constitutional right not to be prevented from obtaining an abortion. Imagine that the judge holds that the woman does not have such a right. It seems that the judge has misread Roe vs. Wade,37 the seminal decision of the United States Supreme Court. The judge claims, however, that according to the correct model of how judicial decisions contribute to legal content, when constitutional rights of individuals are at stake and strong considerations of justice support the claims of both sides, such decisions should be understood as establishing a form of “checkerboard” solution. According to such a solution, whether a person has the right in question depends on whether the person is born on an odd or even-numbered day.38 Since Jane Roe was born on an odd-numbered day (let us assume), Roe vs. Wade’s contribution to content is that only women born on odd days have a constitutional right to an abortion. Before discussing the example, it must be emphasized that the point is not that the judge’s position should be taken seriously; on the contrary, the example depends on the fact that the judge’s position is plainly a nonstarter. Since it is evident that the position cannot be taken seriously, there must be factors that rule out models like the one in the example. The example makes the point that these factors must be independent of practices. Since the unacceptable positions that we want to exclude purport to determine what practices mean, the factors that exclude these positions cannot be based on practices. Moreover, there is no way to rule out such positions on a purely logical level, since, as will become evident, it is easy to construct self-supporting, logically consistent systems of such positions. The claim is, then, that our unwillingness to take the judge’s position seriously suggests that we must be depending on tacit assumptions independent of law practices in determining which models are acceptable. Let us look at the example to see why practices themselves cannot exclude the judge’s model. The first objection to the judge’s position may be that the Supreme Court in Roe vs. Wade said nothing about the abortion right’s depending 36 The example borrows from Dworkin’s discussion of a “checkerboard” solution to the abortion controversy. See Dworkin, Law’s Empire, pp. 178-186. Dworkin cannot be held responsible, however, for my example. 37 Roe vs. Wade, 410 U.S. 113, 1973. 38 See Dworkin, Law’s Empire, cit., footnote 6, pp. 178 and 179.
244
MARK GREENBERG
on birthdates. The judge replies that on the correct model, the reasons that judges give in their opinions make no or little contribution to the content of the law. A second objection may move to a different level: the practices of the legal system do not support the judge’s model. Judicial decisions, for example, do not interpret the contributions made by other decisions in such a checkerboard fashion, nor do they ignore the reasons judges give. The judge, however, claims that according to his model, judicial decisions have all along been using a bent model, according to which the reasons judges give are significant until February 1, 2005, but not afterwards. Similarly, the model specifies no checkerboard contributions to content until that date, then requires them afterwards. All of the judicial decisions so far are logically consistent with the hypothesis that they are using the bent model. Obviously, a third-level objection —that the practices do not support models that give dates this sort of significance— can be met with the same sort of response. In another version of the example, the judge might claim that, according to the correct model, in all cases involving the right to abortion, a Supreme Court decision’s relevance to content ends, without further action by the Court, as soon as a majority of the current Supreme Court believes that the decision was wrongly decided. Since the judge believes that that is now the situation with regard to Roe v. Wade, he claims that Roe vs. Wade no longer has any bearing on the content of the law. If it is objected that the judge’s position is not an accurate account of how judicial decisions interpret past judicial decisions, the judge will claim that judicial decisions have been following his model all along. Since (let us suppose) it has never been the case before that a majority of the Supreme Court has disagreed with a past Supreme Court decision on the right to abortion, the evidence of past decisions supports the judge’s model, which treats only abortion rights cases idiosyncratically, as strongly as a more conventional one. The point should be obvious by now: these sorts of unacceptable models are unacceptable because there are standards independent of practices that determine that some sorts of factors are irrelevant to the contributions made by practices to legal content. The practices themselves cannot be the source of the standards for which models are permissible. In this section, I have argued that practices themselves cannot determine how practices contribute to the content of the law. Although I will
HOW FACTS MAKE LAW
245
not discuss the point here, it is worth noting that my argument is not limited to the law. For example, the argument shows that, without standards independent of the practices, no set of practices can rationally determine rules. What rules a set of practices rationally determines will depend on what aspects of the practices are relevant and how those aspects are relevant. And the practices cannot themselves resolve those issues. Similarly, my argument does not depend on the complexities of contemporary legal systems. My point holds even for extremely simple cases. Even if there were only one law-maker who uttered only simple sentences, and even if it were taken for granted that the law-maker’s practices were legally relevant, the precise relevance of those practices would still depend on factors independent of the practices. For example, there would still be an issue of whether the relevant aspect of the practices was the meaning of the words uttered, as opposed to, say, the law-maker’s intentions or the narrowest rationale necessary to justify the outcome of the law-maker’s decisions. V. OBJECTIONS I want now to consider three closely related objections. First, it may be objected that in practice there is often no difficulty in knowing which aspects of a practice are relevant or which facts provide reasons. Bent models are not serious candidates. Second, it may be objected that practitioners’ beliefs (or other attitudes) about value questions, not value facts, solve the problem of determining how practices contribute to the content of the law. Third, it may be said that, in limiting law practices to descriptive facts, I have relied on too thin a conception of law practices. Properly understood, law practices can themselves determine the content of the law. I replied to a version of the first objection in discussing the example of the abortion-rights decision, but I will make the point in more general terms here. As I have emphasized, the question of the necessary conditions for law practices to determine the content of the law is a metaphysical, not an epistemic, question. The problems that I have raised concerning how law practices determine the content of the law are not practical problems that legal interpreters encounter in trying to discover what the law requires.Hence it is no objection to my argument that legal interpreters do not encounter such problems.
246
MARK GREENBERG
I have argued that there is a gap between law practices and the content of the law that can be bridged only by substantive factors independent of practices. If legal practitioners have no difficulty in crossing this gap —for example, in eliminating bent models from consideration— that must be because they take the necessary factors for granted. With respect to the example of the abortion-rights decision, I argued that practices themselves cannot rule out the judge’s bent models. Therefore, our unwillingness to take the judge’s position seriously is evidence that we are relying on tacit assumptions about what models are acceptable. The lack of difficulty in practice suggests not that substantive constraints are not needed, but that they are assumed. This point leads naturally to the second objection, which holds that it is the assumptions or beliefs of participants in the practice that solve the problem of how practices determine the content of the law. For example, it might be that a consensus or shared understanding among judges or legal officials determines the relevance of practices to the content of the law. Beliefs about value, not value facts, do the necessary work. As an epistemic matter, of course, we rely on our beliefs about value to ascertain what the law is. But that is exactly what we would expect if the content of the law depended on value facts. After all, in working out the truth in any domain, we must depend on our beliefs. That we do so in a given domain in no way suggests that the truth in that domain depends on our beliefs. Notice, moreover, that if the content of the law depended on beliefs about value, then, in order to work out what the law was, we would have to rely on our beliefs about our beliefs about value. For example, we might ask not whether democratic values favor intentionalist theories of statutory interpretation, but whether there is a consensus among judges that democratic values do so. The most important point is that facts about what participants believe (understand, intend, and so on) could not do the necessary work because such facts are just more descriptive facts in the same position as the rest of the law practices. As with the facts about the behavior of law-makers, we can ask whether facts about participants’ beliefs are relevant to the content of the law, and, if so, in what way. Since the content of the law is rationally determined, the answers to these questions must be provided by reasons. As I have argued, the law practices, including facts about participants’ beliefs, cannot determine their own relevance.
HOW FACTS MAKE LAW
247
More generally, the same kind of argument explains why the questions of value on which the content of the law depends must be resolved by substantive standards rather than by value-neutral procedures. In general, there are procedural ways to resolve value questions – flipping a coin and voting are examples. Such procedures are in the same position as other law practices, however. There have to be reasons that determine that a given procedure is the relevant one and what the significance of the procedure is to the content of the law. The third objection claims that the additional substantive factors are part of law practices themselves. I have already addressed the suggestion that the law practices, conceived as facts about behavior and mental states, determine their own relevance. The present objection is that my conception is too narrow. It somehow fails to do justice to law practices to take them to consist of ordinary empirical facts about what people have done, said, and thought. If the objection is to be more than hand-waving, the objector needs to say what practices consist of beyond such facts, and how the enriching factor solves the problem. For example, it would of course be no objection to my argument to claim that the descriptive facts need to be enriched with value facts. Another unpromising possibility, addressed in section II, 3 above, is for the objector to maintain that law practices are legal-content laden. According to this version of the objection, facts about what counts as a legislature, who has authority to make law, what counts as validly enacted, what impact a statute has on the content of the law – in general, legal-content facts concerning the relevance of law practices to legal content are somehow part of the law practices. As argued, however, unless legal content is to be metaphysically basic, there must be an account of what determines legal content that does not presuppose it. It simply begs the question to take law practices to include legal-content facts. The objector challenges my conception of the law practices on the ground that it is too restrictive. Here is one line of thought in support of my conception. We normally assume that law practices can be looked up in the law books. But all that can be found in the law books, other than legal-content facts, are facts about what various people —legislators, judges, administrative officials, and so on— did and said and thought. If there is something else to law practices, how do we know about it? To put the point another way, if I tell you all the facts about what the relevant people said and did, believed and intended, you can work out what
248
MARK GREENBERG
the law is without knowing any more about the law practices. Thus, if there is an aspect of law practices other than these facts, it does not seem to play a role in determining the content of the law. (It is true that you may have to be skilled at legal reasoning to work out the content of the law, and that skill may in clude an understand ing of the signifi cance of the practices to legal content. But I have already addressed the suggestion that it is participants’ understandings, rather than the substantive factors that are the subject of those understandings, that do the necessary work). VI. THE NEED FOR SUBSTANTIVE FACTORS, INDEPENDENT OF LAW PRACTICES I have argued that law practices cannot themselves determine the content of the law because they cannot unilaterally determine their own contribution to the content of the law. There must be factors, independent of practices, that favor some models over others. In this section, I sketch where this argument leaves us. In particular, I explain the sense in which the argument requires facts about value, and the nature of the claimed connection between law and value. 1. Value Facts? In order for practices to yield determinate legal requirements, it has to be the case that there are truths about which models are better than others independently of how much the models are supported by law practices. Since practices must rationally determine the content of the law, truths about which models are better than others cannot simply be brute; there have to be reasons that favor some models over others. We have seen that law practices cannot determine their own contribution to the content of the law. By contrast, value facts are well suited to determine the relevance of law practices, for value facts include facts about the relevance of descriptive facts. For example, that democracy supports an intentionalist model of statutes is, if true, a value fact. What about the relevance of the value facts themselves? At least in the case of the all-things-considered truth about the relevant values, its relevance is intelligible without further reasons. If the all-things-considered truth
HOW FACTS MAKE LAW
249
about the relevant considerations supports a certain model of the law practices, there can be no serious question of whether that truth is itself relevant, or in what way. The significance for the law of the fact that a certain model is all-things-considered better than others is simply the fact that that model is better than others. It might be suggested that an appeal to conceptual truth offers a way to avoid the conclusion that the content of the law depends on value facts. The idea would be that the concept of law (or some other legal concept), rather than substantive value facts, determines that some models are better than others. As noted above, conceptual truth is the kind of consideration that could provide reasons of the necessary sort. The question is whether conceptual truth does so in the case of law. My response begins with two points about what notion of conceptual truth this kind of suggestion can rely on. According to what we can call a superficialist notion, conceptual truths are truths about the use of concept-words, truths that are tacitly known by all competent users of those words or are settled by community consensus about the use of the words. Given such a notion of conceptual truth, we should reject the idea that there are conceptual truths that can do the necessary work. Ronald Dworkin famously argued that disputes about the grounds of law are substantive debates, not trivial quarrels over the use of words.39 Positivists have generally responded by denying that they hold the kind of view Dworkin was attacking. Thus, both sides agree that questions about which models are better than others are not merely verbal questions that can be settled by appeal to consensus criteria for the use of words. And both sides are correct on this point. When, for example, Justices of the Supreme Court debate whether legislative history is relevant to the content of the law, the dispute cannot be settled by appeal to agreed-on criteria for the use of words. A lawyer or judge who challenges well-established models is not ipso facto mistaken. For example, a lawyer could advance a novel theory according to which New Jersey statutes make no contribution to the content of the law (on the ground, say, that there is a constitutional flaw in New Jersey’s legislative process). The claim would not be straightforwardly wrong merely because it goes against the consensus model, though it is likely mistaken on substantive grounds. 39
Ibidem, pp. 31-46.
250
MARK GREENBERG
Second, we have seen that the practices of participants in the legal system cannot be the source of the standards that support some models over others. It follows that if conceptual truth is to be the source of the standards, conceptual truth must not be determined by the practices of participants in the legal system; it must depend on factors independent of our law practices. The consequence of these two points is that, if conceptual truth is to provide the needed standards, it would have to be conceptual truth of a kind that is not determined by consensus about the use of words and is not determined by our law practices. I am sympathetic to such a notion of conceptual truth. Given such a notion, however, it is not clear that an appeal to conceptual truth is a way of avoiding the need for substantive value facts. Instead, the conceptual truths in question may include or depend on value facts, for example, facts about fairness or democracy. At this point, the burden surely rests on a proponent of the conceptual—truth suggestion to offer a position that avoids the two problems that I have just described without collapsing into a dependence on substantive value facts. A different kind of appeal to conceptual truth is possible. It could be argued not that there are conceptual truths about which models are better than others, but that conceptual truth determines that such issues are determined by a specific internal legal value. This appeal to conceptual truth does not attempt to avoid the need for value facts; it attempts to explain those value facts as internal to the law. I will turn now to the nature of legal value facts. It is worth noting, however, that an appeal to conceptual truth as the source of internal value facts will encounter the same challenge as the appeal to conceptual truth to avoid the need for value facts. Such an appeal requires an account of conceptual truth according to which truths about the concept of law are independent of our law practices, yet also independent of genuine value facts. I have argued that the content of the law depends on substantive value facts. What is the nature of those value facts? The most straightforward possibility is that, other things being equal,40 models are better to the extent that they are favored by the all-things-considered truth about the applicable considerations – the Truth, for short. In other words, the legally 40 “Other things being equal” because practices also play a role in determining which models are better than others. See section VI, 2 below.
HOW FACTS MAKE LAW
251
correct standard or value is simply the truth about value. On this view, there is no special legal standard or value. For example, the bearing of legislative history on the content of the law depends on considerations of democracy, fairness, welfare, stability – on every consideration that is, in fact, relevant to the issue. A second possibility is that, in the special context of the law, the all-things-considered truth about the relevant considerations is that the standard for models is not the general, all-things-considered truth about the relevant considerations, but some different standard. For example, it might be that, taking into account all relevant considerations, the Truth is that the legally correct resolution of value questions is the one that maximizes community wealth. According to this second possibility, special legal value facts are genuine value facts; they are the consequence of the application of genuine value facts —Truth— to the specific context of law.41 On this view, the fact that, say, wealth maximization is the virtue of models is a genuine value fact. A version of this possibility would allow the special legal value facts to vary from legal system to legal system. On the first and second possibilities, the content of the law depends on genuine value facts in a way that is inconsistent with both hard and soft positivism. A positivist might try to argue that even if my argument so far is sound, there is a third possibility. According to this possibility, there are substantive standards that, within the law do the work of value facts in resolving value questions, but are not genuine value facts. We might describe this possibility by saying that legal value facts are internal to the law. The hypothetical positivist’s suggestion that legal value facts are internal to the law would have to mean more than that they have no application outside of law. There could be legal value facts that were genuine value facts applicable only in the legal context. In that case, the second possibility would be actual, and the content of the law would at base depend on genuine value facts. The third possibility is supposed to avoid the conclusion that the content of the law depends on genuine value facts. Perhaps the idea would be that legal value facts matter only 41 The position Dworkin calls “conventionalism” could be advanced as a version of possibility two, though that is not exactly the way in which he presents it. See Dworkin, Law’s Empire, cit., footnote 6, pp. 114-150.
252
MARK GREENBERG
to those who are trying to participate in the legal system (and only to that extent). (As with the second possibility, a version of the third possibility would allow that the internal legal value can vary from legal system to legal system). I do not mean to suggest that the idea of internal legal values is unproblematic or even fully coherent. I therefore do not need to explain exactly what it would mean for there to be internal values. Nor do I need to explain what, other than the Truth, could make it the case that there is a special legal value. I mention the idea only because it seems to have some currency in philosophy of law circles. My point is simply that I do not claim in this paper to have ruled out the view that the content of the law depends on internal value facts, rather than genuine ones. I will briefly comment on the problems facing this view. We have already ruled out the possibility that law practices determine their own relevance to legal content. Therefore, something other than law practices would have to determine the internal value standard – to make it the case that this standard was the relevant one for the law (or for the particular legal system). It is difficult to see what that could be other than the relevant considerations – the Truth. If we appeal to the Truth, however, we have returned to the first or second possibility. Any account of internal value facts thus faces a challenge of steering between the law practices on the one hand and the Truth on the other. I have already described the way in which an attempt to ground internal legal facts in conceptual truth faces this challenge. But the challenge confronts any account of internal value facts. For example, suppose a theorist appeals to the function of law or legal systems to ground internal value facts. On the one hand, as we saw with conceptual truth, if the law’s function is going to provide the value facts necessary for practices to determine the content of the law, that function must be determined by something independent of the law practices. On the other hand, if the law’s function is determined by the all-things-considered truth about the relevant factors, an appeal to function is not a way of avoiding an appeal to genuine value facts. Until we have an account of internal value facts that meets the challenge, it is difficult to evaluate the potential of an appeal to internal value facts. An internal-value view faces a more substantive challenge as well. Internal value facts would have to have appropriate consequences for the nature of law. In a normal or properly functioning legal system, the content
HOW FACTS MAKE LAW
253
of the law provides reasons for action of certain kinds for certain agents. Whether the content of the law can provide such reasons may depend on the nature and source of the legal value facts. For example, it is plausible that for a legal system to be functioning properly, the content of the law must provide genuine reasons for action for judges. An internal-value theorist must explain how legal content determined exclusively by law practices and internal value facts can provide genuine, as opposed to merely internal, reasons for action. More generally, we can investigate the nature of legal value facts by asking what role such facts must play in a theory of law. 2. The Role of Value Facts Let us now turn to the role of value facts in determining the content of the law. Since I do not want to beg the question against the possibility of a special legal value (whether internal or not), I use “X” for that property in virtue of which models are better than others. X might be, for example, (the promotion of) wealth maximization, the maintenance of the status quo, security, fairness, or morality. (If there is no special legal value, X is the Truth, in the technical sense explained above.) Note that the fact that a particular model is favored by X may be a descriptive fact (e. g., if X is wealth maximization). In that case, the relevant value fact is that X is what the goodness of models consists in. I will make two clarifications about the role of X and then consider the implications for the relation between law and value. The first point is that X only helps to determine which models are correct. X’s favoring model A over model B is neither necessary nor sufficient for A to win out over B. As we saw in section 4, practices play a role in determining which model is better. Thus, the model that is best all things considered may not be the same as the model that is ranked highest by X alone. (For simplicity, I sometimes omit this qualification). In section 4, we discussed the interdependence between models and legal content. We saw that if we hold law practices constant, different candidate models yield different sets of legal propositions. Without X, each mutually supporting pair of model and set of legal propositions is as favored as any other such pair, and indeterminacy threatens. X’s independence makes it possible for the interdependence of model and legal content not to lead to global indeterminacy.
254
MARK GREENBERG
In particular, what bearing practices have on the legally correct model depends on which model is most X-justified in advance of any particular practices. For X constrains the candidate models of practices and thus makes it possible for practices to determine anything. Practices themselves have something to say about the second—order question of how practices contribute to the content of the law. But X helps to determine what practices have to say on that question. Roughly speaking, the legally correct model is the one that is most X-justified after taking into account practices in the way that it is most X-justified to take them into account.42 In other words, the legally correct model is the one that is most X-justified all things considered. The second point can be brought out with an objection. Suppose it is objected that X need determine only what considerations are relevant to the content of the law, but need not go further and determine how conflicts between relevant considerations are to be resolved. According to this suggestion, X would eliminate some candidate models as unacceptable, but would have nothing to say between models that give weight only to relevant aspects of law practices. The objector grants my argument that, without an independent standard of relevance, practices could not determine which models were correct. The objector points out, however, that once we have an independent standard of relevance, practices themselves might be able to determine which models are correct. Here is a brief sketch of a reply to the objector. In order for there to be determinate legal requirements, X must do more than determine what considerations are relevant; X must favor some resolutions of conflicts between relevant considerations over others. Otherwise, given the diversity of relevant considerations and the complexity of factual variation, law practices will not yield much in the way of determinate legal re42 In many legal systems, the practices, when taken into account in the way that is most X-justified in advance of the practices, will support a model that is not the most X-justified in advance of the practices. And when taken into account in accordance with that model, the practices may support yet a different model. Thus, the question arises how important it is for a model to be supported by the practices (taken into account in accordance with that model). (In the terminology of note 33 above, the more that a model is supported by the practices, the more the model is in equilibrium.) Since X is the virtue of models, X is what determines how important it is for a model to be supported by the practices. This is why it is fair to say, as I do in the text, that the legally correct model is the one that is most X-justified after taking into account the practices in the way that it is most X-justified to take them into account.
HOW FACTS MAKE LAW
255
quirements. Inconsistent propositions of law (and inconsistent models) will typically have some support from relevant aspects of law practices. Therefore, in or der for there to be de ter minate le gal re quire ments, X must not only help to de ter mine what con sid er ations are rel e vant but must also help to determine the relative importance of elements of law practices and how such elements interact. In fact there is a deeper problem with the objection. It assumes that there are discrete issues of what considerations are relevant to the content of the law and how the relevant considerations combine to determine the content of the law. It may be convenient to separate the two kinds of issues for expository purposes, but we should not be misled into thinking that they are resolved separately. It is not the case that there is an initial, all-or-nothing determination of whether a type of consideration is relevant and then an independent, further determination of the relative importance of the relevant considerations. Rather, the reason that a consideration is relevant determines how and under what circumstances it is relevant, and how much force it has relative to other considerations. For example, legislative history’s relevance to the content of the law derives, let us suppose, from its connection to the intentions of the democratically elected representatives of the people. Thus, in order to determine how important legislative history is, relative to other factors, we need to ask exactly how it is related to the relevant intentions and what the importance of those intentions is. The point is that the contribution to content of some aspect of a law practice and how it interacts with other relevant aspects depends on why the aspect is relevant. If this suggestion —that relevance and relative importance are not independent questions— is right, then in helping to determine the relevance of various considerations, X will necessarily be (helping to) resolve conflicts between relevant considerations. I have argued that there is a certain kind of connection between law and value. I would like to conclude by saying something about the implications of this connection. Just for the purpose of exploring these implications, I will assume that X is morality. The point of this assumption is to make clear that even if morality were the relevant value, the consequences for the relation between law and morality would not be straightforward. As I will show, it would not follow that the content of
256
MARK GREENBERG
the law would necessarily be morally good or even that the moral goodness of a candidate legal proposition would count in favor of the proposition’s being true. First, although (by assumption) morality provides legally relevant reasons, independent of the content of the law, the legally correct model is not simply whatever model is morally best (or most justified). “Morally best” here means most supported or justified by moral considerations in advance of consideration of the practices of the legal system. The legally correct model need not be the morally best one in this sense because, as we have seen, practices also have an impact on which model is legally correct. Second, morally good models do not guarantee morally good legal propositions. Even if the legally correct model was a highly morally justified one, the content of the law might be very morally bad. A democratically elected and unquestionably legitimate legislature could publicly and clearly promulgate extremely unjust statutes, such as a statute ostensibly excluding a racial minority from social welfare benefits. The judicial decisions may rely on highly morally justified models, ones that, among other things, give great weight to such morally relevant features of legislative actions as the clearly expressed intentions of the elected legislators. The most justified model, all things considered, will be a morally good one, yet will yield morally bad legal content. In fact, in such a legal system less justified models could yield morally better legal content than more justified models. (In such cases, a judge might sometimes be morally obligated to circumvent the law by relying on the less justified model).43 Although morally justified models do not guarantee morally good legal propositions, it might be suggested that part of what makes a model morally justified is that it tends to yield morally good legal requirements.44 For example, assume that, other things being equal, a legal 43 The relation between a judge’s moral obligations and morally justified models raises interesting issues, but space does not permit discussion. 44 At the extreme, for example, a model could hold that in some circumstances the goodness of a candidate legal proposition tips the balance in favor of that legal proposition and against competing candidates. (A different way to describe such a position would be to say that value not only can help to determine which model is best, thus indirectly favoring some candidate legal propositions over others, but also can favor candidate legal propositions directly. I will not use this terminology.) As I say in the text, such
HOW FACTS MAKE LAW
257
re quire ment is mor ally better the more it treats peo ple fairly. Some models will in general have a greater ten dency to yield le gal re quire ments that treat peo ple fairly. Ac cord ing to the sug ges tion un der con sid er ation, that a model has such a ten dency would be one fac tor sup port ing that model. Suppose that the suggestion were correct. According to one line of thought, it fol lows that the con tent of the law would sim ply be what ever it would be morally good for it to be (or more generally, whatever it would be most X-jus ti fied for it to be). In that case the prac tices would be ir rel e vant. This line of thought might there fore be taken to pro vide a reductio of my ar gu ment for the role of value in de ter min ing the way in which prac tices con trib ute to the con tent of the law. The line of thought is not sound, however. First, even if the tendency of a model to yield morally good legal propositions counts in favor of that model, a variety of other moral considerations favor models that make the con tent of the law sen si tive to rel e vant as pects of law prac tices. A model may be mor ally better, for ex am ple, to the ex tent that it re spects the will of the democratically elected representatives of the people, protects ex pec ta tions, en ables plan ning, pro vides no tice of the law, treats relevantly similar practices similarly, minimizes the opportunity for officials to base their de ci sions on con tro ver sial be liefs, and so on. Roughly, we have a distinction between content-oriented con sid erations and prac tice-ori ented con sid er ations. The rel a tive weight ac corded by morality to these two kinds of con sid er ations is a ques tion for moral theory that I will not take up here. On any plausible account, however, mo ral ity will give sub stan tial weight to prac tice-ori ented con sid er ations. So the mor ally best model (con sid ered in ad vance of law prac tices) will make the law sen si tive to rel e vant as pects of law prac tices. Second, as we have seen, the legally correct model also depends on the law practices. Apart from the weight that morality gives to prac tice-oriented considerations, the practices themselves may support models that make the law sensitive to practices. (Contemporary positivists, my pri mary tar get in this pa per, are likely to be sym pa thetic to the view that practices support models that make the law sensitive to practices). a model may be less sup ported both by mo ral ity and by prac tices than mod els that give less weight to content-oriented considerations. I suggest below (see the last four para graphs of this sec tion), that the role that such a model as signs to value facts is out side the role that this pa per’s ar gu ments sup port.
258
MARK GREENBERG
For example, al though I will not de fend the claim here, in the U. S. and U. K. legal systems, practices themselves strongly support models that make the law sensitive to law practices. Practices are thus a second reason that the role of value need not have the consequence that the all-things-considered best model will be one that tends to yield morally good legal propositions. (Also, even a model that has a tendency to produce morally good legal propositions may not do so, given the law prac tices of a par tic u lar le gal sys tem). Third, and fi nally, if we re flect on the ar gu ment for value’s role in determining the content of the law, we see that it supports only a limited role for value, one that does not involve supplanting law practices or making them irrelevant. Our starting point was that law practices must determine the content of the law and that they must do so by providing reasons that favor some legal propositions over others. The crucial step in the ar gu ment was that law prac tices can not pro vide such rea sons without value facts that determine the relevance of different aspects of law practices to the content of the law. The argument thus supports the involvement of value facts in determining the con tent of the law only for a lim ited role: de ter min ing the rel e vance of law prac tices to the con tent of the law. We can ap ply this point to the spe cific ques tion of to what ex tent a legal proposition’s goodness can help to make it true: the goodness (in terms of mo ral ity or of value X) of a can di date le gal prop o si tion is rel evant to the proposition’s truth only to the extent that its goodness con trib utes to mak ing it in tel li gi ble that an as pect of a par tic u lar law prac tice has one bear ing rather than an other on the con tent of the law. I will call this the rel e vance lim i ta tion. I want to emphasize that the point is only that the argument of this pa per sup ports no more than such a lim ited role for value facts; the ar gument does not show that the role of value facts must be so limited. Whether there is some other or more expansive role for value in de termin ing the con tent of the law is left open. This pa per’s ar gu ment for the con clu sion that value facts play a role in de ter min ing le gal con tent is that value facts are needed in order to determine the relevance of law prac tices to the le gal con tent. The ar gu ment there fore sup ports only that role for value facts. There might, of course, be a different argument that shows, say, that mo ral ity or some other value sup plants the law prac tices
HOW FACTS MAKE LAW
259
(though of course al most no con tem po rary le gal the o rist, least of all one of my posi tiv ist tar gets, thinks that there is such an ar gu ment). Let us con sider more spe cif i cally the im pli ca tions of the rel e vance lim i tation. The lim i ta tion does not im ply that the good ness of a le gal prop o si tion can never be rel e vant to its truth.45 The good ness of a le gal prop o si tion will be relevant to the extent that it has a bearing on the intelligibility of law prac tices’ sup port ing that le gal prop o si tion over oth ers. A Dworkinian the ory of law pro vides a help ful ex am ple.46 Con sider a model ac cord ing to which law prac tices con trib ute to the con tent of the law precisely that set of legal propositions that best justifies those law practices. Whether this model re spects the rel e vance lim i ta tion will de pend on the notion of justification involved in the Dworkinian model. Con sider a simplistic understanding of justification that has the following implication: the set of propositions that best justify the law practices is that set that results from taking the mor ally best set of prop o si tions and carving out specific exceptions for the law practices of the legal sys tem-exceptions tailored in such a way as to have no forward-looking consequences. On this understanding of justification, the model would not re spect the rel e vance lim i ta tion be cause value facts would not de termine the significance of the practices; instead, the practices would simply be de nied any sig nif i cance by a kind of ger ry man der ing. On a more sophisticated notion of justification, to the extent that a le gal prop o si tion is bent or ger ry man dered, it will be less good at jus tifying law prac tices. (In the ex treme case just con sid ered, where a particular law practice is simply treated as an exception without further application, that practice is not justified at all by the propositions to which it is an exception.) I think it is plausible, though I will not argue the point here, that given a proper understanding of justification, the Dworkinian model I have de scribed re spects the rel e vance lim i ta tion. (In 45 It is easy to see that the good ness of a le gal prop o si tion could have ev i den tiary rel evance to the con tent of the law. Sup pose that the in ten tion of leg is la tors mat ters to the content of the law. If there is rea son to be lieve that the leg is la tors would have in tended what is mor ally better (at least other things being equal), the moral goodness of can di date le gal prop o si tions will have a bear ing on their truth be cause it will have a bear ing on what the leg is la tors in tended. The dis cus sion in the text con cerns the ques tion whether the good ness of can di date prop o si tions can have con sti tu tive, rather than ev i den tiary, rel e vance. 46 I say “a Dworkinian the ory” rather than “Dworkin’s the ory” to avoid ques tions of Dworkin ex e ge sis. I be lieve that the po si tion I de scribe is the best un der stand ing of Dworkin’s po si tion. See also note 48 be low.
260
MARK GREENBERG
a mo ment, I will consider a different model, often at trib uted to Dworkin, that ar gu ably does not re spect that lim i ta tion). The rel e vance lim i ta tion im plies that the good ness of a le gal prop o sition is never suf fi cient to make it true. That value facts are needed to determine the contribution of law practices to the content of the law does not pro vide a ba sis for mak ing law prac tices ir rel e vant. To put it an other way, that a candidate prop o si tion is a good one does not make it in tel ligible that the law practices, regardless of what they happen to be, sup port that proposition. It might be tempting to regard a model on which the goodness of a legal proposition can, at least in some circumstances, be suf fi cient to make it true as the de gen er ate or lim it ing case of a model that determines the relevance of law practices to the content of the law. The model determines that in the relevant cir cum stances, prac tices have no relevance. But though this description may be formally tidy, the argument that value facts are needed to enable law practices to de termine the content of the law provides no support for a model on which value facts can make prac tices ir rel e vant. In other words, though we can describe a putative “model” according to which practices provide a reason favoring any particular set of legal propositions (the mor ally best ones, for ex am ple) it does not follow that practices could provide such a reason. What rea sons prac tices pro vide is a sub stan tive not a for mal ques tion. We can ap ply this point to an in ter me di ate case. Con sider a model that includes rules for the contribution of law prac tices to the con tent of the law, but also in cludes a rule of the fol low ing sort: (R) If mo re than one le gal pro po si tion is sup por ted by the (to tal) law practi ces (gi ven the ot her ru les of the mo del) to so me thres hold le vel, the le gal pro po si tion that is mo rally best (of tho se that reach the thres hold) is true .47 47 Dworkin some times seems to sug gest such a rule, e. g., Law’s Em pire, pp. 284 and 285, 387 and 388; Tak ing Rights Se ri ously, Cam bridge, Har vard Uni ver sity Press, 1977, pp. 340, 342. And his com men ta tors typ i cally in ter pret him in this way. See, e. g., Al exander and Sherwin, The Rule of Rules, Durham and London, Duke University Press 2001, ch. 8; Finnis, “On Rea son and Au thor ity in Law’s Em pire”, Law and Phi los o phy, 6, 1987, pp. 372-374; Raz, Ethics in the Public Domain, Oxford, Oxford University Press, 1994, pp. 222 and 223. I think that this is not the best un der stand ing of Dworkin’s view (and Dworkin has con firmed as much in con ver sa tion). On the best un der stand ing, fit is merely one as pect of jus ti fi ca tion, there is no thresh old level of fit, and how much fit matters relative to other as pects of jus ti fi ca tion is a sub stan tive ques tion of po lit i cal morality. (The idea of a thresh old of fit that in ter pre ta tions must meet to be el i gi ble, and
HOW FACTS MAKE LAW
261
I sug gest that R is not sup ported by this pa per’s ar gu ment for the role of value. In general, that legal prop o si tion A has mor ally better con tent than legal proposition B does not ipso facto make it intelligible that law practices support A over B. Adding the hypothesis that law practices pro vide strong sup port for both A and B – sup port above some thresh old level – does not change this conclusion. A moral reason for favoring proposition A over proposition B is not itself a reason provided by law practices, since it is independent of law prac tices. If this argument is right, my ar gu ment for the role of value facts does not sup port a role like that captured by R – one in which there is room for value facts to favor one legal proposition over another, independently of law practices. (Again, however, the point is only that this paper’s argument does not support such a role for value facts, not that such a role is necessarily illegitimate). In sum, even if value X were morality, it would not follow that the most mor ally jus ti fied model would be le gally cor rect, and even a morally justified model would not guarantee morally good legal re quirements. It is no part of the role of value ar gued for in this pa per that the good ness of a prop o si tion ipso facto counts in fa vor of the prop o si tion’s truth. The role of value is in determining the relevance of law practices to the con tent of the law. VII. CONCLUSION I have argued that law practices, understood in a way that excludes value facts, cannot themselves determine the content of the law. Dif ferent models of the contribution of practices to the content of the law would make it the case that different legal prop o si tions were true, and a beyond which substantive moral considerations become relevant, should be taken as merely a heuristic or expository device.) See Dworkin, A Mat ter of Prin ci ple, pp. 150 and 151; “«Nat u ral Law» Re vis ited”, University of Florida Law Review, 34, 1982, pp. 170-173; Law’s Empire, p. 231, 246-247. A different point is that Dworkin sometimes seems to sug gest that there is an as pect of the ques tion of the ex tent to whichin ter pre tations fit law prac tices that is purely for mal or at least not nor ma tive. See, e. g., Taking Rights Se ri ously, cit., foot note 47, p. 107 (sug gest ing that how much an in ter pre ta tion fits is not an is sue of po lit i cal phi los o phy); see also ibidem, pp. 67 and 68 (per haps sug gesting that there are as pects of in sti tu tional sup port that do not de pend on is sues of nor mative po lit i cal phi los o phy).
262
MARK GREENBERG
body of law prac tices can not uni lat er ally de ter mine which model is correct. In or der for there to be determinate legal requirements, the content of the law must de pend also on facts about value. What is the role of such value facts? I have suggested that they support some models over others – that is, they help to determine which features of law prac tices mat ter and how they mat ter. It is not that the good ness of a can di date le gal prop o si tion counts in fa vor of its truth. Rather, the role of value is in help ing to de ter mine how prac tices con trib ute to the content of the law. This paper does not attempt conclusively to rule out the view that the needed legal value facts are internal to law. I have ar gued, how ever, that the pro po nent of such a view must over come significant obstacles to explain how internal legal value facts could be independent of both law practices and genuine value facts. The paper also sug gests a way for ward: We can ask what the na ture and source of le gal value facts must be in or der for law to have its cen tral fea tures, for ex am ple, for a le gal sys tem to be able to pro vide cer tain kinds of rea sons for ac tion.
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS Ram NETA* SUMMARY: I. Introduction. II. Greenberg’s Argument for Legal Emergentism. III. The Generalization of Greenberg’s Argument. IV. What’s Wrong with this General Argument for Normative Emergentism? V. The Consequences for Greenberg’s Local Argument for Legal Emergentim. VI. Works Cited.
I. INTRODUCTION Sometimes, we think or act in certain ways because we have reason to do so. We pay our taxes, we show up on time for our classes, we refuse to assent to claims that we recognize to be inconsistent, and we refrain from wanton violence, and we do each of these things because we have reason to do so. More generally, we have reasons for thinking or acting in certain ways. I’ll express this point by saying that there are norms that apply to us, and more specifically to our thought and action. For a norm to apply to a person is for that person to have a reason for thinking or acting in a particular way, the way indicated by the norm. The fact that a norm applies to someone in this way is what I’ll call a “normative fact”. All other facts I will call “non-normative”. This distinction between normative and non-normative facts has often been thought to have great metaphysical importance. In order to explain why it has been thought to have this importance, I should first draw a different distinction between two mutually exclusive and jointly exhaustive kinds of facts. There are the “evaluative” facts, which are facts about what is good, what is bad, what is better than what, what is worse that * University of North Carolina, USA.
263
264
RAM NETA
what, and so on. All other facts are “non-evaluative”. So there are normative facts and non-normative facts, and there are evaluative facts and non-evaluative facts. For present purposes, we need not take a stand on how the first pair of categories is related to the second pair of categories. Now, philosophers have often been inclined to think of the world as consisting fundamentally of nothing more than the non-normative, non-evaluative facts.1 I’ll use Anscombe’s phrase “brute facts” to denote all and only those facts that are both non-normative and non-evaluative.2 Using this terminology, I will say that philosophers have often struggled to understand how the brute facts can somehow add up to normative facts of various kinds. How —they have wondered— can the brute facts make it the case that we have reason to think or act in a particular way? Typically, philosophical attempts to address this question lead to one of three results: reductionism, eliminativism, or emergentism. Reductionists attempt to show how a conglomeration of brute facts can somehow add up to a fact of the normative kind in question. Thus, we might try to reduce moral facts to facts about what behavior would maximize utility or fitness, epistemic facts to facts about the reliability of our belief-forming processes, semantic facts to facts about the covariation of neural events and external events, and so on. Eliminativists claim that such reduction is impossible, and so conclude that there really are no facts of the normative kind in question (i. e., no moral facts, no epistemic facts, no semantic facts). And finally, emergentists claim that reduction is impossible, and so conclude that the world contains facts over and above the brute facts. In his paper “The Strange and Intelligible Metaphysics of Law”,3 Mark Greenberg offers an elegant and simple argument for emergentism about legal normative facts, or what I will call “legal emergentism”. In 1 I will not attempt to document this historical claim, nor will I attempt to explain it. I refer the interested reader to the classic work on this topic, Burtt, The Metaphysical Foundations of Modern Physical Science, New York, Doubleday, 1924. 2 Anscombe, G. E. M., “On Brute Facts”, Analysis, 18, 1958. As Anscombe uses the term, a fact A is “brute” only relative to another fact B. She leaves it open whether there are facts that are brute relative to any other facts. She also leaves it open whether the relative bruteness of a fact has to do with its being normative or non-normative, evaluative or non-evaluative. So I’m not sure that my use of the term “brute fact” bears any significant resemblance to her use. Nonetheless, the term strikes me as both convenient and appropriately evocative. 3 Greenberg, Mark, “The Strange and Intelligible Metaphysics of Law” (forthcoming).
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
265
other words, he argues that facts about what we have legal reason to do or not to do cannot be reduced entirely to brute facts. This is not to suggest that Greenberg thinks that the legal normative facts are metaphysically basic or primitive: he explicitly denies this. Rather, what Greenberg claims is that, while the legal normative facts might be reduced to some other facts, they cannot be reduced entirely to brute facts. For Greenberg, unless there were some evaluative facts, there could be no legal normative facts. In this sense, then, Greenberg’s metaphysics includes more than simply the brute facts. It also in cludes the evaluative facts, and it must, for Greenberg, include the evaluative facts if it is to include the legal normative facts. This is what I am calling his “legal emergentism”. Greenberg’s argument for legal emergentism seems to have very radical implications, for it suggests a more general argument for emergentism concerning all normative facts, or what I will call “normative emergentism”. If there is a sound, general argument for normative emergentism, that would be news of the very greatest importance to philosophy, for we would then know that the sparse metaphysical picture that in cludes nothing more than the brute facts would leave out something. If Greenberg’s argument really does give us a way to show something of this sort, then we should find out. In this paper, I intend to find out. Specifically, I will do two things. First, I will argue that the generalization of Greenberg’s argument is not sound, and so does not establish normative emergentism. But the flaw in the generalized version of Greenberg’s argument reveals something important about his local argument for legal emergentism. And this brings me to the second goal of this paper, which is to show that the compellingness of Greenberg’s local argument for legal emergentism depends upon contingent and possibly unknown facts of legal history. If Greenberg’s argument is compelling, then this cannot be known a priori. II. GREENBERG’S ARGUMENT FOR LEGAL EMERGENTISM In this section, I’ll state Greenberg’s argument for legal emergentism. First, I’ll briefly summarize Greenberg’s explanations of the terminology that he uses in his argument: “Legal decisions” are decisions that legislators, judges, and other people make, as well as other legally relevant his-
266
RAM NETA
torical events that can be fully characterized in brute terms. (I leave aside the difficult but irrelevant issue of what’s involved in being able to understand a historical event “fully”: let that issue be settled by whatever account, Greenberg can then define “legal decisions” in terms of that account.) “Legal content” is the normative content of the law, i. e. what is legally forbidden or required, or more generally, what legal norms there are. “Legal propositions” are propositions articulating legal content. Finally, to say that one thing A “provides reason for” another thing B is to say that A makes it the case that B, and makes it the case in a way that makes it at least somewhat reasonable for it to be the case that B. Equivalently, we can say that A “rationally determines” B. To illustrate: there is nothing reasonable or unreasonable about the fact that water boils at 212 degrees Fahrenheit, and so whatever makes it the case that water boils at 212 degrees Fahrenheit does not rationally determine that fact. Nothing rationally determines the fact that water boils at 212 degrees Fahrenheit. In contrast, it is at least somewhat reasonable for the law to require that people who are not convicted of crimes not receive punishment. It’s not just a fact that the law requires this, but it is a reasonable fact. Thus, whatever makes it the case that the law requires this, provides a reason for the law to require it, and so rationally determines that the law requires it. These examples should provide one with a general sense of how Greenberg is using the terms “provide a reason” and “rationally determine”. Admittedly, I have not given a rigorous account of these notions, but then Greenberg doesn’t offer a rigorous account either, and I’m following his practice for now in order to state his argument. It will turn out that his argument is subject to criticism no matter how precisely these notions are explicated. Using the terminology above then, here is Greenberg’s argument: 1) Premise D: In the legal system under consideration, there is a large body of determinate legal propositions. 2) Premise L: The legal decisions in part determine the content of the law. 3) The legal decisions can determine the content of the law only by providing reason for the content of the law being what it is (in other words, the legal decisions can determine the content of the law only by rationally determining it). 4) The legal decisions provide reason for the content of the law being what it is. (From 2, 3)
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
267
5) In a legal system with a large body of determinate legal propositions, the legal decisions by themselves cannot fully determine what reason they provide for the content of the law being what it is (that is, the legal decisions cannot fully determine exactly how they rationally determine the content of the law.) 6) Something else besides the legal decisions must help to determine what reason the legal decisions provide for the content of the law being what it is. (From 1, 4, 5). 7) Evaluative facts are the only things that can play the role of helping to determining what reason the legal decisions provide for the content of the law being what it is. 8) Evaluative facts enter into determining the content of the law in the legal system under consideration (from 6, 7) If this argument is sound, then all attempts to reduce legal content to the history of legal decisions, or to the semantic contents of written and spoken texts, or to what judges had for breakfast, must fail. For instance, all versions of legal positivism and legal realism fail. None of the brute facts can, by themselves, fully rationally determine the content of the law. That’s because they can enter into determining the content of the law only by providing reason for the law being what it is. But these facts cannot fully rationally determine their own rational significance. That is, they cannot fully rationally determine what reason they have the power to provide. And that would be true no matter how broadly we extend this range of facts, so long as they exclude the evaluative facts and the facts about legal content. That totality of facts still could not fully determine its own rational significance for the content of the law. And so we would, according to Greenberg, need to add something to it in order fully to determine the content of the law. Here’s one intuitive way to think about Greenberg’s thesis: The law requires us to act in all sorts of determinate ways, and it forbids us to act in all sorts of determinate ways. But there must be some reason for the law to require some things and forbid other things – the law’s requirements, unlike the boiling point of water, are either reasonable or unreasonable, and something makes them either reasonable or unreasonable. The brute facts by themselves cannot provide reason for the law to issue these determinate requirements. The brute facts cannot, on their own, makes the legal requirements either reasonable or unreasonable. So there must be something over and above the brute facts that provides reason
268
RAM NETA
for the law to issue these determinate requirements. And this extra factor is the value facts. Greenberg thus argues that no version of legal reductionism can be right. If we grant prem ise 2, and so re ject le gal eliminativism, Greenberg makes it look as if we must accept legal emergentism. III. THE GENERALIZATION OF GREENBERG’S ARGUMENT Part of what makes Greenberg’s argument so important is that it suggests a more general argument concerning all normative systems of any interest whatsoever – moral, epistemic, semantic, and so on. To see this, let’s consider whether the premises of Greenberg’s argument for legal emergentism apply more generally. Premise 1 says that in the legal system under consideration, there is a large body of determinate legal propositions. But something analogous will be true of any interesting normative system. For instance, any interesting moral code will include a large body of determinate moral requirements. Any interesting methodology will include a large body of rules for theory-choice. Any interesting linguistic system will include a large body of semantic rules. And so on. So it seems that we can generalize premise 1 as follows: Premise 1’: In the normative system under consideration, there is a large body of determinate normative propositions (hereafter, “norms”). Premise 2 of Greenberg’s argument says that the legal decisions in part determine the content of the law. But again, it seems that something analogous will be true of any interesting normative system. For instance, the normative content of a moral code depends to some extent upon various brute facts about the creatures to which the code applies (e. g. that they are mortal, that they are capable of suffering pain, that they can communicate, they are susceptible to certain kinds of temptation, and so on). The normative content of a particular scientific methodology depends to some extent upon various brute facts about the theoretical practice and practitioners to which that methodology applies (e. g. that they have certain sense organs and not others, that they are capable of making certain sorts of calculations easily but others only with great difficulty, that their sense organs can be trained to respond reliably to certain ranges of energies and not others, and so on). And the normative content
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
269
of a particular linguistic system depends to some extent upon various brute facts about the creatures that employ that linguistic system (e. g. that they have a certain universal grammar hard wired, that they have learned to speak a SVO language instead of a SOV language, that they have learned to pronounce certain phonemic combination and not others, and so on). So it seems that we can generalize premise 2 as follows: Premise 2’: The brute facts in part determine the norms. Now it may be objected against premise 2’ that there are some normative facts that are metaphysically basic: they do not depend on any contingent features of the creatures to whom they apply. For instance, one might think that the categorical imperative, or modus ponens, is such a rule. I will not contest such claims here (even though I do think that they are false).4 But even if they are true, we can still accept that premise 2 holds for all normative systems of which premise 1’ is true, i. e., all normative systems that generate many determinate norms. The categorical imperative, all by itself, doesn’t generate many determinate norms. It can only generate many determinate norms when it’s conjoined with lots of contingent facts about the features of the actual agents to whom it applies. The same holds of any other allegedly necessary and basic normative fact. So, even if there are necessary and basic normative facts, this does not threaten premise 2’. Premise 3 of Greenberg’s argument says that the legal decisions can determine the content of the law only by providing reason for the content of the law being what it is. Recall that the phrase “providing reason” is here being used to signify a metaphysical relation: X provides reason for Y just in case X makes Y obtain and also makes it reasonable for Y to obtain. In this sense, nothing provides reason for water to boil at 212 degrees Fahrenheit: it just does. But something does provide reason for the law to require that people not convicted of a crime not receive punishment. Instead of using the phrase “providing reason” to designate this metaphysical relation, we might equally well use the phrase “make it reasonable”.
4 Briefly, the categorical imperative is not a reason for anyone to do anything: rather it is a constraint upon something’s being a good practical reason. Again, modus ponens is not a reason for anyone to think anything, but, in tandem with the laws of logic, places a constraint upon what it is for something to be a good theoretical reason.
270
RAM NETA
Now, we might worry that these examples do not give us a firm grasp on the metaphysical notion of “providing reason” or “making it reasonable”. Greenberg tells us a bit more about this notion, at least in its application to the law. Here’s what he says: “The basic idea is that the content of the law is in principle accessible to a rational creature who is aware of the relevant legal practices. It is not possible that the truth of a legal proposition could simply be opaque, in the sense that there would be no possibility of seeing its truth to be an intelligible consequence of the legal practices. In other words, that the legal practices support these legal propositions over all others is always a matter of reasons – where reasons are considerations in principle intelligible to rational creatures”. I’m eventually going to raise a question about how to interpret this passage. But for now, I’ll allow the passage to stand without comment, and I’ll ask whether something analogous to this passage could be said about the determination of norms in other kinds of normative system. For instance, do the brute facts that enter into determining the norms of a moral code make it reasonable for the norms to be what they are? Do the brute facts that enter into determining the norms of a particular methodology make it reasonable for the norms to be what they are? Do the brute facts that enter into determining the semantic norms of a particular linguistic system make it reasonable for the norms to be what they are? I think it’s not entirely clear how to answer these questions. But I shall now argue that there is at least some plausibility in answering each of them affirmatively. Here’s my argument: If the brute facts do not make it reasonable for the norms to be what they are, then either nothing makes it reasonable for the norms to be what they are, or else the reason for the norms to be what they are is independent of the brute facts. Let’s consider what follows from each of these two hypotheses. If the first hypothesis is right, then nothing makes it reasonable for the norms to be what they are. In that case, it’s arbitrary that the norms are what they are, i. e., there is noth ing reason able about the norms being what they are rather than some other way; they just are that way. But if there is nothing reasonable about the norms being what they are, then those norms are like the rules of a game that there is no reason to play, or the rules of a practice that there is no reason to participate in. That is to
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
271
say, there is no reason to follow those norms, and so they are not really norms at all. But this contradicts our hypothesis that they are norms. Therefore, the first hypothesis cannot be right, and so something must make it reasonable for the norms to be what they are. This line of reasoning will give rise to two objections: first, it may be objected that it generates an infinite regress of norms. But this isn’t so. We can avoid the infinite regress either by appeal to a big circle of norms, or by appeal to some foundation that makes it reasonable for the norms to be as they are, but is not itself a norm. We needn’t choose between these strategies here. Second, it might be objected that, many of our actual norms are arbitrary, but are, for all that, still norms. For instance, it may be said, we have reason to follow the particular linguistic norms of our language community, even though those norms are arbitrary. Again, we have reason to stay within the speed limit, even though that is arbitrary as well. The problem with this objection is that these are not cases of our having reason to follow arbitrary norms. Rather, they are cases in which the specific norms that we have reason to follow are determined by more general norms, together with various non-normative contingencies. For instance, there is a general norm to the effect that we should speak in such a way as to make ourselves understood. But this general norm makes it reasonable for us to comply with the more specific norms of our linguistic community, whatever those happen to be. Again, there is a general norm to the effect that one should do what one can to avoid punishment and promote social coordination. This general norm makes it reasonable for us to comply with the laws of our land, whatever those happen to be (at least within limits). In each of these cases, one has a reason to do some specific thing because it is dictated by one’s reason to do some more general thing, along with the contingencies of one’s particular situation. These are not cases of having a reason to do something for no reason at all. And so these cases do not invalidate the principle used in the preceding argument: if nothing makes it reasonable for a norm to be as it is, then there is no reason to follow the norm, and so it is not really a norm at all. I conclude that the first hypothesis cannot be right. If the second hypothesis is right, then the reason for the norms to be what they are is independent of the brute facts that determine those norms. In that case, it’s
272
RAM NETA
arbitrary that the norms are binding on all and only those creatures of which the determining brute facts obtain. For instance, it’s arbitrary that the norms are binding on mortal creatures who are capable of feeling pain, rather than on angels. And in that case, again there’s nothing that makes the norms in question binding on creatures like us. And that is just to say that, while the norms might really be norms for some creatures, they are not really norms for us. They are like rules of a game that creatures like us have no reason to play. We can conclude that neither the first nor the second hypothesis can be right. It seems then, that for any normative system of which premises 1’ and 2’ are true (i. e., any normative system that has determinate norms that are binding on us), the brute facts that determine the norms of that system must provide reason for us to comply with those norms, and so provide reason for those norms to be what they are. If the preceding line of thought is correct (and I will return to re-examine it below), then we can generalize premise 3 as follows: Premise 3’: The brute facts can determine the norms only by providing reason (i. e., making it reasonable) for the norms being what they are. Premise 5 of Greenberg’s argument says that, in a legal system with a large body of determinate legal propositions, the legal decisions by themselves cannot fully determine what reason they provide for the content of the law being what it is. There are many possible mappings from legal decisions to legal content, and the legal decisions, according to Greenberg, cannot themselves determine which possible mapping is the correct one. That’s why other facts, besides the legal decisions, are needed to determine the correct mapping. Now, so far as I can see, whether or not premise 5 is true depends upon nothing that is peculiar to legal normativity. Whatever it is that makes it the case that legal decisions cannot determine the correct mapping from themselves onto the facts of legal content, that same thing makes it the case that brute facts cannot determine the correct mapping from themselves onto the normative facts. If there is supposed to be something special about the determination of legal norms in this regard, it’s not at all clear what it could be. This suggests that, if premise 5 is true, then so is. Premise 5’: In a normative system with a large body of determinate norms, the brute facts by themselves cannot fully determine what reason they provide for the norms being what they are.
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
273
Finally, premise 7 says that evaluative facts are the only things that can play the role of helping to determine what reason the legal decisions provide for the content of the law being what it is. Greenberg explains this point in the following passage: In order for the decisions to yield determinate legal requirements, it has to be the case that there are truths about which models are better than others, independently of how much the models are supported by the legal decisions. Since the decisions must rationally determine the content of the law, truths about which models are better than others cannot simply be brute; there have to be reasons that favor some models over others.
The reason that favors some models over others includes facts about which models are better. And these are evaluative facts. But for the same reason that evaluative facts are needed fully to determine the correct mapping from legal decisions onto legal norms, so too, it seems, evaluative facts will be needed fully to determine the correct mapping from brute facts onto other norms generally. If premise 7 is true, then so is Premise 7: Evaluative facts are the only things that can plausibly play the role of helping to determine what reason the brute facts provide for the norms being what they are. With all this in mind, we can now consider the following generalization of Greenberg’s argument: 1’) Premise D: In the normative system under consideration, there is a large body of determinate norms. 2’) Premise L: The brute facts in part determine the norms. 3’) The brute facts can determine the norms only by providing reason for the norms being what they are. 4’) The brute facts provide reason for the norms being what they are. (From 2’, 3’). 5’) In a normative system with a large body of determinate norms, the brute facts by themselves cannot fully determine what reason they provide for the norms being what they are. 6’) Something else besides the brute facts must help to determine what reason the brute facts provide for the norms being what they are. (From 1’, 4’, 5’)
274
RAM NETA
7’) Evaluative facts are the only things that can play the role of helping to determine what reason the brute facts provide for the norms being what they are. 8) Evaluative facts enter into determining the norms in the normative system under consideration. (From 6, 7). By generalizing Greenberg’s argument, we’ve constructed an argument for normative emergentism. The argument assumes (premise 2) that normative eliminativism is false, but from this assumption it argues against normative reductionism. IV. WHAT’S WRONG WITH THIS GENERAL ARGUMENT FOR NORMATIVE EMERGENTISM? I will now argue that this general argument for normative emergentism is not compelling, for either premise 5 is false or else we have no reason to accept premise 3’. I’ll begin by leveling an objection against premise 5, and then I’ll argue that the only way to save premise 5’ from this objection is to interpret the notion of “providing reason” in such a way that we have no reason to accept premise 3’. Premise 5’ says that in a normative system with a large body of determinate norms, the brute facts by themselves cannot fully determine what reason they provide for the norms being what they are. But let’s consider whether or not this general claim is borne out by cases. For instance, suppose that Alice mowed the lawn because John promised to pay her 400 dollars if she mowed the lawn. Now, what makes it wrong for John to break his promise? What makes it wrong for John to break his promise is that it would be a case of breaking a promise, and it’s generally wrong to break promises. That’s an essential feature of the practice of promising: making a promise places one under an obligation to keep it (except in very special circumstances). The practice of promising essentially involves norms that are binding on all those who participate in that practice, and these norms include the norm that it’s wrong to break a promise. When I say that the practice of promising “essentially” involves these norms, I mean that it’s not just true by convention that the practice of promising involves the norm that it’s wrong to break one’s promise. It’s not just that we happen to use the word “promising” to designate practices that have this feature. Rather, the practice of promis-
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
275
ing essentially involves the norm in question because there’s no way for the practice of promising to exist over time without that norm. If people were generally permitted to break their promises, then people would know this, and so would not expect other people to keep their promises, and so would tend not to act on any such expectation. Everyone would quickly be able to notice this fact, and so no one would continue to expect her own promises to have any impact. Each person would thereby lose incentive to make promises. In short, the institution of promising would quickly cease to exist if people were generally permitted to break their promises. For there to be an institution of promising, it must be wrong for people to break their promises. Thus, it’s an essential feature of the practice of promising that it involves the norm that it’s wrong to break your promises. But this just pushes our original question back a step. Now, instead of asking why John must keep his promise, we can ask why John has reason to participate in this essentially norm-governed practice of promising. And there could be any number of answers to this question. For instance, John might have an interest in having his lawn mowed, and he recognizes that the only way that he can get his lawn mowed is by promising some able-bodied person that he’ll pay them if they mow it. Or John might, like some children, simply enjoy participating in a social practice that affords him opportunities for market interactions with others. But whatever the story, so long as John has some reason to participate in the practice of promising, he has reason to comply with the norms of that practice, and so they are norms for him. Now let’s consider whether I have indeed provided “the reason”, in Greenberg’s sense, for why it’s wrong for John to break his promise. We can assess this issue by considering what it is for a normative fact to obtain “for a reason”, on Greenberg’s use of that phrase. Paraphrasing the passage from Greenberg quoted above, we can say this: for norms to obtain for some reason is for the contents of those norms to be in principle accessible to a rational creature who is aware of the relevant brute determinants of the norms. It is not possible that the obtaining of those normative facts could simply be opaque, in the sense that there would be no possibility of seeing them to be intelligible consequences of the relevant brute determinants. In other words, that the relevant brute determinants support these normative propositions over all others is always a matter of considerations in principle intelligible to rational creatures.
276
RAM NETA
Now, it seems that, in the story that I’ve told about promising, I’ve shown how the wrongness of John’s breaking his promise follows from the general prohibition against breaking promises. But that general prohibition is an intelligible consequence of various brute facts about the practice of promising. And John’s reasons for engaging in that practice are themselves intelligible consequences of various brute facts about John (e. g., what he likes and doesn’t like). Thus, it seems, I’ve articulated the reason why it’s wrong for John to break his promise. I’ve provided an explanation of what makes it wrong for John to break his promise, and my explanation adverts solely to brute facts about the social function of the institution of promising, and about John. If my explanation is correct, then premise 5’ is false. Of course this is not because of something special about promising. Many other norms are equally susceptible of ex planation in terms of brute facts. In order to rescue premise 5’ from these apparent counterexamples, the defender of normative emergentism seems to have only one way out, and that is to claim that these explanations are not explanations of the right kind at all – they do not explain what reason there is for the norms being what they are. Now, I’m not sure how strong a case can be made for or against this way of avoiding the objection that I’ve just leveled, and that’s because I’m not sure exactly what’s involved in the metaphysical constitutive relation that Greenberg uses the term “providing a reason” to designate. What exactly is involved in the relation between normative facts and their brute determinants being “a matter of reasons” or “in principle intelligible to a rational creature”? Since I’m not sure how to answer these questions, I will not attempt to argue against this proposed way of avoiding my objection to premise 5’. Instead, I’ll point out that it does the normative emergentist no good. For if my aforestated explanation of why it’s wrong to break a promise doesn’t “provide a reason” (in the relevant sense) for why it’s wrong to break a promise, then I don’t see why we should think that anything else “provides a reason” (in the relevant sense). In other words, if I haven’t provided a reason for why it’s wrong to break a promise, then why should we think that there is any reason (in the relevant sense) for why it’s wrong to break a promise? Why shouldn’t we just think that the wrongness of breaking a promise is a metaphysically basic fact of the world? Or it obtains not by virtue of something else providing a reason
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
277
for it, but rather by virtue of something making it obtain, in some non-rational way? Now recall that we have already considered a plausible argument against these apparent possibilities: if there is no reason for the norms to be as they are, then we have no reason to comply with those norms, and so they are not really norms. Now, I do find something plausible about this argument, when the notion of “reason” that it employs is broad enough to include the kind of reason that I gave above for why it’s wrong to break a promise. But if the notion of “reason” is interpreted more narrowly than that, then the argument seems to me to lose its plausibility. Why should there be a “reason”, in this special, narrow sense, for why it’s wrong to break a promise? If there is no “reason”, in this special narrow sense, for why it’s wrong to break a promise, then how does it follow that we have no “reason”, in a broad, ordinary sense, for not breaking our promises? Pending an answer to this question, there seems to be nothing to favor premise 3’. In sum, if we grant that premise 5’ is false, then we have no reason to believe premise 3’. Either way, the argument for normative emergentism is not compelling. Now what, if anything, does this show about Greenberg’s local argument for legal emergentism? V. THE CONSEQUENCES FOR GREENBERG’S LOCAL ARGUMENT FOR LEGAL EMERGENTISM In the preceding section, I argued that the generalization of Greenberg’s argument is not compelling: either premise 5’ is false (for the brute facts do fully determine that John must pay Alice 400 dollars), or else we have no reason to believe premise 3’ (for we don’t know enough about the rational determination relation). I will now argue that an analogous, but somewhat weaker, conclusion is true of Greenberg’s local argument for legal emergentism: either premise 5 is subject to historical falsification (for all we know a priori, the legal decisions may be such as to fully determine their own rational significance), or else we have no reason to believe premise 3 (for we don’t know enough about the rational determination relation). Recall that premise 5 says that in a legal system with a large body of determinate legal propositions, the legal decisions by themselves cannot
278
RAM NETA
fully determine what reason they provide for the content of the law being what it is. Now, in defending this premise, Greenberg considers a foundationalist challenge to it and a coherentist challenge to it. I would like to focus on the foundationalist challenge, and Greenberg’s response to it. Here is the relevant text: Can the legal decisions determine which model is correct, thus determining how the decisions contribute to the content of the law? If the decisions are to determine which model is correct, there are two possibilities. First, a privileged foundational decision (or set of foundational decisions) can determine the role of other decisions. There is then the problem of how the decisions themselves can determine which decisions are foundational. …A putatively foundational decision cannot non-question-beggingly provide the reason that it is foundational. In sum, a foundationalist solution is hopeless because it requires some independent consideration that determines which decisions are foundational.
Now, I’d like to ask why a putatively foundational decision cannot provide the reason that it is foundational. Suppose that, when the framers drafted the American Constitution, they had included a clause that stated explicitly and precisely how the content of the law was to depend upon the legal decisions. Couldn’t their decision to include this clause be a foundational decision, and provide the reason why it is foundational? Perhaps Greenberg would object that their decision to include this clause could not have non-question-beggingly provided the reason why it is foundational: if their decision is foundational, that’s just because the decision says that it is foundational, and so its foundational character is founded in a question-begging way. But then I ask: why must the reason why a decision is foundational be non-question-begging, in this sense? I can imagine, on Greenberg’s behalf, the following response to this question: suppose that there are two putatively foundational but inconsistent decisions. In that case, neither decision can provide a reason why it, rather than the other, is really the foundational decision. And so neither decision can be foundational, except by dint of the help of some additional factor. In that case, each decision has its rational significance for the content of the law only by dint of the help of this additional factor. I’ll grant that this is true in the case in which we have two putatively foundational but inconsistent decisions. But I don’t see why it should
ON THE NORMATIVE SIGNIFICANCE OF BRUTE FACTS
279
also be true for the case in which we have only one putatively foundational decision, the dictates of which are consistent with all of the legal decisions. In short, I don’t see why there cannot be a genuinely foundational decision that provides the reason why it is itself foundational. Now, it is open to Greenberg to object that, in the case that I’ve described, what we have is a legal decision that metaphysically determines the correct model, but not a legal decision that provides a reason why one model is correct. Since I don’t have a fully firm grip on the notion of “providing a reason”, I will not object to this response. But then, if that is the response, I wonder what reason we have to think that decisions determine the content of the law by “providing reason” (in the relevant sense) for that content being what it is. So my challenge to Greenberg stands as follows: If, as a matter of contingent historical fact, the framers had included a clause explicitly stating precisely how legal decisions were to determine legal content, and this clause was consistent with all other legal decisions, then either premise 5 of Greenberg’s argument is false, or else we don’t have any reason to accept premise 3. Either way, the compellingness of Greenberg’s argument depends on a matter of contingent, and possibly unknown, facts of legal history. VI. WORKS CITED ANSCOMBE, G. E. M., “On Brute Facts”, Analysis, 18, 1958. BURTT, E. A., The Metaphysical Foundations of Modern Physical Science, Doubleday, New York, 1924. GREENBERG, Mark, “The Strange and Intelligible Metaphysics of Law”, in Villanueva (forthcoming).
!
SUPERVENIENCIA, VALOR Y CONTENIDO LEGALES
Enrique VILLANUEVA* SUMARIO: I. Introducción. II. De la superveniencia del derecho. III. Las razones, el valor y la determinación del contenido legal.
I. INTRODUCCIÓN Los problemas de la metafísica del derecho son los más fecundos y excitantes de la filosofía del derecho y resulta un placer especial repensar algunos de esos problemas centrales a propósito del trabajo del profesor Mark Greenberg.1 El profesor Greenberg se ocupa del tema fundamental del lugar que ocupan los hechos valiosos o valores en el contenido legal y aporta una nueva tesis que difiere de las dos tesis dominantes, a saber, del postivismo legal y del moralismo legal fuerte; su tesis ilumina el problema al tiempo que constituye un avance importante. Hay un buen número de cuestiones importantes que suscita este rico trabajo pero me limitaré a dos cuestiones metafísicas principales, a saber, una que toca la superveniencia del derecho y la otra que concierne la manera en que se constituye el contenido de las normas a partir de las razones y los valores. El profesor Greenberg elabora su propia tesis deslizándose entre las dos tesis dominantes del positivismo y el moralismo jurídicos. El positivismo jurídico sostiene que el contenido de las normas es de naturaleza proposicional, que es un hecho social y que se relaciona con * Instituto de Investigaciones Jurídicas, UNAM, México. 1 “The Strange and Intelligible Metaphysics of Law”. Este trabajo aparecerá próximamente en el volumen Law: Metaphisics, Content and Objectivity, compilado por Enrique Villanueva, editado por RODOPI.
281
282
ENRIQUE VILLANUEVA
los valores solo contingentemente. Puede haber derecho aún cuando el contenido de las normas no contenga valores o contenga valores negativos o anti-valores. Sostiene, además que si hay algún valor que juegue un papel en la ley ese valor debe ser interno a la ley, debe estar expresamente enunciado o implicado en el contenido de la ley. El moralismo legal, por el contrario, sostiene que el contenido de la ley incluye hechos de valor, que éstos constituyen una condición necesaria de dicho contenido o están implicados por él o mantienen una conexión conceptual, no-contingente, con los valores. Los valores que se incluyen en el contenido legal pueden ser de dos tipos, a saber, genuinos o externos a la ley o internos al contenido legal, según se apuntó más arriba. La tesis del moralismo legal fuerte sostiene además que los valores morales son condiciones suficientes del contenido legal: que basta para que haya contenido legal que haya un valor (intrínsecamente valioso). II. DE LA SUPERVENIENCIA DEL DERECHO La noción de superveniencia2 ha llegado a ser una noción central en la metafísica contemporánea. El derecho es un hecho social del mundo y como tal no puede escapar a la consideración de su status frente a otros hechos básicos del mundo, hechos tales como los hechos físicos y otros hechos sociales, como lo que Mark Greenberg denomina las decisiones legales. La cuestión que debe suscitarse es la de si el derecho superviene y de qué hechos superviene, y la forma que adopta dicha superveniencia. Aquello de lo que algo superviene se denominará la base subveniente. Mark Greenberg acepta que el hecho social del derecho superviene de la base subveniente física. Pero afirma además que el contenido legal superviene de las decisiones o prácticas legales3 y de los valores. Sostiene también que el contenido legal se genera mediante una importante relación de la determinación racional (RDR) y argumenta que dicha importante relación no queda capturada por la relación de la superveniencia y, por tanto, debe considerársela con independencia ontológica de esa relación de la superveniencia. Veamos cómo establece su tesis. 2 Sobre la noción de superveniencia consúltese el capítulo 1 de mi libro ¿Qué son las propiedades psicológicas?, México, UNAM, Instituto de Investigaciones Jurídicas, 2003. 3 Sobre esta noción de decisiones o prácticas legales consúltese el artículo de Mark Greenberg citado en la nota 1.
SUPERVENIENCIA, VALOR Y CONTENIDOS LEGALES
283
Mark Greenberg introduce dos tipos de superveniencia, a saber, una que va de los hechos físicos a los hechos legales (s1) y otra que va de los hechos legales (las decisiones o prácticas legales) al contenido legal (s2). Por transitividad inferimos que el contenido legal superviene de los hechos físicos subvenientes. De acuerdo con esta tesis, si hay una diferencia en los hechos descriptivos, habrá una diferencia en los hechos legales. De una manera más local, si hay una diferencia en las decisiones legales, habrá una diferencia en el contenido legal y, correlativamente, si hay una diferencia en el contenido legal ello implica que hubo una diferencia en las decisiones legales subvenientes. Pero Mark Greenberg no acepta esta última superveniencia pues piensa que el contenido legal tiene un elemento valorativo además del elemento de las decisiones legales y que ese elemento de valor impone una constricción epistemológica, pues a menos que intervengan razones (y con las razones se introduce el valor, como aparecerá más adelante) no habrá contenido legal determinado (ese contenido será vago o no será contenido). Mark Greenberg trata de capturar el papel teórico de las razones mediante la relación RDR, pero sostiene que la idea de superveniencia no captura la RDR e infiere que por lo tanto la RDR no superviene 2. Puede ser también que además de supervenir 2 la relación RDR alcance un status extra y que sea este status extra el que no alcanza a capturar RDR. La cuestión puede ponerse de la siguiente manera disyuntiva: lo que Mark Greenberg desea afirmar es que RDR constituye otra relación ontológicamente diferente e independiente de la relación de superveniencia 2 o bien que RDR es la forma que asume la superveniencia 2. Sin embargo, no veo por qué RDR no puede supervenir de los hechos físicos y de las decisiones legales, pues aun si se concede que la RDR es una relación epistémica, como afirma Mark Greenberg, no hay incoherencia en sostener que los hechos epistemológicos también supervienen de los hechos físicos. Hay que subrayar que la superveniencia es una relación metafísica que no prohibe que haya diferencias entre la base subveniente y aquello que superviene; lo que la superveniencia prohibe es que pueda haber una diferencia ontológica entre la base subveniente y aquello que superviene. Como la RDR no afirma ni implica una diferencia ontológica sino solamente una diferencia epistemológica, podemos concluir que RDR también superviene de la base física y de los hechos legales conceptuados como las decisiones legales. No hay absurdo al sostener que las decisiones legales, el razonamiento y los hechos
284
ENRIQUE VILLANUEVA
legales contribuyen todos a fijar el contenido legal y que por lo tanto este contenido legal superviene de toda esa base subveniente. Si no se quiere abortar la idea materialista de entrada, hay que aceptar que es posible que el razonamiento sobre el valor legal recogido bajo la RDR supervenga. Razonar y ofrecer razones no pueden mantenerse ajenos a aquello que constituye al mundo. III. LAS RAZONES, EL VALOR Y LA DETERMINACIÓN DEL CONTENIDO LEGAL
La segunda tesis que deseo considerar afirma que el contenido legal permanece indeterminado a menos que se apele a hechos de valor que lo hagan determinado. Afirma igualmente que el razonamiento legal tiene que incorporar valores para poder proveer razones y para poder arribar a algún contenido legal. Puesto de otra manera, afirma que a menos que se recurra a algún valor no habrá contenido legal y por lo tanto, no habrá proposición legal o norma individual. En contra del positivismo jurídico, Mark Greenberg sostiene que las prácticas sociales o los significados de las palabras no pueden determinar el contenido de la ley. Más generalmente, sostiene que las decisiones legales no pueden por sí mismas determinar el contenido de la ley y que si un oficial se restringe a las prácticas legales o las decisiones legales no logrará arribar a un contenido legal determinado. Mark Greenberg propone, en lugar de esa tesis positivista, que las decisiones legales junto con los valores determinen cuáles elementos de las decisiones legales son relevantes y cómo se conjuntan para lograr un contenido legal determinado. Ni las decisiones legales ni los valores, por sí mismos, independientemente uno del otro, pueden determinar el contenido legal. Es necesario que se unan las decisiones legales con los valores en el razonamiento legal para alcanzar un contenido legal determinado. De esta manera, Mark Greenberg difiere de ambos, del positivismo jurídico y del moralismo jurídico fuerte. Su tesis integra elementos de cada una de ésas dos tesis. Contra el moralismo jurídico, Mark Greenberg sostiene que los valores son incapaces de determinar el contenido legal. Los valores juegan un doble papel, por una parte, tienen un papel interpretativo, epistemológico, y por el otro alcanzan a ser constituyentes del contenido legal mis-
SUPERVENIENCIA, VALOR Y CONTENIDOS LEGALES
285
mo. El paso decisivo consiste en afirmar que en la integración del razonamiento jurídico los valores juegan un papel crucial decidiendo cuál es el contenido de la ley y en ese contenido así determinado queda inmerso el valor al que se apeló en ese razonamiento. De esta suerte los valores son a la vez hechos epistemológicos y ontológicos. En la medida en que la ley está hecha de contenidos legales y de que los valores vuelven determinados esos contenidos, los valores devienen constituyentes de la ley. Dicho de otra manera, en el proceso epistemológico de volver determinada la ley, los valores se vuelven parte de ese contenido, se vuelven constituyentes del derecho. Los valores resultan así constituyentes (metafísicos) del derecho al tiempo que alcanzan relevancia heurística pues se introducen mediante las razones en el contenido de las proposiciones legales. Pero, ¿cómo alcanzan a introducirse en el contenido legal junto con las decisiones legales? He aquí una respuesta: los valores tienen una limitación de su relevancia, a saber, que ellos determinan la relevancia de los diferentes aspectos de las decisiones legales en lo que toca al contenido de la ley. Al razonar, el juez, por ejemplo, tiene que determinar cuáles elementos de las decisiones legales son los que importan para resolver el caso legal y de qué manera importan. Para resolver esto en el proceso del razonamiento legal el juez tiene que recurrir a algunos valores, es decir, a lo que es valioso de tales o cuales decisiones legales y por lo tanto a aquello que ofrece razones suficientes que permiten zanjar y decidir el caso legal en un sentido o en otro. Ésta es la tesis que Mark Greenberg defiende y deja como una cuestión pendiente el tipo de valores (internos o externos) que se requieren. Es decir, deja esta cuestión como pendiente y por ello mismo necesitando de un argumento adicional. Pero miremos el problema más detalladamente: por una parte los valores funcionan como criterios y en este sentido tienen que ser hechos independientes que no están incluidos en las decisiones legales mismas; por la otra, son hechos valiosos, tienen un contenido valioso. Independencia y valiosidad son notas, independientes una de la otra, que tienen los valores. Me parece que es un punto puramente lógico afirmar que fijar un criterio o estándar que permita escoger entre las notas o elementos de las decisiones legales el estándar tiene que gozar una cierta independencia respecto de las decisiones legales. El metro estándar (que está en París) mide un metro y juega el papel de ser el estándar que determina si
286
ENRIQUE VILLANUEVA
una extensión dada es de un metro o no lo es, es decir, además de tener un metro de extensión, funciona como un criterio que determina la medida de alguna longitud. Este punto puramente lógico nada tiene que ver con los valores. Y si decimos que el estándar fija el valor de un metro de longitud, este sentido de valor no tiene que ver con ser intrínsecamente valioso o con ser moralmente valioso, por ejemplo. Hay un hiato entre la idea de criterio que reclama una independencia y la idea de ser valioso y tenemos que ver la manera en que esas ideas operan conjuntamente en la tesis de Mark Greenberg. De acuerdo con la tesis de Mark Greenberg los valores son necesarios para volver determinado al contenido legal. La cuestión que surge entonces es ¿son necesarios los valores debido a su independencia de las decisiones legales o debido a su valiosidad? Un juez puede considerar que tales y cuales notas de las decisiones legales son las relevantes, salientes, para lograr la sentencia, pero el juez no juzga que esas notas sean valiosas sino que, por ejemplo, se ajustan a las convenciones legales (que pueden no ser valiosas), o porque esas notas producirán algún efecto social deseado (que tampoco es valioso). El juez escogió esas notas de las decisiones legales aún si representan valores negativos o anti-valores o valores moralmente aborrecidos. Y la sentencia expedida por el juez, emitida sobre la base de razones técnicas legales, puede o no ser valiosa. ¿Se dirá acaso que el hecho de que el juez escoja alguna nota de las decisiones legales separándola de las demás notas introduce automáticamente un valor en la decisión del juez? Pareciera entonces que al juzgar el oficial escoge entre las varias notas de las decisiones legales y este acto de elegir ya involucra algo independiente; Mark Greenberg sostiene que eso que es independiente tiene que ser valioso también; el argumento de Mark Greenberg establecería que si no es algo valioso entonces no habría razón, por que ofrecer una razón implica ofrecer algo valioso y solamente si se aferra en algo (intrínsecamente) valioso habrá un contenido legal (determinado). De acuerdo con esta línea de razonamiento, el juez no estará apoyándose en razones a menos que su razonamiento incluya o implique algo valioso; esas razones van cargadas de valor. Empero, parece que se puede conceder que en el razonamiento legal se apela a algo independiente de las decisiones legales pero que utilizar criterios no implica apelar a algo que es él mismo valioso. El contenido legal puede llegar a ser algo determinado sin ninguna apelación a hechos valiosos. Creo
SUPERVENIENCIA, VALOR Y CONTENIDOS LEGALES
287
que esta disputa puede alcanzar claridad apelando a casos legales, como el del antes citado juez. Consideremos una tesis según la cual el razonamiento no involucra valores pero que proveer razones a favor de una alternativa X o Y notas de las decisiones legales sí involucra valores, un mínimo de valor. Ofrecer razones implica, para el caso de la ley, tomar en cuenta algún valor, algo que sea valioso. Pero este mínimo de valor que el juez, por ejemplo, tiene que tomar en cuenta no implica que él piense que es valioso sino únicamente que es algo que como una cuestión de hecho es valioso. Esta tesis afirma que no habrá razonamiento legal ni evaluación ni selección de posibilidades sin recurrir a valores independientes de las decisiones legales y valiosos. ¿Quiere esto decir que un acto de elección cuya razón no contiene algún hecho valioso sería ininteligible? ¿Qué aportar razones legales implica recurrir a hechos valiosas? ¿Que sin hechos valiosos no hay razones legales y no puede haber un contenido (proposicional) legal? ¿Que elegir sin recurrir a hechos valiosos sería una elección irracional o no sería elección? ¿Que ofrecer razones o elegir entre notas alternativas de las decisiones legales ya tiene incluido algún hecho valioso por lo menos? Pero esto es precisamente lo que el caso del juez legalista —harto común— pone de manifiesto. El juez legalista logra elegir mediante razonamiento una sentencia entre varias posibles y afirma que su elección es la mejor entre las alternativas posibles (entre ellas deja de lado una alternativa que recurre a valores que no están en el texto de la norma ni de las decisiones legales y que tal vez se opone a dicho texto) pues se apega al texto de la norma general y de las decisiones legales. Este juez logra una elección legalmente fundada sin tomar en cuenta ningún valor particular. El juez puede tener una concepción general de acuerdo con la cual la observancia del texto de la ley preserva la estabilidad social, o alguna otra, pero ningún valor particular se sigue de esa concepción general; más importante aún, no se sigue que tenga que incluir un valor moral determinado. Es verdad que este juez legalista asume un valor en su elección, a saber, que él considera necesario mantenerse tan cerca del texto legal tanto como sea posible. Pero este valor es como un precepto general, una regla de procedimiento —común entre los oficiales del Poder Judicial— que no tiene valor intrínseco como pretenden tenerlo los valores morales. Es
288
ENRIQUE VILLANUEVA
un valor mínimo, no-moral, que puede dar resultados moralmente malignos como fue el caso en la Alemania Nazi. Resumiendo este segundo punto pienso, que hay dos situaciones en las casos legales, a saber, una de acuerdo con la cual no hay ningún valor intrínseco en la determinación del contenido legal, solamente el texto invocado y otra, de acuerdo con la cual hay algunos valores involucrados. Esta segunda posibilidad se ramifica en otras dos posibilidades, a saber, que los valores invocados se encuentran ya contenidos en las decisiones legales o en las normas generales y otra más, según la cual los valores se importan desde afuera del texto de la ley. Pienso que Mark Greenberg solamente acepta esta última posibilidad. Someto a consideración las siguientes tesis: que en los casos legales hay un hiato entre el razonamiento, ofrecer razones y apelar a hechos de valor; que no hay una conexión necesaria o conceptual obvia entre ambos y que por lo tanto es menester ofrecer un argumento adicional que establezca una relación necesaria entre razones, valores y contenido legal. Que se puede razonar válidamente un caso legal y alcanzar un contenido legal determinado sin recurrir necesariamente a algún hecho (intrínsecamente) valioso.
LA FILOSOFÍA PERENNE. UNA PROPUESTA VIGENTE PARA LA FILOSOFÍA CONTEMPORÁNEA DEL DERECHO Martín HERNÁNDEZ* ...hubiera sido vano de mi parte pretender que yo iba a triunfar allí donde los más ilustres pensadores han fracasado, verdaderamente, no sé ni puedo afirmar qué es la justicia, la justicia absoluta que la humanidad ansía alcanzar, sólo puedo estar de acuerdo en que existe una justicia relativa y puedo afirmar qué es la justicia para mí...** La posesión y la práctica de lo que a cada uno es propio será reconocida como justicia. ***
SUMARIO: I. Una reflexión inicial. II. Lo perenne. III. La Antigüedad y la Edad Media deben ser escuchadas. IV. ¿Qué puede aportar la filosofía perenne a la filosofía del derecho contemporánea?
No puedo pasar por alto mi gratitud al Instituto de Investigaciones Jurídicas de la UNAM, por permitirme compartir algunas reflexiones sobre la filosofía del derecho; alabo al Instituto por organizar este tipo de encuentros de ideas acerca de lo jurídico, pues soy un convencido que el hombre está llamado a buscar la verdad y en este caso particular la verdad de lo jurídico.
* Universidad Anáhuac del Sur, México. ** Hans Kelsen, ¿Qué es la justicia? *** Platón, La República. 289
290
MARTÍN HERNÁNDEZ
I. UNA REFLEXIÓN INICIAL Surge en mí la necesidad de realizar una aclaración inicial. Este trabajo no tiene otro objetivo que el de rescatar la riqueza del pensamiento clásico con relación a la filosofía del derecho, a la esencia de éste y a su manera de expresarse. Tengo claro que no solucionaré con ello toda la complejidad que hoy se despliega alrededor de diversos tópicos jurídicos, pero sí podemos encontrar en ese pensamiento una luz que poco a poco nos guíe hacia la esencias de la ciencia del derecho. No trato de convencer, sino de exponer cómo el hombre contemporáneo puede dar respuesta desde esta perspectiva a algunos problemas que se le presentan. En concreto, se trata de explicar cuál sería la aportación que podemos esperar de la filosofía perenne. Partiendo del dato de la experiencia podemos observar que, como nunca, el hombre se desarrolla de múltiples formas, que asume muy diversos y variadas funciones y está al pendiente de un sin fin de cuestiones y preocupaciones; que la complejidad representa un reto que está dispuesto a enfrentar, que si bien la tecnología se le presenta como una solución para hacer frente a dicho laberinto, paradójicamente, el hombre al parecer más dominador y más controlador de situaciones, se ve perdido e impotente ante cuestiones como su persona, su familia, su salud, etcétera. En efecto, el hombre que controla las grandes empresas, maquinarias poderosas, autos que alcanzan altas velocidades, que se comunica al otro lado del mundo de manera inmediata, no puede hacer frente a sus angustias, depresiones y neurosis. ¡Que paradoja más grande! Pero no queda allí la situación, cómo es posible comprender que el hombre estructure grandes consorcios, economías, e incluso Estados; que busque consensos, estrategias financieras y en un momento dado no vea que la comunidad más simple, más minúscula, como la familia, esté más afectada y deteriorada. La lluvia de ideas se ha convertido en un instrumento de poder, en donde el hombre se ha dado cuenta que entre más confusión más posibilidades de sobresalir y de triunfar se tienen. Antes se decía “divide y vencerás”, ahora debemos decir confunde y vencerás. Sí, es tanta la información que se maneja y circula, que el hombre se ha convertido en un repetidor, más que en un ser reflexivo y valorativo, siendo que esto es lo propio de él. Actualmente la rapidez de los acontecimientos y esa complejidad de la que he hablado hacen que la persona
LA FILOSOFÍA PERENNE
291
no cuente con el tiempo y espacio para cuestionar y descubrir la realidad de las cosas, las cuales —nuevamente la paradoja— son más simples de lo que se piensan. Pero, ¿y el derecho?, ¿qué tiene que ver con lo anterior?, desafortunadamente corre la misma suerte, vivimos en la paradoja de lo jurídico, pues como nunca se escribe sobre derechos humanos, derecho de familia, la vida, la libertad, etcétera, cuántos de estos temas, por dar un ejemplo, se encuentran en el debate diario, en el diálogo, en la política, y no obstante, parece que nos alejamos de vivirlos plenamente. Una cruda ironía que enfrentamos día con día. Se habla y estudia la libertad y cada vez se es más preso del egoísmo y sed de poder; sobran discusiones y textos sobre el respeto a la vida y cada vez más se atenta contra ella; hoy el consenso es la medida y no logramos ponernos de acuerdo; la tolerancia es un valor supremo en la actualidad y no somos capaces de respetar el derecho de los otros. Todo esto no me hace más que lanzar la pregunta ¿qué le está pasando al derecho?, ¿dónde está la justicia? ¿No será acaso, me llego a preguntar, que estamos perdidos dentro de lo vertiginoso de la vida?, acaso la velocidad de lo novedoso se le está presentando al hombre como un vicio, pero dando la apariencia de apetecible lo confunde y ofusca. No podemos negar que esta novedad ha sido desde el siglo pasado una adicción, actualmente no importa tanto lo verdadero como lo novedoso, entre más novedosa sea una doctrina, filosofía o una idea, más valor se le concede y si se le agrega un toque de confusión y complejidad es totalmente plausible. Esta novedad toma como premisa, y al parecer es un requisito para su éxito, el descartar todo lo que sea anterior a ella. De este modo lo antiguo o lo pasado queda descartado por el sólo hecho de serlo. Así, novedad y complejidad son sinónimos de éxito, poder y sabiduría. Sí, de sabiduría, pues hoy esta última no se mide por la profundidad con que se aborda o se enfrenta una problemática, sino más bien por la extensión con que se presenta. Actualmente el hombre prestigiado y reconocido no es el que enfrenta la realidad y trata de llegar a la esencia de las cosas, sino más bien aquel que maneja más datos o información, sea cual fuere el fin que se le dé. Se presentan como nuevos los viejos grandes problemas del hombre, basándose en tesis evolucionistas, cambios sustanciales, nuevas estructuras mentales, como si el hombre en esta vertiginosa evolución un día dejara de ser hombre para transformarse en otra cosa, donde evolución es
292
MARTÍN HERNÁNDEZ
sinónimo de trasformación, así que según esta concepción tenemos que esperar el momento de transformarnos. No estamos en contra de lo novedoso, sino más bien contra lo novedoso no sujeto a una crítica y reflexión que permita hacer frente a la realidad y a descubrir la verdad. Como dije, no es un reproche, sino una invitación a la reflexión profunda, a la reflexión filosófica. II. LO PERENNE Considero que el hombre no es un ser que va brotando momento a momento, sino un ser que trasciende, su constitución ontológica da prueba de ello. En esta esencia humana existe algo que permanece y que lo hace ser lo que es y no otra cosa. Ante esto, muchos argumentarán en contra el aspecto evolutivo y de cambio que aparentemente hoy más que nunca se observa, a ello debemos afirmar que el hombre dentro de esa esencia es un ser histórico y que como tal está sujeto a una historicidad, entendiendo por ésta “la mudanza permaneciendo en el mismo ser y, por tanto, permaneciendo un sustrato o núcleo inmutado”1 de lo que se sigue que hay una esencia inmutable que al operar nos permite hablar de naturaleza, en este caso, de naturaleza del hombre, pues como señala Santo Tomás de Aquino “a toda naturaleza corresponde, en efecto, algo fijo y determinado, pero proporcionado a ella”,2 sólo a partir de aceptar la existencia de un naturaleza es que podemos discernir una serie de normas y reglas propias y objetivas. El conocimiento de la naturaleza de las cosas es lo que permite hablar de una filosofía y de una filosofía perenne concretamente. De una filosofía, porque como ciencia del ser por sus primeros principios obtenidos por la razón natural, permite no sólo explicar las cosas sino desentrañar sus causas últimas y sus fines propios. De allí que sea necesario conocer los principios o aquello por lo cual es, o se conoce, o se hace,3 pues sólo así existirá verdad en los juicios emitidos. Lo anterior nos posibilita para referirnos a una filosofía perenne, entendiendo por perenne un adjetivo que expresa algo continuo, incesante,
1 2 3
Hervada, Javier, Introducción crítica al derecho natural, España, Eunsa, 1999, p. 99. Aquino, Tomás de, Suma teológica, I-II, q.10, a. 1, ad 3. Véase Caturelli, Alberto, La filosofía, España, Gredos, 1977, p. 30.
LA FILOSOFÍA PERENNE
293
que no tiene intermisión o interrupción;4 de allí que hablemos de permanencia. En efecto, cuando me refiero a la filosofía perenne hago referencia a esa filosofía que ha descubierto los principios de las cosas, la esencia de las mismas y a partir de ellos ha tratado de dar una respuesta a los problemas que el hombre como hombre enfrenta, es una filosofía básicamente generada en la Antigüedad y en la Edad Media pero que es actual, pues nunca se aleja de la realidad concreta. Muchas veces se piensa que esa filosofía es inoperante y por lo tanto ajena a las “nuevas” problemáticas, todo ello bajo la visión de lo novedoso a la que me he referido, pero no es así, la filosofía es vida y ambas no pueden ir separadas, pues en términos del maestro Caturelli: el acto de filosofar es inseparable de la situación concreta, en la cual existe el filósofo, y por eso asume desde dentro todos los problemas de semejante situación. Sería sencillamente absurdo e imposible pretender filosofar, pensar, haciendo abstracciones de nuestra actual situación concreta; como si pretendiéramos pensar repitiendo intemporalmente las fórmulas de una escuela o asumir los problemas de otra época. Esto es imposible y semejante actitud suele proporcionar una falsa “seguridad” y un dogmatismo que nada tienen de filosóficos y que están tan separados de la realidad como la nada del ser. Cierto es, naturalmente, que la verdad es supra-histórica, y por eso mismo legítima la filosofía; pero también es simultáneamente verdadero que jamás se piensa fuera de la situación concreta.5
De este modo la filosofía perenne es la búsqueda de la verdad, que como tal es trascendente, y que al ir descubriendo principios sólidos permite explicar y solucionar problemas actuales, pues el desentrañar las causas últimas de lo creado da certeza y razón de lo existente, dando soluciones a los problemas de hoy y de siempre, pues mientras exista un hombre en esta tierra los problemas que aquejen a su esencia y si ésta es lo que lo hace ser, una solución adecuada será siempre válida y universal.
4 5
Diccionario de la Lengua Española. Caturelli, op. cit., nota 3, pp. 31 y 32.
294
MARTÍN HERNÁNDEZ
III. LA ANTIGÜEDAD Y LA EDAD MEDIA DEBEN SER ESCUCHADAS Espero estar siendo claro en la exposición, no se trata de desechar lo nuevo por nuevo, ni lo antiguo por antiguo, se trata sólo de descubrir la verdad de las cosas, la realidad de las mismas, sometiendo cada solución, cada opinión, a un juicio crítico, para ello es necesario sujetarse al juicio de los Primeros Principios, pues sólo éstos nos permitirán saber que la opinión o solución planteada es la mejor y más adecuada para hacer frente a las situaciones conflictivas que vivimos. Es tiempo de alejarnos del relativismo e inmanentismo, que han probado ser ineficaces para solucionar los conflictos humanos, hemos confiado ciegamente en la razón cayendo en un racionalismo que nos llevó a perder de vista la realidad, hemos intentado por el voluntarismo y ello a costado muchas vidas humanas, ahora vemos en el consensualismo y en liberalismo la salida a nuestros problemas y hoy son más complejos. Es necesaria volver a la realidad, dejarnos de perjuicios absurdos y atender a la experiencia y sabiduría, que como sabiduría es válida para cualquier tiempo, redescubramos esa sabiduría, fiel a la esencia y naturaleza de las cosas, no importando quién o cuando fue descubierta, sino atender a que es capaz de solucionar los problemas por sus causas últimas. Volvamos al ser de las cosas. No puedo dejar de sorprenderme al leer en los diálogos de Platón que muchos de los problemas discutidos son actuales, al leer en ese autor sobre la justicia, la voluntad, las leyes, el gobierno, entre otros. Parece ser que el enfrentamiento de Sócrates con los sofistas es una discusión contemporánea, los mismos argumentos, las mismas objeciones, la lucha entre el relativismo sofista y la objetividad platónica es diálogo actual. Cuando uno profundiza en la ética aristotélica, en su Tratado de la justicia o en su Política, descubre principios arrancados de la realidad, no se diga al hablar de las leyes, en donde queda demostrado que con la luz natural de la recta razón el hombre de la antigüedad logró descubrir cosas de suyo valiosas y por ende verdaderas. No se diga cuando uno lee en la Suma teológica respondiendo el Aquinate a las objeciones sobre la justicia, la ley natural, el valor de lo justo y otras cuestiones, que si bien son dichas por un no jurista, toman valor por sí solas pues son apegadas a la verdad de las cosas y no al subjetivismo de su autor.
LA FILOSOFÍA PERENNE
295
Es cierto que la antigüedad no tenía nuestra tecnología y su ciencia era mucho más especulativa y menos “justificada empíricamente” que la actual, pero en la antigüedad sabían estudiar al hombre bajo ciertos aspectos, con más profundidad que hoy, porque trataban de moverse precisamente no sólo en la superficie de las apariencias, sino también observando los fundamentos metafísicos de la condición humana.6
Debe quedar claro, siguiendo al maestro Giovanni Reale: “absolutamente no es un regreso acrítico a ciertas ideas del pasado, sino la asimilación y fruición de algunos mensajes de la sabiduría antigua que, si son bien asimilados y meditados pueden, aunque no logren curar completamente, al menos alcanzar atenuar los males del hombre de hoy, erosionando las raíces de las cuales derivan”.7 Pero permítanme dar unos breves ejemplos: Muchos de los alumnos de mi cátedra de filosofía del derecho, al tocar el tema del derecho natural y del derecho positivo, se sienten inmersos en una problemática actual, candente y novedosa, al menos de inicios del siglo XX a la fecha, qué sucede cuando leemos estos pasajes:
El primero de Aristóteles, que señala: “En el derecho político, una parte es natural, y la otra es legal. Es natural lo que, en todas partes, tiene la misma fuerza y no depende de las diversas opiniones de los hombres; es legal todo lo que, en principio, puede ser indiferente de tal modo o del modo contrario, pero que cesa de ser indiferente desde que la ley lo ha resuelto”. El Aquinate dice: El derecho o lo justo es cierta obra adecuada a otra según algún modo de igualdad. Pero de dos maneras puede algo ser adecuado a algún hombre: primera, por la misma naturaleza de las cosas; por ejemplo, cuando alguien da tanto para recibir otro tanto igual y esto se llama derecho natural: segunda, por convenio o de común acuerdo; por ejemplo, cuando alguien se da por contento si recibe tanto. Esto último puede hacerse de dos modos: primero, en virtud de algún convenio privado, como cuando se firma 6 7
Reale, Giovanni, La sabiduría antigua, España, Herder, 1996, p. 17. Ibidem, p. 16.
296
MARTÍN HERNÁNDEZ
un contrato entre personas privadas; segundo, en virtud de un convenio público; por ejemplo, cuando todo el pueblo conviene en que algo se dé por adecuado y conmensurado a otra cosa, o cuando esto lo ordena el príncipe, que tiene a su cargo el cuidado del pueblo y lo representa; y esto se llama derecho positivo.8
Considero que tanto en la antigüedad como en el medioevo sabían algo de derecho positivo y de derecho natural. Pero hay más ejemplos: hoy existe un tema muy tratado y debatido: el de los derechos humanos, el cual, mirando atrás, se hace referencia a la escuela de derecho natural, al siglo XVI, con el iusnaturalismo moderno, la Revolución norteamericana y la francesa, creyeron que no sólo la antigüedad y la Edad Media no los conoció, sino que siempre fue contra ellos, pues se piensa inmediatamente en la esclavitud, el supuesto oscurantismo del medioevo, etcétera, a ello debemos responder con el siguiente pasaje de Santo Tomás: Según el orden de las inclinaciones naturales, así es el orden de los preceptos de la ley natural. Pues bien, en primer lugar, radica en el hombre la inclinación al bien según su naturaleza en el cual conviene con todas las sustancias, y así cualquier sustancia apetece la conservación de su ser según su naturaleza, y por esta razón pertenece a la ley natural todo aquello que contribuye a la conservación de la vida del hombre e impide su destrucción. En segundo lugar, radica en el hombre la inclinación a cosas más concretas según su naturaleza en la que conviene con los restantes animales, como la unión del macho y la hembra, la crianza de los hijuelos y cosas semejantes. Por último, radica en el hombre al bien según su naturaleza racional, que le es propia y exclusiva, y así el hombre tiene inclinación natural a conocer la verdad acerca de Dios y a vivir en sociedad, y por esta razón pertenece a la ley natural que el hombre evite la ignorancia, que no ofenda a los demás hombres con los que tiene que convivir y cosas semejantes.9
En el pasaje citado encontramos un fundamento sólido, basado en la naturaleza humana del derecho a la vida, a la unión marital, a la participación política, y la educación. No se basa el Aquinate en deducciones lógicas como algunos naturalistas muestran los derechos humanos, sino 8 9
Aquino, II-II q. 57, a. 2. Aquino, I-II q. 94, a. 2.
LA FILOSOFÍA PERENNE
297
en la realidad del ser personal del hombre, con fundamento metafísico y por ende real. Pero para no caer en lo que se pueda pensar una abstracción, que hoy espanta a muchos, pues se piensa en ella como sinónimo de utópico, de irreal, inalcanzable— lo cual no sé si se dice por desprecio o por ignorancia, pues lo abstracto es el pensamiento propio del hombre y, como ejemplo, el propio concepto de derecho que es absatracto—me dirigiré por último, al ámbito práctico, como es el caso de la seguridad jurídica, que se muestra como una obra del positivismo jurídico, quien aparece como creador de esa garantía a través del constitucionalismo o la estructura estatal y de un Estado de derecho. Pues bien, veamos lo siguiente: “El juzgar pertenece al juez en cuanto que goza de pública potestad y por tanto debe informarse en el juicio, no como persona privada, sino como persona pública. Esta información atiende a dos extremos: primero, a las leyes públicas, contra las cuales no puede proceder, y segundo, al caso particular, mediante los testigos y otros documentos legítimos”.10 Nuestro autor sigue diciendo: “El juez es intérprete de la justicia. Pero la justicia entraña alteridad. Por consiguiente es necesario que el juez juzgue entre dos, de los cuales uno es el acusador y el otro el reo. No se puede acusar a nadie en juicio si no tiene acusador.11 Pero nuestro citado autor también conoce la distinción entre denuncia y querella y lo expresa así: “Cuando el delito es tal que redunda en detrimento de la sociedad, está uno obligado a acusar, siempre que pueda probar suficientemente su acusación... Pero si el delito no redundara en perjuicio de la comunidad o no pudiera probarlo suficientemente, no estaría obligado a acusar, pues nadie está obligado a lo que no puede hacer de modo debido”.12 Este autor aparece como todo un defensor de las garantías del acusado o reo, es más, parece que está de acuerdo en las campañas actuales sobre la denuncia de delitos. Pues bien, este autor es Santo Tomás de Aquino, del cual he citado varios fragmentos de su obra, la Suma Teológica. Lo he hecho sin otra intención que invitar a los juristas contemporáneos a escuchar a esa filosofía perenne a estudiarla y, si es necesario, volverla
10 11 12
Aquino, II-II q. 67, a. 2. Aquino, II-II q. 67, a. 3. Aquino, II-II q. 68 a. 1.
298
MARTÍN HERNÁNDEZ
a estudiar, tal vez encontremos algunas respuestas vigentes a la problemática actual. IV. ¿QUÉ PUEDE APORTAR LA FILOSOFÍA PERENNE A LA FILOSOFÍA DEL DERECHO CONTEMPORÁNEA? Llego el momento de señalar lo que desde mi punto de vista puede aportar concretamente la filosofía perenne a la filosofía del derecho contemporánea, lo cual he resumido en cinco puntos que considero básicos, reitero que no niego la importancia de la filosofía contemporánea sólo propongo que ésta sea perfeccionada por la filosofía perenne y que así de cada una se tome lo que de verdadero tienen, pues ello redundará en el bienestar del hombre: Primero es necesario volver a la realidad y por ende a la verdad, pues el hombre está dotado de una inteligencia y voluntad, las cuales le permiten descubrir esa realidad que lo rodea y actuar en consecuencia, debe esforzarse por ser penetrativo en sus reflexiones permitiendo dotar a las ciencias, en este caso a la ciencia jurídica, de principios sólidos a partir de los cuales se piensen los problemas. Principios que deben por un lado coadyuvar a la labor legislativa y por otro dar la solución más justa a los conflictos de intereses que se presentan. No se trata de ocupar esas facultades en crear falacias, que tarde o temprano se vuelven contra el hombre, ni tampoco hacer uso de ellas para intereses personales, sino que, fieles a esos principios deben hacer realidad la objetividad de la justicia. Que sea la realidad la que mida al hombre y no que sea el hombre el que pretenda generar la realidad, ya que esto último podría acarrear, como de hecho ha ocurrido, que tarde o temprano el hombre se encuentra desconcertado, preguntándose ¿dónde estuvo la falla?, ¿qué estuvo mal?; es necesario alcanzar un conocimiento reflejo de la realidad, que sea como “la imagen reflejada en el espejo; la imagen no es el objeto reflejado, pero existe el objeto reflejado y por eso la imagen es verdadera”.13 Es así como el filósofo contemporáneo debe partir de la realidad, y no del querer y del pensar, pues puede ello generar juicios que pudieran ser erróneos. El derecho es uno, que si bien se predica de muchas cosas,
13 Hervada, Javier, Lecciones propedéuticas de filosofía del derecho, España, Eunsa, 2000, p. 61.
LA FILOSOFÍA PERENNE
299
existe en él una esencia real, misma que es deber del estudioso de la filosofía del derecho descubrir. En segundo lugar, es indispensable recuperar la metafísica, pues sólo ella es verdadero fundamento para una adecuada filosofía del derecho. Comparto la opinión del doctor Hervada de que el abandono de la metafísica es una de las causas del inmanentismo contemporáneo que en sus distintas formas se presenta en diversas filosofías del derecho, pues a decir del profesor de Navarra: “La raíz de estos movimientos hay que encontrarla en el abandono de la metafísica. Rechazada la metafísica, resulta una consecuencia directa e inmediata el total repudio de cualquier concepción trascendente del hombre, de la sociedad y del derecho, pues sólo la metafísica accede a las causas últimas y a la íntima esencia de la realidad.”14 Tan es así que el sólo hecho de preguntarnos por el fundamento último del derecho nos ubica en una actitud metafísica, pues sólo esta ciencia es la que nos puede responder esa pregunta, y a partir de su respuesta se podrán explicar los conceptos de la ciencia jurídica o de la teoría general del derecho. Debo aclarar que hablo del fundamento último del derecho, no de definiciones o meros conceptos, sino de la pregunta última de lo jurídico, por tanto de su ser y en consecuencia del orden de las cosas. La Antigüedad y la Edad Media pueden aportarnos mucha luz en esta cuestión. En tercer lugar, y no por ser menos importante, me referiré a la necesidad de volver a la persona. Hoy el hablar de persona en la jerga jurídica es aceptar sin más miramientos que estamos ante un ente imputable de derechos y obligaciones. Considero que la filosofía del derecho debe ir más allá, pues es su objeto propio preguntarse por qué ese ente puede ser sujeto de derechos y obligaciones, qué facultades y apetencias lo ubican en esa posición, por qué sólo el ser personal es capaz de ello. Pues si a una persona se le puede imputar un derecho o una obligación es porque está en aptitud de recibirlo, es decir, la persona en su constitución ontológica es de suyo jurídica, esa juridicidad no es algo puesto a añadido, sino que forma parte de su ser, de allí que resulta importantísimo que la filosofía del derecho no pierda de vista el ser personal del hombre en su esencia y naturaleza, en este sentido nuevamente el doctor Hervada señala: “Nada jurídico podría el legislador dar, si ese acto de dar no se asen14
Ibidem, p. 582.
300
MARTÍN HERNÁNDEZ
tase en un núcleo de juridicidad dado por la naturaleza: faltaría el supuesto ontológico. El legislador da leyes, porque el hombre está naturalmente hecho para recibirlas; da derechos, por que el hombre es naturalmente capaz de ser titular de ellos”.15 Considero que no podemos encontrar mejores estudios acerca de la persona, que aquellos que ofrece la filosofía perenne, radicando allí la importancia de su estudio y vuelta a ella, pues estoy convencido que del concepto que de persona se tenga, será la idea que de derecho se maneje. Un cuarto punto es el rescatar la concepción del derecho como objeto de la justicia, percibido por Sócrates, desarrollado por Aristóteles, aplicado por el mundo romano y sistematizado en Tomás de Aquino. Es indispensable comprender cómo la justicia exige la existencia de un derecho sobre el cual actúe, siendo éste su objeto propio; no se trata de entrar en discusiones, sólo decir que el orden natural que se ha venido descubriendo a lo largo del devenir histórico acredita que para que se pueda hablar de justo o injusto es necesario que alguien tenga algo que sea suyo, pues sobre lo suyo el hombre podrá discernir y actuar en justicia, esto suyo es el derecho, esa cosa que le es debida a una persona ya por naturaleza, ya por voluntad, pues de lo contrario la justicia deja de ser objetiva y real para convertirse en un concepto vacío y lleno de subjetivismo que está a la disposición del más hábil o con mayor poder. La realidad de la justicia debe imponerse, como plantearon los autores citados, como valor en sí mismo trascendente y no como algo relativo y cambiante; a partir de ello se podrá descubrir una adecuada concepción del derecho, que si bien se predica de muchas cosas, tiene en sí mismo una esencia propia y real. Para finalizar y como quinto punto sería apropiado que se tome en cuenta el estudio de la filosofía perenne respecto a la unidad de lo jurídico, en los pasajes antes citados de Aristóteles y Santo Tomás ya se hace referencia a que el derecho es natural y positivo, pero se presentan ambos sin enfrentamientos, sino más bien como un orden de derivación, no desperdiciemos nuestros esfuerzos en luchas inútiles, sería mejor fortalecer ese único sistema jurídico, el cual es en parte natural y en parte positivo. Como señalé al principio de esta exposición, no se trata de convencer o imponer una doctrina, lo que he pretendido es que la filosofía contem15
Hervada, Javier, Introducción... op. cit., nota 1, p. 86.
LA FILOSOFÍA PERENNE
301
poránea del derecho tome su compromiso con la verdad, esté donde esté pues la verdad no se impone, sino que se propone. Ésta es mi propuesta concreta, la cual queda resumida en los puntos citados. Recibamos la filosofía perenne sin perjuicios, sin predisposiciones, que sea ella misma la que nos conquiste o nos aleje, recibámosla como en su momento la escuela de derecho natural apostó por el derecho romano que permitió el inicio de su tercera vida, a beneficio de inventario, sí, a beneficio de inventario, tal vez nos enriquezca, escuchemos la sabiduría que nos antecede, en esa pluralidad actualmente tan de moda debe haber cabida para ella, a lo mejor resulta ser novedosa a pesar de todo.
!
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS Carla HUERTA* SUMARIO: I. Introducción. II. El sistema de fuentes. III. La estructura del sistema de fuentes. IV. El sistema jurídico y las fuentes del derecho.
I. INTRODUCCIÓN La relevancia del análisis del sistema de fuentes del derecho radica principalmente en su vinculación con la validez y aplicabilidad de las normas, esto se debe a que la pertenencia de éstas al sistema jurídico se define a partir de su origen o modo de producción, no obstante, su obligatoriedad depende en cambio, de otros factores, como por ejemplo, de su vigencia. Esto lleva a reflexionar sobre la posibilidad de distinguir entre la pertenencia de las normas a un sistema jurídico y su validez, y por ende, a cuestionar la posibilidad de distinguir entre las reglas de reconocimiento y las reglas de cambio como hace Hart.1 Por otra parte, en relación con la estructura constitucional, el sistema de fuentes no solamente constituye un elemento fundamental para el análisis de la dinámica del derecho, sino que debe ser considerado como correlativo al sistema de control de la constitucionalidad,2 independientemente de que las fuentes han formado parte, tanto del derecho como de su estudio, desde tiempo antes de que se concibiera la necesidad de establecer un control de la constitucionalidad. * Instituto de Investigaciones Jurídicas, UNAM, México. 1 Hart, H. L. A., El concepto de derecho, trad. de Genaro Carrió, Buenos Aires, Abeledo-Perrot, 1968, pp. 116-123. 2 Véase Huerta, Carla, “Constitución y diseño constitucional”, Estado de derecho y transiciones, Caballero y de la Garza (eds.), México, UNAM, 2002, pp. 28-31. 303
304
CARLA HUERTA
En el presente ensayo se pretende conocer la fuerza de las normas jurídicas y sus relaciones en un sistema jurídico estructurado conforme a los lineamientos de la teoría contemporánea del derecho constitucional. Esto se hará mediante el estudio del sistema de fuentes, ya que en virtud de la forma de producción o por los efectos que pueden producir las normas, es posible atribuirles un peso diferenciado. De manera complementaria se revisará la cuestión relativa a la fuerza de las normas en términos de su validez, lo cual conlleva admitir diversos presupuestos de funcionamiento del sistema jurídico3 y de los modos en que las normas se ordenan y relacionan. Es por ello que se partirá de la concepción del sistema jurídico como una pirámide compleja, en la que las normas que pertenecen a éste, se encuentran jerárquicamente subordinadas a la norma que establece su proceso de creación, y así sucesivamente hasta llegar a la primera norma, la Constitución, a la cual se deben conformar todas las normas del sistema. De tal forma, que la Constitución constituye el parámetro de referencia de las normas del sistema, ya que al establecer los procedimientos de creación, genera un sistema de fuentes, atribuyendo a cada fuente una posición y función distinta. Cada sistema jurídico puede contener uno o varios criterios de ordenación de sus normas, pero se puede afirmar que los criterios fundamentales son los de jerarquía y competencia. En término generales, el sistema de fuentes puede ser visto desde dos perspectivas en principio, como facultades y procedimientos de creación normativa (órganos con capacidad de modificar el sistema jurídico), o como tipos de normas (relaciones entre las normas). Además, existe otra posibilidad que ha sido desarrollada por la teoría de la argumentación, que es considerarlas como razones en la aplicación e interpretación de las normas. A pesar de que es posible hacer esta distinción, vale la pena 3 El sistema jurídico debe cumplir con ciertos requisitos de funcionamiento como son el de coherencia e integridad que se encuentran aparejados a la noción de dinámica del propio ordenamiento jurídico. La coherencia del sistema jurídico implica además de una pretensión de ausencia de contradicción entre las normas de un mismo ordenamiento, es decir, consistencia, la congruencia de sus contenidos. La integridad se refiere también a la forma en que el sistema jurídico ha de ser interpretado, esto es, como una unidad sistemática, en la cual existen diversas relaciones entre las normas que lo componen, las cuales siempre deberán ser interpretadas como un todo. Sobre las denominadas propiedades formales del sistema jurídico véase Huerta, Carla, Conflictos normativos, México, UNAM, 2003, pp. 130-135.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
305
mencionar desde ahora, que las tres perspectivas se encuentran estrechamente relacionadas. II. EL SISTEMA DE FUENTES 1. El significado del concepto de fuentes La primera interrogante que debe ser resuelta para poder hablar de las fuentes del derecho es la determinación del significado del concepto de fuente, aunque cabe aclarar que no es mi intención dar una definición del concepto de fuente, ya que el hacerlo no resolvería la cuestión, puesto que el problema de las fuentes se centra más bien, en la identificación y organización de los criterios ordenadores de las mismas, lo cual permite conocer las relaciones que se generan entre éstas. La doctrina ha sostenido que el término fuente4 se refiere al lugar de donde el derecho procede, es decir, al origen de la norma, o más bien, a aquellos actos a los cuales el derecho concede eficacia de creación normativa. En otras palabras, el término “fuente” se refiere a los distintos tipos de procedimientos de creación normativa de normas “generales”, o mejor dicho, a las normas que regulan dicho procedimiento. En cuanto a la generalidad de la norma, se puede decir que ésta bien se refiere al supuesto en relación con el sujeto o la ocasión. En el caso de que se refiera al sujeto, es decir, a quien se dirige la prescripción, la generalidad implica que el destinatario de la norma no se encuentra definido de manera específica. Para Von Wright, existen distintos tipos de prescripciones, así la norma puede ser particular si se refiere a un individuo en específico, o general, cuando se dirija a una clase de personas que responden a una determinada descripción. La ocasión determina la temporalidad y localización del contenido de la norma. Ésta puede tener 4 Si bien el origen del término “fuente”, parece ser más bien metafórico, los teóricos del derecho han admitido su uso desde hace mucho tiempo. En la mayoría de los libros sobre teoría del derecho se encuentra referido a los tres tipos clásicos de fuentes: las formales, las reales y las históricas. De estas dos últimas no me ocuparé, puesto que sólo me interesa revisar las fuentes como procesos de creación de normas jurídicas. El estudio de las fuentes reales, es decir, de los agentes y factores que determinan el contenido de las mismas, corresponde a otras disciplinas. El aspecto que me interesa revisar de las fuentes formales, es la validez y aplicabilidad de las normas, más que los elementos que integran los procesos específicos de creación de normas.
306
CARLA HUERTA
distintos grados de generalidad según Von Wright, así, considera que una norma es particular cuando la prescripción es para una ocasión específica. Es general en cambio, si es para un número ilimitado de ocasiones, éstas pueden ser a su vez, conjuntiva o disyuntivamente generales. Estas consideraciones llevan a Von Wright a concluir que una norma es particular cuando es particular con relación al sujeto y la ocasión. Son generales en cambio, si las prescripciones son generales con relación al sujeto o la ocasión, y en caso de serlo ambas, entonces considera que la prescripción es eminentemente general. 5 El principio de ordenación jerárquica de las normas en el orden jurídico utilizado por Kelsen obedece al criterio de generalidad, en virtud de lo cual la Constitución adquiere el rango supremo. La inclusión de las normas individualizadas en la base de la famosa pirámide se debe a la colaboración de Merkl, y debido a su carácter ocupan el nivel jerárquico más bajo.6 Esta estructura piramidal, sin embargo, solamente indica el orden jerárquico de las normas en un sistema jurídico, pero no implica una asimilación de todas las normas que lo integran a la categoría de fuentes del derecho. De hecho, para Ignacio de Otto no es correcto definir las fuentes como actos que producen normas generales, ni tampoco haciendo referencia al criterio de permanencia solamente, es más, De Otto señala que incluso el criterio de la aplicación judicial es insuficiente para identificar las fuentes, sobre todo en el ámbito del derecho administrativo.7 Sin embargo no propone un criterio de identificación, ni explica por qué razones cierto tipo de actos normativos son incluidos en la lista de fuentes que indica, pero otros son excluidos. A pesar de la observación de De Otto, considero que para la identificación de las fuentes es importante partir de la generalidad de las normas para comenzar a determinar el universo de las fuentes. De otra manera, todos los actos de carácter normativo quedarían incluidos en la clase de 5 Von Wright, Norma y acción. una investigación lógica, trad. de Pedro García Ferrero, Madrid, Tecnos, 1979, pp. 93-99. 6 Esta es la idea fundamental de la propuesta de Merkl, Adolf , cfr., “Prolegomena einer Theorie des rechtlichen Stufenbaues”, Die Wiener Rechtstheoretische Schule, Schriften von H. Kelsen, A. Merkl, A. Verdross, Viena, Verlag, 1968, pp. 1340 y ss. Como se mencionó también para Kelsen el criterio rector es el de jerarquía, así por ejemplo, véase Introducción a la teoría pura del derecho, UNAM, Instituto de Investigaciones Jurídicas, México, 2002, p. 73. 7 De Otto, Derecho constitucional. Sistema de fuentes, Barcelona, Ariel, 1989, pp. 71 y 72.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
307
las fuentes, salvo los actos de ejecución. De lo anteriormente señalado surgen algunas dudas sobre el uso del término “fuente” en el sentido de fuente formal, como por ejemplo, saber si es aplicable a los órganos creadores, a las normas de competencia que facultan para el ejercicio de la potestad normativa, al procedimiento de creación mismo, a todo en su conjunto, o simplemente, a la norma creada. El término “fuente” no puede referirse a los órganos competentes que toman parte en el procedimiento que la norma superior describe, puesto que éstos realizan normalmente también otro tipo de actos, aunque Von Wright considera que puede ser utilizado en ese sentido.8 Tampoco puede referirse al proceso de producción es su totalidad como conjunto de actos y acciones, sino solamente al acto normativo como tal, a la norma que genera derechos y obligaciones, y por ende, a las normas que regulan el proceso de creación. En consecuencia, se puede afirmar, que desde el punto de vista formal, hay dos acepciones básicas del término “fuente”: el proceso de creación y la norma. En el primer sentido, el término “fuente”, ha sido entendido tradicionalmente como las reglas que prevén actos normativos que producen “normas generales” con vocación de permanencia, de esta manera es posible distinguirlo de la norma que emana de un acto de aplicación o del acto de ejecución, por ejemplo. En el segundo sentido, el término fuente se refiere más bien al resultado de dicho proceso. Como consecuencia el término fuente presenta una ambigüedad que se refiere tanto al proceso como al producto. Desde la perspectiva de la teoría de la acción, Von Wright9 al hablar de la acción normativa, disuelve esta ambigüedad al señalar que la acción es el acto de dictar una norma y el resultado de la acción es la existencia (subsiguiente) de una norma. De modo que si se ha de suponer que el concepto de fuentes solamente se refiere a las normas generales, entonces, y siguiendo a Kelsen10 es necesario distinguir entre actos de creación normativa y actos de aplica-
8 Según este autor, “fuente puede ser también una autoridad que dicta (promulga) normas para un grupo de gente”. Von Wright, Un ensayo de lógica deóntica y la teoría general de la acción, México, UNAM, Instituto de Investigaciones Filosóficas, 1988, Cuadernos 33, p. 86. 9 Von Wright, ibidem, p. 95. 10 Kelsen, Hans, Reine Rechtslehre, Viena, Verlag Franz Deuticke, 1960, pp. 239-242.
308
CARLA HUERTA
ción, en primera instancia, y posteriormente definir el significado del término general en relación con las normas. Para Kelsen el término fuente además de metafórico, es ambiguo, pero considera que las fuentes del derecho se refieren al fundamento de validez de una norma, aunque este término también puede utilizarse para referirse al último fundamento de validez de un sistema jurídico. La característica definitoria de una fuente entendida en sentido jurídico es su fuerza obligatoria que deriva de otra norma.11 Los actos de creación significan que mediante el cumplimiento del procedimiento establecido, una norma es introducida al sistema jurídico, y como regla de conducta, su observancia es obligatoria. Esta regla es aplicable a un número indeterminado de casos, en principio, el acto de aplicación implica la individualización de la norma tomando en consideración las circunstancias de un caso específico, es decir, el sujeto, la ocasión, etcétera. Sin embargo, como Kelsen12 señalaba, la aplicación es la creación de una norma inferior con fundamento en una norma superior, o la ejecución de un acto coactivo estatuido. De tal forma que todo acto de creación se vuelve un acto de aplicación, y éste a su vez, un acto de creación de otra norma, pudiendo ser esta última una norma individualizada. En consecuencia, la aplicación no se puede distinguir de la ejecución, salvo cuando se trata de un acto de ejecución, es decir, de un acto coactivo sin consecuencias normativas. Sin la intención de dar una definición, ya que más bien reflexionaba sobre la clausura del sistema jurídico, Georg H. von Wright señalaba que: “en términos generales, un sistema normativo es una clase de normas que provienen de la misma “fuente”. Esta fuente puede consistir de algunos objetivos o valoraciones y lo que proviene de ella consiste en la derivación de un conjunto de normas o reglas de acción a partir de ellos.”13 Aquí Von Wright utiliza el término fuente en un tercer sentido, al que también Kelsen hizo referencia, es decir, al fundamento último de validez de un sistema jurídico, o por decirlo en términos de Hart, a la regla de reconocimiento. En cuanto a las fuentes del derecho, Bobbio14 sostiene que son aquellos hechos o actos de los cuales el ordenamiento jurídico hace depender la producción de las normas jurídicas, por lo que se puede considerar que 11 12 13 14
Kelsen, ibidem, pp. 238 y 239. Kelsen, ibidem, p. 240. Von Wright, op. cit., nota 8, p. 86. Bobbio, Norberto, Teoría general del derecho, Madrid, Debate, 1998, pp. 170 y 171.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
309
se refiere al procedimiento de creación. Por otra parte, Bobbio reconoce también que el ordenamiento jurídico, más allá de regular el comportamiento de las personas, regula también el modo como se debe producir la regla. De esta manera reconoce no sólo la existencia y relevancia de las denominadas normas secundarias por Hart,15 que este autor considera como características del derecho, sino que admite como fuentes, uno de los tipos de reglas secundarias a lo que Hart se refiere, que son las reglas de cambio. Es desde esta perspectiva que Bobbio concibe a las fuentes como “normas de estructura”, ya que se pueden considerar como las normas para la producción jurídica, o sea, las normas que regulan los procedimientos de regulación jurídica, es decir, normas que según él, no regulan un comportamiento, sino el modo de regular un comportamiento, o más exactamente, el comportamiento que regulan tiene que ver con la producción de las reglas.16 Otra de la opciones de significado del término fuente, es la de considerarla como la norma misma. Si se acepta este significado, entonces la fuente puede ser identificada por los elementos constitutivos que definen una norma jurídica,17 lo que haría posible proponer una definición material. Así que una fuente de derecho puede ser considerada como todo aquella regla de carácter general, emitida por las autoridades competentes conforme a los procedimientos previstos, que establezca que algo, ya sea un acto o una acción, está prohibido, es permitido o bien, es obligatorio, y que tenga como contenido la creación de otras normas, ya sean generales o individualizadas. Este tipo de definición incluye las normas de competencia, aun cuando su carácter es más complejo, que el referido por las modalidades deónticas mencionadas. Una definición material permite establecer criterios que distinguen entre las normas que constituyen fuentes y las que no, de tal forma que pueden ser consideradas como fuentes del derecho todas aquellas normas productoras de normas, salvo las que determinen actos de simple ejecución. La importancia de un criterio semejante, radica en la posibilidad de 15 16 17
Hart, op. cit., nota 1, pp. 119 y 120. Bobbio, Norberto, op. cit., nota 14, p. 171. Para Von Wright las normas se componen de dos tipos de elementos, los que constituyen el núcleo normativo, que son el carácter, el contenido y la condición de aplicación, y otros tres componentes que no forman parte de esta estructura lógica que las prescripciones jurídicas tienen en común con otros tipos de normas que son la autoridad, el sujeto y la ocasión; Von Wright, op. cit., nota 8, pp. 87 y ss.
310
CARLA HUERTA
identificar y sistematizar las fuentes en un sistema jurídico específico para determinar su prevalencia en la aplicación, y así poder simplificar la resolución de conflictos entre normas. Una ventaja que esto representa es que al seguir criterios establecidos por la norma, se reduce en gran medida la discrecionalidad del juez, logrando asimismo un mayor grado de objetividad en la toma de decisiones. Finalmente cabe señalar que en principio el concepto de fuente tiene una función puramente académica cuando el ordenamiento jurídico no prevé consecuencias jurídicas específicas a los actos denominados fuentes, ni establece que tales actos tengan un valor o fuerza específicos. Por el contrario, cuando el propio ordenamiento jurídico identifica las fuentes y las jerarquiza, produce una relación entre estos actos que sirve para resolver los conflictos entre normas, ya que de dicho orden derivarían reglas de prelación y de aplicación. 2. Ampliación del sistema de fuentes Para Aarnio18 los conceptos básicos que se encuentran vinculados al concepto de fuentes son los relacionados con los actos considerados como derecho, es decir, aquellos que producen normas. Una de las grandes aportaciones de Aarnio es que, según él, las fuentes de ley pueden también ser concebidas como razones para la argumentación, así se podrían clasificar en dos tipos: autoritativas (razones de derecho) y sustantivas (razones prácticas). Las primeras reciben esta denominación en virtud de la existencia de una autoridad normativa que las expide, una norma que faculta para ello otorgando la competencia y estableciendo el procedimiento de creación y sobre todo de su obligatoriedad, por ello se pueden denominar razones de autoridad. Entre ellas es posible mencionar, sin que por ello se establezca ningún orden de prelación o jerarquía: la ley, la costumbre y los tratados internacionales que por su modo de creación se pueden considerar “fuertemente obligatorias”. Existen otras fuentes dentro de las denominadas fuentes de autoridad que son consideradas débilmente obligatorias en virtud de su modificabilidad, como podría ser la voluntad del legislador (en su carácter de propósito) o la práctica jurisprudencial, entendida como los precedentes y la jurisprudencia. 18 Aarnio, Aulis, Lo racional como razonable, Madrid, Centro de Estudios Constitucionales, 1991, pp. 134 y ss.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
311
Las fuentes sustantivas tienen un peso diferenciado en la argumentación y carecen en cambio, de autoridad en el sentido antes mencionado, por lo tanto, su uso no es obligatorio, sino permitido, siempre y cuando no esté prohibido por alguna disposición jurídica; son razones de apoyo. A este grupo pertenecen, por ejemplo, los argumentos prácticos que forman parte del razonamiento práctico, los datos sociológicos, los argumentos históricos o comparativos que sirven como factores que contribuyen a la interpretación, la doctrina, entendida como opinión de juristas, autores, etcétera, y los valores, incluso aquellos que en principio son propios de la moral. La elección que hace el juez sobre el uso de las fuentes determina su prioridad, en virtud de que la elección es valorativa en sí misma. Por lo que se puede concluir que los catálogos de fuentes están abiertos. De manera que para Aarnio, las fuentes del derecho son las razones (los argumentos) usados en la argumentación jurídica. Se pueden distinguir también otros tipos de fuentes, por lo que resulta posible hablar de fuentes de información material, que son aquellas que proporcionan información sobre las normas como, por ejemplo, la exposición de motivos, los trabajos preparatorios o los precedentes, y de las fuentes de ley que son las normas mismas. Admitir esta concepción de las fuentes como argumentos tal como hace Aarnio, lleva a aceptar un concepto de fuentes mucho más amplio que el convencional, en él se incluyen innumerables argumentos que pueden convertirse en normas en sentido estricto en la medida en que se vuelven razones públicas y que forman parte de una norma con carácter obligatorio, por ejemplo, al integrarse a la jurisprudencia. En opinión de Aarnio, todo dato relevante para el contenido de la ley puede considerarse fuente, ya sean los trabajos preparatorios, el preámbulo y hasta la denominada “voluntad del legislador”. Esto se debe a que en un sistema de derecho escrito, la ley (s.s.) como fuente, representa un límite tanto al razonamiento legal, como a la actuación de las autoridades y a otras fuentes. En consecuencia, Aarnio sugiere utilizar la mayor cantidad de fuentes posibles, para él, el órgano decisor es responsable de la forma en que las fuentes son utilizadas; son los instrumentos mediante los cuales las decisiones son razonadas. En el fondo, según Aarnio, el término fuentes se refiere a todas las normas jurídicas válidas, las fuentes obligatorias son las que se deben (ought to) utilizar en la argumentación en primer lugar, no aplicarlas aca-
312
CARLA HUERTA
rrearía una sanción; las débilmente obligatorias, son las fuentes supletorias (deberían aplicarse, should), pero implican que la decisión puede cambiar en un tribunal de apelación. Por último, las razones sustanciales al ser permitidas, pueden (may) utilizarse y cumplen una función de apoyo. Esta perspectiva de concebir a las fuentes como razones o argumentos no es exclusiva del autor mencionado, de manera similar, Hart19 considera que las fuentes del derecho deben ser concebidas como argumentos para la justificación de toma de decisiones, en virtud de su carácter de rules as open textures, es decir, pautas indeterminadas de conducta. Esta indeterminación resulta del hecho de que las normas se expresan mediante un lenguaje natural. La textura abierta del derecho significa para Hart que hay áreas de conducta que debe dejarse para que sea desarrollado por los tribunales, de tal manera que los juicios sobre lo que es “razonable” pueden ser utilizados en el derecho.20 La orientación de los órganos decisores sobre el uso de las fuentes, debe hacerse a través de reglas determinadas por el propio sistema jurídico, y utilizando todas las fuentes válidas. Del mismo modo señala Hart,21 que los textos reconocidos como “buenas razones” para la interpretación y solución de los casos, pueden ser denominadas fuentes jurídicas “permisivas” para distinguirlas de las “obligatorias” o formales. La propuesta de Dworkin22 en relación con el modelo de ordenamiento jurídico en el que, junto a las reglas, o normas en sentido estricto, se incluyen los principios con una peculiar fuerza normativa, es de tipo funcional, ya que una misma norma puede funcionar a veces como regla y a veces como principio. La diferencia reside en que una regla se aplica en forma de todo o nada, y funciona como una razón excluyente, mientras que los principios se ubican en la dimensión del peso o importancia, de la cual deriva su capacidad de ponderación; según Alexy23 son mandatos de optimización.
19 20
Hart, op. cit., nota 1, pp. 159-169. El razonamiento jurídico está basado en un presupuesto de decisión racional, es decir, se presupone que el juez es un ser capaz de elaborar razonamientos razonables. 21 Hart, op. cit., nota 1, p. 312. 22 Dworkin, Taking Rights Seriously, Cambridge, Harvard University Press, 1978, pp. 22 y ss. 23 Teoría de los derechos fundamentales, trad. de Manuel Atienza e Isabel Espejo, Madrid, Centro de Estudios Constitucionales, 1993, pp. 88 y ss.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
313
Vale la pena señalar que a pesar de la utilidad práctica de esta distinción, sobre todo en materia de resolución de conflictos, ésta no aporta nada en relación con la determinación del sistema de fuentes, ni modifica las reglas sobre la validez de la normas, aunque si puede modificar las de aplicabilidad de una norma en un conflicto determinado. III. LA ESTRUCTURA DEL SISTEMA DE FUENTES 1. En cuanto a los modos en que las normas se relacionan Las formas en que las normas se relacionan en un sistema jurídico dependen de los criterios de organización del mismo, sin embargo, actualmente la identificación y ordenación de las fuentes se ha visto dificultada por diversas razones, pero principalmente por la forma en que los sistemas de fuentes se han visto expandidos en las últimas décadas. La superabundan te actividad legislativa, aunada a la necesidad de satisfacer demandas normativas que no existían cuando las primeras Constituciones fueron otorgadas, ha llevado a incluir en la categoría de fuentes, normas de carácter especial como podrían ser las leyes marco, las leyes medida, etcétera, y disposiciones de carácter técnico, como las normas oficiales mexicanas por ejemplo, lo cual ha tenido como consecuencia, por una parte, una subclasificación de la ley por competencia, y por la otra, la inclusión dentro del sistema de fuentes de muchas disposiciones sin un verdadero contenido normativo e incluso de dudosa legalidad, sobre todo en el ámbito de la administración pública. Otro de los factores que contribuyen a la dificultad de organizar las fuentes del sistema jurídico radica en diferentes aspectos que tienen que ver con la forma de organización del Estado y el gobierno, lo que se traduce en dos formas distintas de distribución de competencias, una que se podría considerar como horizontal, como en el caso de los Estados federales, y una vertical, entre los órganos del gobierno, de cada una de sus entidades en las que se subdivide el ejercicio de la competencia. Por otra parte, el Poder Judicial ha contribuido a la ampliación del sistema de fuentes, no solamente a través de la interpretación, sino también mediante la expansión de la fuerza normativa de los principios.24 24 Esto es consecuencia principalmente de la propuesta de Dworkin, ya que según él, cuando existe un texto directo que resuelve el caso, éste puede ser superpuesto por un
314
CARLA HUERTA
Es desde la perspectiva dinámica que las fuentes adquieren su verdadera dimensión, ya que el ordenamiento jurídico regula su propia producción normativa. Actualmente es indiscutible que establecer reglas para su creación y modificación es una nota característica del derecho.25 Por lo que pensar en un sistema de fuentes organizado significa que existen normas con diferente fuerza derogatoria, y es por ello que tienen una relevancia distinta para la operatividad del sistema jurídico. El problema de la determinación del rango y eficacia derogatoria26 de las normas de un ordenamiento jurídico no puede tener una respuesta simple, pues constituye una pregunta mucho más compleja de lo que a primera vista parece. La doctrina jurídica tradicionalmente ha hablado de fuentes del derecho como aquellos actos que responden a un determinado criterio que sirve para identificar los actos de producción normativa como tales. De tal forma que si se buscan normas y procedimientos, el problema se traslada a la identificación de los criterios definitorios de las fuentes. Una forma de resolver esto, sería recurriendo a la Constitución para que la norma suprema del derecho positivo indicara el orden de las fuentes, pero en la realidad las Constituciones en general no se ocupan de proponer un esquema organizativo. Ésta ha sido considerada normalmente como una tarea de la ciencia jurídica o del órgano facultado para interpretarla. En consecuencia, la identificación de los procesos de creación normativa que pueden ser catalogados como fuentes del derecho no es fácil, por eso, dado que no es posible distinguir los actos creadores por sus efectos jurídicos, parece adecuado tratar de organizar las normas según su eficacia derogatoria, es decir, la forma en que se relacionan en caso de conflicto. principio general que impide la aplicación de la norma por ser contrarios. Vale la pena aclarar, que en este caso el término principio no se refiere a una norma, sino a los principios generales del derecho que se encuentran implícitos en las normas, op. cit., nota 22, pp. 22-27. 25 Esto es conocido también, como autopoiesis. Según la teoría de la autopoiesis, los sistemas sociales son sistemas cerrados que se reproducen a través de dinámicas internas; el derecho es considerado como sistema autopoiético, en virtud de que regula su propia creación y modificación. véase G. Teubner, Recht als autopoietisches System, Frankfurt am Main, Suhrkamp, 1989. 26 El término eficacia goza en el derecho de una especial ambigüedad, ya que en términos generales se refiere a la capacidad para producir un efecto, en este caso se refiere más bien, a la fuerza específica de las normas en caso de conflicto. Sobre la diferencia entre eficacia y vigencia véase Huerta, Carla, op. cit., nota 3, pp. 37-39.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
315
Como se señalaba, algunos autores suponen que la pertenencia de un acto normativo a la categoría de fuente no implica sino una diferenciación de tipo doctrinal o científica, en cuanto que no acarrea efectos jurídicos diversos, si se le denomina o no de esa manera. Sin embargo, esta clasificación presenta un significado práctico relevante, dado que en sentido amplio, sirve para determinar la forma en que se relacionan entre sí las normas de efectos generales. Es por ello que dentro de un sistema jurídico dinámico, con una estructura constitucional determinada que cumpla con los requisitos básicos para ser calificada como una Constitución conforme a la teoría del derecho contemporánea,27 existen uno o varios criterios que permiten identificar y ordenar de manera clara las fuentes, principalmente por su fuerza normativa. A continuación se revisarán algunos criterios que sirven para la identificación de las fuentes, lo cual resulta de gran utilidad no solamente para los estudiosos del derecho, sino también y principalmente para aquellos que deben aplicar el derecho. Esto se debe a que la posibilidad de determinar su validez y su fuerza derogatoria28 mediante el conocimiento de su rango y posición en el ordenamiento, es decir, la determinación de la jerarquía de una norma, puede asimismo determinar su obligatoriedad y fuerza vinculante. Es un aspecto relevante también en un momento determinado, incluso para determinar su aplicabilidad en caso de un conflicto entre normas, y sobre todo, de incompetencia por función o por materia. 2. Algunos criterios de ordenación del sistema Normalmente se habla de un sistema de fuentes, porque en un sistema jurídico se prevé más de un procedimiento de creación normativa y éstos están organizados de una forma determinada. Por lo que la clasificación hecha por Bobbio,29 que permite distinguir los ordenamientos jurídicos en simples y complejos, según las normas que los componen, ya sea que deriven de una sola fuente o de varias fuentes, resulta poco práctica, ya que es posible afirmar que los sistemas jurídicos modernos son todos complejos. Hablar de la complejidad del sistema jurídico, sin embargo, 27 Así se puede hablar de unos contenidos estructurales mínimos como son derechos fundamentales, división de poderes, y control de la constitucionalidad, sobre ello se abunda en “Constitución y diseño institucional”, op. cit., nota 2, pp. 27-31. 28 De Otto, op. cit., nota 7, pp. 88-91. 29 Bobbio, op. cit., nota 14, p. 165.
316
CARLA HUERTA
no excluye su unidad, ya que utilizar el término sistema implica además de una pluralidad de fuentes, que éstas se encuentran ordenadas conforme a ciertos criterios, los cuales determinan la forma en que relacionan y “derivan”30 unas de otras. La relación que existe entre las normas de un sistema jurídico es normativa, no lógica, pues se determina conforme a las reglas del propio sistema. Según Ignacio de Otto,31 las fuentes pueden ser ordenadas conforme a dos principios: el de jerarquía, que produce una ordenación vertical de las fuentes en función de su rango en el ordenamiento, y el de distribución de materias, que sirve como criterio de ordenación horizontal, que permite identificar las normas que ocupan un mismo rango, pero se distinguen creando ámbitos de competencia exclusiva para determinados órganos productores de normas de conformidad con las materias que les sean atribuidas por la norma facultativa, ya sea de manera exclusiva o concurrente. La jerarquía de las normas la establece en primera instancia la propia Constitución, pero también puede ser definida por la jurisprudencia o normas de un rango inferior, cuando la autoridad que las emite ha sido facultada para ello. Se puede decir que los criterios de valoración de las normas que sirven para organizar el sistema de fuentes, son la validez y eficacia derogatoria de cada una de ellas. El problema del sistema de fuentes, radica en que la Constitución normalmente no hace una ordenación exhaustiva de las fuentes, limitándose a establecer los procesos de creación. Por lo tanto, dicha labor se remite a la jurisprudencia, lo cual conduce a otra dificultad que es la de la determinación del rango de la propia jurisprudencia, cuya posición dependerá de las facultades que al órgano que la emita le atribuya la Constitución. En el caso del derecho administrativo, esto ha llevado a que disposiciones subordinadas a la Constitución determinen el rango de las normas o traten de organizar legal o incluso reglamentariamente el sistema de fuentes. Desde la perspectiva doctrinal, la tarea de organización de las fuentes ha sido realizada de manera independiente por cada una de las áreas del de-
30 Si bien, no se trata de una derivación lógica, se puede utilizar el término de manera analógica, en virtud de que las normas se suceden de conformidad con una lógica normativa y en un caso determinado mediante la subsunción siguiendo los principios reguladores del sistema jurídico, o en virtud de la jurisprudencia de conformidad con las reglas establecidas. 31 Otto, Ignacio de, op. cit., nota 7, pp. 87 y ss.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
317
recho, en otras palabras, no existe una estructura genérica de las fuentes elaborada por la teoría del derecho. En cuanto a la validez es conveniente adoptar el criterio de Kelsen,32 para quien la validez de las normas depende de su adecuación formal al proceso de creación determinado por la norma inmediatamente superior, es decir, del procedimiento y la competencia. Pero la validez también depende de la conformidad con los contenidos de la norma inmediata que sea jerárquicamente superior, y en última instancia de la adecuación material a los contenidos constitucionales. La ordenación jerárquica de las normas implica fundamentalmente dos tipos de relaciones entre las mismas que se pueden considerar dependientes: la validez, que deriva de la adecuación al proceso de creación normativo determinado en la norma superior (inmediata) tanto formal como materialmente, y la derogación que se sigue como consecuencia jurídica del incumplimiento, ya sea del proceso formal de creación o de su inadecuación material a la norma jerárquicamente superior.33 Finalmente se puede decir que el rango de una norma es determinado por su capacidad para definir la validez de otras normas. En la medida en que sirve como parámetro de referencia de una o varias normas se supraordena a ellas. Es posible hablar de jerarquía, porque las fuentes se relacionan entre sí, constituyendo una compleja red de interconexiones, su posición refleja su fuerza y eficacia derogatorias, o prelación de aplicabilidad, por decirlo de alguna manera. Esta organización se traduce en límites a los órganos creadores, demarcando el ámbito de validez de la creación del derecho. Por lo tanto, lo que no se encuentre comprendido dentro de la competencia atribuida por o conforme a la Constitución, no sería válido. La ordenación jerárquica implica el análisis de las formas que las normas pueden adoptar, se habla entonces de una jerarquía formal donde hay subordinación de unos poderes normativos respecto de otros. Otro criterio ordenador del sistema jurídico es el de competencia, una de sus expresiones es lo que De Otto denominaba la distribución de materias que se traduce en la subordinación de unas fuentes a otras me32 33
Kelsen, Hans, op. cit., nota 10, pp. 202 y ss. En caso de la derogación, se debe tomar en cuenta el principio de autoridad formal de la ley, que establece que sólo un acto del mismo rango y fuente puede derogar otro. Aquí se utiliza el término derogación en sentido amplio, como consecuencia del enfrentamiento de una norma con otra superior, es decir, en relación con su eficacia derogatoria en caso de conflicto.
318
CARLA HUERTA
diante la asignación de un campo propio, esto es, de materias reservadas, lo cual conlleva a que los órganos creadores de normas son limitados en su objeto. Es un sistema de articulación de fuentes complementario y corrector, que se refiere a las materias susceptibles de ser reguladas. Esto significa que solamente determinados tipos de normas pueden regular algunas materias, un ejemplo de ello, es la distribución territorial de la competencia.34 El sistema de ordenación por competencia confiere a las normas otro rango y prelación que puede llegar a superar al jerárquico en caso de colisión. En relación con la organización de las fuentes conforme al criterio de competencia, se puede decir que existen dos técnicas básicas: 1) la distribución competencial entre órganos de un mismo rango, por ejemplo entre dos órganos constituidos, el Poder Legislativo crea la ley y el Poder Ejecutivo el reglamento correspondiente, así, de conformidad con el principio de legalidad, se produce la subordinación del reglamento a la ley por la naturaleza de norma que desarrolla, y 2) la reserva de ley, que se refiere a las materias que sólo determinado tipo de norma puede regular de manera exclusiva, sin embargo, esto no impide que dichas normas puedan regular otras materias. En este caso la relación entre las normas depende del contenido de las mismas. Esto haría pensar en una estructura del sistema jurídico mucho más compleja de lo que se había pensado en un principio, organizado más bien como una red de varios niveles o dimensiones que como una pirámide. Esta idea, aunque desarrollada en otros términos, ya es mencionada por Raz,35 cuando sugiere que los sistemas jurídicos deben ser considerados como “intrincadas urdimbres de disposiciones jurídicas interconectadas”. A su vez Ost36 y Van de Kerchove se avocan a la revisión del paradigma de la estructura piramidal del sistema jurídico, llegando a la conclusión de que debe ser substituido por el de un derecho en red, vinculado a las ideas de regulación y “gobernación” (gouvernance). 34 De tal forma que en principio las fuentes pueden ser ordenadas jerárquica y de manera territorialmente diferenciada, por lo que en el caso de un sistema federal por ejemplo, se crean, por decirlo de alguna manera, dos pirámides o sistemas de fuentes en razón de sus competencias, subordinadas ambas a una Constitución federal. 35 Raz, Joseph, El concepto de sistema jurídico. Una introducción a la teoría del sistema jurídico, traducción de Rolando Tamayo y Salmorán, México, UNAM, 1986, p. 220. 36 Ost, François y van de Kerchove, Michel, De la piramide au réseau. Pour une Theorie dialectique du droit, Bruselas, Publications des Facultés universitaires Saint-Louis, p. 608.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
319
Finalmente, se puede decir que para poder ordenar las fuentes es preciso encontrar y analizar los criterios de diferenciación entre las normas, para posteriormente poder elegir aquellos que sean acordes a las cualidades propias del orden jurídico en cuestión. Si se define a las fuentes en términos de su capacidad para crear normas jurídicas, deben organizarse de conformidad con la prelación y la aplicabilidad de las normas en caso de conflicto, por lo que el criterio de referencia es su eficacia derogatoria. De modo que las fuentes pueden ser organizadas en principio de conformidad con los criterios de jerarquía y competencia, complementados por las reglas de aplicación y primacía relativas que resuelvan los conflictos entre estos criterios. Por lo tanto, parece lógico concluir que el sistema de fuentes se articula como reglas de validez, lo cual tendría como consecuencia poder establecer reglas de resolución de conflictos y la posibilidad de declarar la invalidez de la norma invasora en el caso de la invasión de materia, y la nulidad, en el caso de la incompetencia. 3. Clasificación La forma en que las fuentes pueden ser organizadas es desde una perspectiva de derecho positivo, considerando si éstas están o no previstas en el orden jurídico vigente. Desde la perspectiva puramente teórica en cambio, para ordenar las fuentes es preciso delimitar el concepto e identificar los criterios de clasificación. Así, es posible partir de un concepto de fuentes del derecho que abarque todos los procedimientos de creación normativa que estén contemplados en el sistema jurídico, aun cuando no sean específicamente designados con este nombre. Esto significa que las fuentes pueden estar reguladas en la Constitución, o que pueden ser encontradas en otras disposiciones de rango inferior, como por ejemplo en leyes o reglamentos. Por ello es que se debe cuestionar hasta qué grado, puede llegar el reconocimiento de fuentes cuyo origen se encuentre en normas de rango inferior al constitucional. De lo anterior, se puede derivar una distinción que permite clasificar a las fuentes en: 1) fuentes primarias, como aquellas que son reguladas por la norma fundamental, y
320
CARLA HUERTA
2) fuentes secundarias, como aquellas reguladas por otras disposiciones secundarias, tales como la ley, los tratados internacionales o la jurisprudencia, por ejemplo. Si bien es cuestionable la legitimidad de la atribución de competencias legislativas por normas de un rango inferior al de la ley, entendido este concepto como norma directamente subordinada a la Constitución, se podría considerar un tercer tipo de fuentes legitimado en el sistema jurídico en virtud del órgano que la emite. De tal forma que cabría hablar de: 3) fuentes terciarias: entendidas como normas generales que emanan de facultades delegadas por autoridad competente, y previstos en normas de rango inferior a la ley. Se trata de una situación que debe analizarse directamente en las disposiciones de un determinado orden jurídico, ya que en estos casos, incluso la legalidad de la norma es cuestionable. Por otra parte, las fuentes del derecho pueden ser clasificadas de acuerdo a criterios formales o bien materiales, los primeros se refieren a los órganos productores de las normas, a los procedimientos o al tipo o rango de la norma que las prevé. Los criterios materiales, en cambio, se refieren a las características propias de la norma, generalidad, abstracción, etcétera. En términos generales, las fuentes que la doctrina ha reconocido son: la ley, la jurisprudencia, la doctrina, los principios generales del derecho,37 así como los tratados internacionales y los reglamentos. La lista mencionada no implica en sí misma ningún tipo de prelación o relación de orden jerárquico. El orden y posición en el ordenamiento jurídico depende del reconocimiento y estipulación expresa que la propia norma fundamental haga de la eficacia derogatoria de las fuentes. En la teoría del derecho, el concepto de fuentes del derecho se ha utilizado para identificar las diversas formas de creación de normas de jurídicas, reconociendo de manera genérica, dos procedimientos de creación: la creación deliberada y la espontánea. Con dichas formas se ha 37 Originalmente los principios generales del derecho sirvieron como instrumentos para el método procedimental de interpretación e integración del derecho hasta 1945. Posteriormente vienen a cumplir una nueva función no solamente interpretativa, sino también directiva como guías de interpretación utilizables aun en los casos en que no exista una laguna. Debido a su estructura se pueden asimilar a normas, ya que se formulan mediante operadores deónticos y al hecho de ser vinculantes, pero su fuerza vinculante no es igual a la de otras fuentes, como su estructura tampoco es igual a la de las demás normas.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
321
identificado normalmente los dos grandes sistemas jurídicos de la actualidad, el sistema de derecho escrito y el de derecho consuetudinario. En consecuencia, en su Teoría general del derecho, Bobbio, al tratar el tema de las fuentes, señala que existen dos medios para regular la conducta. 1) La recepción de normas ya formuladas, producto de ordenamientos diversos y precedentes; y 2) La delegación del poder de producir normas jurídicas en poderes u órganos inferiores. Por estas razones, es que según Bobbio, en todos los ordenamientos al lado de las fuentes directas se encuentran las fuentes indirectas, que se pueden distinguir en dos clases: fuentes reconocidas y fuentes delegadas. Es sobre todo en relación con este segundo tipo de fuentes delegadas que se presentan los problemas de irregularidad ya sea legal o constitucional, que afecta la validez de las normas. Para Bobbio, la complejidad de un ordenamiento jurídico proviene, por tanto, de la multiplicidad de las fuentes de las cuales afluyen las reglas de conducta, en última instancia del hecho de que estas reglas tienen diverso origen, y llegan a existir (esto es, adquieren validez) partiendo de puntos muy lejanos.38 Esta última cuestión, según Bobbio, demuestra que el problema de la distinción entre fuentes reconocidas y fuentes delegadas es un problema cuya solución depende también de la concepción general que se asuma respecto de la estructura de un ordenamiento jurídico. La relevancia de distinguir entre estos dos tipos de fuentes radica en la legitimidad de la autoridad normativa y la validez de la norma que expide, pudiendo llegar a ser el caso que se cuestione la legalidad o incluso la constitucionalidad de la fuente. IV. EL SISTEMA JURÍDICO Y LAS FUENTES DEL DERECHO 1. Las fuentes del derecho como reglas de validez Como es sabido, la denominación de fuente en sí no cumple función alguna en el sistema jurídico, para la doctrina, en cambio, sirve para 38
Bobbio, op. cit., nota 14, pp. 166-168.
322
CARLA HUERTA
identificar y organizar cierto tipo de actos normativos. El objetivo de organizar las fuentes es conocer los efectos de las fuentes como normas y la forma en que éstas se relacionan. Por lo que se puede decir que las fuentes sirven para determinar las obligaciones, prohibiciones y potestades de las personas y autoridades, para establecer su prelación en caso de conflictos normativos, o como argumentos en la decisión judicial. Una de las principales funciones que han sido atribuidas por la doctrina a las fuentes es la de constituir reglas de validez, así por ejemplo, para Kelsen39 la forma en que las normas se relacionan en un sistema jurídico genera cadenas de validez normativa, en virtud de la relación de supra-subordinación que existe entre ellas. Según la tesis de Hart,40 las reglas primarias de obligación se complementan con las secundarias, que además de ser de un tipo diferente por que se refieren a las primarias, o mejor dicho, al sistema jurídico, corresponden además a otro nivel, el de creación normativa. Estos dos niveles no se encuentran jerarquizados y sus normas no se relacionan entre sí, puesto que cumplen funciones distintas. Las secundarias, la regla de reconocimiento, las de cambio y las de adjudicación, sirven básicamente como reglas de identificación de las reglas primarias, así, la regla de reconocimiento constituye en primera instancia un criterio de pertenencia, pero es también un parámetro de validez. Para él, las reglas que confieren jurisdicción, que corresponderían a la clase de reglas de adjudicación, son también reglas de reconocimiento que identifican a las reglas primarias a través de las decisiones de los tribunales, y estas decisiones se convierten en “fuente” de derecho.41 Los sistemas jurídicos desarrollados, prevén según Hart,42 reglas de reconocimiento complejas, que permiten la identificación de sus fuentes por referencia a alguna característica general que corresponde a las reglas primarias, más que por referencia a una lista o texto. De esta manera según Hart, se introduce un signo de autoridad, que contribuye ya de cierta forma, a la idea de sistema jurídico y al mismo tiempo constituye “el germen de la idea de validez jurídica”. Para Hart las ideas de validez del derecho y de fuentes del derecho pueden ser clarificadas en términos de la regla de reconocimiento. Esto 39 40 41 42
Kelsen, Kelsen, op. cit., nota 10, pp. 197-228. Hart, op. cit., nota 1, pp. 116 y 117. Ibidem, p. 121. Ibidem, p. 118.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
323
se debe a que Hart, como Kelsen, considera a las fuentes como criterios de validez. Para Hart, sin embargo, “[d]ecir que una determinada regla es válida es reconocer que ella satisface todos los requisitos establecidos en la regla de reconocimiento y, por lo tanto, es una regla del sistema”,43 mientras que para Kelsen44 el criterio supremo de validez de las normas es la Constitución y, en última instancia, la norma fundamental. Hart, en cambio, considera que la regla de reconocimiento que suministra los criterios para determinar la validez de otras reglas del sistema es una regla última, pero se trata de una cuestión empírica, no de un presupuesto, de una hipótesis o de una ficción como para Kelsen.45 Hart equipara las fuentes del derecho con criterios de validez, y señala, que “un criterio de validez jurídica (o fuente de derecho) es supremo, si las reglas identificadas por referencia a él son reconocidas como reglas del sistema, aun cuando contradigan reglas identificadas por referencia a los otros criterios, mientras que las reglas identificadas por referencia a los últimos, no son reconocidas si contradicen las reglas identificadas por referencia al criterio supremo”.46 De esta manera Hart reconoce una jerarquía a los criterios de validez y determina reglas de prevalencia en la aplicación de las normas en caso de conflicto. Estas reglas de validez proveen además a la organización de las fuentes del derecho que se clasifican en un orden de subordinación y primacía relativas conforme a su fuerza normativa. De las reglas secundarias de Hart que se refieren al propio sistema jurídico, las reglas de adjudicación y de cambio pueden ser consideradas como normas de competencia, ya que establecen los órganos y procedimientos que pueden crear o modificar la regulación. La relevancia de estas normas radica en que constituyen los elementos fundamentales de la dinámica jurídica, aunque como mecanismos de cambio podrían ser con43 44 45
Ibidem, p. 129. Kelsen, Teoría pura del derecho, cit., nota 6, pp. 73-79. Esto es así, porque en la primera edición de la Teoría pura del derecho Kelsen consideraba que la norma fundamental era un presupuesto metodológico necesario, para fundamentar la validez del sistema jurídico. Posteriormente la consideró una hipótesis y finalmente una ficción, no obstante, siempre careció de un acto de autoridad que la fundamentara. Reine Rechtslehre, Darmstadt, Scientia Verlag Aalen, 1934 (1985), p. 66, Reine Rechtslehre, 2a. ed., pp. 197 y ss. y Allgemeine Theorie der Normen, Viena, Manz Verlag, 1979, p. 206. 46 Hart, op. cit., nota 1, pp. 123, 132.
324
CARLA HUERTA
siderados de nivel secundario. El primario lo constituye la regla de cambio constitucional, dado que modifica la base del sistema jurídico. Así, se puede observar que en la teoría de Hart, que distingue dos tipos básicos de reglas, las primarias y las secundarias, se pueden diferenciar varias clases de reglas secundarias. La pregunta que surge a partir de ello es si las reglas de reconocimiento y de cambio pertenecen a una misma categoría por ser reglas de modificación del sistema jurídico que sirven para crear normas, y que solamente se distinguen por su rango y función. De ser así, la regla de reconocimiento podría también ser considerada como una norma de competencia y le correspondería el rango supremo entre las fuentes, pues permite la creación y modificación del “sistema primario de fuentes”, es decir, aquél previsto en la Constitución. Las denominadas reglas de cambio, en el caso de estar previstas en la Constitución, corresponderían a un rango subordinado al anterior en el que se encuentran las “fuentes primarias”, y en un segundo nivel corresponderían las “fuentes secundarias” y también las “terciarias” dependiendo de si se encuentran previstas en la ley o en una norma de rango subordinado a ésta. En realidad la regla de reconocimiento solamente puede ser distinguida de la regla de cambio en relación con su función, más que por su naturaleza, ya que la misma norma puede servir de reconocimiento para determinar la pertenencia de una norma al sistema o como regla de cambio para modificar el sistema jurídico. Ambas son normas jurídicas, cuyo contenido son procedimientos de creación normativa que se distinguen funcionalmente y de acuerdo a la ocasión en que son aplicadas, por lo que se pueden ubicar ambas en la clase de fuentes del derecho. De tal forma que la regla de reconocimiento no sirve exclusivamente para determinar la pertenencia de las normas del sistema, aun cuando sea considerada por Hart como una “regla última que establece criterios dotados de autoridad para la identificación de las normas válidas del sistema“47, sino que constituye en primera instancia una regla de validez, de gran relevancia por cierto, pues determina la validez del sistema jurídico mismo, pero también determina la validez de las normas que lo integran. La regla de reconocimiento es una fuente en sentido estricto, puesto que de ella procede un sistema jurídico, reconoce una autoridad y su compe-
47
Hart, op. cit., nota 1, p. 310.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
325
tencia, y en ocasiones también el procedimiento de creación de la norma suprema o las normas fundamentales de un sistema jurídico. La regla de reconocimiento normalmente se puede considerar como compleja, es decir, integrada por diversas autoridades y procedimientos, o bien, se admite que existen diversas reglas de reconocimiento. Así Hart señala que, “[e]n un sistema jurídico moderno donde hay una variedad de “fuentes” de derecho, la regla de reconocimiento es paralelamente más compleja: los criterios para identificar el derecho son múltiples y por lo común incluyen una Constitución escrita, la sanción por una legislatura, y los precedentes judiciales”.48 Parece que Hart estaría así identificando a la Constitución con la regla de reconocimiento o parte de ella, dependiendo del sistema jurídico en cuestión, y por ende, con el criterio último de validez de las normas de un sistema jurídico. Respecto de estas afirmaciones, surge un problema en relación con la determinación del carácter de la norma que permite el cambio de la norma fundamental, pues al tratarse de una regla de cambio, constituye de manera indudable una fuente del derecho, pero dado su carácter de prescripción que permite la modificación de los contenidos de la norma suprema del orden jurídico, o de ella en su totalidad, debe reconocérsele también el carácter de regla de reconocimiento. Esto llevaría a la conclusión de que no es fácil o posible separar estas dos categorías de manera tajante, tal como hace Hart en su clasificación. Las reglas de adjudicación no son analizadas, dado que a pesar de constituir normas de competencia, solamente facultan para la elaboración de normas individualizadas, por lo que no son consideradas como parte del sistema de fuentes. 2. La Constitución como regla suprema de validez La dinámica del derecho es la línea rectora de la investigación del proceso de determinación de la validez de las normas jurídicas en virtud de su carácter de principio determinante del funcionamiento del sistema jurídico. Esto justifica el análisis de las normas constitucionales, en su calidad de norma fundante del sistema, y norma suprema que estructura las relaciones de todas las normas del sistema. Por lo tanto, para com48
Ibidem, p. 126.
326
CARLA HUERTA
prender la función y operatividad de las fuentes es necesario entender el significado de la supremacía de la primera norma positiva o Constitución, para la determinación de las cadenas de validez normativa. Como ya ha sido mencionado, para poder hablar de la concepción de la Constitución como norma suprema es relevante tomar como punto de partida el concepto de Constitución en Kelsen,49 para contar con un esquema de sistema jurídico escalonado en el que la norma superior determine los contenidos y procedimientos de creación de las normas inferiores para crear reglas de validez. Con ello se determinaría un primer criterio de organización de las normas, el de jerarquía. Este esquema de validez supone que la Constitución es la primera norma positiva del sistema, ya que establece los procesos y órganos de creación de las normas inferiores, así como los contenidos obligatorios, prohibidos o permitidos de las normas inferiores, de tal forma que la Constitución se convierte en el parámetro de validez formal y material del sistema jurídico. Esta posición le confiere una supremacía en sentido material, en virtud de que el sistema jurídico se construye en función de ella, y a que hace la distribución de las competencias, por lo que necesariamente es superior a los órganos creados y a las autoridades investidas por ella. La Constitución es el fundamento y límite de validez del ejercicio de la potestad normativa. En el sentido jurídico del término, la Constitución se identifica en el sistema jurídico principalmente por su relación con la normatividad, producto del ejercicio de las facultades normativas conferidas a los órganos constituidos, como potestad de creación normativa. De tal forma que al establecer la atribución de competencias normativas concreta el sistema de fuentes en un primer nivel, el de las “potestades normativas primarias”, por denominarlas de alguna manera. La supremacía formal, en cambio, se refiere a su forma de elaboración, no solamente en virtud de su especial proceso de otorgamiento, sino principalmente en virtud de la regulación de los procesos de revisión de la norma constitucional. Esto daría lugar a poder distinguir entre dos tipos de normas de cambio en el sentido de Hart, que tendrían rangos diferentes: la constitucional y la ordinaria. La regla de cambio constitucional, permite modificar la base del sistema jurídico y el sistema de fuentes 49 Kelsen, Teoría general del derecho y del Estado, 2a. ed., México, UNAM, 1988, pp. 146 y ss.
FUENTES, VALIDEZ Y APLICABILIDAD DE LAS NORMAS
327
primario que determina la validez de las fuentes derivadas o por delegación de competencia. Por lo que se puede decir que existe una diferencia importante entre la norma fundamental y las demás normas del sistema, ya que la forma de la norma, es decir, su proceso de creación o modificación, determina su rango además de su validez. La supremacía formal es complemento de la material, que la refuerza al impedir su modificación por fuentes de un nivel inferior.50 La cuestión relativa a la supremacía formal se encuentra vinculada a la de la validez de la primera norma positiva y norma suprema de un sistema jurídico. En relación con este problema surgen las dudas respecto de la naturaleza y validez de la regla de reconocimiento primaria del sistema. No obstante su relevancia, es un tema que no será abordado en el presente ensayo, en virtud de que para la determinación del sistema de fuentes, la validez de la Constitución es aceptada como presupuesto de funcionamiento del sistema jurídico. En relación con la validez interna de las normas constitucionales, en el caso de una Constitución escrita, se considera que todos los contenidos previstos en ella son supremos, por lo que en principio, todas las normas constitucionales tienen el mismo rango, a menos que la propia Constitución haga una diferenciación expresa respecto de sus contenidos, estableciendo una cierta prelación y consecuencias jurídicas diferenciadas para algunos de ellos. La supremacía de una norma indica su posición en el sistema jurídico, es decir, su eficacia51 y su fuerza derogatorias, pero además se refiere a su capacidad de constituirse como parámetro de validez respecto de otras normas del sistema jurídico. Es por ello que la validez de las demás normas del sistema jurídico dependen de ella y que la contravención de sus disposiciones puede acarrear distintos grados y formas de invalidez, desde la determinación de no aplicabilidad de la norma, hasta su nulidad. 50 Sobre los conceptos de supremacía formal y material, véase Aragón Reyes, Manuel, “Sobre las nociones de supremacía y supralegalidad constitucional”, Revista de Estudios Políticos, Madrid, núm. 50, marzo-abril de 1986. 51 El término eficacia tiene en el derecho distintos significados, para efectos del presente análisis su significado práctico o sociológico, como la efectiva obediencia y aplicación de una norma, no es primordial. Su aspecto jurídico en cambio, en el sentido de que una norma es válida, es decir, que se ha cumplido con su procedimiento de creación, refleja su significado deóntico y permite realizar una evaluación sobre la juridicidad de la norma. Se refiere principalmente a su capacidad de resistencia en caso de enfrentamiento con otra norma en caso de su aplicación.
328
CARLA HUERTA
Desde la perspectiva de la validez y aplicabilidad de las normas, el término eficacia se refiere más bien al resultado de la colisión de dos normas de rango diverso, es decir, a la fuerza derogatoria o de resistencia que las normas tienen, ésta se conoce como fuerza activa y pasiva, respectivamente. Siguiendo las definiciones de Ignacio de Otto, la “fuerza activa” son los efectos derogatorios de la norma superior, la “fuerza pasiva” es, en cambio, la capacidad de resistencia de la norma superior frente a la inferior.52 Por lo que es posible concluir que la Constitución es por su origen y su posición jerárquica la fuente primaria del sistema jurídico, de tal forma que también puede ser descrita como fuente de fuentes. En virtud de su rango, las normas constitucionales tienen eficacia directa por lo que a su operatividad se refiere, esto implica que no requieren de desarrollo legislativo para producir efectos jurídicos. Como fuente esto le confiere un alto grado de independencia en la aplicación. Esto significa, no solamente que los órganos que hacen el derecho y lo aplican deben tomar la Constitución como premisa de su decisión, tanto al aplicar como al interpretar las normas constitucionales, sino que en caso de conflicto, la aplicación de la norma suprema debe ser considerada preferentemente frente a otras fuentes, salvo en los casos en los que la norma suprema establezca excepciones.
52
De Otto, op. cit., nota 7, pp. 88-91.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL Y SU ESTADO ACTUAL EN LA TEORÍA LIBERAL
Francisco IBARRA PALAFOX* SUMARIO: I. Introducción. II. La primera etapa: derechos de las minorías como comunitarismo. III. La segunda etapa: los derechos de las minorías dentro de un marco liberal. IV. La tercera etapa: los derechos de las minorías como una respuesta a la construcción de los Estados nacionales.
I. INTRODUCCIÓN Entre los principales temas de interés, como estudiosos de la teoría política, se encuentra la discusión sobre los derechos de las minorías1 y la diversidad cultural. ¿Cuáles son los argumentos morales o filosóficos en contra o a favor de tales derechos? Y en particular, ¿cómo se relacionan con los principios básicos de las democracias liberales, tales como son los de la libertad individual, la igualdad y la democracia?
* Instituto de Investigaciones Jurídicas, UNAM, México. 1 Al referirme a los derechos de las minorías etnoculturales, o derecho de las minorías para abreviar, uso este término en el sentido amplio que lo emplea Kymlicka, es decir, para referirme a una gran variedad de políticas, desde derechos y excepciones legales, provisiones constitucionales de políticas multiculturales de los Estados, hasta derechos lingüísticos o derechos de los pueblos indígenas. Ésta es una categoría heterogénea, pero tales medidas tienen dos características en particular: 1) van más allá del conocido conjunto de derechos civiles y políticos que son protegidos por todas las democracias liberales y 2) son adoptados con la intención de acomodar las distintas identidades y necesidades de los grupos etnoculturales. Véase Kymlicka, Will, Politics in the Vernacular: Nationalism, Multiculturalism and Citizenship, Gran Bretaña, Oxford University Press, 2001, p. 17. 329
330
FRANCISCO IBARRA PALAFOX
Al respecto, es importante señalar que el debate filosófico sobre estas cuestiones ha variado sensiblemente tanto en su extensión como en su terminología. A mediados de los años ochenta eran escasos los estudiosos de estos tópicos en la teoría política. En efecto, durante buena parte del siglo XX, aspectos como diversidad cultural, etnicidad o nacionalidad fueron marginales en los escritos filosóficos de los liberales.2 Actualmente, después de décadas de verdadera negligencia por parte de los estudiosos de la filosofía política, podemos sostener que el tema de los derechos de las minorías y el debate multicultural se ha posicionado en el frente de la discusión teórica contemporánea. Este reacomodo teórico tuvo lugar principalmente a finales de la década de los ochenta y principios de la década de los noventa. Desde luego, existen diferentes razones para que esto hubiese sucedido. Entre ellas podemos señalar, obviamente, que el colapso de los países comunistas desató una tremenda oleada de nacionalismo-étnico en Europa del Este, mismo que afectó dramáticamente los procesos de democratización de estos países. En el caso particular de México y de algunos países latinoamericanos, la apertura democrática que experimentaron después de décadas de autoritarismo no sólo estuvo acompañada, sino que fue motivada frecuentemente por la aparición de importantes movimientos de reivindicación indígena, destacando desde luego en el caso mexicano el movimiento armado en el estado de Chiapas.3 La caída del bloque socialista y la apertura democrática de los países latinoamericanos trajo aparejadas las más optimistas 2 3
Kymlicka, Politics in the Vernacular…, cit., nota 1, pp. 17 y 18. En la presente tesis no serán objeto de estudio en lo particular las causas que dieron origen a la aparición del Ejército Zapatista de Liberación Nacional (EZLN) en el estado de Chiapas el 1o. de enero de 1994, ni tampoco haré un estudio del desarrollo de tal movimiento, sin embargo, considero que para abordar los temas relativos al multiculturalismo en México y los derechos de las minorías en este país, es necesaria una comprensión suficiente de este fenómeno, por consiguiente recomiendo consultar las siguientes obras que brindarán una acercamiento inicial al problema bastante completo: Tello Diaz, Carlos, La Rebelión de la Cañadas, México, Cal y Arena, 1997; Stavenhagen, Rodolfo, Indigenous Movements and Politics in México and Latin América, en Curtis Cook y Lindau Juan, Aboriginal Rights and Self-Government, McGill-Queen’s University Press, 2000, pp.72-97; Harvey, Neil, The Peace Process in Chiapas: Between Hope and Frustration, artículo facilitado por el profesor Will Kymlicka, en agosto de 2002; Stavenhagen, Rodolfo, Prospects for Peace in Chiapas, ensayo que me facilitó el profesor Will Kymlicka, agosto de 2002; Hernández Navarro, Luis, Between Memory and Forgetting: Guerrillas, the Indigenous Movement, and Legal Reform in the Time of the EZLN, artículo que me facilitó el professor Will Kynlicka, agosto de 2002.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
331
afirmaciones, en particular aquella consistente en sostener que una pacifica transición a la democracia tendría lugar en estos países. No obstante lo anterior, hay varios aspectos que nos obligan a examinar el avance del estudio sobre los derechos de las minorías con cautela: el resurgimiento de sentimientos xenófobos contra las comunidades de inmigrantes y refugiados en varios países; la aparición de importantes movimientos indígenas que, entre otros hechos, tuvo significativa importancia para que la ONU expidiera una declaración de los derechos indígenas, así como para la reforma constitucional en México; de igual manera, es importante señalar la amenaza de secesión que tuvo lugar en varias democracias occidentales, desde el intento separatista de Quebéc en Canadá, pasando por los escoceses y los norirlandeses en el Reino Unido, hasta llegar a los catalanes y vascos en España.4 Toda esta serie de acontecimientos políticos que tuvieron lugar desde principios de la década de los noventa establecieron que ni las democracias occidentales, ni las emergentes democracias de Europa del Este habían resuelto los problemas que emanaban de las diferencias etno-culturales. En consecuencia, no debe sorprendernos que los estudiosos de la teoría política hubiesen decidido ocuparse de manera creciente de los problemas de la diversidad cultural. De esta manera, ha sido frecuente en la literatura política ver libros sobre democratización, secesión, nacionalismo, diversidad cultural, etnicidad, multiculturalismo y derechos indígenas. Pero no sólo ha habido un incremento considerable en la literatura sobre los temas anteriormente señalados, sino que la naturaleza misma del debate ha cambiado significativamente y es precisamente en esto en lo que deseo concentrarme. En efecto, trataré de explicar brevemente 4 Para un breve examen de los conflictos étnicos y los movimientos nacional-separatistas en algunos países de Europa Occidental, así como sobre algunos casos prácticos acaecidos en la Europa Oriental después del colapso socialista, consúltese: Walzer, M., On toleration, New Haven, Yale University Press, 1997, pp. 51-64, quien examina sucíntamente los casos particulares de Francia, Israel y Canadá; asimismo de la obra de McGarry, John y O’Leary, Brenda, The Eolitics of Ethnic Conflict Regulation. Case Studies of Protracted Ethnic Conflicts, Gran Bretaña, Routledge, 1993; consúltense los siguientes ensayos: McGarry, John y O’Leary, Brenda, The Macro-Political Regulation Of Ethnic Conflict, pp. 1-39; Noel, S. J. R., Canadian Responses To Ethnic Conflic. Consociationalism, Federalism And Control, cit., pp. 41-61; Lieven, Dominic y McGarry, John, Ethnic Conflict in the Soviet Union and its Successors States, pp. 62-83; Schöpflin, George, The Rise and Fall of Yugoslavia, pp. 172-203; Keating, Michael, Spain Peripherial Nationalism And State Response, pp. 204-225.
332
FRANCISCO IBARRA PALAFOX
cómo ha evolucionado el debate multicultural y de los derechos de las minorías. Para empezar y siguiendo a Will Kymlicka, podemos decir que se pueden distinguir con claridad tres etapas del debate multicultural.5 II. LA PRIMERA ETAPA: DERECHOS DE LAS MINORÍAS COMO COMUNITARISMO
Kymlicka señala correctamente, que la primera etapa del debate tuvo lugar principalmente antes de 1989 y la podríamos llamar el predebate.6 En las décadas de los setenta y ochenta, los teóricos que discutían los problemas multiculturales y de las minorías asumían que el debate sobre los derechos de las minorías era, en esencia, equivalente al debate entre liberales y comunitaristas (o dicho de otra manera, entre individualistas y colectivistas). Ahora bien, confrontados como estaban en ese momento con un problema y con una materia poco explorada, no debe extrañarnos que aquéllos dedicados a la teoría política buscaran analogías con debates que les fueran conocidos, entre los cuales, el debate entre liberales y comunitaristas les parecía el más apropiado.7 El debate entre liberales y comunitaristas es ya para nosotros un viejo debate de la filosofía política, de la cual inclusive podemos encontrar claros antecedentes varios siglos atrás y que no trataré de reproducir en el presente artículo. Sin embargo, por considerar que la descripción de tal debate es de la mayor importancia para la cabal comprensión del presente trabajo, trataré de esbozar una idea general del mismo. De manera muy general, puedo señalar que el debate entre liberales y comunitaristas gira esencialmente entorno a la prioridad de la libertad individual. Efectivamente, los liberales insisten en que los individuos deben ser libres para decidir sobre su propia concepción de la vida, asimismo celebran la liberación de los individuos de cualquier tipo de adscripción y status que poseyeran con anterioridad, pues creen en la autonomía individual como factor esencial para la definición de las formas de vida particulares de las personas. Es así como los individualistas 5 6 7
Kymlicka, Will, Politics in the Vernacular..., cit., nota 1, pp. 18 y ss. Ibidem, pp. 18 y 19. Sobre el debate entre comunitaristas y liberales, véase Kymlicka, Will, Contemporary Political Philosophy. An Introducción, Oxford, Oxford University Press, 1990, pp. 199-237.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
333
y liberales señalan que indiscutiblemente el individuo es moralmente anterior a la comunidad y que la comunidad sólo es importante en la medida en que contribuye al bienestar de los individuos que la integran.8 De esta manera, cuando la comunidad se enfrente a la autonomía de los individuos habrá que manifestarse decididamente por esta última. Los comunitaristas, por su parte, disputan esta concepción de la autonomía individual pues ven a los individuos como entes estrechamente vinculados y determinados por los particulares roles y relaciones sociales que desempeñan en sus particulares contextos comunitarios. Es así como señalan que tales relaciones y determinaciones no les permiten revisar sus propias concepciones de lo que podría ser una buena vida, sino que por el contrario, les heredan una forma de vida que define lo que es bueno para ellos. En este sentido, los comunitaristas más que considerar a las prácticas grupales como el producto de las opciones individuales, ven a los individuos como producto de sus particulares prácticas sociales. Más aún, frecuentemente niegan que los intereses de las comunidades puedan ser reducidos a los intereses de los individuos en lo particular. Privilegiar la autonomía individual es, en consecuencia para los comunitaristas, considerado no sólo como algo nocivo, sino además destructivo para las comunidades.9 Asimismo, en esta primera etapa del debate la posición que uno asumiera en torno a los derechos de las minorías dependía, o más bien derivaba, de la posición que uno asumiera sobre el debate entre liberales y comunitaristas. De esta manera, si uno era un liberal, tendería a promover la autonomía individual y a oponerse a los derechos de las minorías como un innecesario y peligroso alejamiento de las perspectivas que enfatizan los aspectos individuales. Los comunitaristas contrariamente a lo anterior, consideraban a los derechos de las minorías como una manera apropiada de proteger a las comunidades de los efectos corrosivos de la autonomía individual, afirmando el valor intrínseco de la comunidad y oponiéndose a todo tipo de autodefinición del individuo mediante su libertad. De esta manera, los comunitaristas consideraban a las minorías etno-culturales como acreedoras de cualquier tipo de protección que se les pudiese otorgar frente a los riesgos provenientes de la autonomía y la libertad individuales que atentaran contra la existencia de los grupos 8 9
Kymlicka, Will, Politics in the Vernacular…, cit., pp. 18 y 19. Ibidem, p. 19.
334
FRANCISCO IBARRA PALAFOX
minoritarios, pues en buena medida consideraban que las solidaridades comunitarias se encontraban en peligro frente a los sociedades liberales, además de que la vida comunal era por sí misma valiosa y en consecuencia digna de proteger. Este debate sobre la relativa prioridad y reductibilidad de los derechos de las minorías a los individuos o a los grupos, a la autonomía o a los vínculos comunitarios, dominó la primera generación de la literatura sobre estos derechos,10 pues como hemos visto, los defensores del liberalismo estuvieron de acuerdo en que los derechos de las minorías eran inconsistentes con los postulados esenciales del liberalismo y de la autonomía individual, mientras que para los comunitaristas la defensa de los derechos de las minorías significaba, en su momento, asumir la crítica comunitaria del liberalismo y considerar a estos derechos como necesarios para una defensa coherente de los vínculos y solidaridades de los grupos minoritarios, que se consideraban per se, adheridos a los valores comunales, contra lo que consideraban era una amenaza por parte del liberalismo individualista. III. LA SEGUNDA ETAPA: LOS DERECHOS DE LAS MINORÍAS DENTRO DE UN MARCO LIBERAL
Estoy de acuerdo con Kymlicka cuando señala que en esta segunda etapa del debate, la pregunta que debemos formularnos es la siguiente: ¿cuál debe ser la amplitud de los derechos de las minorías dentro de la teoría liberal?11 Como podemos apreciar, han cambiado los términos del debate. El problema ya no es cómo proteger a las minorías del mismo liberalismo, como se planteaba en la primera etapa, sino más bien por qué las minorías etnoculturales (que comparten principios liberales básicos) necesitan de los derechos de las minorías. Dicho de otra manera, el problema puede ser planteado como sigue: si los grupos minoritarios son liberales, entonces por qué sus miembros necesitarían derechos especiales como lo son los derechos de las minorías,12 no siendo suficientes los derechos propios de la ciudadanía.
10 11 12
Idem. Ibidem, p. 21. Idem.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
335
Este es el tipo de preguntas que Raz trata de contestar en algunos de sus trabajos en los que aborda problemas relacionados con la diversidad cultural.13 Raz insiste que la autonomía de los individuos —su habilidad para tener elegir una buena vida— esta íntimamente ligada con el acceso a su cultura, con la prosperidad y florecimiento de ésta y con el respeto que los le otros le deben. De esta manera los derechos de las minorías nos permiten asegurar el florecimiento y el respeto mutuo entre las diferentes culturas. Otros escritores liberales importantes como David Miller, Yael Tamir y particularmente Will Kimlycka,14 han formulado similares argumentos acerca de la importancia de la pertenencia cultural o la identidad nacional para los ciudadanos modernos de las democracias liberales. Los detalles del argumento varían un poco, sin embargo, cada uno de ellos señala, en sus propios términos, que existen importantes intereses sociales que son consistentes con los principios liberales de libertad e igualdad y que están intrínsecamente relacionados a la cultura y a la identidad cultural. Tales intereses justificadamente otorgan derechos especiales a las minorías y que nosotros hemos llamado derecho de las minorías. Por lo anterior, podríamos llamar a esta posición como cultural-liberalista. Diversos argumentos se han levantado en contra de la posición liberal que favorece la teoría de los derechos de las minorías,15 sin embargo, para Kymlicka inclusive aquellos que simpatizan con el liberalismo cultural enfrentan un problema obvio pues, en su opinión, es muy claro que hay ciertos derechos de las minorías que podrían erosionar más que favorecer a la autonomía individual. En efecto, para Kymlicka un aspecto crucial que enfrentan aquellos que defienden los derechos de las minorías consiste en distinguir entre lo que podríamos llamar “malos” derechos de las minorías que implican una restricción a los derechos individuales, de aquellos “buenos” derechos de las minorías que soportan y 13 Raz, Joseph, “Multiculturalism: A Liberal Perspective”, Dissent, invierno de 1994, pp. 67-79. 14 Yael Tamir, Liberal Nationalism, Princeton, Princeton University Press, 1993; Miller, David, On Nationality, Oxford, Oxford University Press, 1995; Kymlicka, Will, Ciudadanía multicultural. Una teoría liberal de los derechos de las minorías, Barcelona, Paidós, 1996. 15 Sobre la crítica que hacen algunos a la pretensión de los liberales de integrar los derechos de las minorías a la teoría liberal, es interesante el artículo de Kukhatas, quien fue pionero en este tipo de críticas, veáse Kukhatas, Chandran, “Are There any Cultural Rights?”, Political Theory, vol. 20, núm. 1, febrero de 1992, pp. 105-139.
336
FRANCISCO IBARRA PALAFOX
favorecen a los derechos individuales. En este sentido Kymlicka se ha propuesto distinguir entre dos tipos de derechos que pueden ser exigidos por un grupo culturalmente diferenciado. El primero implica un tipo de derechos del grupo contra sus propios miembros, designados para proteger al propio grupo de los impactos desestabilizadores provocados por las disensiones o las diferencias internas de sus integrantes (como podría ser la decisión de miembros individuales de no seguir tradicionales prácticas o costumbres). El segundo implica el derecho del grupo a protegerse contra la sociedad dominante (como podrían ser los integrantes del Estado nacional) y estaría designado a proteger al grupo del impacto que pudiesen causar las presiones externas, como podrían ser las decisiones económicas o políticas que asumiera en su nombre un Estado.16 Kymlicka llama a las primeras restricciones internas y a las segundas protecciones externas. Ahora bien, en virtud de que el fundamento teórico de los liberales es la autonomía interna, Kymlicka señala que los liberales deben ser escépticos acerca de las restricciones internas. Esto en virtud de que Kymlicka, como la mayoría de los liberales culturalistas, rechaza la idea de que cualquier grupo pudiera legítimamente restringir los derechos civiles básicos o los derechos políticos básicos de sus propios miembros con el pretexto de preservar la pureza o autenticidad de la cultura o las tradiciones del grupo. Sin embargo, en opinión de Kymlicka, una concepción cultural del multiculturalismo puede estar de acuerdo en el otorgamiento de diversos derechos que puedan ser oponibles a la sociedad dominante, de tal manera que se pueda reducir la vulnerabilidad de los grupos minoritarios o en desventaja, frente a las decisiones económicas y políticas que asuman la sociedad dominante. Tales protecciones externas son consistentes con los principios liberales, aunque se pueden convertir en ilegítimas si ellas también, en lugar de reducir la vulnerabilidad del grupo frente a los integrantes de la sociedad dominante, permiten que una minoría dentro del grupo ejerza algún tipo de dominio político o económico sobre otro grupo o sobre integrantes del mismo grupo. Dicho de una manera muy general, podemos decir que para Kymlicka, los derechos de las minorías son consistentes con el liberalismo si: a) ellos protegen la libertad de los individuos dentro del grupo y b) si promueven las relaciones de equidad entre los grupos o sus inte-
16
Kymlicka, Will, Politics in the Vernacular…, cit., nota 1, p. 22.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
337
grantes.17 Otros liberales culturalistas argumentan que algunas formas de restricciones internas deberían ser permitidas, siempre y cuando sus miembros tengan la posibilidad de abandonar el grupo en el cual se encuentran, o la comunidad a la que pertenecen.18 En síntesis, podemos señalar que en esta segunda etapa del debate multicultural, la cuestión de los derechos de las minorías es reformulada como una pregunta o como un problema dentro de la propia teoría liberal y su propósito es demostrar que, algunos (pero no todos) de los derechos de las minorías promueven los valores liberales. Ciertamente, esta segunda etapa refleja un verdadero progreso en relación con la primera, pues ya poseemos una mayor comprensión de las implicaciones normativas que ha propuesto el debate, además de que hemos ido más allá de la estéril y confusa polémica en torno al individualismo o al colectivismo, como era propio de la primera etapa. Asimismo, considero importante señalar que esta segunda fase de la discusión sobre la congruencia liberal de los derechos de las minorías es muy amplia y comprende a muy diversos autores y a algunos de los teóricos más importantes de la filosofía política angloamericana como John Rawls, Joseph Raz, Charles Taylor y Iris Marion Young y Ami Gutman, por citar a algunos de los más importantes.19 Ahora bien, como hemos podido apreciar, esta segunda etapa del debate multicultural se refiere, en buena medida a la necesidad que en la década pasada tuvieron los teóricos liberales de asumir que los derechos de las minorías formaban parte de la teoría liberal, necesidad que, sin embargo, no es nueva en la historia del liberalismo, cuando menos antes de la Primera Guerra Mundial era un tema no poco frecuente en la tradición liberal. 17 18
Ibidem, p. 23; del mismo autor, Ciudadanía multicultural, cit., nota 14, pp. 57-71. Esta tesis es sostenida por Kukhatas, véase Kukhatas, Chandran, “Are There Any Cultural Rights?”, op. cit., nota 15. 19 Añadiría a las obras que he citado en esta sección y que ubico en lo que hemos llamado la segunda etapa del debate multicultural, los siguientes títulos: Rawls, John, Liberalismo político, México, FCE, 1995, pp. 9-170; Taylor, Charles, Multiculturalism and The Politics of Recognition, New Jersey, Princeton University Press, 1992, pp. 25-73; Young, Iris Marion, Justice and the Politics of Difference, New Jersey, Princeton University Press, 1990, pp. 3-38 y 156-191. También véanse los siguientes artículos: Gutman, Amy, “The Challenge of Multiculturalism to Political Ethics”, Philosophy and Public Affairs, vol. 22, núm. 3, 1993; Galston, “Two Concepts of Liberalism, Symposium on Citizenship, Democracy and Education”, Ethics, vol. 105, núm. 3, 1995, pp. 518-533.
338
FRANCISCO IBARRA PALAFOX
En efecto, durante la mayor parte del siglo XIX y la primera mitad del XX, los principales pensadores liberales de ese tiempo discutieron los temas derivados de la diferencia étnico-cultural, pues los mismos fueron una parte importante de la teoría y la práctica liberal que derivaban de las posiciones coloniales de muchas potencias occidentales que, de alguna u otra manera, se habían planteado la necesidad de superar las diferencias culturales en las naciones sometidas a sus dominios. De esta manera, era común por parte de los liberales decimonónicos y de las primeras décadas del siglo XX que sostuvieran que los imperios multinacionales europeos, como el de los Habsburgo o el imperio británico, trataban injustamente a sus minorías etno-culturales. Este trato injusto, decían los liberales, radicaba en que no sólo se les negaban sus libertades civiles y políticas (pues esto mismo sucedía con la mayoría de las poblaciones de los imperios coloniales), sino que además se les negaban sus derechos nacionales de autogobierno, los cuales eran considerados consustanciales a las libertades individuales básicas.20 Por ejemplo, una manifestación del compromiso liberal con las minorías a principios del siglo XX fue el programa de protección de las minorías instaurado por la Sociedad de las Naciones, misma que otorgó derechos individuales, así como algunos derechos específicos en función del grupo referentes a la enseñanza, la autonomía local y la lengua.21 Por otra parte, si bien muchos liberales del siglo XIX y de principios del siglo XX coincidieron en la defensa de los derechos de las minorías, otros se opusieron a tales reivindicaciones. Tal rechazo se debía a la idea que pensadores tan importantes como John Stuart Mill, tenían de que en un Estado multinacional no era posible la existencia de instituciones libres ya que, según Mill, entre gentes “que no tienen afinidad alguna, especialmente si leen y hablan lenguas distintas, la unanimidad necesaria para el funcionamiento de las instituciones representativas no puede existir”. Para Mill era condición necesaria para la existencia de las instituciones libres que las fronteras de los gobiernos coincidieran esencialmente con las de las nacionalidades.22 En efecto, para pensadores liberales como Mill cualquier tipo de autogobierno sólo es posible si “el 20 21 22
Kymlicka, Will, Ciudadanía multicultural, cit., nota 14, pp. 77-79. Idem. Mill, John Stuart, “Considerations on Representative Government”, Utilitarianism, Liberty, Representative Government, Geraint Williams, Everyman (ed.), Londres, J. M. Dent, 1993, pp. 391-428.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
339
pueblo” es una nación en sí misma. Dicho de otra manera, los miembros de una democracia deben compartir un sentimiento de lealtad política, por lo que una nacionalidad común es requisito previo para la existencia de esa lealtad. Para la corriente de pensamiento representada por Mill, un Estado libre debe ser un Estado-nación por lo que la cuestión de la diversidad etno-cultural debe ser resuelta mediante la asimilación coercitiva o, mediante un rediseño de las fronteras, pero nunca mediante la concesión o el otorgamiento de lo que ahora llamamos derechos a las minorías.23 Es importante agregar que Mill y otros liberales no eran los únicos en sostener semejante punto de vista, también los socialistas compartían de alguna manera semejantes postulados en contra de las minorías etno-culturales. Así por ejemplo, justificaban la asimilación forzosa de muy diversos pueblos al movimiento socialista con postulados de universalidad, como lo hacía el liberalismo, pero ahora en su lugar con llamados a la unidad internacional del proletariado, o en aras de la construcción de un estadio final de desarrollo como podía ser el comunismo, donde todos los seres humanos serían iguales y dejando de lado cualquier distinción de tipo cultural.24 Ahora bien, ¿qué explica este notable interés sobre las diferencias etno-culturales durante el siglo XIX y principios del XX, así como la práctica desaparición del mismo en el pensamiento de la posguerra? En parte, la explicación la podemos encontrar en el apogeo y la caída de los grandes imperios coloniales. En efecto, por una parte la política colonial fue conformada, en un principio, por personas que tendían a universalizar la doctrina liberal de una manera abstracta y que poseían una irresistible propensión a generalizar lo que podríamos llamar los principios liberales, haciendo a un lado la historia, la cultura y en general, todas las particularidades de las culturas sujetas al imperio.25 Pero al mismo tiempo, 23 24
Kymlicka, Will, Ciudadanía multicultural, cit., nota 14, pp. 80 y 81. Sobre la ausencia de distinciones etnico-culturales en el pensamiento socialista, sólo basta realizar una sucinta revisión, por ejemplo, del Manifiesto del Partido Comunista en el cual Carlos Marx, desarrolla con toda puntualidad el origen de las causas que dividen a los hombres en clases sociales, en este caso, a los proletarios y a los burgueses. Con toda claridad, Marx puntualizará que la raíz de tal separación y en última instancia de la desigualdad, es de naturaleza económica. Para él, las diferencias culturales o cualquier otra que pudiese distinguir a los hombres, debía buscarse en los motores económicos de la sociedad. Sobre el particular véase, Marx, Carlos, El manifiesto del partido comunista, Moscú, Progreso, p. 64. 25 Kymlicka, Will, Ciudadanía multicultural, cit., nota 14, pp. 83 y 84.
340
FRANCISCO IBARRA PALAFOX
las dimensiones del imperio hacían inevitable la discusión entre otros liberales, de la necesidad de acomodar la diversidad cultural a la que se enfrentaban cada día en los diversos territorios bajo su dominio. Asimismo, los temas relativos a los derechos de la diversidad cultural no sólo se discutieron ampliamente en los imperios coloniales (británico, zarista, hamburgo), sino que también se llegaron a plantear en los países de Europa continental. En efecto, antes de la Primera y Segunda guerras mundiales, los conflictos que tuvieron su origen en las diferentes identidades minoritarias nacionales que estaban latentes en Europa y que fueron fuente de constantes desequilibrios para la paz internacional, motivaron a diferentes escritores a discutir y desarrollar estos temas (habrá que recordar que Alemania invade Polonia y Checoslovaquia en los treinta con el pretexto de proteger a las minorías germanas ubicadas en esos territorios). Sin embargo, esta inquietud desapareció después de la Segunda Guerra Mundial, en el momento en que los grandes imperios coloniales desaparecían del orbe y las discusiones bipolares de la Guerra Fría sustituían a los conflictos nacionalistas. Es muy probable que como resultado de tal cambio en la discusión teórica, muchos liberales regresaran a los temas propios de lo que podríamos llamar un “universalismo liberal abstracto”, incapaces de distinguir entre los principios esenciales del liberalismo y sus manifestaciones culturales y concretas en muchas de las naciones emanadas del derrumbe de los grandes imperios coloniales del siglo XIX.26 Si agregamos que después de la Segunda Guerra Mundial los Estados Unidos jugaron un papel muy importante en el desarrollo de la filosofía política, podemos entender un poco mejor porque hubo tal descuido de los temas relativos a las minorías. Como bien se podrá apreciar en este momento, durante el siglo XIX y principios del XX los liberales estadounidenses estuvieron menos implicados en este debate que los liberales de los imperios coloniales europeos, ya que no tenían que preocuparse por la existencia de colonias como las que mantenían algunas naciones europeas. En términos generales, podemos decir que en los Estados Unidos se dedicaron a discutir el estatus de los inmigrantes blancos y no consideraron seriamente las reivindicaciones de las minorías nacionales históricamente concentradas en su territorio, como podían ser los grupos indí26
Ibidem, p. 85 y 86.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
341
genas, las identidades de lengua española en el sudoeste estadounidense y en la Florida, los portorriqueños, los hawaianos y los esquimales. Fue así como la teoría liberal estadounidense de la posguerra exhibe un gran desinterés por las minorías, lo que no es de poca importancia si consideramos que es ese país uno de los que con mayor energía ha venido desarrollando varios de los temas de la teoría liberal política contemporánea. Por lo que respecta al espacio latinoamericano, habrá que recordar que estas naciones se encontraron inmersas, desde el final de la Segunda Guerra Mundial, en un proceso de franco nacionalismo en lo político y en lo económico se sujetaron a un proceso de sustitución de importaciones y desarrollo de la economía interna. Todo ello obligó a los países latinoamericanos a la consolidación de Estados nacionales sujetos, en la mayor parte de los casos, a un fuerte poder central, a través de un partido dominante como en el caso de México, de un partido único como en el caso cubano o través de dictaduras militares como en Argentina, Chile y Brasil. Estas particularidades políticas de los países latinoamericanos inevitablemente orillaron a los estudiosos de la política a pensar en un modelo de Estado unitario y poco cuidadoso de las minorías. Fue así como los estudios políticos latinoamericanos estuvieron férreamente dirigidos a la consolidación de los procesos de unidad nacional y política, haciendo caso omiso de las diferencias culturales que podían encontrarse en su interior. Esto aplica inclusive para los estudios indigenistas que aparecieron en México y que tanta influencia tuvieron en algunos países latinoamericanos. Estos estudios en lugar de reconocer la diferencia cultural de los grupos indígenas americanos, más bien se encaminaron a asimilarlos a la cultura mexicana dominante, mediante un discurso nacionalista abstracto y generalizador, poco respetuoso de las identidades particulares indígenas.27 27 En efecto, como ejemplo podría ser importante señalar el uso que hicieron del indigenismo algunas de las figuras más sobresalientes de la antropología social mexicana (entre las que destaca Antonio Caso y Manuel Gamio), para la construcción de un Estado nacional mexicano, fuertemente unitario y excluyente de las particularidades indígenas, a las que trataron de asimilar al Estado nacional. Este esfuerzo intelectual fue ampliamente promovido por el Estado mexicano y generó lo que se ha dado en denominar, dentro del pensamiento antropológico y social latinoamericano, el indigenismo, mismo que fue ampliamente promovido por el gobierno mexicano y que ha tenido una amplia influencia en otros países de la región con importante población indígena. Sobre el particular sugiero que se consulte Villoro, Luis, Los grandes momentos del indigenismo mexicano, México,
342
FRANCISCO IBARRA PALAFOX
Ahora bien, no sólo se prestaba poca atención a los derechos de las minorías por las particulares condiciones políticas de la posguerra y de la Guerra Fría, también fue frecuente querer asimilar estos derechos diferenciados a los derechos humanos. En efecto, después de la Segunda Guerra Mundial, la mayoría de los liberales tanto de derecha como de izquierda rechazaron la idea de una diferenciación permanente en los derechos o en el estatus de determinados grupos, así como también se oponían a la idea de que debería concederse a los grupos étnicos o nacionales específicos una identidad política particular o un estatuto constitucional diferenciado y, en este sentido, intentaron integrar los derechos de las minorías a una teoría general de los derechos humanos. Sin embargo, cada vez era más claro que los derechos de las minorías no podían subsumirse bajo la categoría de los derechos humanos, ya que las pautas y procedimientos tradicionales de éstos eran simplemente incapaces de resolver importantes y controvertidas cuestiones relativas a las minorías culturales como las siguientes que acertadamente señala Kymlicka: ¿qué lenguas deberían aceptarse en los parlamentos, burocracias y tribunales? ¿Se deberían dedicar fondos públicos para escolarizar en su lengua materna a todos los grupos étnico-nacionales? ¿Es factible trazar fronteras internas (distritos legislativos, provincias, Estados) que tengan como propósito permitir que las minorías culturales formen una mayoría dentro de una región local? ¿Deberían otorgarse poderes políticos a nivel local o regional a las minorías, en particular en temas relacionados con la educación o la migración? ¿Se deberían conservar y proteger los espacios geográficos tradicionales de los grupos indígenas para su exclusivo beneficio, protegiéndolos de la usurpación de los colonos y de los explotadores de recursos naturales?28
SEP-Lecturas Mexicanas, 1987, pp. 248. Véase también García Canclini, Nestor, Culturas hibrídas. Estrategias para entrar y salir de la modernidad, México, Grijalbo-Conaculta, 1990, p. 179. Asimismo, parece interesante señalar que el término indigenismo no se entiende en el mundo de habla inglesa, pues los anglófonos cuando se encuentran con el término, inmediatamente consideran que se refiere a una doctrina de pensamiento creado por los propios indígenas; es difícil, por consiguiente, explicar que en español por lo menos como se entiende en Latinoamérica, tal pensamiento se refiere más bien a una doctrina que han creado los propios intelectuales para referirse a los indígenas. 28 Véase Kymlicka, Ciudadanía multicultural, cit., nota 14, p. 18.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
343
El problema no era que las doctrinas tradicionales sobre los derechos humanos dieran una respuesta errónea a tales cuestiones, sino más bien, que a menudo no dan ninguna. Así por ejemplo, el derecho a la libertad de expresión, no nos dice cuál podría ser una política lingüística adecuada; tampoco el derecho a votar nos dice cómo se deben trazar las fronteras políticas o cómo podrían distribuirse los poderes entre los distintos niveles de gobierno, ni tampoco nos dice nada sobre los regímenes autonómicos; el derecho a la movilidad y libre circulación, nada nos dice sobre cómo debe ser una política adecuada de inmigración y naturalización,29 etcétera. Como podrá observarse, era evidente que los principios tradicionales de los derechos humanos debían ser complementados con una teoría de los derechos de las minorías. Por lo anterior, no resulta sorprendente que hacia finales de los ochenta y principios de los noventa, los derechos de las minorías hayan recuperado una posición preponderante en las relaciones internacionales. Así por ejemplo, la Conferencia sobre Seguridad y Cooperación en Europa (CSCE) adoptó en 1991 una Declaración sobre los Derechos de las Minorías Nacionales y, posteriormente, estableció un Alto Comisionado para las Minorías Nacionales en 1993. Asimismo, también a principios de los noventa las Naciones Unidas debatieron textos importantes: una Declaración sobre los derechos de las personas pertenecientes a las minorías nacionales o étnicas, religiosas y lingüísticas, y una Declaración Universal sobre los Derechos Indígenas. De igual manera, el Consejo de Europa adoptó una declaración sobre los derechos de las lenguas minoritarias en 1992 (la Carta de Europa para las Lenguas Regionales o Minoritarías).30 En vista de lo anterior, resultaba indispensable complementar los derechos humanos tradicionales con los derechos de las minorías ya que, en cualquier Estado multicultural una teoría de la justicia deberá incluir tanto derechos universales —asignados a individuos independientemente de su pertenencia a un grupo— como aquellos derechos diferenciados de función de grupo. De ahí que los liberales trataran de crear, en esta segunda etapa del debate liberal, una teoría liberal de los derechos de las minorías que explicara como coexisten los derechos de las minorías con los derechos humanos, y también como los derechos de las mino29 30
Idem. Ibidem, pp. 18 y 19.
344
FRANCISCO IBARRA PALAFOX
rías están limitados por los principios de libertad individual, democracia y justicia.31 Ahora bien, no obstante el significativo avance que implica haber llegado a esta segunda etapa, Will Kymlicka considera y estoy de acuerdo con él, que ha comenzado a surgir una especie de consenso entre los liberales para iniciar una tercera y nueva etapa del debate, pues ya no deseamos discutir como se pueden justificar los derechos de las minorías en la teoría liberal, o más concretamente, no deseamos seguir argumentando si tales derechos pueden ser liberales o no. Consideramos que este punto ha sido suficientemente discutido y que tales derechos cuentan con plena carta de aceptación en la teoría liberal.32
31 32
Ibidem, p. 19. No obstante que podemos observar que varios de los pensadores liberales más importantes (como Rawls, Dworkin, Raz, Taylor, Kymlicka, etcétera) han sostenido recientemente una posición en favor de los derechos de las minorías y los temas de la diversidad cultural, es importante señalar que aún hay lo que podríamos llamar un núcleo de teóricos liberales radicales por lo que respecta a su individualismo y universalismo, que han rechazado tales derechos, pues en su opinión no hay posibilidad de congruencia entre ellos y la teoría liberal. Entre tales teóricos se encuentra Brian Barry quien llama la atención no sólo por ser uno de los teóricos más representativos de esta posición, sino además por la virulencia con la que ha dirigido sus ataques en contra de los cultural-liberalistas. Considero que opiniones como las Barry constituyen en este momento posiciones marginales dentro de la teoría liberal, sin embargo, por estar entre los críticos más acérrimos del multiculturalismo, juzgo importante señalar su presencia. A manera de ejemplo, Barry comenta en su más reciente libro: “Will Kymlicka ha sugerido recientemente que hay una convergencia en la literatura reciente acerca de las ideas del ‘multiculturalismo liberal’. Este punto de vista que él llama ‘liberalismo cultural’, dice Kymlicka, ‘se ha convertido en la posición dominante en la literatura de hoy y la mayoría de los debates versan sobre cómo desarrollar y refinar las posiciones del liberalismo cultural, más que en como aceptarlo en primera instancia’. Lo que Kymlicka dice es cierto, pero en algún sentido también es engañoso. Así cuando él dice el ‘liberalismo cultural ha ganado por default’ ya que no hay una clara alternativa a tal corriente teórica, lo que quiere decir es que casi todos los filósofos políticos anglófonos lo han aceptado. Mi propia y privada encuesta, admitidamente acientífica, me lleva a concluir que tal afirmación esta lejos de ser cierta... he creído que el multiculturalismo está condenado tarde que temprano a hundirse bajo el peso de sus debilidades intelectuales y que debería mejor emplear mejor mi tiempo en escribir sobre otros tópicos...” (la traducción es mia) Barry, Brian, Culture and Equality. An Egalitarian Critique of Multiculturalism, Gran Bretaña, Polity Press, 2001, pp. 5 y 6.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
345
IV. LA TERCERA ETAPA: LOS DERECHOS DE LAS MINORÍAS COMO UNA RESPUESTA A LA CONSTRUCCIÓN DE LOS ESTADOS NACIONALES
Esta tercera etapa del debate multicultural que está surgiendo —y en la cual nos hallamos actualmente— se encuentra encaminada a desarrollar y perfeccionar las posiciones de lo que hemos llamado el liberalismo culturalista y en ella se plantea, entre otras cosas, que se interpreta incorrectamente la naturaleza del Estado y de sus instituciones, así como las demandas que éste puede formular a las minorías. En esta tercera etapa de la discusión se examinará cómo el Estado y sus instituciones básicas se deben relacionar en términos de justicia con las minorías nacionales y étnicas. En consecuencia, se discutirá si el Estado liberal ha promovido una cultura dominante en perjuicio de las minorías o si, por el contrario, ha sido neutral al no favorecer ninguna cultura en perjuicio de otras. En tal sentido, habrá que partir de la asunción normalmente compartida tanto por defensores como por críticos de los derechos de las minorías, de que el Estado liberal, en su operación normal, se sujeta a un principio de neutralidad etno-cultural. Lo anterior quiere decir que se supone que el Estado es “neutral” con respecto a las identidades etno-culturales de sus ciudadanos, así como indiferente hacia las habilidades que desarrollen las minorías para reproducir su cultura y sus prácticas. Bajo este presupuesto común, algunos teóricos liberales señalan que los Estados liberales tratan a las diferencias culturales como han venido tratando con la religión, es decir, como un asunto de la competencia privada de los ciudadanos, a quienes se les debe permitir absoluta libertad para tomar las decisiones que más les convengan y en las cuales el Estado, siempre y cuando se respeten los derechos de los otros, no deberá asumir ninguna responsabilidad. En este sentido, señalan que así como el liberalismo ha evitado el establecimiento de una religión oficial, de la misma manera ha evitado el establecimiento de culturas oficiales que puedan ser preferidas sobre otras formas culturales dentro del propio Estado. Este tipo de argumentos los podemos encontrar, por ejemplo, en Michael Waltzer, quien ha sostenido, desde mi punto de vista equivocadamente, que el liberalismo implica un drástico divorcio entre el Estado y
346
FRANCISCO IBARRA PALAFOX
etnicidad.33 En el centro de esa argumentación subyace la concepción de que el Estado permanece por encima de todos los diversos grupos nacionales y étnicos, negándose a adoptar o apoyar la reproducción de alguna de esas culturas o prácticas de vida grupal. De esta forma, Waltzer señala que Estado es neutral con referencia al lenguaje, la historia, la literatura o los calendarios propios de cada uno de esos grupos, más aún, señala que el más claro ejemplo de semejante neutralidad estatal son los Estados Unidos de América, cuya neutralidad etno-cultural se refleja, según su opinión, en el hecho de que no existe en ese país una lengua oficial, pues para que los inmigrantes se conviertan en nacionales de los Estados Unidos, basta según Waltzer, con que ellos manifiesten su adhesión a los principios de democracia y libertad individual reconocidos en la Constitución de los Estados Unidos.34 En consecuencia y para pensadores como Waltzer, que las minorías busquen derechos especiales, constituye un alejamiento radical de las tradicionales formas de neutralidad de los Estados liberales. No obstante lo anterior, coincido con Kymlicka cuando afirma que esta idea de que los Estados liberal-democráticos o las naciones civiles son etno-culturalmente neutros, es manifiestamente falsa.35 Inclusive, tampoco creo en la presunción de que el Estado es completamente neutral en materia religiosa, pues también en esta materia me parece difícil sostener que el Estado liberal hubiese sido siempre neutral. A manera de ejemplo puedo señalar el caso del Reino Unido pues, como acertadamente ha señalado Tariq Modood, el establecimiento de la Iglesia de Inglaterra, en un Estado liberal y democrático como lo es el Reino Unido de la Gran Bretaña, hacen de éste un Estado más bien cristiano y específicamente protestante, en detrimento de otras minorías religiosas que coexisten en ese país, como son los católicos, los judíos, los hindús, los sikhs o los musulmanes.36 En efecto, sólo hay que recordar la especial relación que posee el Estado británico con la Iglesia de Inglaterra, a la que otorga algunas limitaciones y privilegios muy importantes. Entre los privilegios 33 34 35
En Kymlicka, Will, Politics in the Vernacular…, cit., nota 1, pp. 23 y 24. Ibidem, p. 24. Idem; véase también Kymlicka, Will, Can Liberal Pluralism be Exported? Western Political Theory and Ethnic Relations in Eastern Europe, Reino Unido, Oxford University Press, 2001. 36 Véase Tariq, Modood, “Establishment, Multiculturalism and British Citizenship”, Political Quarterly, vol. 65, 1994, pp. 53-73.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
347
podemos mencionar, a manera de ejemplo, sólo los siguientes: el monarca es el supremo gobernador de la Iglesia anglicana; el monarca no podrá ser ni se podrá casar con un católico; la iglesia anglicana estará a cargo de la coronación, así como de todas aquellas funciones estatales en las cuales se requieran de servicios religiosos; veintiséis obispos de la misma Iglesia poseen de ex officio asientos en la Cámara de los Lores; las cortes eclesiásticas son parte del sistema legal y las doctrinas y sensibilidades de los anglicanos están protegidas de blasfemia por disposición del derecho. Entre las restricciones a las cuales se encuentra sometida la Iglesia de Inglaterra podemos decir que el monarca, aconsejado por el primer ministro, tiene la última palabra en el nombramiento de la más altas designaciones de esa jerarquía eclesiástica; de igual manera, el parlamento tiene la última palabra en materias de doctrina y liturgia.37 Es claro entonces que los privilegios y limitaciones que en materia religiosa existen en el Reino Unido, privilegian a la Iglesia anglicana sobre el resto de los cultos religiosos que existen en esa isla y a los cuales coloca en una posición de franca desventaja. Por lo anterior, no es exagerado afirmar que una democracia liberal como la británica no asume en realidad ninguna neutralidad en materia religiosa, como han querido argumentar algunos teóricos liberales. También tenemos el caso de algunos Estados latinoamericanos que se han asumido formalmente como liberales, pero que en la realidad no parecen estar completamente separados de la religión. Así por ejemplo, tenemos el caso del reciente y poderoso crecimiento de las minorías protestantes latinoamericanas que no ha estado exento de una fuerte participación estatal como es el caso de Centro América y en particular de Guatemala, dónde el gobierno ha favorecido abiertamente el crecimiento de los protestantes principalmente de grupos pentecostales, con el propósito de debilitar a diversos grupos guerrilleros que estuvieron vinculados, durante la década de los ochenta y principios de los noventa, a la Iglesia católica y en particular a católicos afines a la teología de la liberación. Hoy en día el protestantismo ha dejado de ser una minoría religiosa en Guatemala y se ha transformado en un poderoso movimiento religioso,
37
Tariq, Modood, op. cit., nota 36.
348
FRANCISCO IBARRA PALAFOX
además de que es casi un requisito para las élites gobernantes guatemaltecas ser protestante.38 En fin, los ejemplos podrían ser múltiples, sin embargo, sólo me interesa resaltar que la supuesta neutralidad del Estado no sólo no aplica en el caso de las relaciones entre el Estado y los grupos etnico-culturales, sino más aun, ni en los propios asuntos religiosos los mismos Estados han sido completamente neutrales, pues muchas veces han favorecido a algún grupo religioso, frecuentemente al mayoritario, en detrimento de las minorías religiosas que pudiesen existir en su seno. Por otro lado, considérense las actuales políticas de los Estados Unidos, mismas que han sido calificadas por Waltzer como prototipo de un Estado neutral. En efecto, históricamente las decisiones acerca de las fronteras entre los estados integrantes de la federación estadounidense y los tiempos de admisión dentro de la misma, fueron deliberadamente elaborados para asegurar que los anglófonos fueran una mayoría dentro de cada uno de los cincuenta estados de la federación americana. Esto, desde luego, ayudó a consolidar el dominio del idioma inglés a todo lo largo y ancho del territorio de los Estados Unidos. Asimismo, la permanencia del inglés ha sido asegurada de muy diferentes formas que se aplican hasta la fecha. Por ejemplo, es un requerimiento legal para los niños aprender inglés en las escuelas; para los inmigrantes de menos de cincuenta años es indispensable para adquirir la ciudadanía norteamericana: asimismo es un requerimiento de facto para poder trabajar en el gobierno, así como para todos los trámites oficiales.
38
Sin lugar a dudas, el estudio del protestantismo en Latinoamérica durante las últimas tres décadas constituye el análisis del desenvolvimiento de la minoría religiosa más pujante en esta región del mundo, mismo que no ha estado exento de una fuerte participación estatal e incluso trasnacional, pues en ocasiones las minorías protestantes en diversos países latinoamericanos han estado financiadas con recursos provenientes de los Estados Unidos. Sobre el particular véase Stoll, David y Garrard-Burnett (eds.), Rethinking Protestantism in Latin America, Philadelphia, Temple University Press, 1993, pp. 227; Martín, David, Tongues of Fire. The Explosion of Protestantism in Latin America, Gran Bretaña, Basil Blackwell, pp. 9-111, 163-185, 271-294; Basrian, Jean-Pierre, Protestantismos y modernidad latinoamericana, México, FCE, 1994, p. 351; Spinner-Halev, Jeff, Surviving Diversity. Religion and Democratic Citizenship, Baltimore, The Johns Hopkins University Press, 2000, pp. 241; Motley Hallum, Anne, Beyond Missionaries. Toward an Understanding of the Protestant Movement in Central America, Estados Unidos, Rowman & Littlefield Publishers, 1996.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
349
Desde luego, algo semejante podría decirse del caso mexicano, en el que muy diversas leyes reglamentarias hacen indispensable el uso del idioma español, sin que exista un mecanismo que proteja la desventaja lingüística de los pueblos indígenas o de algunos grupos migrantes que no hablan español. Así por ejemplo, la Ley de Nacionalidad establece entre los requisitos que deben cubrir los extranjeros para adquirir la nacionalidad mexicana, el probar que hablan español (Artículo 19 de la Ley de Nacionalidad); también podemos señalar que muy diversas leyes reglamentarias de los tribunales federales y locales establecen como requisito indispensable para la presentación de los diversos documentos legales, desde demandas hasta pruebas, que éstas sean realizadas y presentadas en idioma español sin que incluyan tampoco ningún tipo de protección lingüística a las minorías lingüísticas. Estas políticas han sido llevadas a cabo con la intención de promover la integración de lo que se ha llegado a llamar una “cultura societal”. Por una cultura societal, Kymlicka se refiere a una cultura territorialmente concentrada, cuyo centro es un lenguaje compartido, mismo que es empleado en el amplio espectro de instituciones que existen en esa sociedad, tanto publicas como privadas (escuelas, medios de comunicación, derecho, economía, gobierno, etcétera). Kymlicka la denomina cultura societal para enfatizar que ésta implica un lenguaje común y diversas instituciones sociales, más que creencias religiosas comunes, costumbres familiares y formas personales de vida. Así, el Estado crea deliberadamente una cultura societal y promueve la integración de los ciudadanos dentro de ella. En efecto, los gobiernos han alentado a los ciudadanos para que examinen sus opciones de vida como algo estrechamente vinculado con la participación en las instituciones societales comunes que operan dentro del idioma reconocido como oficial y ha alimentado una identidad nacional que es definida, en parte, por su pertenencia común en una cultura societal. Esto se debe al hecho de que promover la integración dentro de la cultura societal es parte del proyecto de construcción de los Estados nacionales, proyecto que todas las democracias liberales han adoptado.39 En síntesis, en esta tercera etapa de la discusión multicultural se ha planteado la necesidad de sustituir la idea de un Estado etno-culturalmente neutral que se supone está implícita en la existencia de los Estados 39
Kymlicka, Politics in the Vernacular…, cit., nota 1, p. 25.
350
FRANCISCO IBARRA PALAFOX
liberal-democráticos. Will Kymlicka en particular ha insistido en dirigir las investigaciones recientes en este sentido, pues, en su opinión, el modelo de construcción del Estado nacional no ha sido el de un modelo neutral y por el contrario, ha obedecido a la necesidad de fomentar, en la mayor parte de los casos, una cultura nacional en detrimentos de las culturas minoritarias.40 Ahora bien, decir que los estados se ajustan a un proceso de construcción de un estado nacional, no quiere decir que los gobiernos sólo promuevan una sola cultura societal. Es posible que los gobiernos alienten inclusive la existencia de dos o más culturas societales dentro de un solo país —como es el caso de Estados como Canadá, Suiza, Bélgica o España—. Sin embargo, históricamente y de alguna manera u otra, casi todas las democracias liberales han intentado difundir una única cultura societal en su territorio. Este tipo de proceso de construcción del Estado nacional sirve a un buen número de objetivos previamente definidos por el Estado. Así por ejemplo, la estandarización de la educación pública, al utilizar un mismo lenguaje ha sido esencial para que todos los ciudadanos tengan iguales oportunidades de trabajo una vez que terminan sus estudios, ya que la igualdad de oportunidades es definida precisamente en términos de un igual acceso a las principales instituciones que operan en la lengua dominante, tanto para trabajar como para obtener los servicios estatales. De igual manera, la participación en la sociedad societal común, ha sido considerada como esencial para generar el tipo de solidaridad que es indispensable para el Estado, ya que éste promueve un sentido común de identidad y pertenencia. Más aún, podríamos decir que el lenguaje común es indispensable para el crecimiento de la democracia: ¿cómo se puede gobernar la población si no pueden entenderse entre ellos? En síntesis, la promoción de una cultura societal común ha sido una parte esencial de la igualdad social y la cohesión política en los Estados modernos.41 Sin embargo, esto ha sido frecuentemente en detrimento de las minorías etno-culturales, cuyas culturas societales han sido desdeñadas en aras de fortalecer a la cultura del Estado nacional. En este momento, como bien ha señalado Kymlicka, la pregunta que hay que hacernos es la siguiente: ¿de qué manera afecta el proceso de construcción de los Estados nacionales a las minorías en las democracias 40 41
Ibidem, p. 26 y 27. Ibidem, p. 26.
LA EVOLUCIÓN DEL DEBATE MULTICULTURAL
351
liberales? Tal pregunta nos proporciona una perspectiva diferente del debate, pues la cuestión ya no es cómo explicar un distanciamiento del valor normativo de la neutralidad, sino más bien explicar cómo los procesos de construcción nacional de los Estados crean injusticias para las minorías y cuál es la reacción de las minorías para protegerse ante tales injusticias. Ahora bien, la explicación de cómo semejante construcción estatal se ha expresado frecuentemente en contra de las minorías etno-culturales no sería posible si no explicáramos de qué manera se han relacionado con esas minorías algunos de los principios e instituciones esenciales del Estado liberal-democrático, tales como la nación y los nacionalismos, la ciudadanía, el federalismo y la democracia. En efecto, explicar la manera a través de la cual el Estado ha excluido a las minorías etno-culturales no sería posible si antes no examinamos cómo esos principios e instituciones particulares se han comportado en relación con las minorías. Así las cosas, será por ejemplo importante precisar qué relación han tenido los nacionalismos y, en particular, la construcción de un Estado nacional en relación con las minorías, para, de esta manera, estar en posición de proponer los términos de una relación más justa entre las minorías y los Estados nación, al respecto, el análisis de las formas de autogobierno será de la mayor importancia para semejante propósito, pues sin ellas las minorías no podrían reproducir su cultura e instituciones básicas. Asimismo, en este mismo rubro será muy importante examinar cuáles formas federadas permiten una más justa convivencia de las culturas minoritarias con la dominante, por lo que se hará indispensable una revisión de las formas del federalismo asimétrico. Más aún, en la construcción de cualquier Estado nacional ha sido de la mayor relevancia la noción que se tenga de ciudadanía, pues ésta ha definido los términos de la inclusión o exclusión de grupos importantes de la población. Tradicionalmente, la noción que hemos heredado de ciudadanía está estrechamente relacionada con el Estado nacional dominante, con una cultura específica y además con un espacio territorial determinado. Ciertamente, semejantes concepciones de la ciudadanía han dejado fuera a quienes por alguna u otra forma no comparten ya sea esa cultura dominante o ese espacio territorial determinado. Para no ir muy lejos, en la mayor parte de los Estado nacionales viven millones de inmigrantes indocumentados que no gozan de los mínimos derechos ciudadanos, no obstante que se encuentran sujetos a los mandatos de los gobiernos de
352
FRANCISCO IBARRA PALAFOX
los Estados donde residen. Por lo anterior, será de vital importancia repensar los términos de una ciudadanía que nos permita integrar, bajo condiciones de justicia, a esas minorías etno-culturales dentro de la sociedad política del Estado en el cual residen. No podría ser de otra manera, la construcción de un Estado nacional pasa inevitablemente por la definición de una ciudadanía, luego entonces, será esencial en esta tercera etapa del debate, pensar los términos justos de una ciudadanía que nos permita una justa convivencia con las minorías. Finalmente, considero que dentro de esta última etapa del debate, será también de la mayor importancia examinar que instituciones de la democracia liberal son propias para una mejor convivencia con las minorías, pues ha sido un viejo vicio de los estudiosos de la política, el prestar particular importancia a las formas de la democracia mayoritaria que tradicionalmente han descuidado el desarrollo y protección de las minorías. Será entonces importante preguntarnos de qué manera podemos acomodar las formas del gobierno democrático, en términos de justicia, en relación con las minorías presentes dentro de los Estados nacionales. Aquí parece pertinente comenzar a pensar en la conveniencia de integrar formas de la democracia consensual para semejante propósito. En síntesis, en esta tercera etapa del debate y para entender de qué manera podemos plantear una justa relación entre el Estado liberal-democrático y las minorías, habrá que entrar al examen teórico de algunos de los principios e instituciones básicas de esa forma estatal, por lo que deberemos pensar en términos de justicia, cómo deben tener lugar las relaciones entre las minorías y la nación dominante, la ciudadanía, el federalismo, la democracia. Éstos son algunos de los términos del debate actual y más reciente.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN. IMPLICACIONES ÉTICAS Jacqueline JONGITUD ZAMORA* SUMARIO: I. Algunas cuestiones previas. II. Legalidad, legitimidad y legitimación. III. La ética como filosofía moral. IV. Algunas consideraciones sobre el contenido ético de legalidad, legitimidad y legitimación.
La presente aportación intenta delimitar conceptualmente, a través de la tridimensionalidad del derecho, los términos: legalidad, legitimidad y legitimación. Ubica a la legalidad en el ámbito del derecho formalmente válido y como objeto de estudio de la ciencia jurídica; a la legitimidad, por su parte, la sitúa en el espacio del derecho intrínsecamente válido, en el entendido de que es un término con contenido axiológico o valorativo, y como tal, lo confía al espacio de reflexión de la filosofía jurídica; finalmente, a la legitimación, como espacio fáctico de reconocimiento y como relacionada con lo auténticamente vivido socialmente, por contar con la aceptación, reconocimiento y adhesión de los destinatarios de las normas, la coloca en la esfera de la sociología jurídica. Una vez realizada la delimitación de los anteriores conceptos, se procede a la definición de la ética como filosofía moral y a su consecuente diferenciación de las morales concretas. Finalmente, y con base en los marcos establecidos, se indica cuáles son las cuestiones éticas entreveradas con los tres términos objeto de reflexión, en donde los derechos humanos universalmente reconocidos son la piedra de toque.
* Instituto de Investigaciones Jurídicas, Universidad Veracruzana, México.
353
354
JACQUELINE JONGITUD ZAMORA
I. ALGUNAS CUESTIONES PREVIAS La exposición del tema que nos ocupa exige realizar algunas precisiones, a fin de evitar la confusión en relación con el enfoque que sobre el mismo se pretende sostener en este lugar. En primer lugar, debe hacerse notar que la utilización de los términos: legalidad, legitimidad y legitimación, en los ámbitos de las ciencias jurídica y política, suele realizarse de manera sumamente diversa e incluso contradictoria. Un simple acercamiento a la literatura existente al respecto, permite verificar la existencia de un gran número y diversidad de concepciones sobre estos términos. Aunado a lo anterior, es posible localizar corrientes de pensamiento y, por supuesto, autores en lo individual, que sostienen la sinonimia entre legalidad y legitimidad,1 o entre legitimidad y legitimación.2 Finalmente, también es lugar común encontrar distinciones de niveles, o clasificaciones en los términos de legitimidad y legitimación, mismas que a la luz de otros marcos teóricos pueden resultar ser precisamente el criterio distintivo de los tres términos objeto de esta reflexión. En el anterior sentido, es bien conocida la clasificación de la legitimidad de Max Weber en carismática, tradicional y racional.3 A ésta, y sólo a manera de ejemplo, pueden agregarse la distinción realizada por Bidart Campos, desde la doctrina constitucional y la sociología política, entre la legitimidad filosófica, la empírica o sociológica, y la legalizada;4 y la rea1 Véase Schmitt, Carl, Legalidad y legitimidad, trad. de José Díez García, Madrid, Aguilar, 1971. 2 Véase Hernández Vega, Raúl, Problemas de legalidad y legitimación en el poder, Xalapa, Universidad Veracruzana, 1986; Tuori, Kaarlo, “Validez, legitimidad y revolución” La normatividad del derecho, Aarnio, Aulios et al. (comps.), Barcelona, Gedisa, 1997; Stein, Torsten, “Estado de derecho, poder público y legitimación desde la perspectiva alemana”, Working Paper, Barcelona, núm. 88, 1994; López Chavarría, José Luis, “Breves notas sobre la importancia de la legitimidad constitucional y cambio político en México”, Boletín Mexicano de Derecho Comparado, México, nueva serie, núm. 86, año XXIX, mayo-agosto de 1996. 3 La legitimidad carismática se constituye a partir de la fascinación que ejerce un jefe y en la creencia de que éste tiene una misión que cumplir; la legitimidad tradicional se sustenta en la convicción, que tiene sus bases en la costumbre y tradición, de la legalidad como orden de dominación, y la legitimidad racional es con la que cuenta la dominación estatal cuando es aceptada porque se considera que es inevitable por motivos racionales. 4 La legitimidad filosófica es valorativa, crítica, ligada a una concepción de derecho natural o a valores sostenidos por la filosofía jurídica y política; es una legitimidad ligada a lo justo. La legitimidad empírica o sociológica, por su parte es entendida como la acep-
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
355
lizada por Zippelius, desde la teoría del Estado, respecto al término legitimación, misma que desde su concepción puede ser ética o sociológica.5 Por el estado de la cuestión descrito, es necesario determinar desde qué concepción se parte en este estudio, adelantando únicamente que entendemos que estos tres términos pueden ser delimitados conceptualmente desde la propia tridimensionalidad del derecho. Esto es, desde el entendimiento de que el derecho puede ser visto desde tres espacios epistemológicos distintos: como derecho formalmente válido, según el cual derecho es el conjunto de normas que han cumplido con un procedimiento formal de creación; como derecho intrínsecamente válido, de acuerdo al cual sólo se considera derecho a aquellos contenidos normativos que se ajustan a ciertos criterios axiológicos o valorativos, y como derecho positivo, es decir, como aquél auténticamente vivido en un tiempo y espacio determinado.6 Ahora bien, también debe aclararse que para este escrito se ha debido acudir a autores que no se inscriben, estrictamente hablando, en el ámbito de lo jurídico, pero sí en disciplinas que por su propia estructura y funcionamiento pueden aportar argumentos a la cuestión.7 Por ello es viable disculparse anticipadamente sobre la diversidad y aparente desorden de las fuentes que aquí se citan. En segundo lugar, debemos decir que compartimos la tesis de Enrique Cáceres de las teorías jurídicas como realidades hermenéuticas.8 Ello implica que se parte de la idea de que las teorías jurídicas graban en la mente de los juristas programas comunes que es indispensable conocer para participar en contextos comunicacionales jurídicos. Y que en el anterior tación social, misma que se da en función de cómo es observado o representado el problema del Estado, del poder y de la convivencia en cada Estado. Finalmente, la legitimidad legalizada es la recogida por el derecho positivo (formalmente válido) de un determinado Estado. Véase Bidart Campos, Germán, El poder, Buenos Aires, Ediar, 1985, p. 40. 5 Zippelius, Reinhold, Teoría general del Estado. Ciencia de la política, trad. de Héctor Fix-Fierro, 2a. ed., México, Porrúa-UNAM, 1989. 6 García Máynez, Eduardo, Introducción al estudio del derecho, 42a. ed., México, Porrúa, 1991, pp. 36-50. 7 Aristóteles, Ética nicomaquea, 17a. ed., trad. de Antonio Gómez Robledo, México, Porrúa, 1998, libro VI-I; Kant, Immanuel, Fundamentación de la metafísica de las costumbres, trad. de Manuel García Morente, Madrid, Real Sociedad Económica Matritense de Amigos del País, 1992, pp. 13 y 14. 8 Cáceres Nieto, Enrique, Las “teorías jurídicas” como realidades hermenéuticas, México, UNAM, 2001, pp. 3-23.
356
JACQUELINE JONGITUD ZAMORA
sentido cada teoría constituye una realidad hermenéutica (una realidad interpretativa) distinta a través de la cual se obtiene cierta manifestación del conocimiento racional de aquello que es la “realidad jurídica”. Entendemos en este mismo contexto que la existencia de una pluralidad de respuestas a las mismas cuestiones posibilita un diálogo en busca de soluciones teóricas lo más acordes posible a los problemas y necesidades a los que ha de hacer frente lo jurídico. Finalmente, y en tercer lugar, se debe señalar que aquí se parte de una concepción de la ética como filosofía moral, misma que será detallada más adelante. II. LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN En el uso correcto del castellano, los términos legalidad, legitimidad y legitimación pueden ser distinguidos muy forzadamente.9 En él la legalidad se asocia inmediatamente a un ordenamiento jurídico vigente. La legitimidad, por su parte, se relaciona tanto al ajustamiento a las leyes, como a un sentido de justicia, situación que puede ser entendida claramente si también se toma en consideración el origen etimológico de ambos términos,10 de acuerdo al cual, y tal como lo ha puesto de relieve Rolando Tamayo, la legalidad y la legitimidad pueden ser considerados en principio como equivalentes o sinónimos.11 Finalmente, la legitimación consiste en una acción (la de legitimar) y un efecto (el de legitimar). Esto significa que la legitimación se sitúa en un plano de ejercicio, consistente en la posibilidad de hacer o de generar un resultado a partir de ese hacer; o incluso puede interpretarse el legitimar como la posibilidad de que un agente, o agentes, generen un efecto legitimador sobre algo o, finalmente, y en términos de causalidad, puede entenderse a la legitimación como el resultado o producto de una causa, la de legitimar.
9 Real Academia de la Lengua Española, Diccionario de la lengua española, 22a. ed., Madrid, Espasa, 2001, t. II, pp. 1360 y 1361. 10 Etimológicamente, legitimidad significa “conforme a las leyes, justo, perfecto, concedido, permitido, verdadero, genuino”. Véase “Legitimidad”, Enciclopedia jurídica Omeba, Buenos Aires, Driskill, 1964, t. XVIII, p. 207. 11 Tamayo y Salmorán, Rolando, “Legitimidad”, Nuevo diccionario jurídico mexicano, Instituto de Investigaciones Jurídicas, México, Porrúa-UNAM, 2001, t. I-O, pp. 2304-2310.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
357
Decíamos que a partir de un uso correcto del castellano, estos tres términos pueden ser distinguidos muy forzadamente, ello es así porque aunque la legalidad nos remita a ley, ello no excluye el problema de su justificación; y aunque la legitimidad nos lleve inmediatamente a la cuestión de la justicia, también nos enfrenta de manera inmediata a su significación ligada a lo legal; y finalmente el tratamiento que se hace de la legitimación, aunque nos sitúa principalmente en el plano de la acción y el efecto, para su entendimiento nos remite nuevamente a la idea de la legitimidad que, como ya hemos señalado, nos ata también a la cuestión de la legalidad. Pues bien, las anotaciones anteriores nos colocan nuevamente ante la complejidad de la determinación del contenido apropiado de estos tres términos. No obstante, tal como lo señala Rolando Tamayo12 y tal y como lo atestigua el texto ya clásico de Legalidad y legitimidad,13 en la doctrina jurídica, desde hace ya algún tiempo, se observan algunos matices diferenciadores entre ambos términos. En este sentido, nada más sugerente que el título proporcionado por Habermas a su primera lección de Derecho y moral, esto es, ¿cómo es posible la legitimidad a través de la legalidad?14 Sobre el concepto de legalidad, Immanuel Kant sostuvo en 1788, para diferenciar a ésta de la moralidad, que: Lo esencial de todo valor moral de las acciones está en que la ley moral determine inmediatamente la voluntad. Si la determinación de la voluntad ocurre en conformidad con la ley moral, pero sólo mediante un sentimiento de cualquier clase que sea, que hay que presuponer para que ese sentimiento venga a ser un fundamento de determinación suficiente de la voluntad, y por tanto no por la ley misma, entonces encerrará la acción ciertamente legalidad, pero no moralidad.15
Con el anterior párrafo kantiano queda destacada la diferenciación entre la legalidad y la moralidad, indicándose que de la legalidad de una 12 13 14
Ibidem, pp. 2304-2306. Schmitt, Carl, op. cit., nota 1, pp. XXIV-XXX. Véase Habermas, Jürgen, “Derecho y moral: dos lecciones”, Facticidad y validez. Sobre el derecho y el Estado democrático de derecho en términos de teoría del discurso, trad. de Manuel Jiménez Redondo, Madrid, Trotta, 1998. 15 Kant, Immanuel, Crítica de la razón práctica, 4a. ed., trad. de E. Miñana y Villagrasa y Manuel García Morente, Salamanca, Sígueme, 1998, p. 95.
358
JACQUELINE JONGITUD ZAMORA
acción no puede deducirse su moralidad, pues una acción legal puede no derivar de motivos morales, quedando pues delimitada como característica principal de la legalidad el ajustamiento a la ley, por la motivación que fuese. Efectivamente, en la actualidad el término legalidad suele encontrarse reservado a aquello que se ajusta, mediante las conductas externas reguladas, a las disposiciones jurídicas establecidas en un lugar y tiempo determinado. En el anterior sentido se dice que la legalidad hace referencia a la exigencia de una ley o de un conjunto de leyes y al sometimiento a las mismas,16 concepción que, por su parte, también dará luz al consabido principio de legalidad. Así pues, la legalidad entendida como el ajustamiento a las leyes, que por supuesto se encuentran condicionadas al cumplimiento de un procedimiento formal de creación, bien puede ubicarse en el ámbito del derecho formalmente válido (una de las tres dimensiones del derecho ampliamente reconocidas por diversas corrientes jurídicas de pensamiento). Aun con lo anteriormente dicho, debe destacarse que diversos autores sostienen que la legalidad no excluye la idea de que el contenido de las normas impuestas mediante el derecho formalmente válido deba contar con una justificación o fundamento,17 o bien que la legalidad ha de atemperarse a las exigencias de justicia y a las de seguridad jurídica,18 o que el derecho debe adoptar un concepto de racionalidad, que incluya las dimensiones morales y axiológicas en pro de su legitimidad.19 Es precisamente bajo estas consideraciones que se establece la necesidad de que la legalidad deba ser legitimada, entrando con ello en juego el término y concepto de legitimidad. Así, se dice que quien piensa en la legitimidad está en realidad aludiendo a la idea de justificación. En este mismo sentido, puede citarse a Martínez-Sicluna,20 quien sostiene que el concepto de legitimidad implica un contenido de tipo valorativo que puede o no comprender la norma jurídica. Incluso, y desde el derecho constitucional, se afirma que el Estado 16 Véase Brufau Prats, Jaime, Teoría fundamental del derecho, 4a. ed., Madrid, Tecnos, 1990, p. 253. 17 Tamayo Salmorán, Rolando, op. cit., nota 11, p. 2304. 18 Brufau Prats, Jaime, op.cit., nota 16, pp. 253. 19 Tuori, Kaarlo, op. cit., nota 2, p. 183. 20 Martínez-Sicluna y Sepúlveda, Consuelo, Legalidad y legitimidad: la teoría del poder, Madrid, Actas, 1991, p. 10.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
359
constitucional no sólo implica una formulación jurídica, esto es, legalidad, sino todo un sistema de valores, como los consagrados en el conjunto de los derechos humanos, que debe estar comprendido en el sistema normativo de los Estados y protegido por el mismo, lo que implicaría la legitimidad de la legalidad impuesta.21 En el anterior sentido, también se sostiene en la teoría del derecho, de forma genérica, que la legitimidad hace referencia a la fundamentación o justificación última del orden jurídico, así como a las condiciones y procesos de trasmisión del poder legítimo.22 Lo anterior, en su primer momento, significa que la existencia de legitimidad de un orden jurídico, de un lugar y tiempo determinado, devendrá de la justificación con la que cuente. El segundo momento se constituye, por su parte, como la obligación de que las normas, para ser válidas en un sentido jurídico, deban ser creadas de acuerdo a un procedimiento formal previamente establecido, y sólo por aquellos sujetos que detenten un poder legítimo, es decir, sólo por aquellos individuos que se hayan sujetado a las condiciones y procesos previamente establecidos para la obtención de aquella posición que les acredite en el desempeño de tal función. Con relación a las anteriores afirmaciones, también podemos traer a colación la afirmación que Habermas presenta en Facticidad y validez: “un orden jurídico sólo puede ser legítimo (de legitimidad)23 si no contradice a principios morales”.24 La legitimidad implica entonces una serie de consideraciones de corte axiológico o valorativo, que algunos verán concretados, sin pretender el agotamiento de la cuestión, en el valor globalizador de la justicia, otros en la protección y promoción de los derechos humanos o de los derechos fundamentales, y otros tantos en el reconocimiento de ciertas normas y principios del derecho natural o en la instauración de un auténtico Estado democrático de derecho.25 21
Jiménez-Meza, Manrique: “Legalidad y legitimidad del Estado constitucional”, La Sala Constitucional. Homenaje en su X aniversario, Universidad Autónoma de Centro América, 2000, pp. 153-180. 22 Tamayo y Salmorán, Rolando, op. cit., nota 11, p. 2307. 23 El contenido entre paréntesis es nuestro. Se coloca en atención a que muchas de las veces el término legítimo suele asociarse a la idea de legalidad, mientras que en contexto habermasiano es utilizado en su sentido de justificación, y por tal, ligado a la idea de legitimidad. 24 Habermas, Jürgen, Facticidad y validez, op. cit., nota 14, p. 171. 25 Véase Cortina, Adela, Ética aplicada y democracia radical, 2a. ed., Madrid, Tecnos, 1997; id., Hasta un pueblo de demonios. Ética pública y sociedad, Madrid, Taurus, 1998.
360
JACQUELINE JONGITUD ZAMORA
De acuerdo a lo anterior es posible afirmar que la legitimidad puede inscribirse, dentro de una concepción tridimensional del derecho, en el ámbito de lo intrínsecamente válido, entendido en el sentido de ser aquel contenido jurídico que de por sí viene justificado o que es críticamente valorado. Nos queda aún pendiente la cuestión de la legitimación, ella misma, de por sí complicada, pues suele equiparársele constantemente con la legitimidad, situación que es aún más común que en el caso de las sinonimias que en algunas ocasiones se establecen entre legalidad y legitimidad. Por ello, y en atención a la necesidad de agotar la temática planteada, nos remitiremos exclusivamente a algunas de aquellas posturas que parecen abrir camino a su diferenciación respecto a la legitimidad. Juan Carlos Monedero26 sostiene que el obrar del poder conforme a la legitimidad otorga legitimación, aunque sólo potencialmente, pues no existe clara relación de causalidad entre ellas. Es decir, la legitimidad puede no conducir directamente a la legitimación, de igual forma la ilegitimidad del poder puede no conducir irremediablemente a la falta de ésta.27 Las aclaraciones que realiza Juan Carlos Monedero (mismas que se amplían en el aparato crítico de este documento) son pertinentes, pero debe aclararse en este lugar que generalmente lo que priva en las diferentes concepciones jurídico-políticas es la de que si existe legitimidad, la legitimación puede darse como su correlato. Es decir, que la legitimación puede darse como resultado de la legitimidad, tal y como lo afirma el autor citado. Una cuestión también interesante, relacionada con las afirmaciones de Monedero, es que su idea de la legitimidad como otorgadora de legitimación nos proporciona el dato de la legitimación como proceso, es decir, a partir de sus reflexiones y de las salvedades que realiza, es posible pen26 [http://www.ucm.es/info/eurotheo/diccionarioF.htm], Monedero, Juan Carlos, “Legitimidad”, Universidad Complutense de Madrid. 27 Idem. Esto sólo potencialmente, ya que: “no hay que olvidar que el conocimiento humano sólo puede ser representativo, es decir, se construye socialmente sobre la base de representaciones colectivas que se validan en el discurso. Todo lo que quiebre la construcción libre de ese discurso afectará a lo que se entienda como legítimo... Ahora bien, merced al principio antropológico que obliga al ser humano a la supervivencia, siempre hay que contar con la receptividad al discurso de la legitimidad, de manera que un poder que sepa de su potencial ilegitimidad y quiera permanecer en el mando debe contrarrestar con todas sus armas disponibles la extensión de ideas contrarias a su ejercicio de gobierno. Conviene señalar que del mismo modo que una actuación legítima no es garantía absoluta del mantenimiento de un poder, la inexistencia de legitimidad no se traduce en una quiebra automática de un sistema político...”.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
361
sar que el término al que venimos aludiendo puede presentarse concretado en los hechos, pero no necesariamente de manera inmediata, sino que puede irse construyendo poco a poco en el transcurso del tiempo, o en la sucesión de ciertas fases o hechos que van precisamente en la dirección de la actualización de la legalidad, que cuenta con legitimidad. Por otra parte, Bidart Campos28 afirma que la legitimidad contribuye a provocar el consenso, a estimular la obediencia, a cooperar con la energía del poder y a que se cuente con dispositivos favorables para su funcionamiento. De lo anterior es posible deducir que la legitimidad puede provocar una serie de efectos positivos para el poder, o en el campo jurídico para los ordenamientos correspondientes. Dichos efectos vistos desde el marco de Juan Carlos Monedero constituirían la legitimación del poder político o del orden jurídico de un Estado. Finalmente, Zippelius, en su Teoría general del Estado,29 nos acerca al concepto de legitimación, dentro del cual distingue dos niveles: uno ético y otro sociológico. Por cuanto al primero señala que éste ha de responder a la pregunta de cómo y en qué puede hallar un orden estatal una justificación suficientemente fundada; cuestión que en su concepción vendría dada a partir del cumplimiento de la función ordenadora y pacificadora de la comunidad jurídica estatal y el establecimiento de un orden jurídico justo, en el que los individuos logren su desenvolvimiento personal. Obsérvese aquí la cercanía de su concepto de legitimación ética, con lo que hasta aquí se ha venido planteando como requerimiento formal de la legitimidad. En referencia al concepto sociológico de legitimación, que es aquí el que más nos interesa, dirá Zippelius que es aquél de acuerdo al cual ésta adquiere un sentido de indagación de los motivos por los cuales una comunidad jurídica acepta y aprueba de hecho un orden estatal. La legitimación supone pues, en este marco teórico, la aceptación real en la que se funda la dominación de un orden jurídico y estatal. En otras palabras, la legitimación de un orden jurídico vendría dada por la adhesión y respaldo de los destinatarios de las normas a los contenidos y procedimientos en ellas inmersos. Cuestión por la cual en algún lugar se ha podido plantear la similitud, guardando las debidas propor-
28 29
Bidart Campos, Germán, El poder, cit., nota 4, p. 42. Zippelius, Reinhold, op .cit., nota 5, pp. 108 y 109.
362
JACQUELINE JONGITUD ZAMORA
ciones, entre el procedimiento ético discursivo planteado por Habermas y el punto de vista interno expuesto por Hart.30 Ahora bien, si adelantamos un poco más en la lectura del autor citado encontraremos que considera que las convicciones individuales sobre lo justo son el punto donde la legitimación sociológica y la legitimación ética se tocan. Así las cosas, desde su punto de vista, la legitimación ética radica en la aprobación crítica del poder del Estado, y la legitimación sociológica descansa, por su parte, en un consenso real. Si se ha seguido el hilo conductor de estas líneas, se recordará que ha quedado anotado que la legitimación ética de la que habla Zippelius se encuentra íntimamente ligada con la idea de legitimidad —que aunque sin contenido específico— aquí se ha aceptado, de hecho parece ser que esta misma es sostenida por él en la siguiente afirmación: Entre los aspectos clásicos de la legitimación normativa (ética) existen igualmente nexos entre legalidad y legitimidad: desde el punto de vista del Estado formal de derecho, se vio en el carácter general de las normas una garantía de rectitud (esto es legitimidad) de un orden de la conducta, sobre todo si estas normas han sido aprobadas en un procedimiento legislativo democrático.31
En Zippelius puede entonces reconocerse a la legitimación ética como ligada a la legitimidad, por lo que la afirmación sociológica del término permite distinguirlo tanto de la legalidad, como de la legitimidad. La legitimación vendría pues marcada por la característica de constituirse en un espacio fáctico de reconocimiento; siendo, por tanto, objeto de conocimiento de la sociología. La legitimación así entendida bien puede ubicarse en el espacio del derecho positivo (dentro de un esquema tridimensional), esto es, del derecho auténticamente vivido en un tiempo y espacio determinado. En
30 [http://www.filofiaay derecho.com/rtfd/numero6/habermas.htm], Botero Bernal, Andrés, “Aproximación al pensar iusfilosófico de Habermas”, Revista Telemática de Filosofía del Derecho, España, núm. 6, 2002-2003.Véase Habermas, Jürgen, Facticidad y validez: sobre el derecho y el Estado de derecho en términos de teoría del discurso, trad. Manuel Jiménez Redondo, Madrid, Trotta, 1998, p. 171; Hart, H. L. A., Sobre el concepto de derecho, 2a. ed., Buenos Aires, Abeledo-Perrot, 1992. 31 Ibidem, p. 111.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
363
este mismo sentido puede hablarse, por ejemplo, de la legitimación de la dominación como justificación pública.32 El entendimiento de la legalidad como el ajustamiento, mediante las conductas externas reguladas, al ordenamiento jurídico correspondiente; la legitimidad como la adecuación de este mismo ordenamiento a una serie de valores o principios; y la legitimación como la aceptación, adhesión, reconocimiento y respaldo a éstos, supone una delimitación conceptual que permite un manejo más afortunado de estos términos en el campo del derecho. Permite considerar las tres grandes vertientes a través de las cuales se ha intentado la conceptualización del derecho y atiende a los tres grandes momentos o esferas que se han reconocido como parte de la realidad jurídica. El derecho formalmente válido que ha cumplido con el procedimiento formal de creación y objeto de la ciencia jurídica ha de vérselas con el concepto de legalidad. La filosofía del derecho como encargada de la perspectiva valorativa del orden jurídico ha de atender a las cuestiones de legitimidad, y finalmente, la sociología jurídica que se ocupa de la perspectiva social del derecho y que tiene como tema fundamental, entre otros, a la eficacia del orden jurídico, ha de responder a las cuestiones de legitimación del derecho en un lugar y espacio determinado.33 De hecho este tipo de escisión conceptual, basada en la mencionada tridimensionalidad y que funciona para conceptuar un mismo objeto desde ángulos epistémicos distintos, y que por tal proporciona un espacio disciplinario especializado dependiendo del ángulo adoptado, ha sido utilizada para términos como validez, en el que se han distinguido un sentido sociológico, uno jurídico, y otro ético.34 Incluso puede recordarse la mencionada clasificación que ofrece Bidart Campos, respecto a la legitimidad, misma que, desde su punto de vista, puede ser filosófica, empírica o sociológica, y legalizada,35 que aunque resulta clarificadora en ese espacio, dificulta las cosas cuando enfrentamos a la legitimidad con la legalidad y la legitimación. 32 Vossenkuhl, Wilhelm, “Dominación”, Diccionario de ética, Camps, Victoria (dir.), Höffe, Otfried (ed.), trad. de Jorge Vigil, Barcelona, Crítica, 1997, p. 84. 33 Para las tres concepciones y para sus mediaciones críticas Véase García Máynez, Eduardo, op. cit., Díaz, Elías, Sociología y filosofía del derecho, Madrid, Taurus, 1980; Atienza, Manuel, Introducción al estudio del derecho, España, Barcanova, 1993. 34 Dreier, Ralf, “El derecho y la moral”, en Garzón Valdés (coord.), Derecho y filosofía, 2a. ed., trad. de Carlos de Santiago, México, Fontamara, 1985, pp. 88-92. 35 Véase Bidart Campos, Germán, op. cit., nota 4, p. 40.
364
JACQUELINE JONGITUD ZAMORA
El colocar a cada uno de estos términos en diferentes campos o esferas no implica, evidentemente, negar las relaciones o mediaciones críticas que entre ellos pueden operar, porque como bien se sabe, bajo el esquema de la tridimensionalidad podemos encontrar al menos siete posibilidades o combinaciones conceptuales diferentes: 1) Legalidad, sin legitimidad y sin legitimación; 2) Legitimidad, con legalidad, pero sin legitimación; 3) Legitimidad, sin legalidad y sin legitimación; 4) Legalidad, sin legitimidad, pero con legitimación; 5) Legalidad, con legitimidad y con legitimación; 6) Legitimidad, con legitimación, pero sin legalidad, y 7) Legitimación, sin legalidad y sin legitimidad. Como puede deducirse, la ubicación o acomodo de los tres términos en las tres clásicas esferas del derecho no diluye la complejidad; más bien lo único que con ello se logra es proporcionar un marco más comprensible y manejable para emprender la tarea de reflexión sobre sus implicaciones éticas. III. LA ÉTICA COMO FILOSOFÍA MORAL Es lugar común que a la ética se le confunda con la moral. Dicha situación bien puede surgir de la comparación de los orígenes etimológicos de ambos términos, pues mientras el término ética deriva del griego ethos,36 que puede ser entendido en el castellano como moral, costumbre o carácter; el término moral, por su parte, deriva del latín mores, que significa costumbre o carácter.37 Es decir, su origen etimológico deja a ambos términos lo suficientemente cerca como para plantear su igual significado. Precisamente por lo anterior se hace necesario traer a colación la diferencia entre ética y moral toda vez que generalmente en la vida cotidiana y en algunos círculos de discusión ambos términos son intercambiados sin mediación reflexiva, cuestión que genera discusiones que en caso de partir de la previa distinción no tendrían ninguna justificación. 36 Höffe, Otfried, “Ética”, Diccionario de ética, trad. de Jorge Vigil, Barcelona, Crítica, 1994, p. 98. 37 Höffe, Otfried, “Moral”, op. cit. supra, p. 190.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
365
La moral, junto con la costumbre, “representa un marco normativo básico, constitutivo de la existencia humana... referido al comportamiento con el prójimo, pero también con la naturaleza y la sociedad”.38 En el anterior sentido, la moral puede ser entendida como un complejo conjunto de normas de acción, de tipo valorativo, que ofrecen a los individuos representaciones de sentido. Ella no sólo está presente en las convicciones y conductas personales, sino también en la conformación de las instituciones públicas y los diferentes ordenamientos sociales. La moral “determina una forma de vida histórica, orgánicamente constituida, no nacida de actos formales del poder estatal”,39 por lo que constituye también un patrón o modelo de vida significativa, con sentido; y que es específica del grupo y cultura, que sirve para la auto expresión y realización del ser humano. Por ello, la moral, que a final de cuentas es la expresión de las diferentes cosmovisiones posibles, suele ser considerada como fuerte elemento de la identidad. De este modo, no cabe pues hablar de ella en singular, sino en plural. Resumiendo un poco, podemos decir que la moral es el conjunto de códigos o juicios que pretenden regular las acciones concretas de los hombres referidas ya sea al comportamiento individual, social o respecto a la naturaleza, ofreciendo para esto normas con contenido.40 La pregunta central de la moral será la de ¿qué debo hacer?41 Cuestión que a final de cuentas ha de ser resuelta de acuerdo a contextos históricos y cosmovisiones determinadas, por lo que su respuesta será tal y como se desprende de lo anterior, contextualizada. La ética por su parte, constituye un segundo nivel de reflexión acerca de los códigos, juicios o acciones reputados como morales. Ella ha de tener como tarea la realización de una evaluación crítica de la moral dominante. En este sentido es interesante la afirmación de Fernando Savater que ubica a la ética en su sentido fuerte, como una reflexión personal sobre la propia libertad.42 La ética ha de ignorar la pregunta con respuesta inmediata: ¿qué debo hacer? Para internarse críticamente en la búsqueda de la respuesta a la 38 39 40
Idem. Idem. Cortina, Adela, Ética mínima. Introducción a la filosofía práctica, Madrid, Tecnos, 1996, pp. 28-32. 41 Ibidem, p. 89. 42 Savater, Fernando, Los caminos para la libertad. Ética y educación, México, Ariel-Cátedra Alfonso Reyes del Tecnológico de Monterrey, 2000, p. 21.
366
JACQUELINE JONGITUD ZAMORA
cuestión: ¿por qué debo? Ello es así porque la ética tiene que dar razón mediante la reflexión filosófica (conceptual y con pretensiones de universalidad) de la moral, es decir, tiene que acoger el mundo moral en su especificidad y dar reflexivamente razón de él.43 La ética como filosofía moral, tal y como lo ha dicho Adela Cortina ha de dar razón filosófica, está obligada a justificar teóricamente porqué hay moral y debe haberla, o bien a confesar que no hay razón alguna para que la haya.44 La ética comofilosofía moral debe, en otras palabras, justificar las formas y principios de la acción justa. En razón de lo anteriormente anotado, podemos decir que la ética como filosofía moral constituye un segundo nivel reflexivo en el que la pregunta principal a plantearse es por qué deben aceptarse o no, los códigos, juicios o acciones reputadas como morales, cuestión que encuentra diversas respuestas en las diferentes teorías éticas existentes.45 Finalmente, y trayendo ahora a este espacio la necesaria comparación directa entre moral y ética, debemos decir con José Luis Aranguren que la primera es moral vivida; mientras la segunda es moral pensada,46 y con Höffe que la ética como reflexión filosófico-moral es la ciencia de la moral, y esta última constituye el objeto de aquella. Ahora bien, la cuestión ética central, esto es, la de dar razón de la moralidad, evidentemente no ha tenido una sola respuesta. A lo largo de la historia, el pensamiento ético ha mostrado el suficiente dinamismo, esfuerzo y enfrentamiento de modelos, como para que en el siglo XIX John Stuart Mill señalara que desde los inicios de la filosofía la cuestión relativa a los fundamentos de la moral ha sido considerada como el problema prioritario del pensamiento especulativo, dividiendo a las mentes en sectas y escuelas.47 Efectivamente, el camino de la justificación de la moralidad ha sido largo y azaroso, pero ello no lo convierte en inútil. 43 Cortina, Adela, op. cit., nota 40, p. 31; id., Ética sin moral, 4a. ed., Madrid, Tecnos, 2000, p. 29 y 221; Höffe, Otfried, “Ética”, op.cit., nota 36, p. 99. 44 Cortina, Adela, Ética mínima, cit., nota 40, p. 31. 45 Para las di fe ren tes co rrien tes éti cas Véa se Camps, Victoria, Historia de la Ética, Barcelo na, Crí ti ca, 1988; Camps, Vic to ria, “Pre sen ta ción”, Con cep cio nes de la Éti ca, Ma drid, Trot ta, 1992, pp. 11-27; [http://www.fi lo so fiay de re cho.com/rtfd/nu me ro5/teo rias.htm], Jon gi tud Za mo ra, Ja que li ne, “Teo rías éti cas con tem po rá neas”, Revista Telemática de Filosofía del Derecho, España núm. 5, 2001. 46 Aranguren, José Luis, Ética, España, Biblioteca Nueva, 1997, pp. 3, y 58-60. 47 Mill, John Stuart, El utilitarismo, trad. de Esperanza Guisán, Madrid, Alianza, 1994, p. 37.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
367
De hecho, en la actualidad son principalmente dos corrientes de pensamiento, sustancialismo y procedimentalismo, las que se encuentran en disputa teórica para desempeñar la cuestión. En un trazado bastante general puede decirse que el sustancialismo sostiene que la ética debe abocarse a la búsqueda de la racionalidad inmanente en la praxis concreta. En esta corriente se inscriben autores como Alasdair MacIntyre, Richard Rorty y Charles Taylor.48 Por otra parte, el procedimentalismo, en el que se inscriben autores como Karl Otto Apel, Jürgen Habermas, Adela Cortina, Enrique Dussel y John Rawls:49 sostiene, también en términos generales, que la tarea ética estriba en descubrir los procedimientos legitimadores de las normas. Ahora bien, independientemente de las diferencias entre corrientes de pensamiento y autores en lo individual, lo relevante de la situación actual es que ninguna teoría ética —al menos las que postulan los autores aquí citados— niega la historicidad del fenómeno moral, ni la existencia de un ethos concreto o de la pluralidad de formas de vida, y todas afirman la importancia de lo moral como parte de un vivir auténticamente humano y de una vida con sentido, e incluso aunque no coincidan en la definición, todas admiten la existencia de criterios de preferibilidad. 48 Respecto a sus propuestas teóricas pueden consultarse los siguientes materiales: MacIntyre, Alasdair, Tras la virtud, trad. de Amelia Varcárcel, Barcelona, Crítica, 2001; Rorty, Richard, Contingencia, ironía y solidaridad, trad. de Alfredo Eduardo Sinnot, España, Paidós, 1996; Rorty, Richard, El pragmatismo, una versión. Antiautoritarismo en epistemología y ética, trad. Joan Vergés, España, Ariel, 2000, y Taylor, Charles, Fuentes del yo. La construcción de la identidad moderna, trad. de Ana Lizón, Barcelona, Paidós, 1996. 49 Respecto a sus propuestas teóricas pueden consultarse los siguientes materiales: Apel, Karl Otto, Estudios éticos, trad. de Carlos de Santiago, Barcelona, Alfa, 1986; Apel, Karl Otto, La transformación de la filosofía, trad. Adela Cortina y otros, Madrid, Taurus, 1985, t. II; Apel, Karl Otto, Teoría de la verdad y ética del discurso, trad. de Norberto Smilg, España, Paidós, 1998; Dussel, Enrique, Ética de la liberación en la edad de la globalización y la exclusión, Madrid, Trotta-UNAM-UAM, 1998; Habermas, Jürgen, Conciencia moral y acción comunicativa, trad. de Ramón García C., Barcelona, Península, 1983; Habermas, Jürgen, Teoría y praxis, trad. de Salvador Más Torres y Carlos Moya, México, Rei, 1993; Habermas, Jürgen, Escritos sobre moralidad y eticidad, trad. de Manuel Jiménez R., España, Paidós, 1998; Habermas, Jürgen, La inclusión del otro, trad. de Juan C. Velasco y Gerard Vilar Roca, España, Paidós, 1999; Rawls, John, Liberalismo político, Barcelona, Crítica, 1996 y Rawls, John, Teoría de la justicia, 2a. ed., trad. de María González, España, FCE, 1997. Para la obra de Cortina véase supra, notas 40 y 43.
368
JACQUELINE JONGITUD ZAMORA
Es precisamente a partir de las coincidencias anotadas, que se intentará a continuación delinear aquellas que consideramos las implicaciones éticas de las ideas de legalidad, legitimidad y legitimación. IV. ALGUNAS CONSIDERACIONES SOBRE EL CONTENIDO ÉTICO DE LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
Las ideas asociadas con los términos de legalidad, legitimidad y legitimación que han sido aceptados en el desarrollo de este documento parecen conformar una tríada. Ello se afirma en el sentido de que entre ellas existe una especial vinculación. Desde el uso correcto del castellano del que hicimos uso al inicio de este trabajo, hasta las aportaciones teóricas referidas a los mismos parecen marcar de forma más o menos clara el siguiente encadenamiento: la legalidad como ajustamiento a la ley, exige una justificación o fundamentación; ello nos lleva hacia la legitimidad y ésta a su vez puede generar un efecto, producto o resultado conocido como legitimación. De este encadenamiento, y por supuesto no pretendiendo una visión unilateral, pues ya se ha aceptado la existencia de siete posibilidades de combinación, puede deducirse que la cuestión de la legitimidad, dentro de un esquema ideal de representación, juega un papel central en el siguiente sentido: ella es la que puede otorgar una justificación a la legalidad, y al mismo tiempo es la que, aunque con algunas matizaciones y no de manera inmediata, puede proporcionar legitimación a un orden jurídico. En este sentido es la legitimidad la que debe ocupar un lugar central a la hora de analizar las implicaciones éticas de los términos objeto de reflexión, pues ella justifica o fundamenta a la legalidad, y provoca o trae como resultado demás de que también puede justificar, a la legitimación. Evidentemente en los tiempos que nos toca vivir la conciencia de moralidad existente no es única. A través de la moralidad contemporánea suelen expresarse valoraciones sumamente diversas, que, muchas de las veces parecen colocarnos ante la disparidad y situar a lo ético en las puertas del relativismo.50 La edad, formación académica, pertenencia a grupos estructurados diferentes, el ser parte de un determinado país, la ocupación de un preciso lugar en la escala social, las agrupaciones profesionales y la confesión religiosa a la que nos encontremos inscritos, entre 50
Cortina, Adela, Ética mínima, cit., nota 40, p. 35.
LEGALIDAD, LEGITIMIDAD Y LEGITIMACIÓN
369
otros elementos, determinan en mucho no sólo las necesidades y preferencias personales, sino también perfilan nuestros diferentes ideales de vida. Es por ello que hace ya algún tiempo se ha podido caracterizar a nuestros tiempos como los que han permitido una vida valoral light y permisiva.51 Es precisamente en este espacio en donde entra en juego la ética como filosofía moral, pues ella nos ha de permitir superar este embrollo al buscar la respuesta a la cuestión de ¿por qué debo?, y sobre todo al tratar que sus respuestas aporten una pretensión de universalidad. A pesar de todas las heterogeneidades existentes, a pesar del derecho a la diferencia y al entendimiento de la riqueza que ofrece la diversidad, existe —como dice Adela Cortina— “una base moral común a la que nuestro momento histórico no está dispuesto a renunciar en modo alguno y que, a su vez justifica el deber de respetar las diferencias”.52 Una base que poco a poco se ha ido extendiendo a lo largo y ancho del planeta, hasta el punto de poder considerarse en la actualidad como sustento ético universal para legitimar y deslegitimar instituciones nacionales e internacionales, dicha base moral la constituye el reconocimiento de la dignidad del hombre, de cuño kantiano. En el reino de los fines —dijo Kant— todo tiene un precio o una dignidad. Aquello que tiene precio puede ser sustituido por algo equivalente; en cambio, lo que se haya por encima de todo precio y, por tanto, no admite nada equivalente, eso tiene una dignidad”.53 En este mismo sentido, en la Crítica de la razón práctica Kant afirmó que “... únicamente el hombre, y con él toda criatura racional, es fin en sí mismo”.54 Bajo dicho principio toda persona tiene derecho a ser tratada como un fin en si mismo y no como un medio para cualesquiera fines, porque en ella se reconoce un valor, que todas las demás personas deben reconocer y aceptar sí es que quieren comportarse como agentes morales. El principio de la dignidad humana, como bien se sabe, ha sido considerado como fundamento de los derechos humanos.55 Éstos, por su parte, 51 Lipovetski, Guilles, El crepúsculo del deber (la ética indolora de los nuevos tiempos democráticos), 3a. ed., trad. de Juana Bignozzi, Barcelona, Anagrama, 1996. 52 Cortina Adela, Ética mínima, cit., nota 40, pp. 35 y 36. 53 Kant, Immanuel, Fundamentación de la metafísica de las costumbres, cit., nota 7, p. 71. 54 Kant, Immanuel, Crítica de la razón práctica, cit., nota 15, p. 111. 55 Fernández, Eusebio, Teoría de la justicia y derechos humanos, España, Debate, 1991, pp. 85 y ss.
370
JACQUELINE JONGITUD ZAMORA
pueden ser considerados en la actualidad como el criterio de justificación ética, de legitimidad, de los sistemas jurídicos modernos. En nuestra opinión los derechos humanos basados en la dignidad humana, y consiguientemente pertrechados con el principio de la autonomía y de la universalidad, e incluso con su ampliación discursiva, además de con sus características de universalidad, incondicionalidad, inalienabilidad, indivisibilidad, complementariedad e interdependencia, constituyen el tope ético consensuado de nuestros tiempos, al cual han de sujetarse todos aquellos sistemas jurídicos que pretendan legitimidad. En el anterior sentido, los derechos humanos tienen que ser contemplados en los sistemas jurídicos contemporáneos, en la legalidad, como exigencias normativas, en pro de su legitimidad. Pero su justificación, no puede encontrarse —como lo ha dicho Luis Villoro56— en el derecho mismo, sino en el orden de la justicia, en concreto y parafraseándolo, en la dignidad de la persona. Concretando, la legalidad puede obtener su justificación o fundamento, es decir, su legitimidad, a través del reconocimiento del contenido ético de los derechos humanos. La legitimación, por su parte, vendría condicionada por el propio reconocimiento, adhesión o respaldo de los ciudadanos a estos contenidos y por la puesta en marcha de un auténtico reconocimiento, protección, promoción y defensa de los mismos. La legitimación exige pues no sólo la fundamentación o justificación del contenido legal, sino que para su concreción respecto a las normas jurídicas de un determinado Estado necesita que éstas se hagan efectivas cotidianamente en todos sus niveles. Exige, en una frase, el aterrizaje de la legalidad-legitimada en la vida real de los ciudadanos.
56 Villoro, Luis, El poder y el valor. Fundamentos de una ética política, México, FCE, 1997, pp. 302 y 303.
A LEFT PHENOMENOLOGICAL CRITIQUE OF THE HART/KELSEN THEORY OF LEGAL INTERPRETATION Duncan KENNEDY* This paper has two parts. The first presents a summary of the left phenomenological critique of legal positivism, as developed by one tendency within critical legal studies. The second attempts to clarify the position through a response to one of the many misreadings of the Cls position that are current in the positivist and post-positivist mainstream of Unitedstatesean academic legal philosophy. I This part concerns the following set of ideas common to Hart’s and Kelsen’s canonical brief writings on legal interpretation. Within a “core”, or at the boundary of the “frame” established by a norm, interpretation is “determinate” In the “periphery” or “within the frame” set up by the norm, interpretation is another word for “discretion” or “legislation”, and the meaning that the interpreter will give the norm is not determinate. For Kelsen and Hart, determinacy of a given norm, seen as a unit, is a matter of degree. For Kelsen, constitutional norms defining the proper exercise of legislative power are relatively indeterminate as to what statutes the legislature should adopt, while statutes are relatively more determinate of the content of judicial decisions purporting to apply them. Likewise, for Hart norms can have larger or smaller penumbras. Both authors seem to me use the word determinate in a confusing way. Sometimes determinate means that we can predict with great certainty what the interpreter will do with the problem at hand. But at the * Harvard Law School, USA.
371
372
DUNCAN KENNEDY
same time, it seems to mean that the operation is “cognitive” in the sense that we understand it to be a judgment about a meaning, understood to be something that is independent of the observer, and with respect to which we believe there is a “truth of the matter,” even if interpreters are likely to disagree about what that truth is. I don’t think either of them thought this made a lot of difference, but in what follows I will argue that they were wrong. For both authors, the determinate operation is not problematized. They characterize it as though the cognition of a correct meaning for the core or frame, or the highly predictable choice of interpretation, were automatic and effortless, supposing good faith. For Hart it is the application of a norm to a case whose (legally established facts) bring it within the core of the norm’s meaning. For Kelsen, it is the refusal of an interpretation of the norm that would lie outside the frame delimiting the possible meanings of the norm. In other words, when the judge applies the rule about vehicles in the park to an automobile being driven through the park, the rule as applied is determinate. When the Kelsenian interpreter claims that there is a gap, it is, says Kelsen, usually the case that “in fact” there is merely a tension between a validly established norm of no liability for the defendant, as it applies to the case in hand, and the politics of the interpreter. Here a determinate norm is being given a wrong interpretation, one outside of the frame defining the possible meanings of the norm. One of the most striking and peculiar aspects of the Hart/Kelsen theory of interpretation is that it seems to be a version of “exegese”, or “literalism”. In other words, H/K are explaining how interpretation works when there is a single norm that either does or does not make the defendant liable to the plaintiff given the facts of the case. Surprisingly enough, neither addresses one way or another the interpretive practice that seem most characteristic of their own period of European legal history, namely interpretation using the method of “constructions” or “coherence” or “conceptual jurisprudence”. We can distinguish this method from literalism as follows. Conceptual jurisprudence accepts that there will be situations in which there is more than one valid norm (section of the code or binding precedent) that is arguably applicable to the facts, and that different norms will give different outcomes for the case. Conceptual jurists (and their
A LEFT PHENOMENOLOGICAL CRITIQUE
373
critics, e. g., Geny in Methode) have also have tended to believe that there are situations that are “new” in the specific sense that no valid legal norm was specifically intended to determine them one way or another. The method requires the judge to deal both with conflicts and with gaps as follows: he is to presuppose the coherence of “the system” as a whole, and then to ask which of the conflicting norms, or what new norm, made applicable to the case, “fits” best with closely related norms, and if this is not clear, with the more abstract norms, explicit or implicit in “the system”, from which the particular norms are understood to derive (Savigny). From the point of view of H/K, the operation of “construction” through which a conceptual jurist deals with the conflict or gap is discretionary and “legislative”. But what counts for us is that before the construction begins, there has already been a judgment, not theorized, that the gap or conflict “exists”. This, in practice, is treated as a cognition of the interpreter, but unlike the conceptual jurist’s highly self-conscious operation of construction, in which induction and deduction supposedly guarantee the objective validity of the choice of norm, the initial framing of the situation as conflict or gap is not theorized. Along with literalism and conceptual jurisprudence, the third method of interpretation of legal norms that is current in the Western legal domain is policy analysis, or the method of balancing or proportionality. Here, the interpreter understands himself to have a choice between norms or between formulations of the norm, a choice that is resolved by appeal to the conflicting considerations that he understands to underlie the norm system as a whole. There are many variants of the method of policy analysis. What is balanced might be conflicting rights, principles, or instrumental goals supposedly of common interest, along with interests in administrability (vs. equitable flexibility), and system maintenance interests, such as that in the preservation of the separation of powers. Or all of the above. For H/K, it is important that policy analysis uses considerations that are discretionary or legislative. But for our purposes, what counts is not how policy analysis is done, but how the situation is framed as one in which it is possible, or required. In other words, before the policy analysis begins, whatever its content, the interpreter explicitly or implicitly frames the situation as one in which there is a conflict or a gap that ex-
374
DUNCAN KENNEDY
empts him from the elementary duty to apply a clear norm when the facts clearly fit within its definitions. This initial framing is not theorized by the authors who developed policy analysis. This paper asks how we can understand the framing of a problem of interpretation, that is the process by which the interpreter constitutes the situation in either of two ways: either as one in which all that is required is application of a norm, or as one in which, because we are in the penumbra or within the Kelsenian frame, or there is a conflict or a gap, something more than mere application of a norm is required (the “something more” being choice among eligible interpretations based on legislative discretion, coherence analysis, or policy analysis). The italicized words are meant to indicate the points of departure from positivist and post-positivist theories of interpretation. There are two aspects to our inquiry. The first is as to the process by which the interpreter decides what norm or norms to interpret in a given case. The second is as to the process by which the interpreter decides that the facts of the case locate it in the core or the penumbra, outside or within the Kelsenian frame, or that there is a conflict of arguably applicable rules or a gap. In the Hart/Kelsen framework, shared by conceptual jurisprudence and policy analysis, there is no room for the activity that I would place at the center of a phenomenology of cores, frames, gaps and conflicts, a phenomenology that can account for determinacy and indeterminacy. This is the activity of legal “work” understood as the transformation of an initial apprehension (Husserl) of what the legal materials making up the system require, by an actor who is pursuing a goal or a vision of what they should require. (The conception of work here is inspired by Marx’s Economic and Philosophical Manuscripts of 1844-1845.) Legal work, as I am using the term, whether aimed at cores or frames or at penumbras or conflicts or gaps, is undertaken “strategically”. The worker aims to transform an initial apprehension of what the system of norms requires, given the facts, so that a new apprehension of the system, as it applies to the case, will correspond to the extra-juristic preferences of the interpretive worker. Legal work occurs after the initial apprehension of facts and norm, and after “unself-conscious rule application”. The interpreter “grasps” (a gestalt process, as in Kohler’s Gestalt Psychology) the situation as a whole as one in which a norm governs and the question is whether particular facts within the situation trigger its application so as to produce a
A LEFT PHENOMENOLOGICAL CRITIQUE
375
sanction. Someone has died, and the court is asking, first, whether the defendant killed a person, and, second, whether the killing was a legal murder, and that “depends on the facts”. Often, once the facts are found, no one will even advert to the possibility of legal work directed at the interpretation of the norm that defines and punishes murder. The facts will be understood to establish guilt or innocence “of their own accord”, as the “norm applies itself” seemingly without any agency of the interpreter. It is familiar that the facts come into legal being through the work of investigators, so that the facts presented depend on the work strategies and levels of effort of prosecutors and parties. It is also familiar that the advocates and the judge, and, at a more abstract level, the jurist, sometimes work to transform the initial apprehension of which norm governs and what it requires. This is “strategic behavior in interpretation”. These are three types of strategic behavior in interpretation: First, trying to find legal arguments that will produce the effect of legal determinacy for a rule different from the one that initially appeared self evidently to govern the case, as for example by making it appear that there is necessarily an exception to the rule that covers the case, or that the case is covered by a different rule altogether. Second, trying to make what looked like a self evidently discretionary judicial decision (one in the periphery or within the frame) appear to be one in which there is, after all and counter-intuitively, a particular rule whose application is required by the materials (i. e. the case falls within the core or all alternatives are outside the frame). Third, trying to displace an initially self-evidently “valid” or legally required rule with a perception of the situation as one in which the judge is obliged to choose according to vague criteria between legally permissible alternative (i. e. moving an interpretation from the core to the periphery or into a frame permitting judicial discretion). In all these cases, the interpreter works to create or to undo determinacy, rather than simply registering or experiencing it as a given of the situation. Work presupposes a medium, something that the worker “fashions”. In this case, the medium is that body of legal materials which are considered relevant in establishing the meaning of the norm. This will certainly include the dictionary, with its definitions, and the legal dictionary with its quite different ones, and doctrinal commentary, and the full body of valid legal norms, perhaps legislative debates, perhaps case law.
376
DUNCAN KENNEDY
From our point of view, the question is not what count, officially, as “sources”, but what elements are sought out and deployed in fact in the work of advocacy or justification. The worker works uses the legal materials to convince an audience of some kind (and himself as well) that an initial apprehension (his or that of another) of determinacy or indeterminacy was wrong. But there is nothing that guarantees that this enterprise will succeed. Work is neither cognition of binding law nor discretion in devising law according to “legislative preference”. It is between these two. The legal materials constrain legal work but the way a medium constrains any other worker. It constrains only against an effort to make the materials mean one thing or another. To say that the interpretation of the rule was determinate is only to say that at the end of the work process the interpreter was unable to accomplish the strategically desired re-interpretation of the initially self-evident meaning of the norm. In other words, critical legal studies, as I understand it, accepts fully the positivist idea that law is sometimes determinate and sometimes indeterminate. Cls rejects both the idea of global indeterminacy and the idea that there is always a correct interpretation, however obscure or difficult to arrive at. But it also rejects the idea that determinacy and indeterminacy are “qualities” or “attributes” inherent in the norm, independently of the work of the interpreter. Strategic success against initially self-evident determinacy (or self-evident indeterminacy) is a function of time, strategy, skill, and of the “intrinsic” or essential or “objective” or “real” attributes of the rule that one is trying to change. The “ontological” question is whether it is appropriate to regard the determinacy of the rule, meaning it’s insuperably binding or “valid” quality at the end of the period allowed for working on it, as its own attribute, something inherent to it. The alternative is that the determinate or indeterminate quality of the rule cannot be understood otherwise than as an “effect”—the “effect of necessity”— produced contingently by the interaction of the interpreter’s time, strategy and skill with an unknowable “being in itself” or “essential” nature of the rule. The legal worker performs the classic phenomenological reduction or “bracketing” [epoche] (Husserl) of the question of whether the resistance of the rule to reinterpretation is a result of what it “really” is or merely an effect of time, strategy and skill. The worker proceeds by trying to change things, without a pre-commitment one way or another to an on-
A LEFT PHENOMENOLOGICAL CRITIQUE
377
tology of the norm. For the strategic interpreter nothing turns on deciding on the essence. The left phenomenological position within Cls adopts this attitude as well. Stakes determine how much work to do. Max Weber’s distinction between material and ideal stakes is useful here. The litigants may be materially motivated, and the judge too, but judges (and jurists) are obviously often conscious of only ideal stakes. They choose a work strategy because they understand their enterprise as having to do with “justice”, understood as non-identical with law application. They also understand the duty to achieve justice as “subordinate” to law. But this duty can be operative only after law is established. The conventional definition of the judicial (or juristic) role doesn’t say anything about legal work, because the standard (positivist) model recognizes only cognition and discretion, and makes no place for work. Those who understand interpretation as either cognitive or discretionary are likely to regard work designed to achieve a particular change in the self evident meaning of a norm, in a direction that is determined strategically, that is, extra-juristically, as illegitimate. I think the illegitimacy argument is incorrect. First, most people agree that judges are supposed to work at interpretation, and have to decide how to orient their work. Indeed, most jurists would regard it as a violation of the duties of the judicial role for the judge simply to act on whatever meaning of the norm was initially self-evident, once it has been pointed out that there is another possibility. The reason for this is that the judge knows that work may change the initial appearance. He cannot take it as “true” merely because it is initially legally self-evident. Faced with the obligation to work in one direction or another, judges (and jurists) often choose to orient their work to the goal of making their extra-juristic or legislative intuition of justice-in-rule-choice into the reality of judicial decision these are the “activists”, in Unitedstatesean parlance. What Hart and Kelsen refer to as “legislative” motives we all understand to fall within the domain of “ideology”. An ideology is a “universalization project” asserting a conception of justice that is controversial, alleged by some to be mere rationalization of non-universal interests and by others to be universal– as well as leading to vindication of the interests alleged by its opponents to be merely partial (Mannheim, Habermas). Judges (and jurists) sometimes work not ran-
378
DUNCAN KENNEDY
domly in trying to make law correspond to justice but according to their commitment to well known universalization projects or ideologies. This posture is problematic because even if we readily acknowledge that judges are obliged by their role to work to make positive law correspond to justice, it is a premise of the liberal democratic theory of the separation powers that ideology is not just “legislative” but that it is not for the judiciary (or for the jurist). Judges often respond to the dilemma by claiming to work and attempting to work non-ideologically – bracketing their legislative preferences in deciding in which direction they will try to move frames or cores. But when they do this, they have to contend with the fact that their audience, and they themselves, understand different outcomes to respond, in many cases with high stakes, to different ideologies. Two very common judicial (and juristic) postures, in the presence of this dilemma, are “bipolarity” and “difference splitting”. In the first, the judges establishes, for himself and others, that he is an ideological “neutral” because he unpredictably alternates between the alternatives defined by conflicting ideologies. In the second, the judge establishes his neutrality by being a “centrist”, devising a solution that gives something to each side, but gives neither side all that it demands. These are bad faith solutions, in Sartre’s sense in Being and Nothingness, because they avoid role conflict through denial (in Freud and Anna Freud’s sense). The position of the “activist” judge, who consciously or unconsciously pursues his own ideological commitments (rather than claiming neutrality because he is a wild card or a centrist) seems to me more ethically plausible. The judge knows that work may make the rule approach his legislative preference, but may not. Suppose he is committed to applying the rule if he cannot destabilize it using accepted, conventional judicial techniques – that is by research into the legal materials that will lead to their reinterpretation according to accepted canons of legal reasoning. Then why shouldn’t he direct his work, time strategy and skill, to finding the argument that will make law correspond to his conception of justice? It seems plain, to me, that he would be acting illegitimately precisely if he failed to attempt this, in other words if he failed to make the attempt to rework positive law to make it correspond to his idea of justice. The judicial (and the juristic) role requires fidelity to “law” in the complex sense that combines a positive and an ideal element. This position, which legitimates juristic work intended to inflect the law in the
A LEFT PHENOMENOLOGICAL CRITIQUE
379
judge’s (or jurist’s) preferred ideological direction, is, of course, “anarchist” (or at least “pluralist”) from the “Jacobin” point of view that locates legal legitimacy solely in the will of the people. If we recognize that judges can and do work to change cores or frames (whether or not we regard this work as legitimate), then a basic Hart/Kelsen notion is undermined. This is what Kelsen calls the “dynamic conception”, in which the movement of norm creation is from the abstract to the particular or concrete. In Hart, it is the notion that adjudication “fills in” the periphery, as well expressed by MacCormick in the following quotation. The thesis that even the best drawn laws or lines leave some penumbra of doubt, and this calls for an exercise of a partly political discretion to settle the doubt, is not particularly new, it is but the common currency of modern legal positivism... A crucial point, though, is that one ought not to miss or under-estimate the significance of line-drawing or determinatio as already discussed. The law really does and really can settle issues of priority between principles by fixing rules, and even when problems of interpreting rules arise, these focus on more narrowly defined points of interpreting rules than if the matter were still at large as one of pure principle. Fixing rules can be done either by legislation or by precedent; most commonly, in a modern system, by the two in combination. It is one of the gifts of law to civilization that it can subject practical questions to more narrowly focussed forms of argument than those which are available to unrestricted practical reason.
If strategically directed work in interpretation can initial apprehensions of cores or frames, then this statement is much too optimistic about the “gifts of law to civilization”. In my extended treatment of this topic, I suggest that “small” questions can have very large ideological stakes. Second, I suggest that contrary to MacCormick’s suggestion, the same arguments of principle recur at each level of abstraction, so that settling issues “further down” in the pyramid will involve arguments no less controversial than those that apply at the top. But for my purposes here, there is a quite different point: even after an interpretation is settled, work can destabilize it. This means that work can “inflect” or “shift” cores and frames. There is now a “from the bottom up” dynamic that counteracts to one extent or another Hart and Kelsen’s top down, abstract to concrete, dynamic. Rather than MacCormick’s progressively narrower focus for issues of controversy, the worker can hope to split open cores or dissolve them.
380
DUNCAN KENNEDY
So work does more than fill the frame or the periphery dynamically with strategically determined norm choices. Ideology inflects work which inflects frames and cores, which in turn provide, in the coherence view, means to further destabilizations of other cores and frames. In this view, the body of valid law, that is law that is regarded by legal workers in their initial encounter with the materials as core or frames, is best understood, first, as an historical work product of lawyers, jurists and judges pursuing conflicting ideological projects (which may be centrist, in the above sense), and, second, as always but unpredictably subject to destabilization by future ideologically oriented work strategies. II In order to understand how the above position, representing one, possibly the dominant position within critical legal studies since about 1985, and, today, the only remaining explicitly argued Cls position, it may be useful to contrast it with a typical misreading of Cls from within the mainstream of Anglo-American legal philosophy, in this case by my friend Brian Bix: [I]n particular, Cls theorists argued for the radical indeterminacy of law: the argument that legal materials do not determine the outcome of particular cases. Cls theorists generally accepted that the outcomes of most cases were predictable; but this was, they claimed, not because of the determinacy of the law, but rather because judges had known or predictable biases. The legal materials, on their own, were said to be indeterminate, because language was indeterminate, or because legal rules tended to include contradictory principles which allowed judges to justify whatever result they chose (Kelman 1987). The Cls critiques have generally been held to be overstated (Solum 1987); though there may well be cases for which the legal materials do not give a clear result, or at least not a result on which everyone could immediately agree, this negates neither the easiness of the vast majority of possible disputes nor the possibility of right answers even for the harder cases. The Oxford Handbook of Legal Studies, Peter Cane and Mark Tushnet, eds., p. 983.
1. The left-phenomenological Cls tendency (arguably the dominant tendency) argued that the legal materials do or do not determine the outcomes of cases only in interaction with the argumentative strategies of
A LEFT PHENOMENOLOGICAL CRITIQUE
381
jurists pursing objectives with limited time and resources. The materials are one part of the determination, but only in combination with interpretive activity which is not cognitive but rather consciously or unconsciously strategic. It is not and never was the position of this tendency within Cls that the legal materials “do not determine the outcome of particular cases” but rather that their influence is mediated and that their “intrinsic” or “essential” determinacy or indeterminacy is unknowable. The legal materials are “indeterminate” only in the sense that sometimes it is possible to destabilize initial apprehensions through legal work–“intrinsically” or “essentially” they are neither determinate nor indeterminate. True, we often initially apprehend them as determining the outcome of a particular case or, on the contrary, as not determining the outcome (because the case falls in the periphery or within the frame, for a H/K person, or within the areas of indeterminacy of conceptual analysis or policy analysis for advocates of those methods). On this basis, we can predict results when we anticipate that no work will be done to destabilize the initial apprehension. And it will often be possible to predict that no such work will be done because the extant ideological projects empowered through the judiciary are in agreement with the initial apprehension – in other words because actors with radical or outlying ideological projects do not work as judges or as influential jurists. In a second moment, the legal materials are determinate in those cases where after legal work to the point of exhausting the time and resources available, the interpreter finds himself or herself unable to destabilize the intial apprehension that there is an applicable norm and that that norm decides the case for one party or another. On this basis, we can predict results when we anticipate that the work done to destabilize outcomes will fail. In this case, we are making a prediction about the outcome of the interaction between interpretive work and the unknowable “essence” of the materials. Again, the centrist ideologies shared by judges and jurists in capitalist countries are an important factor in this kind of prediction. CLS writers have worked from the beginning and continually, to figure out how rules that seemed likely to resist even the most sustained effort at transformation through interpretation, given the moderate left or moderate right ideological preferences shared by virtually all judges in all capitalist countries, have massive and unjust impacts on oppressed groups. This is the Cls contribution to the sociology of law and left wing law and economics.
382
DUNCAN KENNEDY
2. The notion that the indeterminacy of language explained the way in which law is indeterminate has had some influence in Cls, particularly on the early work of Unger, and on writers like Boyle, who purported to speak for Cls as a whole. From the beginning, a more influential current argued that rules vary in “formal realizability,” or “administrability”, so that the simple linguistic critique is often trivial, as are all other arguments for “global” indeterminacy. Bix’s attribution to Cls of a notion that “legal rules [tend] to contain conflicting principles” is puzzling. The Cls claim was, a la Dworkin, that principles, policies and rights, and indeed world views, are all part of the commonly deployed sources of law, but, contra Dworkin, that they are in ineradicable conflict, within each of us as well as between us. Their conflictual presence is reflected in the more concrete “valid legal norms of the system,” which Cls, following legal realism, understands to be, always, complex compromises of those conflicts. Because the rules are compromises, rather than a coherent working out of one or another over-arching principle, they are much more open to destabilizations of various kinds than coherentist writers acknowledge. 3. The “biases” of judges are relevant because they orient legal work by judges (and other jurists) to transform initial apprehensions of what the materials require in the particular direction suggested by the judges material or ideal interests (loosely, the judge’s or jurist’s ideology). Whether the jurist will succeed in the work of making the materials conform to his ideological or material extra-juristic strategic motive is never knowable in advance (though as with any uncertain future event, we can make odds). Jurists constantly accept interpretations according to which the positive law is contrary to their view as to what it ought to be. Moreover, “biases” or ideology do not determine jurist’s work strategies in any way more determinate than the system of legal norms determine outcomes. Ideologies are indeterminate in just the way that the legal order is. There is an hermeneutic circle at work here, in which the indeterminacies of each level get resolved by appeal to a deeper level with its own indeterminacies, and so on, back to the starting point, in which legal ideas influence ideology as well as vice versa. 4. The Cls critiques have been held to be overstated (or to indicate mental incompetence or insanity) within a mainstream that has misunderstood them more or less in the manner of Brian Bix in the above pas-
A LEFT PHENOMENOLOGICAL CRITIQUE
383
sage, although they are quite often misinterpreted, not as above, but as claiming “determination in the final instance” by the base, or as a vulgar Marxist claim that the judges are the “executive committee of the ruling class,” and proceed case by case to further “the interests of capital”. The misreadings derive in part from the more or less complete ignorance both of phenomenology and of critical social theory among mainstream Unitedstatesean legal theorists, in part from the limited resources that mainstream legal philosophers devote to marginal currents (Bix is exceptional in his familiarity with Cls writing), and in part to the normal investment of mainstreams in reproducing the marginality of the margins. 5. Everyone knows that “there are cases for which the legal materials do not give a clear result”. And that there are cases in which the legal materials do not give a result “on which everyone could immediately agree”. The Cls claim is that the question of what proportion of actual or imaginable cases have determinate outcomes, given the legal materials, has to be asked taking into account the possibility that legal work will destabilize the initial apprehension of what the materials require. Once we take into account that determinacy is a function not just of the words of valid norms and the content of other sources, but of an interaction-between the resources and strategies of whoever has the power to do legal interpretation, and the “thingness” of the materials-statements about the “vast majority of disputes” are simply meaningless. 6. That results are not determinate in some cases, according to Bix, does not “negate the... possibility of right answers even for the harder cases.” The only intelligible meaning of a “right answer” in a case, hard or easy, given the phenomenology above, is that having worked with the time and resources available and according to a chosen strategy, the interpreter can’t find an alternative to some particular apprehension of what rule applies and what it requires when applied. In other words, after performing the phenomenological reduction, the “right answer” is the one that is produced by an argument having the “effect of necessity”. As to whether there is a right answer in the sense of one available to cognition, Cls. takes the position of Kant as to the “thing in itself”.
!
SEIS PROBLEMAS RELACIONADOS CON EL CONCEPTO DE SANCIÓN Roberto LARA CHAGOYÁN* SUMARIO: I. Introducción. II. El concepto de sanción en la teoría contemporánea del derecho. III. La sanción como elemento interno o externo de la norma jurídica. IV. El regreso al infinito. V. La sanción como criterio de individualización de las normas jurídicas. VI. La relación deber-sanción. VII. La nulidad vista como sanción. VIII. La motivación de la conducta a través de las sanciones positivas. IX. Conclusión. X. Bibliografía.
I. INTRODUCCIÓN En las siguientes páginas, expondré algunos problemas que, en mi opinión, tienen una considerable importancia de cara a elaborar una teoría de la sanción. Por un lado, indicaré en qué consiste el problema y, por otro, cuál podría ser su solución o la manera de hacerle frente. Los problemas son: 1) la sanción como elemento interno o externo de la norma jurídica; 2) el regreso al infinito; 3) la sanción como criterio de individualización de las normas jurídicas; 4) la relación deber-sanción; 5) la nulidad vista como sanción; y 6) la motivación de la conducta a través de las sanciones positivas. Para acercarme a tales problemas, traté de basarme en una doble perspectiva de análisis: el enfoque estructural, que busca entender qué es la sanción y cómo se integra en las normas, y el enfoque funcional que trata de determinar para qué sirve la sanción, es decir, justificar la existencia de castigos o premios por servir de motivaciones efectivas de la * Suprema Corte de Justicia de la Nación, México.
385
386
ROBERTO LARA CHAGOYÁN
conducta. Mi análisis se centra en las obras de cuatro autores, cuya concepción del derecho está íntimamente relacionada con el análisis del concepto de sanción, al cual dedicaron buena parte de su obra: se trata de Jeremy Bentham, John Austin, Hans Kelsen y Norberto Bobbio. Conviene advertir que no profundizaré sobre la obra de estos autores, pues el énfasis del trabajo está en los problemas y no en el análisis de la obra de estos pensadores.** II. EL CONCEPTO DE SANCIÓN EN LA TEORÍA CONTEMPORÁNEA DEL DERECHO
Jeremy Bentham define a la sanción como la probabilidad objetiva de que se producirá, como consecuencia del incumplimiento de un deber, un mal o dolor. Para este autor, la relación entre el deber y la sanción es el fundamento de las normas jurídicas: alguien tiene el deber de hacer algo cuando la omisión de esa acción significa incurrir en una sanción. El deber jurídico es visto por Bentham a partir de dos “arquetipos” (formas de definición creadas por él) diferentes: por un lado, se dice que alguien “está bajo una obligación” cuando sobre una persona pende una carga apremiante que hace necesario un modo determinado de actuar o de no actuar; y, por otro lado, la idea de “actuar como es debido” se refiere a estar ligado a una fuerza obligatoria que limita el curso de la conducta. La imagen que representa al primer arquetipo es la de un peso que pende sobre la cabeza del obligado, mientras que para el segundo arquetipo, se recurre a la imagen de una cuerda que ata al obligado a un curso de acción determinado. De acuerdo con Bentham, las cláusulas sancionadoras sólo se encuentran en las normas obligatorias (en donde se incluyen tanto las normas que obligan como las que prohíben realizar una determinada acción). En ese tipo de normas puede distinguirse una parte directiva (provision) que es la expresión completa de la voluntad del legislador, y una parte iniciativa o sancionadora que expresa una predicción de lo que ocurrirá al destinatario que no cumple con lo ordenado (sanción conminativa) o de lo que ocurrirá si cumple con lo ordenado (sanción invitativa o premio). ** Para profundizar sobre la obra de los autores referidos, véase Lara Chagoyán, Roberto, El concepto de sanción en la teoría contemporánea del derecho, México, Fontamara, 2004.
EL CONCEPTO DE SANCIÓN
387
Desde el punto de vista funcional, las sanciones se traducen en motivos para la acción; es decir, en motivos que necesita el destinatario de las normas para cumplirlas. Esos motivos pueden representar un mal o un bien. En el primer caso se llaman coerciones y se traducen en castigos. En el segundo se trata de motivos seductores, que se traducen en recompensas o premios. La razón de fondo que Bentham señala como fundamento de las sanciones jurídicas es la eficacia, es decir, la efectiva observancia de las normas. El dolor y el placer son, pues, para Bentham, los únicos motivos por los cuales el hombre actúa. Además, atendiendo la fuente donde se originan, Bentham clasifica las sanciones en físicas (la naturaleza), políticas (el Estado, el derecho), morales (la comunidad, la moral social) y religiosas (Dios, o una similar voluntad sobrenatural). Bentham es uno de los primeros autores que destacaron la importancia de las sanciones positivas en la teoría del derecho. Aunque para él el elemento fundamental de un sistema jurídico se encuentra en la idea de coerción que se manifiesta mediante las sanciones negativas, los premios tienen, desde el punto de vista funcional, la misma razón de ser que los castigos: en ambos casos se trata de mecanismos de motivación de la conducta. De manera que la importancia que atribuyó al castigo no le llevó a descartar la idea de que la conducta también se puede normar mediante motivaciones “seductoras”. El análisis del concepto de sanción en John Austin se puede abordar desde dos perspectivas: una estructural, en la que se lo ubica en el nivel de las normas de mandato y se lo define como uno de los elementos necesarios de toda norma; y otra funcional, en la que se considera el aspecto externo, material o motivacional de la sanción: la compulsión a la obediencia y la formación de un hábito de comportamiento conforme a los mandatos del soberano. En cuanto al aspecto estructural, las sanciones, junto con el deseo del soberano de que los destinatarios de la norma realicen una determinada conducta, forman parte de una norma de mandato. El concepto de mandato, es decir, de una norma jurídica completa, es correlativo al de deber: sólo se tiene un deber si existe un mandato, y viceversa. Las sanciones jurídicas son definidas por Austin como el daño anexado al deseo del soberano de que el destinatario realice una determinada conducta (contenido del deber), daño que será probablemente aplicado en caso de que dicha conducta (el deber) sea incumplida. Puede decirse que los términos mandato y deber son correlativos antes de que se ejecute la conducta con
388
ROBERTO LARA CHAGOYÁN
la que se quebrante el deber, pero cuando se ha infringido el deber, entonces los términos correlativos pasan a ser mandato y sujeto sancionable. Para Austin, es importante distinguir entre la sanción y la mera compulsión física. La sanción, como se ha dicho, es un daño probable que viene anexado al deseo del soberano; ello implica que el destinatario de las normas tiene la opción, cumpliendo o incumpliendo el deber, de dar lugar o no al daño de la sanción. La compulsión física, en cambio, supone la realización de un daño o la existencia de un estado de imposición que no permite la elección al que la sufre. Los mandatos (en el sentido de normas) son correlativos de los deberes jurídicos; y los mandatos se componen del deseo del soberano y de la sanción. Si lo que hubiera fuera una simple compulsión física, no hablaríamos de mandatos, porque faltaría el deseo del soberano y, por tanto, tampoco podría haber deberes correlativos a ese mandato. En su aspecto funcional, las sanciones tienen un objeto directo y otro indirecto. El objeto directo o próximo se refiere a la compulsión a la obediencia puesta en práctica en aquellos casos en los que una persona no muestra el sentimiento provechoso o utilitario propio de la obediencia. Dado que, a decir de Austin, este sentimiento puede estar ausente o ser anormal en algunos sujetos, la sanción sirve como un factor de corrección. Las sanciones operan provocando un proceso gradual de asociación entre deseos y consecuencias en el destinatario de la norma; un proceso que regularmente da como resultado el cumplimiento de las normas porque coincide con el deseo más fuerte que los individuos tienen: escapar del mal o de las consecuencias negativas de las sanciones. El objeto indirecto o pedagógico de la sanción es el de la formación del hábito de obediencia en los destinatarios de las normas. Gracias a las sanciones los sujetos van eliminando gradualmente los llamados “deseos siniestros”, es decir, deseos contrarios al derecho, para sustituirlos por otros deseos conformes con la utilidad general. Mediante este proceso educativo de las sanciones, los sujetos llegan a cumplir las normas de forma espontánea, llegan a tener una predisposición hacia la justicia. Este objeto indirecto de las sanciones es empleado por Austin para demostrar que los destinatarios de las normas no cumplen con lo ordenado por éstas simple y exclusivamente por el temor a las consecuencias negativas de la sanción correspondiente, ya que eso significaría que los destinatarios no están adheridos a la idea de justicia; la sanciones, además de operar —mediante su objeto directo— como refuerzos para el cumpli-
EL CONCEPTO DE SANCIÓN
389
miento de los deberes, digamos a corto plazo, también operan indirectamente sirviendo como auxiliares a largo plazo en la guía de la conducta. En una interpretación amplia de las tesis austinianas, Roger Cotterrell señala que el estudio de las sanciones no se agota cuando se las considera como un elemento analíticamente esencial de las normas; la sanción también puede ser vista como un elemento necesario desde una perspectiva sociológica. A partir de esa premisa, Cotterrell considera que lo que, según Austin, guía la conducta no son sólo las normas de mandato, sino también otro tipo de normas desprovistas de sanción a las que Austin llama “normas imperfectas” (equivalentes a las reglas que confieren poderes; véase norma jurídica), las cuales emplean como refuerzo análogo a las sanciones la consecuencia jurídica de la nulidad. De esta forma la guía de la conducta parece más completa: los mandatos y sus posibles sanciones compelen al destinatario al cumplimiento de las obligaciones mediante la amenaza del castigo; mientras que las reglas que confieren poderes y sus posibles nulidades motivan a los destinatarios mediante las desventajas que acarrean. Cotterrell propone una interpretación amplia del concepto de sanción a partir de la idea austiniana de considerar como sanciones aquellas medidas que reporten al sujeto “la más mínima posibilidad del más mínimo daño”. Austin admite básicamente dos tipos de sanciones: las privadas y las públicas. Las privadas corresponden a la violación de ciertos deberes relativos, es decir, deberes que han de cumplirse ante derechos subjetivos de personas determinadas; aquí las sancio nes se demandan a instan cia de parte. Las sanciones públicas, en cambio, corresponden a la violación de deberes absolutos, es decir, deberes que no se corresponden con derechos subjetivos de personas determinadas, sino que son deberes erga omnes; son impuestos a discreción del soberano o de los representantes del Estado. Hay, además, un tipo especial de sanciones: las sanciones vicarias. Se trata de sanciones que se aplican a un individuo pero que tienen efectos sobre los allegados de éste que nada tienen que ver con el ilícito que dio lugar a la sanción; los males recibidos por estos allegados inocentes son sanciones vicarias. La existencia de este último tipo de sanción y su justificación están relacionadas con una moral utilitarista que se basa en el logro del bienestar general, aunque ello suponga atentar contra derechos de los individuos. Siguiendo a Kelsen, las propiedades necesarias y suficientes del concepto de sanción jurídica son las siguientes: a) se trata de un acto coerci-
390
ROBERTO LARA CHAGOYÁN
tivo, esto es, de un acto de fuerza efectiva o latente; b) tiene por objeto la privación de un bien; c) quien la ejerce debe estar autorizado por una norma válida; y d) debe ser la consecuencia de la conducta de algún individuo. Hay, sin embargo, dos sentidos más del término sanción: un sentido amplio referido a aquellos actos coactivos que son reacciones contra hechos socialmente indeseables que, al no configurar una conducta humana, no pueden ser considerados como prohibidos; estos actos tampoco están conectados con el concepto de ilicitud. Se trata de figuras afines a la sanción como la reclusión de enfermos contagiosos o peligrosos; la expropiación coactiva de bienes por utilidad pública; y la destrucción coactiva de bienes o animales ante el peligro que representan o el riesgo que generan. Por otro lado, el sentido amplísimo de sanción abarca tanto a las sanciones propiamente jurídicas como a las figuras afines a la sanción, esto es, se refiere a la totalidad de actos coactivos estatales. Para Kelsen, la sanción es el concepto primario del derecho, lo cual implica que todos los demás conceptos jurídicos se definen a partir del concepto de sanción: el acto ilícito no constituye la violación de una norma, sino la realización de una de sus condiciones de aplicación. La obligación jurídica es la conducta opuesta al ilícito. El derecho subjetivo puede verse en términos de derecho objetivo y, en consecuencia, también se define, aunque indirectamente, a partir del concepto de sanción. Para definir de esta última forma el concepto de derecho subjetivo es menester determinar el significado del ambiguo término que lo expresa, pues éste puede tener las siguientes acepciones: reflejo de una obligación; derecho en sentido técnico; permisión positiva; derecho político; y libertad fundamental; en todos estos casos, el concepto originario es —o se supone que es— el de sanción. El concepto de responsabilidad es definido por Kelsen como la situación normativa en la que se encuentra un individuo que es susceptible de ser sancionado por la comisión —propia o ajena— de un acto ilícito determinado. Por otro lado, para Kelsen, la sanción es el criterio de individualización de las disposiciones jurídicas, ya que para él una norma es jurídica si estatuye ella misma un acto coactivo (una sanción), o bien está en una relación esencial con una norma que lo estatuya. Una crítica que suele dirigírsele a Kelsen y que tiene mucho que ver con su concepción de la sanción es la reducción del derecho a la fuerza. Sin embargo, el autor de la Teoría pura sostiene que esa reducción no tiene lugar en su obra porque la amenaza de daño y el orden jurídico son
EL CONCEPTO DE SANCIÓN
391
cosas distintas. Señala esencialmente tres diferencias: 1) el sentido de la amenaza es la predicción de un daño o un mal que será infligido, en tanto que el sentido del orden jurídico es que, bajo ciertas condiciones, deberán ser infligidos ciertos daños; 2) los actos mediante los cuales se instaura el derecho tienen al mismo tiempo un sentido objetivo y un sentido subjetivo, es decir, son reconocidos como actos válidos productores o aplicadores de normas y al mismo tiempo tienen el sentido de obligar al destinatario, mientras que los actos de mera expresión de fuerza (como los de un salteador de caminos) pueden tener un sentido subjetivo, pero no un sentido objetivo; 3) los actos instauradores o aplicadores del derecho tienen como presupuesto la norma fundamental, mientras que los actos de mera amenaza no tienen ese presupuesto. Con todo, las razones que da Kelsen no parecen convincentes. El cierre del sistema mediante la norma fundamental sólo puede funcionar si se acepta que la propia norma fundamental está determinada en última instancia por la efectividad del poder coercitivo. Lo que esa norma hace es autorizar el empleo del poder físico, que de esa forma resulta válido jurídicamente. Pero eso significa que la norma fundamental es el criterio de legitimación de la amenaza del ejercicio de la fuerza y que el poder coactivo eficaz está jurídicamente autorizado precisamente porque de hecho es capaz de imponerse. En suma, en lugar de que el derecho determine al poder —como pretendía Kelsen— todo parece indicar que, en su teoría, es el poder el que determina al derecho. En la obra de Norberto Bobbio el concepto de sanción —como también el concepto de derecho— ha recorrido, no sin tener que sortear algunos obstáculos, el camino que va desde la estructura a la función. En una primera etapa teórica, Bobbio sostiene una concepción cercana a la de Kelsen, en la cual la sanción servía como criterio de identificación de las normas jurídicas. Habiendo descartado los criterios formales de identificación porque llevarían a no poder distinguir el derecho de otros sistemas normativos, Bobbio trata de buscar un criterio más adecuado y lo encuentra (después de excluir el criterio del contenido, del fin, del sujeto que las dicta, de los valores, o de la naturaleza de las obligaciones) en el concepto de sanción jurídica. Aquí la sanción viene a ser la respuesta a la violación de una norma: un concepto que se distingue tanto de las sanciones morales (de carácter interno y en las que el sujeto activo y pasivo es el mismo) como de las sanciones sociales (externas, pero no institucionalizadas); las sanciones jurídicas tienen un carácter externo y están
392
ROBERTO LARA CHAGOYÁN
institucionalizadas. Al tratar de responder a los argumentos que consideran que la sanción no es un concepto necesario y que, por tanto, no es útil para identificar a las normas jurídicas, Bobbio señala que se trata sólo de un criterio más adecuado que otros y que su utilidad depende de que la sanción no se vea sólo desde una perspectiva formal. Aquí es donde comienza el tránsito de la estructura a la función. Una vez en el terreno del análisis funcional, Bobbio centra su atención en la pregunta ¿para qué sirve el derecho? en lugar de ¿qué es el derecho? Ese cambio en la concepción del derecho tendría que ver con factores tales como el desarrollo de la sociología del derecho a partir de la segunda guerra mundial, la pérdida de la función (tradicional) del derecho en la sociedad industrial, la existencia de funciones negativas del derecho, o la aparición de nuevas funciones del derecho como la función distributiva o la función promocional. La idea fundamental de Bobbio es que, en el paso del Estado liberal al Estado social, el ejercicio de la función primaria de regular el comportamiento ha asumido formas distintas a las tradicionales que reposaban en la intimidación mediante sanciones negativas. Esas nuevas formas son medidas de alentamiento como los premios (sanciones positivas), los incentivos y las facilitaciones. Las sanciones positivas son la promesas de premios consistentes en otorgar una satisfacción a quienes han cumplido con una determinada actividad. Los incentivos, por su parte, son medidas que sirven para alentar el ejercicio de una actividad económica determinada que redunda en beneficios colectivos. Las facilitaciones son, finalmente, medidas de organización que consisten en proveer de medios necesarios para el desarrollo de cierta actividad orientada a un fin. Los mecanismos promocionales tienen la ventaja de que influyen positivamente en la psique del destinatario ofreciéndole ventajas, haciéndole más fáciles las cosas y estimulándole a actuar conforme a las normas. La diferencia entre la técnica promocional y la tradicional de la sanción negativa está en el hecho de que el comportamiento que tiene consecuencias jurídicas no es ahora la inobservancia, sino la observancia. Ese análisis funcional de la sanción no resulta, sin embargo, incompatible con la concepción kelseniana. Bobbio piensa que la definición de sanción que da Kelsen es una definición funcional porque su finalidad (en palabras de Kelsen) es “la obtención de un comportamiento deseable por el legislador”. Además, las sanciones positivas entran perfectamente en la estructura de la norma primaria de Kelsen: si es A, debe ser B, si se
EL CONCEPTO DE SANCIÓN
393
interpreta que A no es un ilícito sino una conducta conforme, y que B no es un castigo sino un premio. Y, finalmente, tanto las sanciones positivas como los incentivos no son más que técnicas específicas de organización social. III. LA SANCIÓN COMO ELEMENTO INTERNO O EXTERNO DE LA NORMA JURÍDICA
Varios autores se han preocupado por determinar si las sanciones son una condición sine qua non de las normas jurídicas. Los que creen que sí, señalan, como Kelsen, que la nota esencial de las normas jurídicas —y del derecho— son las sanciones, pues es lo que las distingue de otro tipo de normas que no son jurídicas. Por el contrario, los que consideran que las sanciones no son necesarias, sino contingentes, en la idea misma de norma jurídica, conciben a las sanciones como refuerzos externos a las normas que cumplen la función de garantía de cumplimiento, pero que estrictamente no forman parte de la norma. Este segundo punto de vista admite la existencia de varios tipos de normas, algunas de las cuales carecen de sanción y no por eso dejan de ser normas jurídicas, por ejemplo, las normas que confieren poderes. Como he dicho, Kelsen afirma categóricamente que la sanción es un elemento interno de la norma y excluye cualquier consideración en relación con elementos extrajurídicos. El autor de la Teoría pura señala que todas las normas del sistema estatuyen una sanción: la mayoría lo hacen directamente y en otras ocasiones, las normas que no cuentan con una sanción se conectan con otra norma jurídica que sí la establece, por lo que, a final de cuentas, todas las normas jurídicas establecen como consecuencia, una sanción. Jeremy Bentham, John Austin y Norberto Bobbio dieron una definición funcional de la sanción: la sanción como motivo para la obediencia. No es que Kelsen no considerase importante esa cuestión, sino que para él no debía ser materia de un análisis jurídico sino de uno de tipo sociológico o psicológico. Sin embargo, Bobbio, al analizar las tesis kelsenianas, observa —y con razón— que también la definición de Kelsen es una definición funcional, pues admite que “las sanciones están dispuestas en el ordenamiento jurídico para obtener un determinado comportamiento humano que el legislador considera deseable”.
394
ROBERTO LARA CHAGOYÁN
En las obras de Bentham y Austin puede observarse el empleo de los análisis estructural y el funcional, en cuanto al estudio del concepto de sanción: a veces hablan de las sanciones como elementos interno a las normas, y otras veces como elementos externos. Para Bentham, por ejemplo, las sanciones son partes de las normas; y Austin las consideraba como partes de los mandatos. Bentham entendió que las sanciones eran los únicos motivos útiles para la eficacia del derecho (motivos dolorosos y motivos seductores); mientras que para Austin las sanciones tienen como objeto directo la compulsión al cumplimiento de las normas, y como objeto indirecto la formación del hábito de obediencia. Bobbio empleó también los dos análisis, pero se decantó más bien por el funcional: las sanciones para él son elementos necesarios para la guía de la conducta: unas veces reprimiéndola y otras veces alentándola. En mi opinión, habría que decir que, en general, los dos enfoques son necesarios para dar cuenta adecuadamente de las sanciones y que, por tanto, no deben considerarse como excluyentes, aunque en ocasiones uno de ellos sea el determinante. Por ejemplo, si lo que se busca es distinguir la sanción de lo que no es sanción —lo cual constituye un problema de interés—, el punto de vista funcional o externo resulta insuficiente. El concepto de sanción no sólo es un concepto empírico, sino también un concepto normativo. Y en relación con el carácter complementario de ambos análisis, lo que puede decirse es lo siguiente: la sanción jurídica es una reacción frente a ciertas conductas establecidas por el derecho; ello significa que la sanción necesita estar integrada en la estructura de algunas normas y que esas normas necesitan que la sanción forme parte de ellas; sin embargo, el contenido de la sanción (positivo o negativo) supone que ésta ha de consistir en una motivación de la conducta que sólo puede ser analizada en términos funcionales. IV. EL REGRESO AL INFINITO La idea de derivar el deber de la sanción o la sanción del deber genera el conocido problema del regreso al infinito. Ese problema se plantea también en relación con el concepto de soberano, de validez, etcétera. Se trata, en general, de una consecuencia natural de estudiar al derecho como un sistema escalonado. Un deber es jurídico si, y sólo si, existe una norma (N1) que disponga la aplicación de una sanción en caso de su in-
EL CONCEPTO DE SANCIÓN
395
cumplimiento. Ahora bien, el deber del órgano competente para aplicar dicha sanción será jurídico si existe otra norma (N2) que disponga el deber de aplicar una sanción en caso del incumplimiento del deber contenido en la norma (N1). La norma (N2), a su vez, contiene un deber que, para que sea jurídico, necesita una norma (N3) que disponga otro deber de aplicar otra sanción para el caso del incumplimiento, y así sucesivamente hacia el infinito. En opinión de Kelsen, para sostener que una conducta es debida jurídicamente no hace falta que exista a su vez el deber jurídico en el sentido estricto de imponer una sanción en caso de un comportamiento opuesto, sino que basta con que, para dicho caso, una norma (la fundamental) “estipule”, “establezca” o “determine” la imposición de la sanción. Pero está claro que Kelsen no resuelve del todo el problema porque sólo elude la conclusión de que en un sistema normativo finito ha de haber un deber no sancionado, al precio de admitir que ha de haber en él alguna sanción no debida (en sentido estricto), sino meramente “estipulada” o “establecida”. Pero con esa respuesta se oscurece demasiado la calificación deóntica de la conducta consistente en imponer esa sanción última. Si se replica que se trata de una conducta meramente autorizada al órgano para imponerla, el resultado es demasiado contraintuitivo como para poder aceptarlo. La tesis del regreso al infinito aparece también en las primeras obras de Bobbio, al considerar a la sanción como criterio individualizador del derecho. En su opinión, el regreso al infinito se detiene, por un lado, por la adhesión espontánea a las normas de máxima jerarquía que de hecho se produce y, por otro, porque la caracterización del sistema a través de la sanción debe hacerse tomando en cuenta no normas específicas, sino el sistema normativo en su conjunto. La tesis de Hart consiste en afirmar que es posible mantener que una regla es jurídica sin caer en el regreso al infinito. La solución consiste en el establecimiento de una norma parcialmente autorreferente: una norma que dijera “los jueces, so pena de la sanción X, tienen el deber de sancionar la transgresión de los deberes que los jueces tienen de sancionar, incluido el deber de sancionar el incumplimiento de la presente norma”. Ahora bien, con ello se evita el problema de tipo lógico, pero sigue existiendo el problema práctico: si para romper el regreso al infinito esa norma parcialmente autorreferente se ha de dirigir al conjunto de los jueces (en una especie de tejido reticular, en lugar de la antigua cadena vertical
396
ROBERTO LARA CHAGOYÁN
al infinito), todos los jueces se encontrarían con el deber de sancionar a cualquier otro (incluidos sus superiores en la jerarquía judicial) por cualquier incumplimiento de deberes sancionadores; lo cual no parece que resulte ser muy operativo en la práctica. Raz, por su parte, señala que cuando el soberano ordena a sus subordinados aplicar dichas sanciones, existe un respaldo de dicha orden que no necesita, a su vez, el respaldo de otra norma, porque se trata de una política de sanciones dispuesta por tal soberano; dado que esta política de sanciones no es una disposición jurídica independiente, no impone deberes y, por tanto, no necesita ser respaldada por ninguna otra disposición jurídica punitiva. V. LA SANCIÓN COMO CRITERIO DE INDIVIDUALIZACIÓN DE LAS NORMAS JURÍDICAS
Bentham ha sido probablemente el primer autor preocupado por individualizar las normas jurídicas y también el primero en tomar como criterio individualizador al concepto de sanción. Austin también señaló que la sanción era uno de los elementos necesarios para que pueda hablarse de una norma jurídica (de un mandato). Kelsen sostuvo que cada una de las normas que componen el orden jurídico ha de prescribir una sanción. Y el primer Bobbio consideró que la identificación del derecho debía hacerse usando el criterio de la sanción, aunque al mismo tiempo entendiera (a diferencia de Kelsen) que la sanción caracteriza al conjunto, al orden jurídico, pero no necesariamente a cada uno de los elementos que lo componen. En mi opinión, el concepto de sanción como criterio de identificación de las normas jurídicas puede ser un criterio preferible a otros, pero no deja de presentar inconvenientes: no permite dar cuenta de ciertas obligaciones jurídicas que no se hallan en una conexión esencial con una norma que estatuya una sanción; tampoco explica la obediencia al derecho por razones distintas de las suministradas por la presencia de la sanción; y, finalmente, no aclara de qué manera las normas que confieren poderes dirigen la conducta de los destinatarios. Por otro lado, las teorías del derecho basadas en el concepto de sanción (de sanción negativa) acaban por reducir el fenómeno jurídico a la idea de fuerza, con lo que dejan de lado elementos importantes de los
EL CONCEPTO DE SANCIÓN
397
sistemas jurídicos. En particular, quedan fuera funciones del derecho que, como la función promocional o la función distributiva, no se basan en la idea de que la guía de la conducta haya de obtenerse exclusiva o esencialmente mediante el uso de la fuerza. VI. LA RELACIÓN DEBER-SANCIÓN Los anteriores problemas convergen en el de determinar si la sanción es un factor determinante para la existencia de los deberes jurídicos. Las preguntas a hacer aquí son: ¿tienen los destinatarios de las normas un deber porque existe una sanción, o bien son las sanciones las que existen porque resultan ser un refuerzo útil de ciertas normas?; ¿hay deberes sin sanciones?, ¿hay sanciones sin deberes? Los análisis de Bentham y Austin tienen (cualquiera que sea la interpretación que se haga de ellos) un carácter predictivo: las sanciones se ven como consecuencias probables de lo que sucederá si los deberes no son cumplidos. Claramente, este concepto de deber tiene una conexión analítica con el concepto de sanción, pues el deber es deber en función de las consecuencias, de modo tal que si no existieran sanciones no podría haber deberes. El análisis de Kelsen es particularmente rígido: los deberes existen sólo porque la conducta opuesta al deber constituye la condición de la sanción, pues, como se sabe, el concepto primario del derecho para este autor es el de sanción. Ahora bien, si se considera que la sanción es el concepto primario del derecho (y el que hay que utilizar para identificar los deberes), podemos llegar a resultados indeseables. Se puede aceptar sin más que las sanciones son males o privaciones de bienes, pero no es fácil saber cuáles de los males, de las consecuencias de las acciones, constituyen sanciones. Por ejemplo, si comprar un boleto para la ópera supone para alguien cierta desventaja económica, podría interpretarse que ese pago es una sanción (una especie de multa) y que, en consecuencia, quien así lo percibe tiene el deber de no ir a la ópera. Ahora bien, si el pago del boleto de la ópera no es visto como una sanción sino como una tasa, entonces no puede hablarse de “un deber de no ir a la ópera”. Desde mi punto de vista, para identificar los deberes jurídicos no siempre es necesario acudir a las sanciones, pues en ocasiones basta con descubrir cuál es la voluntad del soberano en el mandato, esto es, basta
398
ROBERTO LARA CHAGOYÁN
con identificar cuál es la conducta querida o deseada por él. Así, puede decirse que ciertamente no hay sanciones sin deberes, pero sí deberes sin sanciones. Pero más allá del problema lógico de determinar si el concepto de deber implica al de sanción o si el de sanción implica al de deber, las convenciones lingüísticas indican que, por lo regular, no se califican ciertas conductas como debidas porque la conducta opuesta lleve aparejada la imposición de una carga negativa, sino que se califican esas cargas negativas como sanciones precisamente en la medida en que son vistas como respuestas o reacciones a la transgresión de un deber. VII. LA NULIDAD VISTA COMO SANCIÓN La consideración o no de la nulidad como una sanción es una cuestión sumamente controvertida. Roger Cotterrell, al analizar las tesis de Austin, señala que la equivalencia entre sanción y nulidad puede darse si se toma en cuenta que las nulidades generan desventajas tanto a los ciudadanos comunes como a los funcionarios. En esas desventajas puede verse una mínima idea de reproche. Por ejemplo, en las reglas que confieren poderes públicos puede entenderse que hay un reproche al ejercicio de la capacidad profesional de un funcionario cuando éste ve anulada o invalidada su actividad; las consecuencias negativas que sufre se manifiestan en el desprestigio o la afectación a su reputación. Cotterrell aclara que, para que haya una sanción de nulidad en estos casos, es necesario que exista un deber de ejercicio por parte del titular del poder. Por otro lado, en el ámbito privado, en los negocios jurídicos, la nulidad implica muchas veces el no nacimiento de ciertos derechos subjetivos, lo cual puede verse perfectamente como una sanción. Hart, por su parte, no admite que la nulidad pueda ser considerada como una sanción: la sanción implica necesariamente un daño, pero no así la nulidad. El contratante que ve anulado el contrato por algún vicio del consentimiento no tiene por qué ver necesariamente como un daño esa anulación. Para Hart, la relación entre las normas que establecen obligaciones y la sanción no es una relación intrínseca porque puede haber normas de este tipo sin sanciones; en cambio, la relación entre las reglas que confieren poderes y la nulidad sí es una relación intrínseca toda vez que no puede haber normas de este tipo sin una referencia a la validez o a la nulidad de los actos jurídicos realizados. Hart distingue, pues, la
EL CONCEPTO DE SANCIÓN
399
función de los diferentes tipos de reglas y con ello muestra que nulidad y sanción juegan papeles distintos: mientras que las sanciones tienen como función desalentar o evitar ciertas conductas futuras dado su carácter amenazador, la nulidad cumple simplemente la función de imposibilitar que un acto tenga fuerza o efectos jurídicos. Carlos Nino ofrece una posible solución para el problema de la sanción como nulidad: verla no como motivo para la acción, sino como la privación de un bien. Si tratamos de buscar cuál sería el bien afectado por la nulidad tendríamos que considerar que se trata, como dice Nino, de “la negativa a «prestar» la coacción estatal” que sufre el interesado por la falta de validez del acto en cuestión. Es decir, que la persona a quien se le anula un acto jurídico se le deja sin la tutela del derecho, lo cual supone una molestia objetiva. En el ámbito privado, una persona a quien se le anula alguna actuación pierde la posibilidad de que sus derechos subjetivos nazcan, porque la invalidez del contrato no genera ningún deber para el otro contratante. Si no existiera la nulidad no habría respaldo de la coacción estatal, lo cual, como dice Nino, haría muy difícil la existencia de los contratos. Alchourrón y Bulygin señalan que así como las sanciones negativas constituyen la forma típica de reaccionar frente al incumplimiento de obligaciones, la nulidad constituye una reacción típica frente a otro tipo de situaciones que no reúnen los requisitos exigidos por una definición de obligación. En mi opinión, las cosas se pueden aclarar bastante si se distingue entre el enfoque estructural y el funcional a propósito de las sanciones. Desde el punto de vista estructural está claro que sanción y nulidad son conceptos distintos: por ejemplo, las sanciones están vinculadas con los deberes, pero no así las nulidades. Sin embargo, no cabe duda de que, desde el punto de vista funcional, existen analogías, pues las nulidades, cumplen una función motivadora semejante a la de las sanciones toda vez que, como dice Nino, amenazan con un tipo especial de “mal” a aquellos que no toman en cuenta lo establecido por el derecho; dicho mal puede traducirse en la falta de respaldo coactivo del Estado que sufre la persona interesada en la validez del acto que ha devenido en nulo.
400
ROBERTO LARA CHAGOYÁN
VIII. LA MOTIVACIÓN DE LA CONDUCTA A TRAVÉS DE LAS SANCIONES POSITIVAS
Asociar los males con el término sanción parece ser lo más intuitivo: la mayoría de las personas que oyen hablar de sanciones tienen representaciones mentales de prisiones, multas, reos, dolor, etcétera. En la teoría contemporánea del derecho esta imagen es algo distinta. Por ejemplo, Jeremy Bentham y Norberto Bobbio se preocuparon por el concepto de sanción jurídica positiva; en particular, a Bobbio se debe el desarrollo de una teoría promocional del derecho que ve a éste como una guía eficaz de la conducta a través del reconocimiento e incentivación de ciertas conductas. Tanto Kelsen como Austin consideraron más bien que las sanciones positivas desvirtúan el concepto jurídico de sanción y acaso el del derecho. Bentham fue uno de los primeros autores en darse cuenta de la importancia que tienen las sanciones positivas en la teoría del derecho. De hecho dedica una parte de su obra a lo que él llamó “derecho premial”. Aunque para él el elemento fundamental de un sistema jurídico se encuentra en la idea de coerción que se manifiesta mediante las sanciones negativas, los premios tienen, desde el punto de vista funcional, la misma razón de ser que los castigos, en el sentido de que en ambos casos se trata de mecanismos de motivación de la conducta. De manera que la importancia que atribuyó al castigo no le llevó a descartar la idea de que la conducta también se puede normar mediante motivaciones seductoras. Por otra parte, una vez que Bobbio dio su conocido giro de la estructura a la función en cuanto a la concepción del derecho, centró su atención en la pregunta ¿para qué sirve el derecho? en lugar de ¿qué es el derecho? Así, se ocupó del análisis de nuevas funciones del derecho —o por lo menos no tomadas en cuenta tradicionalmente—: la función distributiva y la función promocional. La idea fundamental de Bobbio es que, en el paso del Estado liberal al Estado social, el ejercicio de la función primaria de regular el comportamiento ha asumido formas distintas a las tradicionales que reposaban en la intimidación mediante sanciones negativas. Esas nuevas formas son medidas de alentamiento como los premios (sanciones positivas), los incentivos y las facilitaciones. Las sanciones positivas son las promesas de premios consistentes en otorgar una satisfacción a quienes han cumplido con una determinada actividad. Los incentivos, por su parte, son medidas
EL CONCEPTO DE SANCIÓN
401
que sirven para alentar el ejercicio de una actividad económica determinada que redunda en beneficios colectivos. Las facilitaciones son, finalmente, medidas de organización que consisten en proveer de medios necesarios para el desarrollo de cierta actividad orientada a un fin. Los mecanismos promocionales tienen la ventaja de que influyen positivamente en la psique del destinatario ofreciéndole ventajas, haciéndole más fáciles las cosas y estimulándole a actuar conforme a las normas. La diferencia entre la técnica promocional y la tradicional de la sanción negativa está en el hecho de que el comportamiento que tiene consecuencias jurídicas no es ahora la inobservancia, sino la observancia. Ese análisis funcional de la sanción no resulta, sin embargo, incompatible con la concepción kelseniana: las sanciones positivas entran perfectamente en la estructura de la norma primaria de Kelsen: si es A, debe ser B, si se interpreta que A no es un ilícito sino una conducta conforme, y que B no es un castigo sino un premio. Y, finalmente, tanto las sanciones positivas como los incentivos no son más que técnicas específicas de organización social. Desde luego, Bobbio no quedó exento de críticas; sin embargo, no entraré a ellas por cuestiones de tiempo. Desde mi punto de vista no es que la idea de sanción positiva cambie el concepto de derecho, sino viceversa: un concepto más amplio de derecho en el que se tomen en cuenta sus distintas funciones hace posible que se admita como jurídico el concepto de premio. No se puede olvidar que el respaldo eficaz de las medidas promocionales del derecho sigue basándose en último término en la existencia de actos coactivos. De manera que las sanciones positivas no tienen la misma importancia que las negativas, pero su utilidad no puede ponerse en tela de juicio. IX. CONCLUSIÓN Una teoría general de la sanción demanda, desde mi perspectiva, una articulación de los diferentes problemas que aquí he señalado de manera aislada. Creo que el planteamiento de los mismos no puede quedar al margen de ninguna teoría de la sanción —ni del derecho— que se precie de seria. Así pues, me queda como incentivo construir esa articulación. Espero que ello no traiga como consecuencia, algún tipo de sanción negativa.
402
ROBERTO LARA CHAGOYÁN
X. BIBLIOGRAFÍA AUSTIN, John, Lectures on Jurisprudence or the Philosophy of Positive Law, en CAMPBELL, Robert (comp.), edición original de John Murray, Londres, 1913, Michigan, Scholarly Press, Inc., 1977. ———, The Province of Jurisprudence Determined, Rumble, Wilfrid E. (ed.), Cambridge, University Press, 1995. BAYÓN MOHINO, Juan Carlos, “Deber jurídico”, Enciclopedia Iberoamericana de Filosofía. El derecho y la justicia, GARZÓN VALDÉS, Ernesto y LAPORTA, Francisco, Madrid, Trotta, 1996. BENTHAM, Jeremy, An Introduction to the Principles of Morals and Legislation, Oxford, Clarendon Press, 1996. ———, Of Laws in General, HART, H. L. A. (ed.), University of London, The Anthole Press, 1970. BOBBIO, Norberto, “Hacia una teoría funcional del derecho”, Derecho, filosofía y lenguaje. Homenaje a Ambrosio L. Gioja; trad. de Genaro R. Carrió, Buenos Aires, Astrea, 1976. ———, Contribución a la teoría del derecho, en RUIZ MIGUEL, Alfonso (ed.), Madrid, Debate, 1990. COTTERRELL, Roger, The Politics of Jurisprudence. A Critical Introduction to Legal Philosophy, Londres-Edimburgo, Butterworths, 1989. HACKER, P. M. S., “Sanction Theories of Duty”, en SIMPSON, A. W. B. (ed.), Oxford Essays in Jurisprudence. Second Series, Oxford, Clarendon Press, 1973. HART, H. L. A., “Self-refering Laws”, Essays in Jurisprudence and Philosophy, Oxford Clarendon Press, 1983. ———, El concepto de derecho, 2a. ed., Buenos Aires, Abeledo-Perrot, 1963. KELSEN, Teoría pura del derecho, 7a. ed., México, Porrúa, 1993. LARA CHAGOYÁN, Roberto, El concepto de sanción en la teoría contemporánea del derecho, México, Fontamara, 2004. TAPPER, Colin, “Austin on Sanctions”, The Cambridge Law Journal, 1965.
PRIVILEGE IN MEXICAN AND AMERICAN CRIMINAL LAW Larry LAUDAN* Like many others around the world, the systems of criminal justice in Mexico and in the United States recognize a certain category of potential testimony, that of privileged witnesses. These are persons with a knowledge of the crime who, despite that knowledge, are not obliged to tell what they know. On its face, this category of witnesses is an affront to the truth-seeking aims of criminal inquiry. Both Mexico and the US espouse the general principal that those who know something about a crime have a legal duty to tell what they know. As the Mexican Code of Criminal Procedures says in article 242: “Every person who is a witness is required to speak with respect to the facts under investigation. As for anglo-saxon views on this subject we have the verdict of the great evidence scholar Wigmore to the effect that: AFor more than three centuries it has now been recognized (in common law countries) as a fundamental maxim that the public Y has a right to every man’s evidence.1 This seemingly robust commitment to the truth, however unpleasant that truth may be, sits side-by-side in both countries with rules that explicitly permit certain persons with a knowledge of a crime to say nothing. The most obvious exception to the rule obligating testimony is the defendant himself. Another prominent exception in the United States, is the right against self-incrimination by a witness, although that rule can be circumvented by the grant of prosecutorial immunity. These exceptions will not by the focus of my talk today. Instead, I want to look briefly at how these two legal systems handle and justify what is called privileged testimony. * Instituto de Investigaciones Filosóficas, UNAM, México. 1 Wigmore, Treatise on the Anglo-American System of Evidence in Trials at Common Law, 3d. ed., 1940, 2192 at 2264. 403
404
LARRY LAUDAN
In both countries, it is a general rule that a witness with knowledge of a crime who refuses to testify is committing a criminal act and may be sent to jail. The idea that a witness could refuse to testify simply because he finds it inconvenient or embarrassing or dangerous would undermine the commitment to the truth that both legal systems share. The impressive power of subpoena was invented in order to underscore the idea that relevant evidence of a crime belongs to the state and that it not within the discretionary power of the individual to share it or withhold it. The category of privileged witness seems to undermine these basic doctrines and to raise doubts about the sincerity of the commitment of these systems to the belief that everyman’s evidence belongs to the state. It is that set of tensions I want to explore in my remarks today. I will have more to say about anglo-saxon privileging practices than about mexican ones because I know more about the one system than about the other. I nonetheless thought it might be useful to try to say something about both since they represent starkly different philosophical approaches to the question of privileged testimony. The first difference between the two systems, and the one that is the easiest to describe, shows up when we compare those persons whose testimony is privileged in each system. I will begin there, even though those differences striking as they are, are by no means the most important differences between the two systems with respect to privileging. Having described those, I will move on to look at two more interesting differences in terms of the theoretical suppositions made by the two systems of criminal justice. One of those two theoretical differences will show up if we ask the question: To whom does the privilege belong? The second theoretical difference will reveal itself when we begin to probe the question: What is the rationale for allowing this class of witnesses to be exempted from the overarching rule that those who know something about a crime must give evidence? The mexican list of privileged witnesses is impressively long. (Overhead) It includes, among others, the spouse of the accused, all his blood relatives, his in-laws to the fourth degree, and any person who is linked to the accused by love, respect, affection or close friendship. Mexican case law suggests that lawyers and priests likewise are privileged, although the relevant federal codes do not explicitly confer the privilege on them. In the United States, there are wide differences among various jurisdictions about which witnesses are privileged and which are not. For
PRIVILEGE IN MEXICAN AND AMERICAN CRIMINAL LAW
405
brevity, I will limit my remarks to the privileges as understood in the Federal courts. Federal common law recognizes five groups of privileged witnesses: the spouse of the accused, his attorney, his priest, his psychiatrist, and his psychiatric social worker. These are the most common categories. I should mention in passing that, in addition to these privileged witnesses, there is also a privilege extended to certain information. Specifically, state secrets are privileged as are the voting preferences of whatever witness. Since these last two privileges are obvious and noncontroversial, I will say nothing more about them, focusing instead on the so called relationship privileges. What specifically is the privilege conferred on these witnesses in the two systems? They are by no means the same. In the mexican courts, the privileged witnesses may simply refuse to testify unconditionally about any matter having to do with the case. This is a obviously very blanket exclusion. In American courts, the privilege, except the spousal one which is total, extends only to certain forms of communication between the accused and the person enjoying the privilege. Thus, what the accused said to his attorney, or his psychiatrist or his priest is privileged. But if something falls outside the area of communication, it is not. So, if the accused’s psychoanalyst sees him committing a crime, he must testify as to what he knows. Likewise his priest, his lawyer, and his social worker. But if what they know was learned by confidential communication from the accused in the course of a professional relationship with him, then their information is privileged. Only the spouse in American courts enjoys the sort of omnibus exclusion that we see extended quite broadly in Mexican law to the family and friends of the accused. I said earlier that it would be important to ask who owned the privilege? In the US, the privilege unequivocally belongs to the accused. He and he alone can waive it, thereby triggering the obligatory testimony of the otherwise privileged witness. Popular folklore to the contrary notwithstanding, American courts do not recognize that lawyers or doctors or journalists or priests have a right to maintain their silence about the accused. That right, in anglo-saxon law, belongs to the person in the dock. If he waives the privilege, such witnesses have to testify, even if such testimony would violate the ethical codes of the witnesses. The only exception to this principle about the privilege belonging to the defendant rather than the witness occurs with the spousal privilege. This,
406
LARRY LAUDAN
uniquely among the privileges, belongs to the spouse and not to the defendant.2 By contrast, in mexican law, the privilege belongs entirely to the witness. Mexican law is quite explicit that if some witnesses in a privileged category desire to offer testimony, they may do so, whether the defendant likes it or not. The choice between exercising and waiving the privilege belongs to them not to him. We will return to this point a little further along, but I want to flag it now as being of considerable importance to understanding the different philosophies of privileging in the two countries. We must note one further difference before moving on to a more theoretical analysis. In the case of mexican law, the trier of fact, the judge, comes to learn if there were privileged witnesses. That is to say, the judge becomes aware that the state or the defense attempted to obtain testimony from certain persons with a knowledge of the crime and that they refused to tell what they knew. This information about the refusal of relevant witnesses to testify can become a factor in the judges determination of guilt and innocence. By contrast, an american jury does not usually learn that there were privileged witnesses since they will typically assert the privilege during a preliminary hearing that excludes the jury (although the federal rules of evidence are silent in this regard, more than 30 states have codes that forbid juries from drawing adverse inferences from a client´s unwillingness to waive the attorney-client privilege). Moreover, the appellate court rulings are quite explicit that the prosecution cannot mention to the jury that there were witnesses with relevant information about the crime whom the defendant would not allow to testify.3 This piece of information is surely relevant to a jurys verdict but, like much other relevant information in American criminal trials, it never informs a jurys deliberations. This feature feeds back to our earlier point about who owns the privilege. If, as in Mexico, the privilege belongs entirely to the witness, then it would probably be inappropriate for the judge to make a strong adverse inference from the fact that some friend or family member of the accused exercised his privilege not to testify. Such an act could have all sorts of possible causes and cannot be legitimately blamed on the accused. But when, as in the American system, the privilege belongs not to the witness but to the accused, then it seems more plausible 2 3
See Trammel vs. US, 445 US 40, 1980. The most relevant case was Griffin vs. California, 380 US 609, 1965.
PRIVILEGE IN MEXICAN AND AMERICAN CRIMINAL LAW
407
that an objective trier-of-fact might be inclined, if he knew about it, to draw an adverse inference from the failure of the accused to allow a witness to testify. Unfortunately, because the American system conceals such information from the jury, they are not in a position to make the inference that an objective, fully-informed third party might well make about such matters. It is time now to take a few steps back from a description of the privileging practices of these two countries to look at their theoretical foundations, in so far as they have any worthy of the name. I intend to be critical of both systems, and I hope that my mexican friends will excuse the harshness of my judgements about their system, since I will offer equally harsh ones of my own. Let us begin with the mexican rule about exclusion. Clearly, its principal thrust is to enable family and friends of the defendant to avoid giving testimony, if they do not wish to do so. To understand this rule, we must go back to its historical origins in roman law. Medieval courts determined that family and friends of the defendant could not give sworn testimony at all. The justification was that their testimony was probably suspect and unreliable in effect, they had clear motives for lying about the facts of the case so as to protect the accused. Since roman law treated testimony and witnesses as absolutely essential in a criminal inquiry giving no weight at all to physical or circumstantial evidence it was extremely important to screen prospective witnesses to make sure that their testimony would be unbiased and reliable. The blanket exclusion of all the friends and family of the accused was seen as a way of excising biased testimony that might be of dubious value. During the 19th century, mexican criminal law broke sharply with its roman origins. It replaced trial by inquisition with an adversarial system. It admitted the probative value of circumstantial evidence and, most relevantly for our concerns, it came to regard the testimony of eyewitnesses not as a proof of guilt but merely as an indicator, what is known technically as an indicio. Since eyewitness testimony was no longer regarded as essential for conviction, since it was no longer thought to be as probative as it once was, it became plausible to admit the testimony of those whose testimony had once been excluded that is, the testimony of friends and family members of the accused.
408
LARRY LAUDAN
This was a very positive development; like any other change that makes more relevant evidence available to the trier of fact, it promoted the truth-seeking aims of the justice system. But this particular Mexican reform was half-hearted. Instead of moving to a system which demanded the testimony of friends and family members who had knowledge of the crime, mexican authorities left that decision to the witnesses themselves. As we have seen, the current policy is that they may give testimony but they don’t have to. This is a policy without an evident epistemic rationale. Under the old Roman regime, there was at least a reason for excluding the testimony of such persons: it might be suspect. Having decided, however, they such testimony was relevant even if sometimes biased, mexican law should have moved to eliminating the privileges altogether, insisting that anyone with a knowledge of the crime must testify. Instead, its retention of the privilege, at the discretion of the witness himself, creates a situation in which those with knowledge hostile to the defendant are likely to refuse to testify while those with knowledge helpful to the defendant will give testimony. This is hardly how one would design a system if one’s aim were principally to find out the truth about the crime. The dilemma here is particularly sharp: either family members and friends are unreliable witnesses, in which case they should not be allowed to testify; or their testimony is potentially reliable in which they should be obliged to testify. Leaving the choice in their hands can have no epistemic rationale, unless we have reason to believe that those who voluntarily testify are more likely to speak the truth than those who do not. But that hypothesis has no plausibility. The American case is a bit more complex. Like Roman law in the middle ages, anglo-american law in the 19th century prohibited the sworn testimony of family and friends of the defendant, ostensibly on the grounds of its unreliability. The massive, Benthamite reforms in evidence law in the mid 19th century changed all that. Being a friend of the defendant, being his son or daughter, his mother or father, no longer exempted one from telling what one knew. Only the spousal exclusion survived in american law as a vestige of this practice. All the other privileges in american law, as we have seen, derive from professional relationships between the defendant and his priest, his doctor, his lawyer and his social worker. There is broad agreement that -if we leave aside the lawyer-client relation none of these privileges has anything to do with promoting the truth. On the contrary, each sets up an obstacle to discovering the truth in the
PRIVILEGE IN MEXICAN AND AMERICAN CRIMINAL LAW
409
name of some non-epistemic social good. Thus, the rationale for the psychiatrist-client privilege is that the treatment of mental disease requires full candor between the patient and his doctor. In the religious case, salvation itself may depend on the truthfulness of a confession that a person offers to his priest. Here, the argument for the privilege seems to be that the interests of finding out the truth in a criminal trial are less important than curing neurotic patients or securing a comfortable afterlife. As an epistemologist, I find myself at odds with the decisions about value implicit in giving a priority to mental health or religion over meting out justice. I am also troubled that it is judges, via the common law, who are left to define such privileges rather than legislators, who are better placed than appointive judges to weight the social and legal values at stake in such decisions (the area of privileged witnesses is one of the few where the Federal Rules of Evidence refuse to take a stand and simply defer to common law practices, practices wholly defined by judges and not legislators). But this is not the place to pursue those concerns. Another concern worthy of mention but not to be further pursued here has to do with the spousal privilege. Although a wife cannot be forced to testify against her husband, the defendant’s children, siblings, and parents both can be made to take the stand and to tell what they know. If, as would appear to be the case, the rationale for the spousal privilege is that it is designed to protect the sanctity of marriage as an institution, it is quite unclear why Bin this age of ubiquitous divorce, the relation between husband and wife is singled out by the law for protection when relations with parents and off-spring are not. If we are to extend testimonial privileges to any relatives of the defendant, and I am not saying that we should, it seems the mexican model is more consistent than the north american one. For our purposes, the obvious feature of all the privileges, whether mexican or north american, with the possible exception of how you voted, is that they pose obstacles to truth seeking. Although often criticized for making it more difficult to convict the guilty (which they frequently do), the privileges likewise work sometimes to convict the innocent. For instance, if Jones is on trial for raping Smith and a priest or analyst learns in a confession or therapy session that Wilson is the rapist, the inability to elicit the privileged information from Wilson’s confidant may lead to an incorrect conviction of Jones.
410
LARRY LAUDAN
In essence, the relationship privileges seem to say to those guilty of a crime: You can reveal what you did, however horrible it was, to certain persons in the full knowledge that they cannot be made to pass along those revelations in ways that will be harmful to you. The courts say that they privilege such communications because it is Ain the broader public interest to do so. Is this a viable claim? Does it seem plausible that, if I reveal to my social worker that I just robbed the local liquor store, she will be better able to help solve my problems with (say) domestic violence or a slum landlord? Indeed, if I have just robbed the local liquor store, do I even have a legitimate claim on the unstinting confidentiality of my social worker? That seems doubtful. Perhaps the argument in favor of these privileges has less to do with protecting the guilty and is directed instead at protecting the relationship that innocent people have with their social workers. But an innocent person should probably have nothing to fear from telling the truth to his social worker, even if the privilege didn’t exist, since nothing he revealed to her would be the sort of thing that would land him in trouble if repeated in a criminal trial. I flatly deny that a social worker can do her work in a way that promotes the public in terest only if she can tell her clients that everything they say to her, however revelatory of crimi nal activ ity, will be her met i cally sealed from le gal scru tiny (in deed, social work flourished for more than a century before, in 1996, the Supreme Court invented this privileged category). What we should focus on is the one privilege in American criminal law which is supposed to have an epistemic rationale. I refer, of course, to the attorney-client privilege. This is an old privilege in Anglo-Saxon law, dating back to the 18th. century. Its rationale, as you all know, is this: in an adversarial system, it is the obligation of defense counsel to provide the best defense for his client that is possible. In constructing that defense, it is important for counsel to know as much about the details of the crime as his client does. Hence, candor between attorney and client is important. But, so the argument goes, that candor would be impossible if the defendant believed that whatever he said to his attorney might show up as evidence in the trial against him. Hence, the attorney-client privilege ultimately promotes the end of a truthful verdict by giving the attorney the information he needs to mount the strongest case that the facts will permit.
PRIVILEGE IN MEXICAN AND AMERICAN CRIMINAL LAW
411
Is this a telling argument? When confronted by puzzles like this one, it is always helpful to begin by asking the question: who stands to gain most from the rule, the guilty defendant or the innocent one? Or do both gain equally? Although one can readily imagine exceptions, it seems fair to say that a guilty party who spoke candidly to his lawyer (whose testimony could be subsequently subpoenaed) would be put at much greater risk of conviction than an innocent party would. Indeed, under such circumstances, guilty defendants would say very little to their lawyers while innocent parties would say more. It is true that guilty defendants would probably be less robustly defended than they now are if this privilege were to vanish. But a legal system must be judged by how far it goes to protect the innocent from conviction not by whether it makes the guilty especially difficult to convict. In sum, abandoning the rule of lawyer-client confidentiality would have the predictable result of more convictions of the truly guilty without significantly increasing the number of convictions of the truly innocent. Accordingly, eliminating this rule would increase the number or proportion of true verdicts. That, in turn, implies that there is no compelling intellectual rationale for preserving attorney-client privilege. In the long run, it is an obstacle to discovering the truth just as the notorious exclusionary rules are. The unavailability to the jury of relevant, privileged information is bad enough. That problem is exacerbated by the fact that, in many jurisdictions, jurors are not allowed to be informed when a potential witness has invoked the privilege. In other jurisdictions, which permit the invocation of the privilege in front of the jury, jurors are instructed that they can draw no adverse inferences from the invocation of the privilege. Even if there were a justification for recognizing certain classes of privileged relationships (and I am not persuaded of that), no compelling evidential rationale exists for failing to inform jurors when a witness has invoked a privilege or for obliging them to repress any memory of its occurrence. The only hint of an argument relating such privileges to truth finding involves the claim that no legitimate adverse inference could ever be drawn from a witness choosing to invoke one of these privileges. If, for instance, an analyst steadfastly refuses to answer all questions about the content of his conversations with his patient, or if a priest refuses to say anything about what happened in the confessional, what inference could the jury legitimately make concerning the guilt or
412
LARRY LAUDAN
innocence of the patient or the penitent? We cannot blame the defendant, after all, for the testimonial recalcitrance of some third party. The antidote to this form of self-deception is to remind ourselves who owns the privilege in question. The right to the privilege belongs not to the analyst but to his patient, the defendant. It belongs not to the priest but to the penitent. If it belonged to the analyst or the priest, then its exercise could sustain no adverse inferences against the defendant. But, belonging as it does to the defendant, the privilege can be waived by him, allowing the analyst or priest to respond freely to the prosecution’s questions. If the defendant chooses not to remove that muzzle, and the jury is informed of that fact, the jury may well conclude that this is because he wants to hide something that he fears his analyst or priest will reveal. This is why a jury, in certain circumstances, may be inclined to draw adverse inferences from the assertion of a testimonial privilege. Because that inference will often be a rational one to make, that is likewise why juries should be both informed if witnesses have asserted the privilege and allowed to make of that what they will. It is hard to fault Jeremy Bentham’s (only mildly overstated) observation that the belief that relevant evidence can be legitimately excluded if it might create unpleasant consequences for various human relationships is one of the most pernicious and most irrational notions that ever found its way into the human mind.4 In the balancing act between society’s joint interests in justice being done and certain interpersonal relationships fostered, courts have fairly consistently sacrificed the interest in justice to the larger social good, even though (as in the case of the social worker-client relation) they have only the most tenuous empirical evidence that the relationship in question would be undermined if the privilege were to vanish. Perhaps the last word on this subject belongs to McCormick, who remarks, in his classic text on evidence, apropos the marital privilege: We must conclude that, while the danger of injustice from suppression of relevant proof is clear and certain, the probable benefits of the rule of privilege in encouraging marital confidences and wedded harmony is at best doubtful and marginal.5 4
Bentham, J., Rationale of Judicial Evidence, pp. 193 and 194, London, J. S. Mill,
1827. 5
McCormick on Evidence, 5th. ed., para. 86, 1999.
PRIVILEGE IN MEXICAN AND AMERICAN CRIMINAL LAW
413
That is to say that privileging certain forms of testimony exacts an undeniable epistemic cost in the name of possibly conferring certain social benefits. That is a tradeoff that is dubious at best. There may be situations in which silence is golden. A criminal proceeding is not among them.
!
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA: CONDICIONES DE POSIBILIDAD DE UNA FILOSOFÍA LOCAL DEL DERECHO Diego Eduardo LÓPEZ MEDINA* Desde París, desde Londres, desde Amsterdam se proferían las palabras‘¡Partenón!, ¡Hermandad!’ y en alguna parte de África y Asia, se abrían los labios ‘¡...tenón! ¡...mandad!’ Era la edad de oro.**
SUMARIO: I. Hacia una iusfilosofía personal y contextualizada. II. “Sitios de producción” y “sitios de recepción” en la teoría transnacional del derecho (TTD). III. Originalidad, influencia, copia y transmutación en la teoría del derecho.
I. HACIA UNA IUSFILOSOFÍA PERSONAL Y CONTEXTUALIZADA Como estudiante, primero, y luego como profesor interesado en los campos de la filosofía y teoría del derecho, resulté, como muchos otros miembros de mi generación con intereses similares, leyendo libros y artículos escritos por o acerca de teóricos jurídicos tales como Hans Kelsen, Herbert Hart, John Rawls, Ronald Dworkin, Robert Alexy o Jürgen Habermas. La literatura dedicada a reflexionar sobre la filosofía o la teoría del derecho es ya enorme (aunque su crecimiento no da señas de parar) y uno podría, con toda facilidad, pasarse la vida entera tratando apenas de permanecer actualizado en ella. Dentro de esta vasta literatura, sin em* Universidad de los Andes, Colombia. El presente escrito es parte de un libro publicado en el año 2003. ** Jean-Paul Sartre, Introducción a la obra de Frantz Fanon, Los desdichados de la tierra, 1963. 415
416
DIEGO EDUARDO LÓPEZ MEDINA
bargo, había cosas que llamaban mi atención con especial fuerza, mientras que otras parecían ya resueltas. Originario, como soy, de un país latinoamericano y educado entre 1987 y 1991 en una facultad de derecho de cuño más bien tradicionalista, el nuevo ambiente intelectual que parecía estar imponiéndose entonces (y que aún hoy, al comenzar el siglo XXI, el lector reconocerá parcialmente como la teoría jurídica todavía “en boga”) alentaba una atención renovada hacia algunos aspectos específicos de la teoría legal contemporánea, a saber, aquellos que parecían concentrarse en cómo debía “interpretarse” el derecho.1 En términos generales puede decirse que la nueva concepción de la interpretación jurídica reconocía, primero, que los textos de las leyes o de los códigos no eran tan claros y rotundos como parecía creer la teoría tradicional de la interpretación; como consecuencia de esta redescubierta “textura abierta” de los textos, se insistía en el papel activo del operador jurídico en la interpretación de la ley y en la producción de cambio social. Dentro de esta reconsideración, la “interpretación jurídica”, como un sub-campo dentro del universo de la teoría del derecho, parecía ofrecer una visión alternativa, quizá más abierta y flexible, que remediaba, al menos en parte, una sensación difusa, pero creciente, de malestar e inconformidad (en verdad, una reacción) contra las formas dominantes de enseñar y analizar el derecho en que estábamos siendo socializados. La enseñanza dominante, contra la que nos revelábamos, subrayaba, a un nivel básico, el papel de la memorización de reglas contenidas en leyes y códigos como paso indispensable para recordarlas y mostrarles fidelidad. La “legalidad”, como técnica de control social, partía de allí, de la memoria, para continuar un trayecto en el que prevalecían, una a una, las técnicas formalistas del derecho. El resultado final era una mezcla de memorización de reglas, ejecución de pretendidas demostraciones lógicas de conclusiones jurídicas, creencia acrítica en respuestas únicas y correctas, todo ello en un ambiente de rigidez y jerarquización pedagógica, social y personal que tendía a reforzar la apariencia de rigor, cientificidad y neutralidad. El nuevo énfasis en teoría de la interpretación y argumentación jurídica, en contravía, parecían servir como mecanismo general de inoculación contra los excesos de ese formalismo dominante. Desde este nuevo punto de vista la memorización cedía espacio a la argumentación, se empezaba a 1 Como ejemplo de esta forma de argumentación que ahora revalúo, Véase mi propio trabajo: López Medina, Diego, El significado de la ley: Elementos para una crítica pragmática del lenguaje y la hermenéutica jurídica, Pontificia Universidad Javeriana, 2001.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
417
desconfiar en la infalibilidad de la deducción lógica y se afirmaba, en su lugar, la naturaleza dialéctica, problemática, no apodíctica del derecho y, por último, se derrumbaba la idea de respuestas únicas y correctas. Mi visión del papel renovador de la teoría del derecho y los usos que en mi conciencia (y en la de algunos de mis colegas y compañeros) tenían los autores ya mencionados se explicaba por razones situacionales y contextuales específicas que yo no veía al comienzo, pero que ahora me parece fundamental describir con mayor detenimiento. A eso paso a continuación. En primer lugar, parece ahora claro que durante mis años de formación en una facultad de derecho tradicional el vanguardismo teórico estaba constituído por autores y comentaristas que tomaban, para decirlo de manera amplia, un enfoque lingüístico o hermenéutico de la teoría jurídica.2 En todo ese material, la palabra “interpretación” aparecía como la llave con la que se podían abrir las puertas cerradas por el formalismo. Más aún, el enfoque hermenéutico estaba ligado con una fuerte atención en lo institucional a la determinación judicial de reglas o hechos (una “teoría judicialista del derecho” si se quiere) que resultó ser muy interesante para gente que, como yo, queríamos emprender un asalto a las bases teóricas de una conciencia legal formalista y legocéntrica que bautizaré “tradicionalismo-positivismo” (TP) y que desvalorizaba el papel del intérprete en la creación del derecho mediante el mito de la sabiduría del legislador y una férrea confianza en la soberanía parlamentaria. Vine a caer en cuenta, entonces, que mis años formativos fueron nutridos en un lugar y época en donde un modelo “interpretativo” y “judicialista” del 2 Varios autores han señalado la preponderancia que ha adquirido, en el último cuarto de siglo, el “giro interpretativo” en teoría jurídica: “sin duda alguna la nuestra es la época de la interpretación... En derecho, la importancia del giro interpretativo no puede ser ignorada fácilmente. Adicional a una plétora de simposios, libros y artículos por parte de académicos en todos los campos del derechos sustantivo, el crecimiento del interés en el derecho por parte de académicos de las humanidades confirma que cuestiones relacionadas con el significado de los textos son la preocupación central, si no la organizadora, de muchos teóricos legales sofisticados”. Patterson, Dennis, “The Poverty of Interpretive Universalism: Toward the Reconstruction of Legal Theory”, 72, Texas Law Review, 1-3, 1993. La responsabilidad de dicho giro se le atribuye especialmente a Ronald Dworkin. Al respecto Véase Stick, John, “Literary Imperialism: Assessing the Results of Dworkin’s Interpretive Turn in Law’s Empire”, 34, UCLA Law Review, 371, 1986. Sobre el giro interpretativo en general Véase, Feldman, Stephen M., “The New Metaphysics: The Interpretive Turn in Jurisprudence”, 76, Iowa Law Review, 661, 1991; y West, Robin, “Are There Nothing But Texts in This Class? Interpreting the Interpretive Turns in Legal Thought”, 76, Chi.-Kent. Law Review, 1125, 2000.
418
DIEGO EDUARDO LÓPEZ MEDINA
derecho estaba empezando a ser importado y que el nuevo transplante teórico implicaba reordenamientos muy importantes en el mapa geojurídico del mundo. El transplante de teoría, sin embargo, no se estaba dando en el vacío: la nueva teoría del derecho servía de manera fundamental como “manual de uso” para el transplante de una nueva generación de Constituciones liberales que afirmaban su poder normativo directo por encima del principio clásico francés de soberanía legislativa (por oposición a soberanía constitucional) y su corolario de respeto estricto a la ley (las más de las veces en la forma de un código). Las nuevas cláusulas constitucionales, ahora con efecto normativo directo y con mecanismos específicos de justiciabilidad, se constituyeron en excelentes ejemplos de normas de “textura abierta” donde la interpretación judicial debía completar, por necesidad, el sentido de sus disposiciones generalísimas. En las normas constitucionales se consagraron así “conceptos jurídicos indeterminados”: el positivismo dominante (usualmente en su forma kelseniana) aconsejaban tratar a estas normas como carentes de sentido ya que no cumplían con los requisitos exigidos, bajo una teoría positivista, para hablar de norma jurídica en sentido primario.3 En el nuevo ambiente teórico, sin embargo, los conceptos jurídicos, a pesar de su indeterminación, fueron entusiastamente saludados como maneras de dar fuerza normativa directa a los fines civilizatorios más preciados de la teoría política y moral, en el sentido de apuntar hacia una alineación de todo el derecho legal y codificado existente a principios jurídicos anhelados y a una interpretación finalista de la ley de conformidad con tales principios. En el nuevo lenguaje constitucional, los conceptos jurídicos indeterminados (las metas civilizatorias del derecho) pasaron pronto a ser considerados como “principios jurídicos”, para terminar, finalmente, siendo positivizados bajo la nueva forma de “derechos fundamentales”. Este giro hermenéutico y político implicaba, quizá por primera vez, la recepción entusiasta de materiales ius-teóricos y constitucionales anglosajones, rompiéndose así el santuario inmunológico que, uniendo a Europa y América Latina, había evitado la contaminación jurisprudencial y dogmática por fuera de la familia jurídica del derecho civil.4 3 4
Véase al respecto Kelsen, Hans, Teoría pura del derecho, 1934, capítulo 3. Con la excepción de Argentina en donde el constitucionalismo nacional había tenido un intercambio singularmente dinámico con los Estados Unidos desde el siglo XIX. Al respecto véase Miller, Jonathan, “The Authority of a Foreign Talisman: A Study of U.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
419
En segundo lugar, es fundamental señalar que los nuevos transplantes de teoría del derecho posibilitaban la importación de una nueva y específica forma de crítica anti-formalista que se oponía al clima reinante, en el que predominaba, desde la época de la codificación en el siglo XIX, una visión positivista y formalista del derecho en América Latina. La importación de la nueva crítica anti-formalista proveyó de un cuerpo teórico sólido a las dubitativas preocupaciones y ansiedades de las nuevas generaciones locales que tanteaban el camino para romper el formalismo hegemónico. Dentro de este contexto cultural e intelectual, la “interpretación” fue quizá el tema bandera que permitió la recepción de nuevos enfoques de teoría jurídica relativamente recientes que parecían confrontar la larga hegemonía disfrutada por el formalismo en la práctica y la imaginación de los abogados en toda la región. Lo novedoso y lo reciente de esta teoría y la relativamente tardía recepción en Latinoamérica de este material, tal como vine a apreciarlo más tarde, eran hechos completamente relativos a las necesidades políticas y a las influencias académicas disponibles. Sin embargo, la justificación más frecuente de este transplante teórico tendía a desenfatizar los aspectos materiales (políticos y contextuales) de la recepción para afirmar, en vez, que la nueva hermenéutica (en autores como Hart y Dworkin) era una teoría analíticamente correcta, y que, por tanto, servía, sin límites espaciales, para criticar el formalismo legal dominante en América Latina, así como, se presumía, había servido para golpear con fuerza el formalismo propio de la tradición anglosajona. La “transplantabilidad” de Hart y Dworkin se basaba en la creencia de que se trataba de teorías anti-formalistas de validez universal porque sus conclusiones se extraían a partir de la naturaleza ubiS. Constitutional Practice as Authority in Nineteenth Century Argentina and the Argentine Elite’s Leap of Faith”, 46, Am. U. Law Review, 1483, 1997. De la misma manera, fueron iusteóricos argentinos los que en mayor parte aclimataron la recepción, a partir de mediados de la década de los sesenta, de la nueva filosofía del derecho anglo-sajona, reconectándola una vez más con las dinámicas constitucionales. En mi lectura personal fueron fundamentales en ese sentido (y siguiendo el orden cronológico en que los leí) el estudio preliminar de Carrió y Rabossi a Cómo hacer cosas con palabras, Austin, J. L., Barcelona, Paidós, 1981; el libro de Carrió, Genaro, Notas sobre derecho y lenguaje, Buenos Aires, Abeledo-Perrot, 1965; y finalmente, la utilización dogmática y constitucional que de estas ideas hace Salvador Nino, Carlos, Introducción al análisis del derecho, Buenos Aires, Astrea, 1980; y Fundamentos de derecho constitucional, Buenos Aires, Astrea, 1992.
420
DIEGO EDUARDO LÓPEZ MEDINA
cua del lenguaje y la argumentación jurídica. Estas características, seguía el argumento, son compartidas universalmente por todos los sistemas jurídicos. Por estas razones, se argumenta, el formalismo jurídico estricto dominante en la región era una teoría verificablemente errónea. El transplante y uso de teoría jurídica contemporánea (esencialmente post-hartiana), por las razones aludidas, terminó convirtiéndose en un gesto heterodoxo en América Latina. Los estudiantes que hablaban de la nueva sensibilidad constitucional, lingüística y hermenéutica se definían, casi de entrada, como oponentes directos de las convicciones acríticas de la conciencia jurídica dominante. Así las cosas, para mucha gente en América Latina la filosofía y la teoría del derecho no eran una disciplina académica como otras. No se escoge la filosofía del derecho como se escoge el derecho civil, el derecho financiero o el derecho comercial. Muy por el contrario, la filosofía del derecho era una escogencia partidista ya que señalaba el camino para darse de cuenta de que el formalismo, como tal, no era la única posibilidad para concebir los problemas jurídicos. El filosofar jurídico, al menos en el momento de transplante del nuevo anti formalismo anglosajón, era el equivalente a una versión contracultural y contrahegemónica, académica y antiprofesionalizante, moderadamente progresista, de cuál era el papel que el derecho debía jugar en el conflicto social de países como Argentina, primero y luego Colombia. Por este motivo, muchos estudiantes atraídos por la filosofía y la teoría del derecho en América Latina terminan articulando una inclinación anti-formalista básica, especialmente del tipo interpretativo, que los sitúa a contrapelo de las ideas dominantes dentro de la cultura legal en la que viven. La filosofía del derecho en este periodo de recepción del antiformalismo lingüístico no apuntaba tanto a captar o a describir la cultura legal subyacente como a transformarla. La teoría fungía así como expresión de descontento frente a una cultura formalista, dogmática y acrítica de sus supuestos teóricos fundamentales que nunca se había preocupado por reexaminar sus bases, a pesar de los signos de crisis que ya exhibía. La filosofía del derecho representaba, por tanto, el rótulo disciplinario de una revuelta antiformalista y humanista largamente esperada en la región.5 5 A riesgo de excesiva generalización, los profesores de derecho parecen caer en dos categorías diferentes: por un lado, están los practicantes prestigiosos (consultores o litigantes) que, con sorprendente frecuencia, son también irreductibles positivistas. Su visión del derecho enfatiza la necesidad de impartir una educación profesionalizante a sus
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
421
En esta nueva función, la teoría del derecho se convirtió de nuevo en un discurso atractivo y emocionante. En su nueva posición contra-hegemónica se tuvo la impresión, quizá no compartida en generaciones anteriores, que algo (y algo de importancia) estaba en juego en la argumentación iusfilosófica. Hoy, a comienzos del siglo XXI, la sensación de que la estructura básica del derecho no es la misma que la que existió en los siglos XIX y XX sigue aportando gran parte de su energía a la reflexión iusfilosófica: en Colombia, en especial, esta nueva energía proviene de la intersección, en el frente interno, de la nueva hermenéutica constitucional y, en el frente exterior, de los crecientes fenómenos de globalización y desnacionalización del derecho. La conjunción de estos fenómenos contribuyen al interés aumentado (en realidad una moda) de la que disfrutan, hoy por hoy, los estudios iusteóricos. En tercer lugar, es necesario destacar aún más que la recepción de teorías “hermenéuticas” del derecho se dio de la mano de cambios institucionales muy definidos. Así como en su momento la recepción de la obra de Hans Kelsen en la teoría del derecho apuntaba a tener el efecto político de escudar a la profesión y a la judicatura de las incursiones del fascismo y del marxismo, la recepción del nuevo antiformalismo hermenéutico aupó en la región el proyecto de liberalización y constitucionalización de la vida como vacuna o remedio frente a las enfermedades del autoritarismo y militarismo políticos, bendecidos en la región por los imperativos geopolíticos de la doctrina de seguridad nacional en el contexto de la Guerra Fría. La cepa de autores de la nueva teoría del derecho recepcionada (como Hart, Dworkin, Rawls o Habermas) tiene claros compromisos con una cierta versión de constitucionalismo liberal, progresista y tolerante que ubican por encima de la voluntad legislativa coyuntural, así ella se exprese en leyes formalmente válidas. Ya que la voluntad legislativa tiene límites morales y políticos (límites constitucionales), la nueva hermenéutica coadyuvó en la recepción global de un nuevo constitucionalismo y en la expansión de una cultura de los dereestudiantes y, por tanto, descartan, total o parcialmente, la necesidad de hacer teoría jurídica; por otra parte están los profesores académicos, con interés en la teoría y con una orientación genérica anti-positivista y anti-profesionalizante de signo humanista e interdisciplinario. La reforma de la educación jurídica en facultades de derecho avant garde ha tendido a transferir ciertos poder de los practicantes a los académicos. Sobre la sociología del profesorado Véase en general Bourdieu, Pierre, Homo Academicus, Londres, Polity Press, 1990.
422
DIEGO EDUARDO LÓPEZ MEDINA
chos constitucionales (ahora directamente justiciables) como nunca antes se había visto.6 La sinergia entre la nueva teoría del derecho y la globalización del nuevo constitucionalismo en los últimos quince años del siglo XX constituye un dato fundamental para explicar su éxito en la región. Mucho del trabajo de tendencia antiformalista que se ha llevado a cabo en Latinoamérica recientemente ha estado vinculado, primero, con el nuevo constitucionalismo y, dentro de él, con una nueva y dinámica conciencia de que existen derechos constitucionales justiciables por fuera y por cima de la ley común. Las reformas constitucionales de la última década han construído un lugar desde el cual el antiformalismo puede ser entusiastamente defendido y expandido como una teoría jurídica correcta. Estos acontecimientos en el clima iusfilosófico internacional tendrían pronta traducción en el ambiente latinoamericano. En este contexto era relativamente natural que el trabajo de muchos filósofos del derecho locales, empezando con la Escuela de Buenos Aires e incluyendo a los de mi propia generación en Bogotá, se concentrara en problemas de interpretación jurídica dentro de un modelo analítico post-hartiano. El aporte de Hart consistió, desde mi punto de vista, en mostrar que los desarrollos en filosofía analítica y del lenguaje tenían consecuencias directamente aplicables a la filosofía del derecho. Implícito en la obra de Hart hay un convencimiento de que existe convergencia entre hallazgos filosófico-linguísticos generales y la naturaleza del lenguaje y la interpretación legal. Así como Hart había utilizado el trabajo de Austin y Weissman para moderar la tesis positivista clásica, así mi propio trabajo buscó examinar la dimensión pragmática del lenguaje, tal y como el filósofo Paul Grice la había enunciado. Este trabajo temprano pretendía mostrar que el formalismo jurídico tenía características excepcionales dado que suspendía, sin buenas razones, el funcionamiento de los principios pragmáticos del lenguaje en la interpretación y argumentación profesionales. Lo que quiero subrayar aquí es qué tan poco consciente era para mí la dependencia de mis propios intereses de las tendencias iusfilosóficas y políticas transnacionales de la época. Para mí la filosofía del derecho era un espacio vacío de argumentos donde era posible aclarar verdades fundamentales sobre la naturaleza del derecho a través de un análisis filosófico general. La verdadera razón, la “pasión” con que descubrimos la obra de 6 Véase en general, Epp, Charles, The Rights Revolution: Lawyers, Activists, and Supreme Courts in Comparative Perspective, Chicago, Chicago University Press, 1997.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
423
Hart, a pesar de su evidente circunspección y opacidad estilísticas, se debía en cambio, no tanto a las verdades filosóficas abstractas allí contenidas, sino a la confirmación indirecta y a veces excesivamente reservada que daba a nuestra inconformidad con los protocolos de la cultura jurídica dominante en América Latina. Hart, en ese sentido, abría una ventana hermenéutica y finalista en el derecho que parecía no existir dentro del corpus de formalismo dominante. Con el tiempo, y luego de imitar el patrón hartiano de trabajo analítico en el campo de la interpretación legal, vine a darme cuenta de que mi propia selección local de tópicos e influencias estaba fuertemente delimitada por datos de contexto personal y social. La obra de Hart fue perdiendo la pátina de verdad abstracta que poseía, y se me fue descubriendo su posición y significado específicos en el mapa transnacional de producción de iusfilosofía. En Colombia, donde había empezado a emplumar mis alas de jóven iusfilósofo, este trabajo a la Hart era novedoso, heterodoxo, e incluso, contra cultural. Animado por estos intereses, sin embargo, continué mi formación doctoral en los Estados Unidos donde, a modo de carta de presentación, presenté mis jóvenes e inciertas musitaciones hartianas. Mi proyecto de disertación sobre una teoría lingüístico-pragmática de la intepretación jurídica fue afortunadamente aceptado, pero cierta sombra de duda, quizá de incomprensión, parecía cruzar por la mente de mis profesores norteamericanos. Al tratar de escribir esta tesis doctoral me sentí atrapado por proyectos iusfilosóficos diferentes: para mi audiencia norteamericana, en donde ahora se desarrollaba mi socialización iusfilosófica, este tipo de comprensión hermenéutica y lingüística del derecho estaba, por razones que demoré en comprender, pasada de moda; mis profesores percibían mi intención de utilizar la iusfilosofía hartiana como una fuente emancipadora del derecho frente a la tiranía del formalismo local. Ellos alcanzaban a percibir que en Hart yo encontraba confirmación de que el derecho presentaba, con frecuencia, una textura abierta que desmentía el ubicuo rigor silogístico de la teoría latinoamericana dominante. Pero, mientras comprendían el uso emancipatorio y antiformalista que yo hacía del viraje hartiano, les era muy difícil entender cómo ya pretendía lograr ese gesto emancipatorio con un autor, como Hart, que a ellos les parecía militar en la dirección exactamente opuesta a la de mis intenciones. Para ellos Hart era un crítico se-
424
DIEGO EDUARDO LÓPEZ MEDINA
vero de la revuelta antiformalista del derecho en el mundo anglo,7 y si bien él reconocía la existencia de zonas de penumbra en la interpretación jurídica, esta concesión se hacía a ragañadientes y con una tacañez tal que impedía hacer de Hart el líder de la emancipación anti-formalista a la que yo aspiraba. Para los norteamericanos no era claro, de ninguna manera, por qué un latinoamericano pretendía hacer antiformalismo de la mano de un positivista inglés, de la misma forma como yo no entendí, al principio, las razones del desdén norteamericano para con la iusfilosofía analítica inglesa. Así como para mí no era claro el mapa intelectual en la que mis profesores leían los libros de filosofía o teoría del derecho, asimismo ellos no tenían presente los contornos de la cultura legal e intelectual de América Latina donde esos extraños usos de Hart eran posibles. Debido, sin embargo, a la evidente debilidad política del estudiante frente al profesor, yo (el estudiante) sí estaba obligado a aprender la grilla intelectual desde la cual ellos comprendía la iusteoría, mientras que ellos no adquirían una obligación simétrica. Gran parte de lo que sigue en este trabajo es una exploración de por qué, en concreto, mis profesores norteamericanos pensaban que mi interpretación de Hart era sub-estándar y errónea, mientras que la de ellos era más normalizada y, por tanto, correcta. Mi proyecto antiformalista era, en lo esencial, correcto, pero mi lectura y utilización de Hart eran, por el contrario, incorrectas y extrañas. La lectura latinoamericana de la filosofía del derecho era codificada, en ese sentido, como otro síntoma más de la dependencia y subdesarrollo culturales de la región y no como una grilla intelectual alternativa que pudiera competir con el rico entretejido de argumentos iusfilosófico de la cultura estadounidense. Y, no obstante el error en que caía, la discusión cultural y política en casa sobre el derecho seguía desarrollándose como un combate entre el formalismo tradicional y el discurso hermenéutico y lingüístico hartiano que aún parecía atractivo para muchos latinoamericanos en el proceso de criticar la cultura legal dominante. Ya observará el lector la situación crítica en la que me encontraba: por un lado quería hacer una iusfilosofía que diera cuenta del clima cultural y de los procesos locales que se daban en mi jurisdicción, pero al mismo tiempo entreveía que esos desarrollos locales eran subestandarizados si se les oteaba desde la tradición iusfilosófica angloamericana. Como estu7
Explicación.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
425
diante de filosofía del derecho, adicionalmente, no tenía mucho margen de acción para proponer un argumento particularista que restituyera mi identidad y mi confianza en las posibilidades de una iusfilosofía específicamente latinoamericana. El argumento particularista tiene dos vertientes: un estudiante doctoral extranjero puede reclamar identidad y localización (particularización) frente a sus profesores de una manera iuspositivista o de una manera multiculturalista. (1) O bien puede proponer una tesis sobre el “acto administrativo en Colombia”, que su director, supongámoslo francés, codificara en la categoría “derecho comparado”. El estudiante obtiene así la ventaja iuspositivista de trabajar con textos legales que su audiencia francesa e internacional no puede verificar independientemente y respecto de los cuales no tiene opiniones fuertes o bien informadas. De esta forma, el positivismo jurídico tiene el potencial de particularizar en razón del origen de normas legales. (2) O bien, por otro lado, el estudiante puede hablar de un tema común que comparte con su profesor, por ejemplo, “la defensa de los derechos humanos”, pero reclama para sí un “punto de vista” local, bien sea porque su “realidad” o su “cultura” introducen modificaciones significativas a la comprensión estandarizada y transnacional del tema. Se culmina de esta manera con una tesis, supongan ustedes, sobre “la noción de derechos de la mujer en el Magreb africano”. En suma, el multiculturalismo particulariza en razón de la relativización de la cultura. Bien sea a través del positivismo, bien sea a través del multiculturalismo, lo cierto es que el estudiante proviniente de jurisdicciones periféricas o semi-periféricas logra crear un espacio de particularismo, un real estatus de excepcionalismo positivo o cultural que, si bien puede neutralizar la intervención de su disciplinadora audiencia del norte, también termina por marginalizar su producción intelectual. En teoría del derecho, sin embargo, estas opciones de particularización y neutralización no eran tan fáciles de usar en mi caso: en primer lugar, la particularización positivista en filosofía del derecho no parece ser de recibo porque, por definición, la iusfilosofía es un discurso sobre la naturaleza del derecho con abstracción hecha de las normas positivas concretas del sistema. Por tanto, argumentar que el preciso texto, por ejemplo, del Código Civil de Bello, genera un particularismo iusfilosófico fuerte es, cuando menos, un argumento poco atendible. De otro lado, la estrategia multiculturalista en defensa de una iusfilosofía latinoamericana tradicionalmente conduce a identificar a algún autor iusfilosófico local para mostrar que, también en el
426
DIEGO EDUARDO LÓPEZ MEDINA
terruño, se produce iusfilosofía exportable. Aunque comparto sin reservas el mérito de nuestros autores locales, sin embargo yo quería seguir hablando de Hart porque pensaba que su influencia era más potente en la configuración de una cultura jurídica contemporánea que el trabajo, muy meritorio, de Carlos Cossio en Argentina o de Luis Eduardo Nieto en Colombia. Pero, la pregunta persiste, ¿por qué no es fácil alcanzar una particularización del discurso en el campo de la iusteoría? Primero, porque la iusteoría, como campo esencialmente erudito y académico del derecho, ha sido estructurada desde su inicio como una empresa verdaderamente transnacional. Por “empresa transnacional” quiero significar lo siguiente: los autores, argumentos y controversias llamados “iusteóricos” ocupan un campo por encima de lo nacional, lo regional o lo local en donde cierto tipo de conocimiento abstracto del derecho puede ser compartido y usado por gentes con diferentes antecedentes y en distintos contextos. En ese sentido obsérvese, por ejemplo, cómo es inmensamente más fácil que un jurista en América Latina sepa algo de iusteóricos anglosajones o alemanes por comparación a escritores dogmáticos de esas mismas tradiciones.8 La iusteoría, después de todo, es el más abstracto de todos los discursos acerca del derecho y por este mismo motivo es el tipo de discurso académico que puede, con mayor facilidad, atribuirse cierta forma de desapego frente a minuciosidades regionales, nacionales o locales. El excepcionalismo o particularismo, es decir, la interpretación o aportación local que la gente de sitios exóticos o periféricos puede darle a algunos campos de la academia jurídica es más difícil de explotar en la iusfilosofía que en otros campos. La aceptación del particularismo en el derecho, bien sea por el camino positivista o por el camino multiculturalista que esbocé con anterioridad, apuntan a los siguiente: la aceptación de la existencia de diversas interpretaciones locales de un mismo objeto epistémico constituye, al menos implícitamente, una crítica a una construcción hegemónica y pseudo-universalista del objeto por un número limitado de eruditos y de intereses asentados en países centrales que terminan monopolizando, desde un punto de vista igualmente particular, la lectura estándar, objetiva o universal de un campo jurídico. La difusión y aceptación de estrategias excepcionalistas o particularistas apuntan hacia una crítica del conocimiento etno, euro o anglo-céntrico. Esta estrategia ya 8 El caso con los autores franceses es quizá opuesto pero esto no le quita mayor fuerza a la idea que estoy explorando.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
427
ha sido desarrollada con gran dinamismo en campos tales como los derechos humanos o el derecho internacional. Estos temas son ahora tratados desde diferentes perspectivas culturales, históricas y geográficas.9 Este creciente proceso de fragmentación geográfica de objetos de estudio tiene muy importantes implicaciones en la forma como se crea y transforma conocimiento en la academica jurídica. La iusfilosofía, mientras tanto, está menos inclinada a aceptar esta clase de perspectivismo y sigue adoptando un tono y metodología transnacional. Los autores, argumentos y países que participan en el debate con cierto grado de reconocimiento son todavía muy limitados si se les compara con la geografía global en expansión que empieza a verse en otros campos jurídicos. En segundo lugar, viniendo de América Latina, y según nuestra propia admisión, no somos lo suficientemente exóticos o periféricos como para reclamar en nuestro favor una posición excepcionalista o particularista. Es en el subcontinente latinoamericano donde ha operado con mayor fuerza el proyecto asimilacionista de lo local con lo universal o general: Se trata, al menos en el imaginario colectivo, de una parte más del mundo occidental, aunque se trate de una parte “en desarrollo”,10 “en transición a la democracia”,11 y en donde nuevas oportunidades de inversión se presentan bajo la forma de “mercados emergentes”.12 Somos, en esencia, miembros de la familia jurídica occidental (un gran paraguas civilizatorio que cubre tanto a la tradición romanista como al common law) y no poseemos una iusfilosofía o un derecho distintivas que pudieran ser usadas como fundamento para una contribución genuinamente exótica o alternativa a la jurisprudencia. Se podría aceptar, por ejemplo, que existe genuino interés por estudiar las ideas iusfilosóficas que subyacen los de9 Para una discusión general del debate Universalista-Relativista en derechos humanos, véase Steiner, Henry y Alston, Philip, Los derechos humanos internacionales en contexto 192-255, 1996; Dalacuora, Katherina, Islam, liberalismo y derechos humanos, Londres, Tauris, 1998, pp. 6-38 y 192-199. 10 Para un análisis de la “invención” del desarrollo y del tercer mundo, Véase Escobar, Arturo, La invención del tercer mundo: construcción y deconstrucción del desarrollo, Bogotá, Norma, 1998. 11 Al respecto véase, Nino, Carlos S., “Transition to Democracy, Corporatism and Constitutional Reform in Latin America”, 44, U. Miami Law Review, 129, 1989; Rosenfeld, Michel, “Constitution-Making, Identity Building, and Peaceful Transition to Democracy: Theoretical Reflections Inspired by the Spanish Example”, 19, Cardozo Law Review, 1891, 1998. 12 Taylor, Celia R., “Capital Market Development in the Emerging Markets: Time to Teach an Old Dog Some New Tricks”, 45, Am. J. Comp. L., 71, 1997.
428
DIEGO EDUARDO LÓPEZ MEDINA
rechos tradicionales o religiosos, tales como el Dharma hindú13 o la Sharia islámica.14 América Latina, por el contrario, está justo en el medio entre el mundo occidental normalizado y hegemónico y el mundo oriental exótico y subalterno, argumentando a veces que su asimilación con Occidente es completa, a veces reclamando los beneficios y privilegios de la diferencia identitaria frente a Occidente. A pesar del triunfo, al menos en nuestras mentes, del proyecto asimilacionista de América Latina, era claro que no por asimilados éramos iguales. Ser “igualado” no significa lo mismo a ser “igual”. A la asimilación subyace una dinámica de imitación, o como decían los filósofos clásicos griegos, de mímesis.15 Desde Platón, sin embargo, la ontología occidental ha asumido, en perjuicio de nosotros sempiternos imitadores, que el producto mimético o imitativo es una reproducción en la que el original pierde claridad y fuerza existencial. La caverna, en el mito platónico, se caracteriza por ser el mundo de la mímesis en el que tan sólo se copian los objetos del mundo real que se sitúa, literalmente, allá arriba bajo la luz del sol. Este envilecimiento de lo mimético envilece así los productos iusfilosóficos de América Latina: al comienzo de nuestra vida republicana, cuando nuestros ideales de derecho y Estado imitaban cercanamente los de la República francesa, éramos simplemente reproducciones imitativas de acontecimientos europeos. Y ahora, a comienzos del siglo XXI, cuando nuestros ideales de derecho y Estado imitan cercanamente la “República comercial”16 de los norteamericanos, nuestra iusfilosofía parece ahora una pálida sombra de nuevos autores y argumentos. Eramos, en un principio, copias europeas y ahora, quizás, copias norteamericanas. Los estudiantes latinoamericanos de iusteoría, por consiguiente, tienen la tendencia a conformar sus propios estudios y esfuerzos a la estructura que esta visión transnacional les permite. Dos caminos parecen abrirse: Para nosotros, en primer lugar hay que ponerse al día, actualizar o estandarizar las lecturas y los proyectos intelectuales. Un ejemplo clarificará el asunto: yo pensaba, antes de viajar a Estados Unidos, que la obra de H. L. A. Hart era altamente innovativa y antiformalista (en comparación 13 Véase en general, Lingat, Robert, The Classical Law of India, Nueva Delhi, Munshiram, 1993. 14 Véase, en general, Noel J. Coulson, Historia del derecho islámico, Bellaterra, Barcelona, 2000. 15 Platón, República, passim. 16 Stephen L. Elkin, “The Constitutional Theory of the Commercial Republic”, 69, Fordham Law Review, 1933, 2001.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
429
con la de Hans Kelsen) para simplemente descubrir que, en la academia norteamericana y medio de un contexto de interpretación distinto y más “normalizado” de la obra de Hart, estas dos características que había encontrado en mis lecturas locales eran simplemente equivocadas (o al menos así lo juzgaban mis profesores). Opuesto a mi interpretación local (¿errónea?), la obra de Hart era un buen ejemplo de un cierto tipo de teoría altamente formalista. Esto, de por sí, constituía (especialmente para algunas audiencias en el mundo norteamericano) una acusación contra esta teoría. Su influencia, su posicionamiento dentro del espectro de puntos de vista en la teoría legal contemporánea, eran también completamente diferentes a la visión local que nos habíamos formado de la misma: la obra de Hart no era tomada como un discurso particularmente crítico, como en principio lo pensé ( y lo mismo ocurrió con otros miembros de mi cultura legal), sino que era considerada como una pieza fundamental diseñada para restringir o moderar las exageraciones de una escuela antiformalista de iusteoría denominada en los Estados Unidos “realismo jurídico”. En ese orden de ideas, era claro que la obra de Hart tenía diferentes significados en distintos lugares: en un escenario iusteórico post-realista, la obra de Hart era usada como dique de contención; en un escenario iusteórico pre-realista, como continúa siendo el latinoaméricano, la obra de Hart tiene el claro pontencial de acelerar y animar la crítica antiformalista del derecho. El segundo camino abierto a los estudiantes latinoamericanos de teoría del derecho es el siguiente: luego de ponerse al día en relación a las lecturas estandarizadas de iusteoría transnacional, se les concede ahora la posibilidad de participar en el debate transnacional, aunque con algunas restricciones: por lo general su lugar dentro de una escuela es el de seguidores y promotores fieles de alguna iusteoría en la que se hayan matriculado por escogencia o por azar. Es fácil mostrar, por ejemplo, como muchas de las más genuinas e importantes contribuciones latinoamericanas a los estudios iusteóricos se ubican como continuaciones (si no meras repeticiones) de teorías transnacionales ya hiper-estructuradas.17 Por 17 Más adelante mostraré que a lo largo del siglo veinte los jurisconsultos locales han estado demasiado preocupados con tratar de interpretar correctamente a los autores internacionales y muy poco interesados en la conciencia jurídica efectiva que les rodea. La producción iusteórica reciente en Latinoamérica parece mantener esta orientación. Esto en sí mismo no es cuestionable. Pero a los jurisconsultos locales todavía les hace falta tener éxito para ser reconocidos como actores con voz propia en el espacio transnacional
430
DIEGO EDUARDO LÓPEZ MEDINA
consiguiente, uno tiene la tendencia a pensar que la iusteoría mexicana ha estado muy preocupado con la recepción, y en ocasiones, con el mejoramiento y refinación de la Teoría pura de Hans Kelsen; de la misma manera, se podría también decir que la iusteoría argentina trabajó en el aclimatamiento y desarrollo del análisis y la lógica jurídicas, primero de manera informal, como se ve en los trabajos de Carrió y Nino,18 hasta llegar a altos grados de formalización, como los de Carlos Alchourrón y Eugenio Bulygin.19 Curiosamente, la dedicación local de la iusteoría argentina tan sólo sea comparable con un enamoramiento analítico similar que se encuentra en la iusteoría polaca20 o escandinava.21 II. “SITIOS DE PRODUCCIÓN” Y “SITIOS DE RECEPCIÓN” EN LA TEORÍA TRANSNACIONAL DEL DERECHO (TTD) Por razones de definición disciplinar hemos visto que es difícil particularizar el análisis iusteórico. La filosofía del derecho presenta un grueso blindaje frente a un posible asalto del perspectivismo teórico. De esta forma se genera la impresión de que la filosofía y las teorías del derecho son discursos abstractos de alcance global. En ese sentido, personas de Japón, Ghana, Alemania o Colombia pueden participar sin mayores obstáculos en la discusión transnacional sobre un mismo canon de lecturas, autores y argumentos. Este campo intelectual transnacional en el que los iusteóricos nos hallamos inmersos podría denominarse Teoría transnade la teoría jurídica. Siguiendo esta tendencia, véase Atria, Fernando, “Legal Reasoning and Legal Theory Revisited”, 18, Law and Philosophy, 537, 1999 (Atria es profesor en la Universidad de Talca, Chile); Lindahl, Hans, “Authority and Representation”, Law and Philosophy, 2000 (Lindahl, de ascendencia europea, estudió derecho en Bogotá, y ahora enseña en la Universidad de Tilburg en Holanda); Arango, Rodolfo, ¿Hay respuestas correctas en el derecho?, Bogotá, Uniandes, 1999 (Arango es profesor de derecho en la Universidad Nacional de Bogotá). 18 Carrió, Genaro, “Los conceptos jurídicos fundamentales de W. N. Hohfeld”, Notas sobre derecho y lenguaje, Buenos Aires, Abeledo-Perrot, 1965, pp. 303-320; Nino, Carlos S., Introducción al análisis del derecho, Buenos Aires, Astrea, 1980, pp. 63-100. 19 Análisis lógico y derecho, Madrid, Centro de Estudios Constitucionales, 1991. 20 Wroblewsky, Jerzy, Meaning and Truth in Judicial Decision, Helsinki, Juridica, 1979; Wroblewsky et al. (eds.), Juristiche Logik, Rationalität und Irrationalität im Recht, Berlín, Duncker, 1985. 21 Véase en general, como una fiel expresión de la teoría analítica anunciada por Alf Ross, Hernández Marín, Rafael, Introducción a la teoría de la norma jurídica, Barcelona, Marcial Pons, 1998.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
431
cional del derecho (a la que me referiré, de aquí en adelante, con las siglas TTD). Este concepto será muy importante para el resto del análisis. Con el mismo quiero definir un tipo de literatura, ideas y argumentos iusteóricos que cruzan los fronteras nacionales mucho más fácilmente que los libros y análisis de doctrina o comentario legal-positivo. El importe de TTD es hábilmente capturado por uno de los más importantes iusteóricos transnacionales, Hans Kelsen, cuando en la primera edición de su Reine Rechtslehre (1934) insiste en el hecho de que su obra no versa sobre un sistema legal específico sino sobre las bases teóricas de cualquier sistema legal posible. La TTD también esta adecuadamente caracterizada por el iusteórico alemán Theodor Viehweg, para quien la jurisprudencia pertenece a las ciencias internacionales del derecho que pueden ser estudiadas por fuera del país donde se ejerce la profesión, en oposición a las ciencias nacionales que están exclusivamente conectadas con los dogmática, regla y técnica de un sistema legal nacional.22 La TTD se produce comúnmente en un lugar que me gustaría caracterizar abstractamente como “sitio de producción”.23 Un sitio de producción parece ser un medio especial en donde se producen discusiones iusteóricas con altos niveles de influencia transnacional sobre la naturaleza y las políticas del derecho. Los sitios de producción están usualmente afincados en los círculos intelectuales e instituciones académicas de naciones-Estados centrales y prestigiosos. Por consiguiente, los países centrales generan los productos más difundidos de TTD, productos que con el tiempo son circulados por la periferia, para finalmente venir a constituir globalmente el canon normalizado del campo. Cuidadosamente examinadas, es patente que las iusteorías formadas en sitios de producción son también el producto de circunstancias políticas y sociales muy concretas. Sin embargo, su transplantabilidad global y su valor “general” y “objetivo” depende del hecho crucial de oscurecer 22 Viehweg, Theodor, Tópica y filosofía del derecho, Barcelona, Gedisa, 1991, pp. 36 y 37. 23 Quiero insistir en que hay una distinción iusteórica relevante entre sitios de producción y sitios de recepción. Varios autores han trabajado ya las consecuencias para teoría del derecho que se derivan de la distinción entre “contextos de descubrimiento” y “contextos de justificación”. Véase Norris, Christopher, “Sociology of Knowledge”, Cultural and Critical Theory, Payne, Michael (ed.), Oxford, Blackwell, 1996. La misma distinción ha sido ampliamente usada por Martin Golding, “Jurisprudence and Philosophy in Twentieth Century American: Mejor Themes and Developments”, 36, J. Legal Educ., 441, 1986.
432
DIEGO EDUARDO LÓPEZ MEDINA
o minimizar los contextos específicos en que dichas iusteorías se forjaron. Una posible razón que justifica la minimización de la contextualidad en que la iusteoría nace en los sitios de producción parece ser que en tales localidades los lectores de iusteoría leen o decodifican los textos en ambientes hermenéuticos ricos: En estos ambientes el lector posee acceso extratextual a un rico bagaje de información contextual que comparte con el autor del argumento iusteórico aparentemente abstracto. Esta información extratextual, que completa la información tan sólo sugerida en los textos, se comparte entre autor y lector a partir de una experiencia social y jurídica compartidas, expresada particularmente en una comprensión común de la educación jurídica y de las practicas, fuentes, instituciones, tradiciones y desafíos del derecho dentro de un mismo sistema jurídico compartido. Este conocimiento presupuesto entre autor y lectores en sitios de producción permite un doble proceso: los argumentos iusteóricos presuponen un contexto material (problemas o preocupaciones sociales, doctrinarios, económicos específicos al autor), pero en la medida en que ese contexto se supone culturalmente alcanzable por el lector en el sitio de producción a partir de algunas pocas trazas escriturales específicas, se termina por suponer que el lector terminará haciendo una lectura correcta, o por lo menos, normalizada de la iusteoría que se le ofrece. La contracara de los sitios de producción son los sitios de recepción. La iusteoría producida dentro de un sitio de recepción, por lo general, ya no tiene la persuasividad y circulación amplia de la TTD, sino que, por el contrario, uno estaría tentado a hablar mejor de iusteoría “local”, “regional”, “particular” o “comparada”.24 Con estos nombres quiero hacer referencia a los conceptos o sistemas iusteóricos particulares que dominan en países periféricos o semi-periféricos25 En teoría del derecho, 24 Una de las pocas disciplinas jurídicas en donde América Latina ha hecho un aporte aún no exotizado por la academia internacional es en derecho internacional. La temprana liberación de las colonias de España en el siglo XIX ayudó a crear un sistema de Estados en los que se creó tempranamente una costumbre de alcance regional. Esta costumbre regional tiene cierto prestigio en el discurso jurídico internacional. Véase Obregón, Liliana, Derecho internacional criollo (en los archivos del autor). 25 Tomo este concepto de la teoría del “sistema-mundo”. Véase en general Shannon, Thomas, An Introduction to World-System Perspectives, 2a. ed., Westview, 1996. Esta terminología ha sido usada por Boaventura de Sousa Santos. Su obra, sin embargo, es usualmente clasificada como “sociología del derecho” y no como teoría jurídica. Para que algo sea considerado teoría jurídica debe Esto último conformarse a ciertos criterios
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
433
como en muchas otras áreas de derecho, estos países transplantan o usan ideas originadas en jurisdicciones prestigiosas. Estas jurisdicciones prestigiosas, según los comparativistas, son las figuras parentales de familias jurídicas. Las jurisdicciones periféricas son los hijos de las familias, y su misión, como en las familias humanas, es aprender, mediante mímesis de sus padres. En los sitios de recepción la actividad de lectura de la iusteoría se realiza en medio de ambientes hermenéuticos pobres. Con esto quiero decir que el autor y sus lectores periféricos comparten muy poca información contextual acerca de las estructuras jurídicas subyacentes o las coyunturas políticas o intelectuales específicas en las que nació el discurso iusteórico. Esta invisibilidad de una rica información contextual y material refuerza, por lo menos para el lector periférico, la apariencia de que la filosofía del derecho es una rumiación abstracta sobre la naturaleza de cualquier sistema legal posible. Sin embargo, cuando confrota su lectura con la obtenida en ambientes hermenéuticos ricos recibe la descorazonadora noticia que su comprensión es subestándar. La actividad de transplantar, leer y usar literatura académica en el mundo periférico o semi-periférico ha llamado la atención de reciente en las ciencias sociales. El viejo modelo que anticipaba que la teoría de las disciplinas sociales era una, objetiva y universal, ha empezado a ceder frente a la idea, contrapuesta, de que no existe un solo canon teórico en todos los lugares. Las ideas sufren cambios en el viaje y esos cambios son fundamentales para explicar la diversidad en la fundamentación de las creencias y prácticas de distintos actores sociales. Frente al modelo que predice la convergencia y homogeneidad del corpus universal de teoría (en filosofía, en sociología, en derecho), se abre paso una actitud que subraya las divergencias mutantes de teoría particulares y heterogéneas. Parece existir una creciente certeza de que las particularidades nacionales o regionales sí impactan la construcción académica de discursos en formas que el cientifismo antiguo no podría aceptar, ni prever.
de abstracción. La ubicación particular de un texto (y muy en especial si esa ubicación es periférica) lo relega al discurso descriptivo, nunca normativo. Yo creo, de otra parte, que hay mucho más que sociología del derecho en las iusteorías locales. En la iusteoría local periférica existe un auténtico conocimiento acerca de la naturaleza general del derecho del cual pueden beneficiarse personas en otros sitios. Véase Boaventura de Sousa, Santos, De la mano de Alicia, Bogotá, Uniandes, pp. 373-454.
434
DIEGO EDUARDO LÓPEZ MEDINA
Esta posibilidad de una teoría social mutante y difusa abre la pregunta de cómo y por qué se originan las mutaciones en el transplante teórico. Por regla general se responde la cuestión afirmando, en estrecha conexión con la biología, que el transplante de teoría a nuevos lugares implica la inserción de la teoría transplantada en nuevos ambientes o contextos. Se dice que los nuevos ambientes son los responsables de las mutaciones ya que la teoría transplantada produce respuestas adaptativas frente a las nuevas condiciones. Pero aunque parezca relativamente claro hablar de nuevos “ambientes”, “contextos” y “adaptaciones” en biología, estos conceptos se muestran mucho más ambiguos con relación al transplante iusteórico. Mientras que las adaptaciones biológicas parecen tener un principio autónomo de mutación, las ideas, por el contrario, no cambian orgánicamente. Su transplante responde a agendas humanas más o menos conscientes y es de esas agendas humanas de donde las ideas o conceptos reciben sus mutaciones. En la literatura que explora la lectura contextual de teorías y las mutaciones teóricas por razón de transplante, me parece que existen dos posibles caminos explicativos del papel de los nuevos “ambientes” en la mutación teórica: de un lado, existen la posibilidad de hacer una comprensión institucional-material del viaje teórico de acuerdo con el cual las modificaciones de la teoría transplantada son generadas por su implementación dentro de nuevas estructuras institucionales y por actores sociales diferentes que no son idénticos a los que primero se encontraron en el sitio de producción. 26 Según esta forma de ver las cosas, por ejemplo, el transplante de ideas liberales en América Latina estaría condicionado por la existencia de estructuras sociales patrimonialistas, clientelares y anti-individualistas que, por fuerza, generaron una mutación en la comprensión local del liberalismo.27 Por otro lado, hay una comprensión del viaje teórico que hace énfasis en el hecho de que los nuevos ambien26 Véase en general Sikkink, Kathryn, Ideas and Institutions: Developmentalism in Brazil and Argentina Cornell, Ithaca, 1991; Hall, Peter (ed.), The Political Power of Economic Ideas: Keynesianism across Nations, Princeton, 1989; Wagner, Peter; Hirschon Weiss, Carol; Wittrock, Björn y Wollman, Hellmut (eds.), Social Sciences and Modern States: National Experiences and Theoretical Crossroads, Cambridge, Cambridge University Press, 1991. 27 Las ideas originales pueden verse, por ejemplo, en Weber, Max, La ética protestante y el espíritu del capitalismo, Barcelona, Península, 1979; la recepción local está en López M, Alfonso, La estirpe calvinista de nuestras instituciones políticas, Bogotá, Tercer Mundo, 1966.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
435
tes para la teoría transplantada no están en realidad primariamente conformados por arreglos institucionales o materiales (reales) sino por redes (culturales) de textos, ideas e imaginarios compartidos por quienes hacen el transplante. Este entendimiento del contexto es cultural e intertextual en vez de ser socio-político y material, como parecería sugerir el primer modelo. El último modelo está, entonces, más preocupado con el impacto de teorías transplantadas en redes de conciencia construida, tal como se expresa en nociones contemporáneas de crítica literaria tales como intertextualidad o dialogismo.28 De esta forma, la mutación local que se hizo de la Teoría pura del derecho de Hans Kelsen no obedece a características sociológicas de la población colombiana o de la profesión jurídica, sino al dominio teórico previo que concentró, desde la expedición de los códigos nacionales, el positivismo jurídico francés del siglo XIX. Estos dos modelos esbozan dos mecanismos distintos mediante los cuales se hace el tranplante teórico. En el primero, mi concepto de “sitio de recepción” se inclina hacia una formación social específica en que las teorías mutan. En el segundo, la idea de “sitio de recepción” parece señalar a una red intertextual donde nuevas ideas o teorías sufran modificaciones dentro de la esfera discursiva. La primera es, si se quiere, una teoría materialista de la mutación eidética, mientras la segunda es una teoría culturalista de ese mismo fenómeno. Lo primero, por regla general, es parte de estudios de historia social o sociología, mientras lo segundo es, con mayor frecuencia, parte de estudios de historia de las ideas o de teoría general del campo, sin más. Me parece importante, a este altura, señalar provisionalmente bajo qué modelo de viaje teórico voy a estructurar las reflexiones que siguen. Antes de decidir quiero, sin embargo, presentar un argumento que tendrá peso decisivo en el modelo a adoptar: La selección entre estos modelos determina si los estudios teóricos realizados en sitios periféricos o subordinados pueden ser propiamente considerados como “teoría del derecho” o si, de acuerdo con la práctica actual, siguen siendo relegados pertenecen y marginalizados como ejemplos de historia intelectual o de 28 Mi inspiración general se encuentra en tres autores: Zea, Leopoldo, La filosofía americana como filosofía sin más, México, Siglo XXI, 1969, pp. 9-43; Bajtin, Mikhail M., The Dialogic Imagination, Austin, University of Texas Press, 1981, pp. 84-258; Bloom, Harold, A Map of Misreading, Oxford, Oxford University Press, 1995; Bloom, Harold, The Anxiety of Influence: A Theory of Poetry, 2a. ed., Oxford, Oxford University Press, 1997.
436
DIEGO EDUARDO LÓPEZ MEDINA
sociología jurídica o del conocimiento. Al escoger entre los modelos “materialista” y “cultural” del viaje teórico, es importante tener en cuenta que ninguno de las dos es correcto en términos absolutos cuando se le compara con el otro. Ambos modelos sugieren caminos plausibles de investigación; en ese sentido, ambos modelos son correctos, dependiendo de la meta fijada y del campo académico al que pretendan contribuir. De reciente, como puse de relieve hace poco, ha aparecido una literatura en las ciencias sociales que se ha concentrado en el impacto de la de la particularidad local sobre la teoría transnacional. Este tipo de literatura está todavía muy lejos de ser dominante, pero ya muestra un interesado distanciamiento respecto del valor incondicional y universal de la teoría social, o en nuestro caso, de la TTD. Al repasar esta literatura, sin embargo, es fácil mostrar que estos recientes esfuerzos por explicar los transplantes y viajes teóricos han sido ejecutados privilegiando el modelo que llamé “materialista”. Según esta explicación, los procesos mediante los cuales las teorías transnacionales interactúan o reaccionan ante contextos ha sido conceptualizado como el impacto que dichas teorías ejercen cuando son desplegadas en nuevas circunstancias materiales, tales como instituciones, mores o actores locales. Esta escogencia ha creado, sin embargo, varios obstáculos insuperables para los investigadores semi-periféricos que aún pretenden contribuir a discursos de fuente inclinación normativa o teórica (como es el caso de la filosofía y teoría del derecho). En especial, esta predilección por la lectura materialista del viaje teórico ha tendido a subestimar la importancia de las teorías locales o particulares: Como se estudian en función de la reacción entre ideas viajantes y grupos e instituciones sociales, se crea la firme impresión de que pertenecen a discursos meramente descriptivos, como la sociología, la antropología y la historia de las mentalidades y de las ideas, desechándose por esa vía el valor autónomo que como teoría pudieran tener. Por esa razón, los estudios del desarrollo de las ideas iusteóricas en sitios de producción son inmediata y naturalmente presentados como filosofía o teoría del derecho; ese mismo desarrollo, para el caso de países periféricos receptivos, es presentado, con igual naturalidad, como antropología, sociología o historia del derecho y sus ideas. Esta selección del modelo materialista y el relativo descuido del modelo cultural revela una tendencia implícita a negar la posibilidad de estudiar con seriedad las iusteorías locales o particulares en su propio valor
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
437
teórico. Así, cuando uno desea saber, por ejemplo, qué le sucede a una teoría jurídica cuando viaja y se aclimata en nuevas instituciones constitucionales o mores y hábitos nacionales, los productos de la iusteoría local periférica tienden a ser leídos materialmente como contribuciones a la historia, la sociología o la antropología del derecho. Por consiguiente, rara vez dichos productos son considerados dentro de sus contextos inter-textuales o culturales, esto es, como productos teóricos en sí mismos que tratan de resolver, para el nuevo contexto, los problemas generales que la teoría (cualquier teoría) tiene como misión esclarecer. Cuando estos textos ya no son vistos como adaptaciones antropológicas de un tema europeo (¡observad qué interesante: Los criollos también beben vino!) sino como verdaderas contribuciones a la creación del conocimiento en la materia (¡observad: hay conocimiento vitivinícola en América Latina que no poseíamos con anterioridad!) se da un paso cualitativo fundamental para aceptar el modelo difusionista y perspectivista de teoría del derecho que se entrevía más arriba. En realidad, según creo, la tarea propiamente normativa de cualquier teoría, contrario a los deberes descriptivos de la sociología, la antropología y la historia, no se relaciona en últimas con la cualidad intrínseca de los textos de una tradición: no es condición necesaria tener abundancia de teóricos del derecho para que una jurisdicción nacional tenga representaciones teóricas sobre el derecho. Es más: la marca definitoria de países como Colombia es que la mayor parte de su teoría del derecho relevante se ha desarrollado en textos que se presentan como antiteóricos o que no tienen como objetivo primario la reflexión ius-filosófica. Por tanto, reitero, la misión normativa de la iusteoría se puede reconstruir en un diálogo permanente entre los textos que se producen en una determinada cultura jurídica. En el presente texto pretendo presentar una tal reconstrucción de la teoría local del derecho. El cambio en actitud es ya no observar esos textos como libros dogmáticos, o como meras trazas de la historia de las ideas: más bien se trata de cambiar la óptica para observar en esos textos, por razones de su influencia cultural, cómo se presentan y resuelven pretensiones de validez teórica. Este desempeño de pretensiones clásicas del discurso normativo (de la iusfilosofía o de la iusteoría) ocurren, por necesidad aunque con distintos niveles de conciencia y apropiación, en toda jurisdicción, central o periférica, que tenga una práctica jurídica formalizada. Estas pretensiones normativas, si se les puede considerar apropiadamente de esta manera, tienen cierto grado de autonomía frente el mundo de la rea-
438
DIEGO EDUARDO LÓPEZ MEDINA
lidad y de los hechos. Sin embargo, los productos iusteóricos elaborados en sitios de recepción muy pocas veces son considerados, desde la perspectiva de las pretensiones propiamente teóricas, como contribuciones legítimas a la lógica, la epistemología o la ética del derecho. Los textos periféricos se trasladan al campo de lo descriptivo gracias al constante hábito de leerlos dentro del modelo materialista. Si es que acaso permanecen en el ámbito de lo normativo, son leídos consistentemente como extensiones de pensamiento europeo, esto es, en total abstracción de cualquier tipo de contexto local. En mi opinión, considerarlos como contribuciones genuinas a la filosofía del derecho no es tanto una consecuencia de alguna característica “objetiva” de su textualidad interna sino una decisión por parte del lector. Gran parte de los textos que se ufanan de tener un valor filosófico normativo son simplemente el resultado de la disposición del lector para considerar, al interpretar dicho texto, que es posible extraer de allí rendimientos teóricos por encima a su mero valor facial en la dogmático, lo sociológico, lo histórico o lo antropológico. Estas ideas me dan ya un punto de partida firme para poner sobre la mesa mis propias opciones metodológicas: considero sospechoso el dato según el cual la teoría del derecho tiene un menor desarrollo en América Latina si se le compara con países centrales y prestigiosos. Ello no puede ser así porque la existencia de un derecho formalizado exige la estructuración, así sea implícita, de un conjunto de ideas operativas sobre cómo funciona y para qué sirve ese sistema jurídico. Es posible que haya diferencias de grado en la formación de una consciencia académica explícita alrededor del tema: es posible que la iusteoría, como género explícito de enseñanza, investigación y escritura, tengo menor desarrollo. Pero de ahí no se sigue que no exista un desarrollo muy detallado e incluso sistemático de planteamientos iusteóricos en sistemas jurídicos periféricos. Los textos allí producidos, las teorías viajantes allí tranplantadas, aparecerán con claridad en los productos escriturales que allí se encuentran, bien sea libros dogmáticos, sentencias, memoriales, etcétera, si es que acaso el género específicamente iusteórico escasea. Estos materiales serán legítimamente iusfilosóficos si el análisis textual intenta extraer su pontencial rendimiento teórico. La lectura materialista de estos mismo textos, por otra parte, nos desplaza hacia un entendimiento sociológico, histórico, antropológico o meramente dogmático de las ideas. Este tipo de investigación es, por
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
439
supuesto, importante y legítima.29 Sin embargo, una tradición de pensamiento jurídico en la que (1) las ideas jurídicos son apenas momentos o etapas históricas y/o sociológicas, unido al hecho (2) de considerar dichas ideas como una mera extensión de la iusteoría europea o global, han finalmente generado una devaluada práctica jurídica regional en la que, se supone, no existe ninguna teoría o reflexión valiosas. Este resultado, en sus propios términos, es en verdad muy extraño. La prevalencia de estudios basados en contextos materiales o institucionales de ideas impide una participación genuina de académicos periféricos en el debate propiamente iusteórico ya que los sitúa en los márgenes del tema. Una segunda característica relacionada con esta preferencia por los contextos materiales e institucionales tiene que ver con la escogencia de marcos temporales para el análisis. Los contextos materiales que unen las ideas iusteóricas a instituciones locales tienen la tendencia a tratar de mostrar las conexiones existentes entre estas formas da la conciencia jurídica con la infraestructura material de la nación. En este sentido, los contextos materiales usualmente definen periodos de tiempo más extensos, de larga duración, la tendencia nuevamente es para considerar puntos de referencia espaciales más amplios en los que lo local una vez más se revela a sí mismo simplemente como una parte de ideas universales. En estos marcos de tiempo ampliados, el espacio geográfico es igualmente amplio, lo que conduce de nuevo a sugerir que lo local es meramente un aspecto o parte de ideas cuya espacio y tiempo son propiamente universales. El análisis de las iusteorías locales también tiene esa tendencia a extender el marco temporal. Quizá sea por esto que si uno busca en la literatura latinoamericana la forma como se analizan ideas iusteóricas, se termina encontrando dos formas de escape: De un lado, las ideas no tienen especificidad local y son sin más parte de un mundo universal de reflexión iusteórica; del otro, las ideas son parte de la historia y de la sociología de siglos pasados sin relevancia teórica contemporánea. Esto explicaría, de un lado, la existencia de múltiples trabajos de 29 Hay una creciente literatura de estudios locales en Colombia que exploran este punto de vista. Véase Jaramillo, Jaime, El pensamiento colombiano en el siglo XIX, Bogotá, Planeta, 1996; Quevedo, Emilio (ed.), Historia social de las ciencias en Colombia: Fundamentos teórico-metodológicos, Bogotá, Colciencias, 1993; Kalmanovitz, Salomón et al. (eds.), Historia social de la ciencia en Colombia: ciencias sociales, Bogotá, Colciencias, 1993; Leal, Francisco y Rey, Germán, Discurso y razón: una historia de las ciencias sociales en Colombia, Bogotá, Uniandes, 2000.
440
DIEGO EDUARDO LÓPEZ MEDINA
historia de las ideas dedicados a los siglos XVIII y XIX; en contraste, uno encuentra múltiples trabajos de TTD dedicados al siglo XX, pero en que la contextualización material de las ideas cede frente a las trampas que interpone la creencia en una teoría universal del derecho. En la literatura publicada, si uno quiere aventurarse a investigar acerca de la especificidad regional de ideas jurídicas en América Latina, es más o menos claro que existe un predominio de los temas y autores de los siglos XVIII y XIX. La historicidad y particularidad local del siglo XX, esto es, la historicidad y particularidad locales de la consciencia jurídica actualmente dominantes son infortunadamente ignoradas. III. ORIGINALIDAD, INFLUENCIA, COPIA Y TRANSMUTACIÓN EN LA TEORÍA DEL DERECHO
Al distinguir entre sitios de producción y de recepción de teorías se abre un interesante espacio para la reconstrucción de la reflexión iusteórica. La forma tradicional de describir esta distancia entre productor y receptor ha sido la de distinguir jerárquicamente entre ellos: al productor ó autor se le reconoce la originalidad de la creación; al receptor, lector o imitador se le otorga, en cambio, un papel pasivo mediante las palabras, con frecuencia peyorativas, de “influencia” o “imitación”. Es importante notar cómo estas nociones reiteran la jerarquía implícita entre sitios de producción (jurisdicciones de países centrales) y sitios de recepción (jurisdicciones de países periféricos). Conviene ahora examinar algunos de estos conceptos. La influencia es, primero, una herramienta utilizada en historia de las ideas que se concentra en el conjunto de lecturas que una nación, autor o cultura ha hecho y que marca, a su vez, el estilo en que este receptor se expresa. Sin embargo, el concepto de influencia (a veces análogo al de “transplante” que se utiliza en derecho comparado) simplifica exageradamente el análisis: Se observa con frecuencia que si se descubre una “influencia” se es permitido dejar de hablar acerca del objeto directo de interés (lo influenciado) para proseguir examinando su fuente (lo influyente). Con esta sencilla esquematización, la teoría jurídica latinoamericana es fácilmente descartada y clasificada como un subproducto de la iusteorías naciadas en otras tradiciones. Así como en derecho comparado se predica la influencia que el sistema legal latinoamericano ha recibido
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
441
del nor-atlántico, así también su iusteoría parece ser un fenómeno dependiente de elaboraciones surgidas en otros lugares. Si se le compara con otros sitios periféricos de recepción, América Latina parece ser uno de los sitios iusfilosóficos menos interesantes ya que es considerado como un mero apéndice del pensamiento jurídico europeo. Con la noción de influencia también aparecen los conceptos de escuela y discípulo. Un maestro, el originador, posee ideas poderosas que, por vía de influencia son aceptadas por discípulos dentro de una escuela. Todo este lenguaje metafórico, proveniente del taller artesanal, fue importado a las dinámicas intelectuales de difusión e influencia. En ese orden de ideas, la iusteoría latinoamericana puede ser descrita como la influencia que TTD ha tenido en la región. El resultado ha sido la formación, por parte de discípulos, de escuelas locales que pretenden, no tanto transformar una doctrina, como defenderla y aplicarla a sistemas legales que se presumen convergentes con los contextos de producción de la teoría.30 Para los discípulos periféricos las opciones son estrechas: Pueden, primero, reproducir la obra original, tratando de mostrar una comprensión estándar de su significado y direccionalidad. En esta forma de recepción se evidencia aplicación, pero no originalidad. Esta opción es difícil de ejecutar luego de realizado el transplante teórico dada la distancia que siempre existe entre sitios de producción y sitios de recepción. En segundo lugar, el receptor periférico puede producir, y este términa siendo el escenario más común, una lectura subestándar de la obra original: realiza una mala lectura o transmutación que exige corrección y estandarización. Esta forma de barbarización del conocimiento se expresa en lecturas locales vulgares que se distancian del verdadero significado del autor. Baste con mencionar, para efectos de ilustración, la relación tormentosa de crítica y afecto que se siente hacia las vulgatas locales de Karl Marx y Hans Kelsen. Finalmente, está el camino de acceso a la originalidad, esto es, la participación activa en la producción iusteórica, ya sea dentro de una escuela o por fuera de las mismas, como fundador de un movimiento autónomo. Este camino de la originalidad, en cualquiera de sus dos formas, es raramente reconocido a iusfilósofos latinoamericanos que son siste-
30 Kelsen y Hart han sido “maestros” de las dos más importantes escuelas en la región, especialmente la escuela mexicana de Kelsenianismo y la escuela analítica argentina. A pesar de la evidente proximidad teórica de Kelsen y Hart en la TTD, parecen ser enemigos mortales en iusteoría regional.
442
DIEGO EDUARDO LÓPEZ MEDINA
máticamente clasificados como discípulos de escuela, y aún peor, como vulgarizadores (transmutadores) de ideas. Una forma privilegiada de develar la estructura epistemológica y política con la que se va creando una teoría transnacional del derecho consiste en analizar la publicación, entre 1945 y 1970, de la 20th Century Legal Philosophy Series, por parte de Harvard University Press. El objetivo de la serie, que alcanzó a publicar ocho volúmenes, era desensimismar a la cultura iusteórica estadounidense de su reconocido parroquialismo mediante la selección y traducción al inglés de la teoría del derecho que estaba siendo producida en otras partes del mundo. La serie constituye, en ese sentido, un claro esfuerzo de “internacionalizar” la filosofía del derecho, muy en consonancia con el clima general prevalente después de la Segunda Guerra Mundial. La serie, por esas razones, constituye un laboratorio excelente para examinar la formación de una filosofía internacional del derecho (TTD), al tiempo que revela con claridad el funcionamiento interno entonces prevalente de los conceptos de “influencia” y “transplante teórico”. La publicación de esta colección es tanto más reveladora si se considera que el tercer volumen de la serie fue dedicado a la filosofía legal latinoamericana en un libro del mismo nombre, Latin American Legal Philosophy, editado por Josef Laurenz Kunz, profesor de la Universidad de Toledo (Ohio, Estados Unidos). Los otros volúmenes de la serie, por contraste, son exclusivamente destinados a explorar el significado de ideas iusfilosóficas europeas. El tomo sobre América Latina es excepcional al ser el único que intenta dar cuenta de las ideas iusfilosóficas dominantes en países periféricos.31 Pero, como será evidente en el análisis subsiguiente, el propósito final es mostrar cómo América Latina es una extensión clara del proyecto civilizatorio de occidente, y en particular, de su concepción de juridicidad. Esta afiliación era asaz importante precisamente en la segunda postguerra, ya que la pretendida convergencia iusteórica facilitaba el proyecto de un derecho mundial que se desprendía de los nuevos desarrollos en derecho internacional y la creación de la ONU. La introducción al volúmen sobre iusfilosofía latinoamericana contrasta notablemente a las que se dedican,
31 Junto con la latinoamericana, hay sólo otro ejemplo de una iusteoría “exótica”: En 1951 se publica un volumen dedicado a la iusteoría soviética: Babb, Hugh (trad.), Soviet Legal Philosophy, Cambridge, Harvard University Press, 1951. En la Guerra Fría, sin embargo, la teoría soviética del derecho no puede ser considerada como “periférica”.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
443
por ejemplo, a Kelsen (volumen I),32 a la jurisprudencia alemana de intereses (volumen II),33 a la iusfilosofía de Lask, Radbruch y Dabin (volumen IV),34 a la teoría soviética del derecho (volumen V),35 a la traducción de los pasajes de interés iusteórico de Wirtschaft und Gesellschaft de Max Weber (volumen VI),36 al libro de Petrazycki sobre la relación entre derecho y moral (volumen VII)37, o, finalmente, a los institucionalistas franceses (volumen VIII).38 En las introducciones a estos libros se tiene la impresión de estar lidiando con tradiciones iusteóricas autónomas, complejas y altamente transformadoras de la cultura jurídica local. Esas escuelas son así el producto de procesos endógenos de evolución teórica, firmemente asentadas y con vocación de influir sobre la práctica cotidiana del derecho. Frente a estas tradiciones fuertes, los estadounidenses demuestran curiosidad de aprender y subrayan, ante todo, la diferencia y la originalidad con la iusteoría extranjera. En el volumen sobre América Latina, en cambio, el énfasis es puesto, no tanto en la autonomía, diferencia y originalidad, sino en la continuidad e influencia que los criollos exhiben respecto de los europeos. Por eso, América Latina y sus autores, aunque tratados con respecto, son una tradición iusteórica débil, en la que el mérito consiste, precisamente, en el mimetismo y la alineación con lo europeo. Igualmente notable es el alto nivel de abstracción de la iusfilosofía latinoamericana, verdaderas reflexiones profesorales que, a diferencia de sus contrapartes europeas, se ubican a gran distancia de las preocupaciones corrientes de la práctica profesional. Resulta ilustrativo analizar la Introducción que Joseph Kunz escribe para el volumen Latin American Legal Philosophy, de 1948. El texto comienza citando a un jurisconsulto y comparativista latinoamericano, Enrique Martínez Paz, quien acepta el truísmo de que “en todas las na32 Kelsen, Hans, General Theory of Law and State, Cambridge, Harvard University Press, 1945. 33 Schoch, Magdalena (ed.), The Jurisprudence of Interests, Cambridge, Harvard University Press, 1948. 34 Wilk, Kurt (ed.), The Legal Philosophies of Lask, Radbruch and Dabin, Cambridge, Harvard University Press, 1951. 35 Babb, Hugh, Soviet Legal Philosophy, Cambridge, Harvard University Press, 1951. 36 Rheinstein, Max (ed.), Max Weber on Law in Economy and Society, Cambridge, Harvard University Press, 1954. 37 Petrazicky, León, Law and Morality, Cambridge, Harvard University Press, 1955. 38 Broderick, Albert (ed.), The French Institutionalists, Cambridge, Harvard University Press, 1970.
444
DIEGO EDUARDO LÓPEZ MEDINA
ciones latinoamericanas, el pensamiento jurídico filosófico ha seguido en su evolución, aunque con cierta tardanza, el ritmo del pensamiento europeo continental.”39 La iusfilosofía, así entendida, es una empresa conjunta, universal, que se encamina progresivamente hacia la develación de la esencia del derecho. Algunos, sin embargo, por estar ubicados en regiones periféricas del mundo, parecen empeñarse en reinventar la rueda con cierta tardanza.40 Luego de establecer esta premisa de continuidad teórica, el texto de Kunz es una presentación de los principales tópicos de iusfilosofía latinoamericana en la primera mitad del siglo XX. Esta presentación nos ayudará a definir el cambio de enfoque que yo quisiera proponer para la iusfilosofía latinoamericana. En especial, la “introducción” de Kunz saca a la superficie las condiciones de posibilidad de iusteorías locales y periféricas dentro de la estructura cognitiva de la teoría transnacional del derecho en boga a mediados del siglo XX. La primera y muy importante caracterización que hace la “introducción” de Kunz es que la iusfilosofía latinoamericana no es, en ningún sentido de la palabra, propiamente latinoamericana. El pensamiento jurídico en la región pertenece a una comunidad más amplia de pensamiento europeo,41 por lo menos de dos maneras: Por un lado, la iusfilosofía local puede ser esquematizada y periodizada en fases que son una mera proyección de los esquemas y periodos propios del pensamiento europeo; por el otro, la iusfilosofía local responde al predicamento general del “hombre moderno”, quien termina siendo, una vez más, una proyección de la crisis de la modernidad que el pensamiento europeo estaba entonces comenzando a articular en el periodo entreguerras tal y como lo des-
39 Kunz, Joseph (ed.), “Latin American Legal Philosophy”, 20th. Century legal Philosophy Series, vol. III, Cambridge, Harvard University Press, p. XIX. 40 Véase Bloom, Harold, A Map of Misreading, Oxford University Press, Oxford, 1995. En este libro Bloom resalta la relevancia del “atraso” y del “llegar tarde” en la dinámica de la influencia poética. Como mostraré infra, la grilla de análisis de Bloom ofrece una mirada profunda a la cuestión general de la influencia en la iusfilosofía. 41 La misma comunidad es subrayada por J. Mayda cuando hace el mapa de los diferentes usos de la palabra “jurisprudencia” en pensamiento legal. Mencionando al jurisconsulto brasileño Miguel Reale, Mayde habla de ideas legales “formuladas en el contexto de la tradición europeo-latinoamericana”. Mayda, Jaro, Francois Geny and Modern Jurisprudence, Baton Rouge, Louisiana University Press, 1978, p. 109.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
445
cribió en su momento la fenomenología husserliana.42 A continuación examino en mayor detalle esta doble proyección. En primer lugar, Kunz ofrece una periodización del pensamiento iusfilosófico latinoamericano que está claramente marcada, no por eventos o circunstancias propias de la región, sino por el marco de referencia de la filosofía general europea. La periodización resultante es extraña; la sincronía es difícil de comprender, incluso para latinoamericanos que acepten sin objeción el proyecto de asimilación regional a Europa. De acuerdo a Kunz, “en el periodo colonial de Latinoamérica, la filosofía escolástica prevaleció. Después del comienzo de la independencia, la influencia francesa fue esencial en toda Latinoamérica. Esto significó, en la filosofía del derecho, la predominancia del derecho natural francés del siglo XVIII”.43 Justo después de esta época de iusnaturalismo, “los pensadores latinoamericanos trataron de destruir las doctrinas teológicas y metafísicas y, para lograr este fin, hicieron uso de Herbert Spencer y, especialmente, de Auguste Comte”. Este periodo que abarca de 1870 hasta 1925 estuvo dominado “por un positivismo agnóstico, desdeño por la metafísica, hostilidad hacia el derecho natural, repudio de la especulación metafísica por su carácter acientífico, y por el creciente prestigio de las ciencias naturales”. Después de 1925, la dominación de la filosofía de Comte comenzó a desvanecerse, siguiendo nuevamente los sucesos europeos: “La situación actual —diagnostica Kunz en 1948— se caracteriza por el hecho de que la filosofía general y la filosofía del derecho latinoamericanas han seguido de nuevo el ritmo del pensamiento europeo continental, especialmente un desarrollo dual de la filosofía y la jurisprudencia alemana y austríaca”. Este “desarrollo dual” se refiere, según Kunz, al transplante jurisprudencial del neo-Kantianismo de Marburgo,44 en primer lugar, y enseguida, de la teoría pura del derecho de Hans Kelsen.45 A partir de la preponderancia regional de este desarrollo dual, el volumen editado por Kunz pretendía dar una visión global del 42 Una lectura Husserliana de las faenas de la teoría jurídica, una lectura de la razón en crisis en América Latina se manifiesta, por ejemplo, en el trabajo del colombiano Nieto Arteta, Luis E., Lógica, fenomenología y formalismo jurídico, Medellín, Universidad Bolivariana, 1941. 43 Kunz Joseph, Latin American Legal Philosophy, supra, nota 39, p. XIX. 44 “El mismo movimiento [como el de Europa] contra el positivismo y hacia el neo-kantianismo tuvo lugar en la jurisprudencia latinoamericana”. Ibidem, p.XX. 45 “Pero la mayor influencia en la teoría latinoamericana del derecho la ejerce en la actualidad Hans Kelsen”. Ibidem, p. XIX.
446
DIEGO EDUARDO LÓPEZ MEDINA
pensamiento legal de vanguardia en la región. Por tal razón, el libro es una vitrina de autores latinoamericanos para el naciente mercado estadounidense de teoría transnacional del derecho. Los autores escogidos son un guatemalteco-español, Luis Recaséns Siches; un argentino, Carlos Cossio; un mexicano, Eduardo García Máynez; y por último, un uruguayo, Juan Llambías de Azevedo. Aunque la hegemonía de Kelsen era obvia en todos estos autores, también era cierto que ellos estaban transplantando hacia la región otros tipos de filosofía académica contemporánea, a saber, la fenomenología (Husserl)46 y el existencialismo (Heidegger). Esta influencia marcada tanto de la filosofía como de la iusfilosofía alemanas genera la ficción de un espacio transnacional en el que el comentarista local puede divagar libremente en compañía de sus colegas europeos: “Puesto que la filosofía del derecho de los autores arriba citados acepta, en distinto grado, las filosofías de Husserl, Scheler, Hartman, Dilthey, Heiddeger y Ortega y Gasset, es pertinente considerar el estatus de estas filosofías”.47 La voz de los influenciados deja de hablar por sí misma, y los influyentes retoman la prioridad: “Es el movimiento fenomenológico el que inspira la mayor parte de la jurisprudencia latinoamericana. Por consiguiente sería de ayuda describir brevemente ciertas características destacadas de la filosofía fenomenológica ya que los escritos presentados en este volumen están muy relacionados con ella...”.48 Mediante este expediente, Kunz crea una comunidad intelectual imaginada y América Latina ahora se mueve imaginariamente hasta el corazón mismo de la discusión intelectual en Europa: entender la jurisprudencia local coincide con la comprensión del neo-kantianismo de Marburgo o la fenomenología de Husserl. Se forma así una tradición iusteórica europeo-latinoamericana. La “introducción” de Kunz, coherente con sus presupuestos, describe con mayor cuidado a los influyentes europeos que a los influenciados americanos, no obstante que el objetivo explícito del libro fuese dar a conocer en los Estados Unidos el trabajo de punta de la filosofía del derecho latinoamericana. Los cuatro autores locales escogidos son así reduci46 “La fenomenología juega un papel importante en la filosofía del derecho contemporánea en América Latina, y más aún como consecuencia del hecho de que las teorías de valores y la filosofía de la vida dominantes han sido desarrolladas fenomenológicamente”. Ibidem, p. XXIII. 47 Ibidem, p. XXXV. 48 Ibidem, p. XXII.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
447
dos a meras extensiones de maestros europeos: “La filosofía de la vida, especialmente en las ideas de Ortega y Gasset, es básica en la filosofía del derecho de Recaséns (sic) Siches. El existencialismo de Heidegger y, específicamente, su concepto de “temporalidad”, es uno de los cimientos de la “teoría egológica del derecho” de Cossio”.49 A renglón seguido el lector se entera de que los argumentos de García Máynez son “exactamente el razonamiento de Verdross, y, como Verdross, García Maynez es inevitablemente llevado por él hacia el derecho natural”.50 En el caso de Llambías de Azevedo, “el autor es un seguidor cercano de Scheler y Hartmann”, pero “él no lleva a cabo una verdadera investigación fenomenológica en el sentido de Husserl”. La influencia europea en la jurisprudencia local constituye su nota central: “Las ideas de Husserl, Scheler y Hartman son, en palabras de los propios autores, aceptadas como los presupuestos básicos de sus ensayos”.51 Como un segundo medio de generar la comunidad que se necesita para formar la TTD, Kunz afirma que, respecto a su propósito intelectual y político, “es como hombres modernos de la cultura cristiana occidental en este periodo histórico que los filósofos latinoamericanos del derecho aceptan estas filosofías”52 europeas. Este “periodo histórico”, de acuerdo a Kunz, está marcado por “una época de inmensa crisis para la totalidad de la civilización cristiana occidental. «La historia de la axiología moderna» dice Wilbur M. Urban, «es en cierta forma la historia de una cultura —la cultura europea— luchando por su vida»”.53 Esta crisis de la “cultura europea” que igualmente sufren los latinoamericanos está conformada por la transformación de los valores, por la destrucción de la fe en el progreso y la ciencia, por los cambios que la tecnología ha llevado a cabo, por la ansiedad que la burguesía siente ahora ante ideas que antaño parecían ser muy fuertes, por nuevas guerras de una magnitud nunca antes imaginada, e, incluso, por la permanente amenaza de la bomba atómica. Todas estas circunstancias afectan a la comunidad de una América Latina europea, cristiana y civilizada (así sea en estado de crisis). Ésta es una forma de aceptar que el trabajo de la iusfilosofía está enraizado en las circunstancias materiales de la vida. Sin embargo, 49 50 51 52 53
Ibidem, p. XXV. Ibidem, p. XXXIV (énfasis añadido). Ibidem, p. XXXIII (énfasis añadido). Ibidem, p. XXXVI. Ibidem, p. XXXVI.
448
DIEGO EDUARDO LÓPEZ MEDINA
este enraizamiento es en verdad extraño, inventado, imaginario, un producto de una creciente comunidad de pensadores iusfilosóficos, todos interesados en convergir entorno a una TTD de alcance europeo-latinoamericano. Latinoamérica parece estar respondiendo con las mismas teorías y a los mismos retos que el hombre europeo vive después de la Segunda Guerra Mundial. El latinoamericano y su derecho, según esta imagen, se encuentran ellos mismos en crisis luego de la Segunda Guerra Mundial. Otra importante característica de esta continuidad imaginada de pensamiento iusfilosófico entre Europa y América Latina tiene que ver con el hecho de que la jurisprudencia se concibe como la actividad erudita de estudiosos filosóficos que reflexionan sobre el derecho en condiciones de extrema abstracción y lejanía de la práctica diaria del derecho. En este sentido, la filosofía del derecho latinoamericana contrasta notablemente, por su abstracción y academicismo, con la producción análoga que se hace en la TTD de la época: piénsese, por ejemplo, en el típico Freirechtler alemán,54 o en el instituticionalista francés, ambos dispuestos a desarrollar una jurisprudencia aplicada, con altos niveles de rendimiento práctico. La periodización iusfilosófica que Kunz hace para América Latina puede que haya sido verdadera en las bibliotecas personales de ciertos iusfilósofos y profesores de derecho, pero carece de sentido para los circuitos efectivos que conforman la derecho en su práctica diaria. En la descripción de Kunz, una iusfilosofía local está constituida exclusivamente por la alta teoría de eruditos y no por las ideas que han penetrado en la profesión legal (a la que quisiera denominar jurisprudencia pop).55 La alta teoría, tal como la practican muchos jurisconsultos latinoamericanos, es principalmente “teoría de teóricos”, i. e., el ejercicio de involucrarse “en polémicas teóricas que lo poco que consiguen es alimentar un metadiscurso perpetuo, auto-referencial y a menudo vacuo sobre conceptos tratados como tótemes intelectuales”.56 Los iusteóricos de “alta teoría” a menudo piensan en un modo de “discurso profético o programático que se origina en la disección o la amalgama de otras teorías con
54 Véase al respecto, Albert Foulkes, “On the German Free Law School (Freirechtsschule)”, Archiv für Rechts- und Sozialphilosophie, 1969. 55 Desarrollaré más delante de manera más detallada la distinción entre “alta teoría” y “teoría pop”. 56 Tomo la expresión “teoría de teórico” de Bourdieu y Wacquant, An Invitation to Reflexive Sociology, Chicago, Chicago University Press, 1991, p. 161.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
449
el único propósito de confrontar otras «teorías de teóricos» puras”.57 Esta dirección, hacia el predominio en la filosofía del derecho de la “alta teoría”, es necesaria para crear la comunidad internacional de pensamiento que se estructura en torno a la TTD. Para la TTD sería mucho más difícil formar un campo transnacional de filosofía jurídica si, en vez de teoría de teóricos, se examinara a profundidad las convicciones iusteóricas efectivas dominantes en una comunidad jurídica realmente existente. En ese sentido, si la verdadera misión de la filosofía del derecho fuera la de explorar la jurisprudencia pop de una jurisdicción, la TTD no se entendería como una actividad universal sobre la definición del derecho. La jurisprudencia pop,58 con su transmutación de los insumos aparentemen57 58
Idem. La “jurisprudencia pop” es mi propia manera de recrear una forma de ver la jurisprudencia que tiene una clara arqueología que no he explicado en el texto. Brevemente haré en esta nota un recuento de los estratos formativos de los que soy consciente: Primero, el trabajo de Savigny fue pionero en su esfuerzo de definir una teoría legal que no fuera una mera continuación de posiciones filosóficas generales. La reflexión de Savigny muestra que la teoría legal puede ser importante y autónoma puesto que hay objetos dentro de ella que ameritan atención por sí mismos. La jurisprudencia pop, entonces, participa del desplazamiento de la filosofía del derecho hacia la teoría jurídica logrado en el nacimiento, en Alemania, de una Methodenlehre (una ciencia de métodos jurídicos). Véase Casanovas, P. y Moreso, J. J. El ámbito de lo jurídico, Barcelona, Crítica, 1994, p. 8. En segundo lugar, y en cierta forma paralelo a las preocupaciones de Savigny, François Gény insiste en el hecho de que la filosofía legal no debería ser “filosofía profesional” sino “filosofía progresiva del sentido común... filosofía del derecho en el sentido de crítica filosófica de la ciencia del derecho, siguiendo el modelo de crítica en las varias ciencias naturales y sociales”, y por consiguiente llevada a cabo “en términos propios de la misma”. La philosophie du sense comun progressif “nace espontáneamente de la reflexión atenta y se pule a sí misma por medio de una contínua integración de elementos de la experiencia colectiva”. Gény, François, Science et technique en droit privé positif: nouvelle contribution à la critique de la mèthode juridique, 73, París, Sirey, 1912. Esta manera de ver la filosofía del derecho como una “filosofía de acción” (Gény, op. cit., supra, p. xiv) está cercanamente relacionado con la “filosofía experimental” de Dewey y probablemente con la “sociología reflexiva” de Bourdieu. Savigny y Gény son, sin embargo, ejemplos más bien raros dentro del pensamiento jurídico europeo en donde el pensamiento abstracto sigue siendo el estándar corriente. Para ellos el punto esencial es poder relacionar la teoría y la práctica jurídicas: para Savigny lo importante era poder estar en posesión de “verdadera experiencia”. Para tener una “experiencia verdadera es necesario tener siempre un conocimiento claro y vívido del todo, para poder comprender efectivamente en su totalidad el caso particular: sólo el teórico puede lograr que la práctica sea fructífera e instructiva”. Savigny, De la vocación de nuestro siglo para la legislación y la ciencia del derecho, Buenos Aires, Heliasta, 1977, p. 142. Gény, mientras tanto, rechaza la noción según la cual “la teoría no tenga influencia en el desarrollo verdadero de la práctica jurí-
450
DIEGO EDUARDO LÓPEZ MEDINA
te universales, exige por tanto la reivindicación de la teoría local o particular del derecho, desde una concepción perspectivista y difusionista. La alta teoría, por otra parte, aspira a una transferencia más expedita de conocimiento a través de canales transnacionales ya que, según sus presupuestos, la filosofía del derecho es necesariamente universal o general. Dejando por ahora de lado el tópico, bastante más tradicional, de la “influencia” intelectual, quisiera presentar ahora otra manera de conceptualizar el espacio abierto entre la producción y la recepción por medio de la idea, debida al crítico literario Harold Bloom, de mala lectura, lectura tergiversada o, mejor aún, transmutación.59 Aunque Kunz pretende dica... la alternativa no es sacrificar la práctica por la teoría. La pregunta es si la prácti ca ilustra da no logra sus me tas con gran certe za y de for ma más comple ta que la prácti ca cie ga... cuando la pregunta se hace de esta manera, no puede haber duda respecto a la respuesta”. Gény, Science…, cit., supra, p. xiv. En la jurisprudencia angloamericana, por otra parte, la idea de “jurisprudencia pop” está vagamente inspirada en la insistencia de Llewellyn de identificar el “estilo” de una época mediante la lectura de la literatura por ella producida. Luego de Llewellyn muchos otros iusteóricos insisten, implícita o explícitamente, en desarrollar la teoría jurídica con el propósito, no de construir la erudición del estudiante, sino de ofrecer un análisis puntual de la cultura jurídica dominante. Véase Llewellyn, Kart, The Common Law Tradition: Deciding Appeals, Boston, Little, Brown & Co., 1960, p. 6 (“Demostraremos también que las decisiones judiciales de hoy, en sí mismas, dan excelentes indicaciones de qué tipo sentido jurídico están funcionando”). Llewellyn también decide estudiar “el estilo general de un periodo general y su promesa futura”. Id., p. 34. El presente texto puede verse como una reconstrucción de los estilos de período de una jurisprudencia local. 59 Bloom utiliza en inglés los términos misreading and misread para referirse al proceso de mutación que ejecuta el lector sobre la obra original. Esta transformación, a pesar incluso de ser una “mala lectura”, no es simplemente una falta de comprensión: es, de hecho, la única posibilidad de originalidad hacia el futuro. La teoría bloomiana del misreading ha puesto en jaque la comprensión tradicional de la “originalidad”, ya que, según él, nada es original en lo absoluto sin estar inscrito en alguna cadena traslaticia y traidora de “malas lecturas” consecutivas. Esta forma de ver el proceso creativo tiene importantes repercusiones para el derecho ya que, a un nivel meramente dogmático, impactaría la noción de originalidad que se requiere para la protección jurídica de obras mediante los derechos de autor. Al respecto, véase “Note: Originality”, 115, Harvard Law Review, 1988, 2002. La traducción al español de este concepto bloomiano es realmente difícil. Algunas de las posibilidades de traducción más literal son “mala lectura” y su forma verbal, “leer mal” (Amed, Amir, Orientales: Uruguay a través de su poesía, [http://www.henciclopedia.org.uy/autores/Hamed/Orientales1.htm], “lectura errónea” (Bello, Javier, El problema de la postmodernidad, http://www.uchile.cl/cultura/poetasjovenes/naufragos4.html, y “lectura personal” (Bello, op. cit., supra). Las opciones más literales, sin embargo, invocan con demasiada fuerza un componente peyorativo en sentido de sancionar implícitamente a quien “lee mal”. La palabra española malinterpretación
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
451
presentar la naturaleza mimética de la iusfilosofía latinoamericana como una fortaleza en medio de la división geopolítica entre bloques ideológicos, es ampliamente aceptado en los imaginarios corrientes que la iusfilosofía latinoamericana es una reproducción roma y carente de brillo de sus contrapartes del norte. La repetición y mimetismo, contrario a lo que opina Kunz y otros pensadores ideológicamente motivados, es una desventaja notable en la ejecución de la tareas científicas de la iusfilosofía. Más aún: la iusfilosofía local carece totalmente de interés debido a que, además de copiar, raramente se aventura a ir más allá de lecturas parciales y tergiversadas de autores que son “mejor” comprendidos en ambientes hermenéuticos ricos. Los transplantes teóricos de otras partes, por consiguiente, reemplazan la producción de una iusfilosofía local que realice las tareas de la teoría. Adicionalmente, las importaciones o transplantes jurisprudenciales son escasos, azarosos, episódicos y fragmentarios: La difícil empresa hermenéutica de entender el corpus iusfilosófico de una tradición o de un autor es reemplazada por una recepción al detal de libros y argumentos aislados, generalmente extraídos de sus contextos materiales e intratextuales. Estas porciones de información son leídas, además, sin el beneficio de compartir con el autor los prejuicios que permiten la lectura estandarizada de sus argumentos.60 Los iusfilósofos que trabajan desde tradiciones académicas poco prestigiosas y periféricas usualmente no participan de manera creíble en la empresa hermenéutica de entender y desarrollar los argumentos iusfilosóficos que circulan en la TTD. Ellos participan, si es que lo hacen, en la transmisión y reproducción locales de nuevas doctrinas e ideas de pretensiones más universales. En este modelo de dependencia y subordinación teórica, los actores locales son despojados de agencia en la producción válida de saber iusteórico. Las jurisprudencias locales parecen estar condenadas al constante se acerca más a la estructura y significado de misreading. Para el verbo leer, en cambio, no hay una palabra igual (¿malectura?). Para Bloom, en cambio, to misread es una actividad creativa en sí misma, la única posibilidad de verdadera creatividad. En ese sentido prefiero opciones no literales para traducir misreading y misread: En texto utilizaré la palabra transmutación (también en Bello, op. cit., supra). Dentro del mismo campo semántico están las palabras transversión (que debo a mis estudiantes de la Universidad Libre), tergiversación y lectura tergiversada (Baños Orellana, Jorge, El escritorio de Lacan, Oficio Analítico, 1999. En teoría literaria existen varias palabras emparentadas con la idea bloomiana: palimsesto, pastiche, precursividad, pensamiento traslaticio, etcétera. Sobre estas relaciones se habla infra en el texto. 60 Véase Gadamer, H. G., Verdad y método, Salamanca, Sígueme.
452
DIEGO EDUARDO LÓPEZ MEDINA
vaivén de modas intelectuales que no se relacionan completamente con las circunstancias y contextos político-jurídicos concretos que se supone tienen el deber de teorizar y explicar. Las influencias y las lecturas tergiversadas conducen a los conceptos, aún más peyorativos, de copia y plagio.61 Los conceptos que hasta aquí he utilizado, influencia, mala lectura, transmutación, imitación, copia y plagio definen, aunque con matices, el espacio vacío entre producción y recepción en jurisprudencia. Marcadores geopolíticos y jerárquicos como centro y periferia, sitios de producción y sitios de recepción, jurisdicciones prestigiosas y no prestigiosas, tradiciones fuertes y tradiciones débiles, también ayudan a definir preliminarmente el sentido en el que ocurre el flujo de ideas y teorías. La trayectoria de las ideas empieza usualmente en lugares de producción en Occidente (Francia, Alemania, Estados Unidos) prosigue por sitios intermedios de traducción y difusión en la semi-periferia (México, Argentina y ahora, quizás, Colombia, son ejemplos de dichos sitios intermedios en Latinoamérica) para llegar, por último, a lugares de (aparentemente) pasiva y total recepción. Este trabajo, primero, acepta esta posición de dependencia. Pero, al siguiente paso, da suficientes razones para desafiar este diagnóstico. Mi argumento, no consiste en denunciar la estructura internacional del saber que quita agencia a las teoría locales de la periferia. En ese sentido, el argumento que propongo no conduce a la emancipación intelectual por el camino ya sugeridos por los teóricos de la dependencia62 o la subalternidad.63 Mi objetivo es mostrar cómo, sin necesidad de variar la estructura universal de producción de conocimiento, hay mucho que los iusteóricos locales podemos hacer para redimir las tareas científicas de la iusteoría 61 Los matices de significado en estos conceptos pueden verse, por ejemplo, entre Kelsen y su emblemático seguidor latinoamericano, el argentino Carlos Cossio. La relación de odio-amor entre padre e hijo se desarrolló bajo el sutil tema de qué tanto del pensamiento de Cossio era creativo y qué tanto era simple plagio (como finalmente Kelsen llegó a pensarlo). El paso inaceptable por parte de Cossio, de acuerdo a Kelsen, fue la publicación de un solo volumen titulado “Kelsen-Cossio”, que contenía tanto las conferencias de Kelsen en Buenos Aires en 1949 como las opiniones de Cossio. Tal como lo cuenta Rudolf Metall, el biógrafo de Kelsen: “Kelsen tuvo que tomar fuertes medidas para hacer que se retirara de circulación este libro no autorizado, además de que verse involucrado por Cossio en una controversia que duró hasta 1953”, Metall, Rudolf, Hans Kelsen, vida y obra, Universidad Autónoma de México, p. 94, 1976. Metall rechaza la teoría de Cossio, la así llamada “teoría egológica”. 62 Furtado, Celso, Obras escogidas, Bogotá, Plaza & Janés, 1982. 63 Bhabha, Homi K., The Location of Culture, Londres, Routledge, 1994.
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
453
en países periféricos o semiperiféricos. Para empezar a cambiar la visión de que América Latina es dependiente del centro en iusfilosofía no necesito empezar por negar lo obvio: que el pensamiento local se ha formado en procesos miméticos, en cadenas traslaticias frente al iusfilosofar del Norte del Atlántico. No requiero, por tanto, tratar de mostrar un vibrante mundo intelectual local, criollo o precolombino, para justificar una originalidad independiente de la influencia del centro. No necesito reconstruir una legalidad ancestral y terrígena que se oponga a la legalidad occidental. Esta vía, criolla y precolombina, también ha sido intentada por autores locales interesados en la fundación antagónica de una filosofía periférica propia.64 Las dos estrategias así esbozadas me parecen insatisfactorias: La primera, suponer que América Latina es tan sólo extensión de ideas universales, conduce efectivamente, como han señalados los teóricos de la dependencia, a una posición intelectual alienada en la que la reflexión no cumple el trabajo esencial de diagnosticar las realidades y necesidades locales para ofrecerles caminos de debate y solución; la segunda estrategia consiste en negar la dependencia y reinventar, usualmente mediante la historia de lo más terrígeno o propio, el carácter completamente original de lo local. No se trata, pues, ni de mera copia ni de pura originalidad. El espacio entre producción y recepción de teorías es mucho más interesante que lo que tienden a indicar los conceptos de influencia, mala lectura, imitación, copia y plagio. En realidad, la iusteoría particular es en sí misma una actividad de producción y no de mera recepción. Una de sus principales limitaciones, la lectura dentro de ambientes hermenéuticos pobres, origina al mismo tiempo una de sus características más fascinantes: la iusteoría latinoamericana no simplemente copia o imita. En vez de ello, cambia y transforma (tergiversa o transmuta en el sentido muy especial de Bloom) todo lo que toca. De esta forma puede ser que, al final, las teorías meramente imitativas de países no prestigiosos en ius filosofía terminen siendo tan ricas en sugerencias y desarrollos como la de las tradiciones fuertes y reconocidas. El esquema general de mi argumento es éste: En los sitios de recepción de iusfilosofía ocurren importantes transmutaciones o tergiversación de las ideas provinientes de los sitios de producción. Esas ideas, a pesar de ser transmutaciones o tergi64 Ejemplos de esto se dan especialmente en temas como el marxismo político y la etno-ecología, etcétera.
454
DIEGO EDUARDO LÓPEZ MEDINA
versaciones, no pueden ser desestimadas, sin más, por tratarse de productos miméticos o traslaticios. No se trata de “errores” que requieran de correción mediante ajustamiento a la lectura estandarizada que se hace en otros sitios. Las transmutaciones terminan siendo, para bien o para mal, el inventario disponible de ideas iusfilosóficas disponibles en una jurisdicción. En ese sentido, las lecturas tergiversadas no pueden ser reemplazadas por lecturas normalizadas. Las lecturas tergiversadas han impulsado prácticas jurídicas locales, y, por tanto, están ya imbricadas con la cultura local produciendo dinámicas, pasadas y futuras, que ya no se pueden deshacer. Para hay aún más: no es simplemente por fatalidad que debemos conformarnos con la transmutación eidética que produce la recepción. No se trata simplemente que un error teórico se haya vuelto moneda corriente a través de tergiversaciones locales (como usualmente se denuncia de la recepción vulgar de la Teoría pura del derecho de Hans Kelsen). Muy por el contrario: En la lectura tergiversada se abre la posibilidad de variación, adaptación y verdadera creación. El estudio cuidadoso de estas transformaciones revela usos locales tan, o incluso más interesantes, que la historia natural de esas mismas ideas en contextos de producción. Para sólo mencionar algunos de los efectos transmutativos, es notable observar, por ejemplo, cómo iusteorías, que son consideradas aliadas o cercanas en TTD, terminan conviertiéndose en las insignias de luchas y disensos en la jurisprudencia local. Escritos y teóricos iusteóricos cambian su significado normalizado en contextos de producción y asumen nuevas responsabilidades y direcciones en contextos de recepción. De esta manera, y sólo como un ejemplo preliminar, las obras de Kelsen y Hart, que desde la visión de una TTD normalizada ocupan el espacio común del positivismo jurídico, terminan siendo enfrentadas en la jurisprudencia local mucho más allá de las diferencias de detalle ya conocidas por los académicos al Norte del Atlántico. En los usos que se hacen de estas teorías en la jurisprudencia regional, Hart y Kelsen son tótems teóricos de un serio conflicto jurídico que va más allá que las diferencias internas de matices fácilmente aceptables dentro del campo positivista: de hecho, en contextos de recepción, Kelsen y Hart son ubicados en campos diametralmente opuestos de la teoría jurídica. Para agregar a la sorpresa, también es importante mostrar cómo Hart y Dworkin, cuyas iusteorías son estándarizadamente descritas como un “debate”, terminan siendo en América Latina aliados en el proceso de crítica y transformación de la teoría local del derecho en el último cuarto del siglo
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
455
XX. Estos efectos transmutativos me parece que llaman a la sorpresa, y no al desdén. La respuesta adecuada frente a estos efectos transmutativos debe apuntar hacia el estudio sistemático de cómo se producen transmutaciones teóricas y cómo ellas dan forma a culturas jurídicas reales; la respuesta inadecuada es el desprecio por el error y el mimetismo de tradiciones iusteóricas pobres, la correción inmediata mediante la internalización de lecturas estandarizadas y la reconstitución ficticia de una TTD que, finalmente, no puede explicar el inventario efectivo de ideas que constituyen la cultural jurídica local. Quisiera en todo caso aclarar un punto de la mayor importancia: no estoy interesado, per se, en lecturas tergiversadas o transmutaciones de autores al Norte del Atlántico. No me interesa, per se, las transmutaciones del pensamiento kelseniano: Me interesa cómo la transmutación del pensamiento kelseniano es importante para entender el concepto local que del derecho se ha forjado la iusteoría del sitio donde yo practico y enseño derecho. La detección y descripción de las formas como la transmutación ha generado cultura jurídica local es una forma privilegiada, primero, de cumplir con los fines científicos que cualquier teoría está llamada a realizar, y segundo, de generar un sentido de tradición, relevancia y autoestima que la teorización periférica ha sido incapaz de obtener, sofocada, en lo externo, por una cierta incompetente marginalidad que resulta de una irrepresible ansiedad de absorber la TTD como forma definitiva de la iusteoría, y en lo interno, por el totalitarismo de la concepción profesionalizante del derecho aún dominante entre profesores y estudiantes de la región. ¿Cuál es la posible utilidad de esta estrategia de estudiar las transmutaciones teóricas? ¿Tenemos, como parece ser la opinión prevalente, que enderezar y corregir estas malas lecturas que se generan en contextos de recepción? Como ya lo manifesté, pienso que no. Pienso, por el contrario, que tenemos que explorar sistemáticamente esas malas lecturas, al menos por dos razones. En primer lugar, esta historia de malas lecturas constituye, sin que importe qué pensamos sobre ello desde la aparente superioridad de la TTD, la jurisprudencia relevante y efectiva de sistemas jurídicos locales. Existen, sin duda, sistemas jurídicos reales en América Latina y estos sistemas jurídicos tienen prácticas que son, en algún nivel, intermediadas o articuladas por proposiciones abstractas (de naturaleza teórica) sobre qué es en general el derecho. Sostengo que este sis-
456
DIEGO EDUARDO LÓPEZ MEDINA
tema de proposiciones teóricas que intermedian las prácticas locales no forma un continuo con TTD como la mayoría de la gente lo afirma, aunque, por otro lado, no se trata de una tradición indígena independiente de TTD. Las jurisprudencias realmente dominantes en América Latina tienen ciertamente mucho de TTD pero estos transplantes jurisprudenciales han sido (en el sentido creativo y sorprendente que he tratado de estipular) mal-leídos y mal-apropiados en formas muy complejas. La descripción y el análisis de los procesos de mala lectura son un paso inevitable en la consciente autoapropiación de jurisprudencias particulares, usualmente invisibilizadas por la ficción de una continuidad no problemática con la TTD. En segundo lugar, pienso que las lecturas tergiversadas son importantes, ya no sólo para la refundación de teorías locales con altos niveles de autoestima y relevancia, sino también incluso para la animación y dinamización de la discusión en la TTD. Si se llegara a apreciar el valor de las tergiversaciones y transmutaciones teóricas, los países teóricamente periféricos podrían terminar aportando a TTD nuevos puntos de vista sobre la riqueza y posibilidades de un autor, una idea o un argumento. En ese sentido, las jurisprudencias locales tendrían mucho que aportar a un caleidoscopio universal de transmutaciones en iusteoría, en vez de asumir que ciertas lecturas estándar centrales tienen derechos a la hegemonía universal. Se podría incluso ir más lejos y afirmar que aquellas teorías, argumentos y autores que se han elevando al espacio de una TTD objetiva y universamente válida son, a su vez, simplemente el producto de jurisprudencias también locales, claro está, altamente prestigiosas, que de alguna manera se las han ingeniado para volverse mercancías transnacionales. Este trabajo iusteórico tratará de sustentar la tesis general según la cual es necesario y divertido develar los procesos de transmutación iusteórica que se producen entre sitios de producción y sitios de recepción. Este tipo de estudios es necesario, primero, porque sin un análisis de las transmutaciones no puede reconstruirse una teoría cultural del derecho en América Latina que cumpla los objetivos científicos del cualquier discurso teórico. Además este enfoque resulta divertido, porque se trata de mostrar cómo para el caso de América Latina las lecturas transmutativas (a pesar de su naturaleza heterodoxa y subestándar) pueden ser tan fascinantes y enriquecedoras como la experiencia de emprender lecturas ortodoxas y estándares de autores iusfilosóficos. Las lecturas tergiversadas
KELSEN, HART Y DWORKIN EN HISPANOAMÉRICA
457
crean la misma experiencia de satisfacción y logro que uno alcanza cuando uno entiende una argumentación teórica en un sentido más estricto y tradicional. Paradójicamente, una vez más, estos tipos de lecturas podrían terminar enriqueciendo de una manera mucho más dinámica estudios autoriales de TTD (dándole quizá más diversidad a las florecientes industrias de exégesis kelseniana, hartiana o dworkiniana) en los que eruditos periféricos muy pocas veces tienen éxito profesional.
!
EL SIMULACRO DE LA READAPTACIÓN Dante LÓPEZ MEDRANO* La categoría de lo simbólico, hoy no solamente aceptada sino de un uso bastante común, ha condensado un gran flujo de ideas que en ocasiones hace imposible comprender qué se quiere entender o qué se nos da a entender con el empleo del término. Es por ello que al construir nuestro objeto nos vemos precisados a explicar lo que debería permanecer en forma implícita. Para la tradición idealista, tanto la kantiana como neokantiana, los sistemas simbólicos son instrumentos de conocimiento y de construcción del mundo objetivo. La tradición estructuralista, fundada por F. Saussure, pretende aprehender la lógica de las formas simbólicas, su estructura inmanente. Y la tradición marxista privilegia las funciones políticas de los sistemas simbólicos. Esto nos lleva a comprender los instrumentos simbólicos en una triple dimensión: como estructuras estructurantes, como estructuras estructuradas y como instrumentos de dominación.1 Las estructuras objetivas tienden a producir prácticas que le son ajustadas. Entre las estructuras y las prácticas se ubican los agentes y sus acciones que nos dan cuenta de esta relación: “…la relación entre los habitus y los campos provee la única manera rigurosa de reintroducir a los agentes singulares y sus acciones singulares sin caer en la anécdota sin pies ni cabeza de la historia de los acontecimientos”.2 La percepción que de las instituciones tengan los agentes sociales singulares dependerá de su posición en el espacio social: una secretaria, un funcionario de alto o mediano nivel, un custodio, tienen puntos de vista *
Facultad de Estudios Superiores Acatlán, México. Cfr. Bourdieu, Pierre, Intelectuales, política y poder, trad. de Alicia Gutiérrez, Buenos Aires, Eudeba, 2000, pp. 65 a 73. 2 Bourdieu, Pierre, Cosas dichas, trad. de Margarita Mizraji, Barcelona, Gedisa, 1993, p. 55. 1
459
460
DANTE LÓPEZ MEDRANO
diferentes respecto de la cárcel, puntos de vista que aun entre sí pueden ser antagónicos. Sin embargo, su práctica se ajusta al campo carcelario a través de una representación que les es común, el mundo del sentido común, lo que les es evidente; simplemente hacen lo que tienen que hacer. Estas representaciones de sentido común del personal que labora en los lugares de reclusión guarda relación con la representación de sentido común que de la cárcel tienen las masas: albergan a los anormales.3 Así mismo constituyen el programa de percepción social incorporado, en las mentes de los agentes, que legitima la exclusión con base en la división sano/enfermo que el devenir histórico de la institución carcelaria impuso, y que el derecho terminó por consagrar.4 Éste confiere, a la vez, a esa realidad su permanencia.5 La institucionalización de esta percepción social se incorporó a los centros de reclusión a través de los Consejos Técnicos Interdisciplinarios. La práctica de los centros de reclusión verifica semanalmente el ritual del Consejo Técnico Interdisciplinario. ¿Cómo construyó el mundo social esta práctica? Desde luego el proceso histórico que instaura el discurso científico, a los técnicos, al Consejo Técnico, en la institución carcelaria en nuestro país tiene que ver con Lecumberri, la penitenciaría del Distrito Federal, inaugurada el 29 de septiembre de 1901, con las diferentes prácticas que, a su interior, se verificaban y su sustitución por la actual Penitenciaría de Santa Martha, pero también con un proceso de imposición de modelos desde diferentes posiciones teóricas. Lecumberri se construyó, como espacio social, como producto de la etapa de moralización de las capas populares que se verificó en el siglo XIX,6 tal es su proyecto según el texto legal, los programas, las declaraciones de intención. ...aquí se elaborará la corrección del delincuente corregible, y encontrará segregación y sufrimiento, sin infamia ni horror, el incorregible; ella será siempre y para todos fórmula de la suprema ley moral de que el ataque ar3
Cfr. Foucault, Michel, Los anormales, trad. de Horacio Pons, FCE., Buenos Aires,
2000. 4 Cfr. Bourdieu, Pierre, Poder, derecho y clases sociales, trad. de José González Ordovás, Bilbao, Desclée de Brouwer, 2000, p. 201. 5 Cfr. Ibidem, p. 202. 6 Cfr. Foucault, Michel, Microfísica del poder, 3a. ed., trad. de Julia Varela y Fernando Álvarez-Uría, Madrid, Las Ediciones de la Piqueta, 1992, pp. 90 y ss.
EL SIMULACRO DE LA READAPTACIÓN
461
tero o violento al derecho produce, como consecuencia necesaria, el mal que comienza en las suaves sanciones del orden civil y llega hasta la privación de la libertad y aun de la vida, en las ásperas cimas de la criminalidad.7
El programa de moralización de la institución no requería de los científicos, de los técnicos. Su necesidad no se ha planteado aún en la práctica penitenciaria que inauguró Lecumberri. El programa se encamina a la corrección moral, a través de una torre de combate contra el mal: “Aquí todo va a ser silencio, quietud, casi muerte; al poblarse estos recintos se advertirá apenas que albergan seres vivientes; al perderse el eco de vuestros pasos, comenzará el reinado del silencio y de la soledad”.8 Desde luego este fue un proyecto entre otros, el modelo que se impuso. Entre 1876 y 1880 el entonces secretario de Justicia, Ignacio Ramírez, dictó diversos acuerdos para materializar el establecimiento de la penitenciaría, así se presentaron, entre otros, la fortaleza de Perote, los proyectos de los arquitectos Rivas y Plowers, el de Medina y Ormaechea, saliendo triunfante el proyecto de Torres Torija que incorporaba el sistema celular y el panóptico.9 Este proyecto de establecimiento permite materializar el proyecto teórico, conservando la esencia de la institución carcelaria: la exclusión-encierro. Recuérdese que el establecimiento de Lecumberri sustituyó a la Cárcel de Belén. El programa teórico fue concluido el 30 de diciembre de 1882.10 En éste, después de analizar los diferentes sistemas penitenciarios existentes en la época, se resuelve por el sistema Croffton o irlandés, agregándose al que ya se encontraba previsto en el texto del Código Penal de Martínez de Castro, el sistema Filadelfia. El sistema Filadelfia había sido recomendado por el congreso Internacional de Francfort Sur-le-Mein, en 1846. Sin embargo, al abrigo de ulteriores Congresos terminó por imponerse el sistema Croffton. Tal fue la situación de los Congresos de Cincinatti de 1870 y de Londres de 1872, en donde “fue unánime la preferencia en favor de los procedimientos del 7 Macedo, Miguel S., “Discurso pronunciado en la ceremonia inaugural de la Penitenciaría de México”, Álbum conmemorativo de la inauguración de la Penitenciaría de México, México, Archivo General de la Nación, 1900, pp. 8-10. 8 Idem. 9 Cfr. González Bustamante, Juan José, La reforma penitenciaria en México, México, Ateneo de Ciencias y Artes de México, 1946, Cuaderno 11, pp. 10 y ss. 10 Proyecto de Penitenciaría del Distrito Federal, México, Archivo General de la Nación, Fondo Gobernación, Cárceles y Penitenciarías, 1882.
462
DANTE LÓPEZ MEDRANO
sistema Croffton, tal como se practica en Irlanda”.11 Este sistema, a decir de sus impulsores en México, gobierna “a los hombres como dóciles ovejas”.12 Para implementar este sistema tampoco hacían falta los científicos, o técnicos, aunque ya se vislumbra su pálida silueta. Si bien, por una parte, de acuerdo con el proyecto de penitenciaría de 1882, la piedra angular del sistema, los premios y castigos, se encargaba a los profesores de la escuela, jefes de talleres, celadores, y desde luego al director.13 Por otra parte, el discurso científico va perfilando su necesidad, tanto en declaraciones como en el texto de la ley. Al sistema penitenciario, reconocido como mejor por la mayor parte de los sabios en todos los congresos internacionales; al sistema nacido en Irlanda y ensayado con éxito por el capitán Croffton, que con las convenientes modificaciones aconsejadas por la experiencia y el medio, y teniendo en consideración la raza, los elementos locales, es de esperar que produzca el resultado apetecido; esto es, hacer que dentro del principio de la unidad de la pena se pueda seguir en una buena parte el de su individualización o aplicación a cada uno, del tratamiento que su modo de ser psíquico y moral exija, o sustituirlo al menos por el de clasificación según los diversos tipos aceptados.14
En el Reglamento de la penitenciaría, dado con carácter de provisional en 1900, se plasma esta necesidad, como parte de los servicios médicos. La materialización de este proyecto va a ser la historia de la imposición de un criterio de teoría-práctica carcelaria que se verificó en nuestro país a lo largo del siglo pasado y va a concluir con el Reglamento del Centro Penitenciario del Estado de México de 1969. Proceso que permitió a ciertos grupos pasar del capital simbólico difuso, el reconocimiento, al
11 12 13 14
Proyecto de Penitenciaría del Distrito Federal, cit., nota 10. Idem. Idem. “Alocución pronunciada en la ceremonia inaugural por el señor gobernador del Distrito Federal, licenciado don Rafael Rebollar al hacer entrega de la Penitenciaría de México al Ejecutivo de la Unión”, Álbum conmemorativo de la inauguración de la Penitenciaría de México, México, Archivo General de la Nación, Fondo Gobernación, 1900, pp. 11-14. El subrayado es nuestro.
EL SIMULACRO DE LA READAPTACIÓN
463
capital simbólico objetivado, “codificado, delegado y garantizado por el Estado, burocratizado”.15 En la práctica el proyecto que inauguró Lecumberri siguió el programa de la propia institución carcelaria: su reforma. Así, a partir de 1908 la construcción original de Lecumberri empezó a sufrir modificaciones, en este caso una ampliación, con lo que se terminó con el régimen original de vigilancia, el panóptico. Por otra parte el régimen de la disciplina y el silencio, bosquejado por Macedo en su discurso inaugural, hacia 1911 se caracterizaba por la indisciplina de los reos y la desobediencia a los superiores. La causa principal consistía en que los reos consideraban que la Revolución Mexicana debía extenderse a las cárceles, atenuando las penas y su aplicación.16 Estas ideas eran difundidas por los presos políticos, pero aun éstos no cuestionaban la existencia misma de la cárcel. Al respecto, y entre paréntesis, es interesante observar que a lo largo del siglo pasado los reos políticos, incluyendo a los alumnos de la Universidad Nacional Autónoma de México integrantes del Consejo General de Huelga, al interior del establecimiento carcelario, tuvieron como una preocupación fundamental su separación de los reos comunes, bajo el lema: ¡nosotros no somos delincuentes! No obstante ello, el régimen planeado para regir la existencia en Lecumberri, sí llegó a realizarse: “finalmente el 26 de agosto de 1976, el Palacio Negro de Lecumberri había quedado totalmente solo, el silencio era realmente escalofriante y albergaba un eco sollozante, ahí mi abuelo y miles de presos dejaron casi toda su vida”.17 El proyecto Lecumberri al cumplir una década de su apertura se encontraba agotado. Había nacido agotado, por una parte el proyecto Croffton, recomendado en los Congresos de Cincinatti y Londres como el mejor sistema y que debía implementarse para lograr la enmienda moral del reo tal y como se practicaba en Irlanda, era imposible verificar en Lecumberri, ya que el proyecto Irlandés no sólo incluía más de un 15 Bourdieu, Pierre, Razones prácticas. Sobre la teoría de la acción, 2a. ed., trad. de Thomas Kauf, Barcelona, Anagrama, 1999, p. 112. 16 Cfr. “Informe del delegado del Consejo de Dirección de la Penitenciaría de México sobre la situación que priva en ese establecimiento”, Cárceles y penitenciaría diciembre 26 de 1911, sección 3a., México, Archivo General de la Nación, Fondo Gobernación, 1911-1912. 17 Zamudio Pérez, Elizabeth, “El Palacio Negro de Lecumberri”, …A hacer memoria, cit., p. 12. El subrayado es nuestro.
464
DANTE LÓPEZ MEDRANO
edificio, sino que éstos se encontraban en distintas ciudades, y por otra parte, ya desde los discursos inaugurales y en el propio reglamento se aprecia la pálida silueta del modelo que se estaba imponiendo, el positivismo lombrosiano, la antropología criminal. La historia de Lecumberri es la historia de los accidentes y luchas que se verifican para justificar la imposición de esta tehorein,18 mirada, la mirada científica, la mirada positiva, la transformación del reo de enfermo moral, sujeto de arrepentimiento, a otra clase de enfermo, emocional, mental, psíquico: sujeto de readaptación. Con la inauguración de Lecumberri inicia el proceso de imposición de un nuevo discurso, portador de otra representación del mundo social, de una nueva representación del delincuente, vinculada a los intereses de los nuevos grupos. “En suma, no se trata sólo de comunicar, sino de hacer reconocer un nuevo discurso de autoridad, un nuevo discurso con un nuevo vocabulario político, con sus términos de identificación y referencia, sus metáforas, sus eufemismos y la representación del mundo social que vehicula”.19 Lecumberri fue el espacio central en que se verificó la lucha por el monopolio de la autoridad científica, de la capacidad de decir y hacer que socialmente se reconoce a un agente determinado.20 Lucha en que concurrieron los detentadores de esa capacidad ganada en luchas precedentes y los nuevos actores que van a abanderar el positivismo lombrosiano. Se identifican al menos dos grupos: los militares y los técnicos. Recuérdese que el proyecto Irlandés fue materializado por un militar, el capitán Croffton, privilegiando, desde luego, la disciplina como índice del progreso del reo y que en este sistema tal y como se ponía en práctica en Lecumberri no eran necesarios los técnicos. Esta lucha se identifica por las estrategias de descalificación del adversario, tomando como objeto de conocimiento a los propios adversarios y sus estrategias.21 Se materializa en la sucesión de técnicos y militares en la dirección del propio penal, culmina con el final de Lecumberri, la apertura del Centro Penitenciario del Estado de México, la Penitenciaría de Santa Martha y los reclusorios preventivos en el Distrito Federal. Y se simboliza en el acto del nombramiento del último director: el cam18 19 20 21
Cfr. Bourdieu, Pierre, Cosas dichas, cit., nota 2, p. 132. Bourdieu, Pierre, ¿Qué significa hablar?, cit., p. 22. Bourdieu, Pierre, Intelectuales, política y poder, cit., nota 1, p. 76. Ibidem, p. 109.
EL SIMULACRO DE LA READAPTACIÓN
465
bio de director —un técnico por un militar— se verificó cuatro meses antes del final de Lecumberri. En este proceso se identifican tres momentos que contienen tres niveles de realidad social: la posición de los intelectuales, la estructura de las relaciones objetivas en donde se verifican estas luchas y las prácticas establecidas.22 La posición de los intelectuales, quienes en algún momento ocuparon cargos de dirección en Lecumberri, se centró en dos sentidos: la descalificación de la práctica y proyecto que se verificaba en Lecumberri, que se resume en nada funciona nada puede funcionar, y plantear la necesidad de la reforma penitenciaria. Estas estrategias se verificaron a través de la Academia Mexicana de Ciencias Penales y su órgano de difusión, la revista Criminalia, el campo académico y los congresos nacionales penitenciarios. Lugares en los que no tuvieron espacio los defensores de otros proyectos, los militares. Basta revisar quienes participaban en esos tres espacios, para constatarlo. Se pretende el desplazamiento de la mirada, de una observación con el fin de que el interno se sienta vigilado para que enmiende su comportamiento, conforme a los principios del panóptico, a una observación con la finalidad de detectar tendencias criminales: el positivismo lombrosiano. El 3 de marzo de 1958, Lecumberri dejó de tener carácter de penitenciaría al efectuarse el primer traslado de reos a la Penitenciaría de Santa Martha. Ésta se inauguró el 14 de octubre de 1957, pero comenzó a funcionar a partir del primer traslado de reos de Lecumberri.23 Para el inicio de esta etapa de Lecumberri como cárcel preventiva, se designó como director a un militar, el general Carlos Martín del Campo. El general asume la dirección de la cárcel preventiva para “hacer cumplir las reglas mínimas aprobadas en Ginebra en 1955”, con particular énfasis en el Trabajo como medio de rehabilitación.24 Así, si bien hacia 1950 “no había ni médico”, salvo cuando se le llamaba, para 1963, debido a las gestiones del general Martín del Campo, el cuerpo técnico se componía de un médico de guardia permanente, dos dentistas, dos radiólogos, un urólogo, un cirujano, dos psiquiatras, un tisiólogo, dos internistas, un anestesista, un neu22 23 24
Ibidem, p. 31. Cfr. Martín del Campo, Carlos, cit., siguiente nota. Cfr. Martín del Campo, Carlos, La rehabilitación desde procesados, México, Talleres Industriales de la Cárcel Preventiva, 1966.
466
DANTE LÓPEZ MEDRANO
rólogo, un ortopedista y un oculista. Además de seis médicos más que cubrían guardia cada día de la semana.25 Términos equivocados, personal equivocado, fines equivocados: fracaso asegurado. Los límites del moderno penitenciarismo se han construido para evitar el rechazo tanto del castigo como de la instancia que castiga: el dolor humanizado. Desde Beccaria, los autores del derecho penal clásico enseñan que la evolución de las ideas penales nos llevó al periodo de humanización de las mismas. Hoy en día, los órganos de gobierno encargados de la protección de los derechos humanos,26 —nos referimos a los órganos de control político, es decir, Comisiones de Derechos Humanos— nos hablan de esta aporía, la humanización de las penas, de la humanización del dolor.27 El sistema de reclusión opera la exclusión de los desviados, de los que han infringido la ley penal y se convirtieron en sus clientes. Sin embargo, la gran masa de la desviación de la ley penal no ingresa a la cárcel, por diversas circunstancias.28 La cárcel es un lugar con fines evidentes de exclusión social, esto se muestra de manera descarnada. Existe consenso en señalar que la cárcel no cumple con los fines para los cuales está diseñada. “Conocidos son todos los inconvenientes de la prisión, y que es peligrosa cuando no es inútil. Y sin embargo, no se “ve” por qué reemplazarla. Es la detestable solución de la que no sabría hacerse la economía”.29 En nuestra opinión esto es así porque cumple con otro tipo de funciones, más bien simbólicas. En nuestro medio la constatación empírica sobre el fracaso de la cárcel, en cuanto al cumplimiento de sus fines declarados, la proporcionan 25 Cfr., Martín del Campo, Carlos, Antecedentes de sistemas penitenciarios de México y labor desarrollada en la Cárcel preventiva del D. F., dentro del Régimen actual, cit. 26 Cfr. Mora Mora, Juan Jesús, Diagnóstico de las prisiones en México, México, Comisión Nacional de Derechos Humanos, 1991, serie Folletos 1991/12. 27 Cfr. Christie, Nils, Los límites del dolor, trad. de Mariluz Caso, México, FCE, 1984, col. Breviarios 381. 28 En una conferencia dictada el día 19 de noviembre de 1999, en el marco del Segundo Congreso Iberoamericano de Derecho Penal organizado por el Instituto Iberoamericano de Derecho Penal, en la ciudad de México, un subprocurador de la Procuraduría General de la República comentó que estudios realizados por el Sistema Nacional de Seguridad Pública estimaban que de cada 100 delitos cometidos, 20 se denunciaban a la autoridad; 10 se consignaban a juez, y en 5 casos se obtenía sentencia de condena. 29 Foucault, Michel, Vigilar y castigar. Nacimiento de la prisión, 9a. ed., trad. de Aurelio Garzón del Camino, México, Siglo XXI, 1984, p. 234.
EL SIMULACRO DE LA READAPTACIÓN
467
las recomendaciones que sobre los centros de Reclusión en el país han emitido las comisiones de derechos humanos. Sobre todo, cuando, como señala Ribera Beiras, contrariamente a lo que debía de esperarse han contribuido a diferenciar al preso del ciudadano, “la «devaluación» de los derechos fundamentales de los reclusos, diseñada en las normas y delimitada por la jurisprudencia, ha supuesto la construcción (jurídica) de un ciudadano de segunda categoría en comparación con aquél que vive en libertad”.30 Tales conclusiones sirven exclusivamente para ilustrar la realidad de las cárceles de México, realidad que nos delinea lo que Rivera Beiras denomina derechos de segunda categoría. Es claro que el programa de los organismos de derechos humanos plantea corregir el funcionamiento de la cárcel sin que se cuestione su existencia misma o al menos su programa de readaptación a través de la educación, el trabajo y la capacitación para el mismo. Este tipo de organismo constituye, en consecuencia, el más reciente de los mecanismos que acompañan a la cárcel, con la apariencia de corregirla, pero que sirven para justificarla. Resulta paradigmático, por poner sólo un ejemplo, que se hable de segregar en “condiciones inadecuadas”, avalando por ende el segregar, pero en condiciones adecuadas, ¿cuáles serán éstas?. La posición que delinean estos organismos sobre la cárcel se puede considerar como una lectura de autoengaño, eminentemente política. En otro ámbito, la cotidianidad carcelaria se nos presenta como un universo natural, en donde los profesionistas, cualquiera que éstos sean, se insertan en una práctica incuestionada, simplemente para hacer lo que saben hacer. Así, el psicólogo se inserta en la práctica carcelaria para realizar lo que sabe hacer, pero ¿qué sabe hacer?, y ¿cómo es que sabe lo que hay que hacer? La práctica simplemente se va imponiendo al psicólogo, quien acepta su lugar y especificidad como algo natural, evidente, incuestionable. Se inserta en un espacio social que además se encuentra delimitado por lo jurídico. Pero esto no siempre fue así, la práctica que el psicólogo lleva a cabo en el espacio carcelario se ha construido, es un producto histórico, y como tal arbitrario. De todo aquel psicólogo que ingresa a laborar a los sistemas carcelarios se espera que aplique pruebas psicométricas; las sepa interpretar o 30 Rivera Beiras, Iñaki et al., Tratamiento penitenciario y derechos fundamentales, Barcelona, Bosch, 1994, p. 73.
468
DANTE LÓPEZ MEDRANO
calificar; conducir una entrevista, y finalmente dar un reporte, cuyos aportes principales serán: señalar la orientación espacio-temporal del sujeto en estudio, su capacidad de juicio y razón, su coeficiente intelectual, si la persona presenta daño orgánico o no, sus rasgos de carácter, rasgos de personalidad, sus preferencias sexuales, hábitos de consumo de drogas, dinámica de la personalidad, y un diagnóstico. Para ello se le enseñan en la facultad ciertos instrumentos metodológicos. Estas herramientas y recursos técnicos pueden emplearse como expedientes de conocimiento del objeto de estudio, sin embargo, también “pueden emplearse en forma inconsciente ante todo como defensas aisladoras que desfiguran nuestra percepción de la realidad y estorban la investigación en varios modos.”31 Pero ¿qué realidad es ésta que es desfigurada? Únicamente enunciaremos algunos aspectos que en particular nos interesa señalar. Hoy en día, el trabajo del personal de reclusorios en particular nos referimos al Área Técnica (funcionarios, psicólogos, trabajadores sociales, médicos, psiquiatras, y criminólogos), se convierte en un trabajo avalador: justifica el trabajo de otras instancias de selección de internos, individualizando el conflicto.32 Siguiendo la normatividad, una vez que el sujeto ingresa a la institución total,33 el cuerpo médico lo observa a efecto de indicar únicamente si ingresó con lesiones, no para la atención de su salud física o canalización a la atención de su salud mental. El psicólogo pone su presencia, ya que si los sujetos requieren apoyo emocional lo reciben de sus compañeros de reclusión, y del cuerpo de seguridad y custodia. La tarea más ingrata, la del criminólogo, avala o justifica el que el sujeto esté en el encierro, sus diagnósticos encierran invariablemente la eti31 32
Ibidem, p. 120. Cfr. Basaglia, Franco, La institución negada. Informe de un hospital psiquiátrico, 2a. ed., trad. de Jaime Pomar, Buenos Aires, Barral Editores, 1972; Basaglia, Franco, et. al., Los crímenes de la paz. Investigación sobre los intelectuales y los técnicos como servidores de la opresión, 2a. ed., trad. de Juan Diego Castillo, María Elena Petrilli y Marta E. Ortiz, México, Siglo XXI, 1981; Castel, Robert, El orden psiquiátrico. La edad de oro del alienismo, trad. de José Antonio Álvarez-Uría y Fernando Álvarez-Uría, Madrid, Ediciones de la Piqueta, 1980; col. Genealogía del Poder, núm. 5, Foucault, Michel, Microfísica del poder, cit., nota 6; y Guinsberg, Enrique, Normalidad, conflicto psíquico, control social. Sociedad, salud y enfermedad mental, 2a. ed., México, Plaza y Valdés Editores, 1996. 33 Cfr. Goffman, Erving, Internados. Ensayo sobre la situación social de los enfermos mentales, trad. de María Antonia Oyuela de Grant, Buenos Aires, Amorrortu, 1988.
EL SIMULACRO DE LA READAPTACIÓN
469
queta de peligroso, el interno es más o menos peligroso, pero la categoría de no-peligroso está negada, no existe, y en el peor de los casos el sujeto es extremadamente peligroso. Es notable que esta práctica, diagnosticar a los internos como peligrosos, se lleve a acabo en los reclusorios y centros penitenciarios del Distrito Federal, y del país, aun y cuando tal categoría fue eliminada expresamente del Código Penal, y la tendencia en las entidades federativas es a eliminarla de los textos legales; a demás de que a ella no hacen mención las normas instrumentales relativas a la reclusión. Esto es así porque se ha incorporado al habitus, es una práctica que ya ni siquiera se plantea si tiene fundamento legal. En la práctica del encierro, en la mayoría de los casos el diagnóstico señala “peligrosidad media” o “peligrosidad baja”, pero estos diagnósticos no tienen importancia. El criminólogo, al interior de los cárceles da unidad a la tecnología del encierro, ofrece una solución a las contradicciones de la Institución carcelaria —entre otras la readaptación, la exclusión social, etcétera—, es da una unidad de la que antes carecían.34 es particularmente repugnante. Como pueden darse cuenta, habría a la vez poco y mucho que decir sobre este tipo de discursos. Puesto que, después de todo, en una sociedad como la nuestra son raros, no obstante, los discursos que tienen a la vez tres propiedades. La primera es poder determinar, directa o indirectamente, un fallo de la justicia que, después de todo concierne a la libertad o la detención de un hombre. En el límite (y veremos algunos casos), la vida y la muerte. Así pues, se trata de discursos que en última instancia tienen un poder de vida y muerte. Segunda propiedad: ¿de dónde sacan ese poder? De la institución judicial, tal vez, pero también del hecho de que funcionan en ella como discursos de verdad, de verdad por su status científico, o como discursos formulados, y formulados exclusivamente por personas calificadas, dentro de una institución científica. Discursos que pueden matar, discursos de verdad y discursos —ustedes son la prueba y los testigos— que dan risa... Esos discursos cotidianos de verdad que matan y dan risa están ahí, en el corazón mismo de nuestra institución judicial.35
Por otra parte, los conflictos relativos a la población interna —legales, de relación, de satisfacción de las necesidades— se resuelven en el plano 34 35
Cfr. Castel, Robert, op. cit., nota 32. Foucault, Michel, Los anormales, cit., nota 3, p. 19.
470
DANTE LÓPEZ MEDRANO
donde el técnico no tiene nada que ver. Mientras el técnico clasifica a la población en diferentes dormitorios, a partir de los resultados que arrojan sus estudios, en la dinámica de la vida en dormitorios se realizan reclasificaciones, auspiciadas por las autoridades, los cuerpos de seguridad o los mismos internos. Poco o nada tiene que ver el técnico con la vida de los internos. Si el científico social construye sus objetos de conocimiento, el científico que trabaja en los centros de reclusión los simula. Conocer acerca de una problemática social implica, en sí, una toma de postura.36 Toma de postura que se manifiesta desde el inicio de la investigación, y que se acentúa o diluye en las diferentes etapas: en la determinación de los individuos a investigar, en la selección de las técnicas y el diseño de los instrumentos de recolección de datos, en la formulación de la estrategia y el desarrollo del trabajado de campo y en el análisis de la información empírica. La toma de postura tiene que ver con la posición que se tenga en la jerarquía de poder, la posición de los grupos en el campo intelectual y el habitus.37 La metodología aplicable en el sistema privativo de libertad individualiza el conflicto. Hace de la problemática una cuestión individual.38 Su producto es el etiquetamiento de la persona.39 Esto es así porque el dispositivo carcelario tiene este encargo.40
36 Cfr. Lourau, René, El diario de investigación. Materiales para una teoría de la implicación, trad. de Emmanuel Carballo Villaseñor, Guadalajara, Universidad de Guadalajara, 1989. 37 Cfr. Bourdieu, Pierre, Intelectuales, política y poder, cit., nota 1, p. 31. 38 Cfr. Basaglia, Franco, op. cit., nota 32; Foucault, Michel, op. cit., nota 32, y Guinsberg, op. cit., nota 32. 39 Cfr. Baratta, Alessandro, Criminología crítica y crítica del derecho penal, 2a. ed., trad. de Álvaro Bunster, México, Siglo XXI, 1989; y Lamnek, Siegfried, Teorías de la Criminalidad, 3a. ed., México, trad. de Irene del Carril, 1987. 40 Cfr. Bergalli, Roberto, “¿Qué se controla: individuos o el propio sistema penal? (Breve ensayo sobre la subjetividad en el pensamiento criminológico)”, Crítica Jurídica, Revista Latinoamericana de Política, Filosofía y Derecho, núm. 15, 1994; Castel, Robert, op. cit., nota 32; Marí, Enrique Eduardo, La problemática del castigo. El discurso de Jeremy Bentham y Michel Foucault, Buenos Aires, Hachette, 1983; Pavarini, Massimo, Control y dominación. Teorías criminológicas burguesas y proyecto hegemónico, 2a. ed., trad. de Ignacio Muñagorri, México, Siglo XXI, 1988; “Balance de la experiencia Italiana en materia de reforma penitenciaria”, Alier, Revista Internacional de Teoría, Filosofía y Sociología del Derecho, año I, núm. 1, enero-abril de 1997.
EL SIMULACRO DE LA READAPTACIÓN
471
Se construyen objetos de conocimiento distintos de los objetos reales. “Los objetos de conocimiento son representaciones, ficciones, simulacros, metáforas de los objetos reales, mientras estos últimos, según ciertas opiniones, sólo sirven para engañar al investigador”.41 ¿Son constatables estas ideas de la simulación, del simulacro de la readaptación? Para dar respuesta recurrimos a la experiencia del interno a quien llamaremos Toledo. El relato inicia cuando Toledo ingresa a reclusión, puesto a disposición del juez, asistido de todos los derechos constitucionales. Toledo inicia su proceso de adaptación al nuevo medio, nuevo para él. Pronto se da cuenta que en reclusión impera la ley del más fuerte y la extorsión, auspiciada por los custodios. Sabe que tiene que adoptar posturas fieras, de reto, tal vez así lo dejen en paz. También descubre que su vida de asaltante —“yo allá afuera me dedicaba a asaltar, asalto a mano armada”— le ha proporcionado valedores que se encuentran en reclusión y que lo van a ayudar. Entiende que el grupo hace la fuerza que le permite resistir. Así, consigue trabajo como ayudante de limpieza, como sirviente de un padrino. De esta forma se entera que la droga y el alcohol ingresan al reclusorio con la connivencia y participación de las autoridades, ve como los propios custodios le llevan al padrino cocaína, y ve como éste la consume y distribuye. Esta forma de vida le permite un ingreso económico para sus propios gastos de vestido y alimentación, y para poder darse su toque (fumar marihuana). También presencia que algunos internos abusan sexualmente de otros, con el pretexto de que ingresaron por el delito de violación. Y “es que aquí todos temen por sus mujeres, imagínese que un buey abuse de ella, todos tienen mamá o hermanas, o hijos, por eso no se quiere a los violadores”. También ve que se abusa sexualmente de los internos de reciente ingreso, que son muy jóvenes, “los tiernos”, los “chavos bizcocho”. “¡Chale!, no entiendo, conocí a uno que en el reclusorio entre varios abusaron de él, le introducían la verga por el ano y la boca, lo hacían diario... hoy lo veo aquí en cana —en la penitenciaría—, que lo visitan su esposa y sus hijos... me pregunto si no le habrá afectado... o a lo mejor después de tanto que le hacían le gustó”. En el internamiento de Toledo también existe el correctivo disciplinario. “Me colgué de la lista, y los custodios querían que les pagara —había que entregarles un peso—. No, pos me negué. Y que me les pongo 41
Lourau, René, op. cit., nota 36, p. 37.
472
DANTE LÓPEZ MEDRANO
bien al chile. Hasta llamaron al jefe de seguridad. Me enviaron al módulo de máxima seguridad, apandado por culero. Me querían meter miedo, me dijeron que ya me habían encargado con la persona que estaba en la celda, en el apando, a donde me iban a llevar. No, pues sí, me dio miedo. Y que voy entrando, y no pues que era el maguey. Ya lo conocía, me dijo: qué onda, por qué te trajeron... ya después salí”. Toledo es llamado, entonces, por primera vez, por el staff experto. Descubre que éste está compuesto en su mayoría por mujeres, también descubre que algunas de ellas tienen relaciones con internos, que otras se casaron con internos y éstos ahora ya son libres, o que siendo casadas andan con otra persona. Y es entonces cuando se pregunta, “y ¿por qué conmigo no?” Le hacen preguntas acerca de su vida, del delito, de lo que hace en el reclusorio... Pero esto a él no le interesa, le interesa quedar bien con alguna de ellas, y decirles lo que quieren ellas escuchar: que todo fue un error, que es inocente, que lo torturó la policía, que sufre mucho, que nunca había conocido a una persona tan humana y comprensiva como la que tiene enfrente... Sabe esto porque ya se lo dijeron los demás internos. Que así tenía que conducirse, que así tenía que ser. Después de dos o tres días de acudir con el staff experto se olvida de ellos, salvo que alguna psicóloga, trabajadora social, pedagoga, o criminóloga, le interese. En este caso vuelve una y otra vez. Sabe de una psicóloga que ahora tiene visita íntima con un interno. Llega el día en que es trasladado a la penitenciaría, en donde el proceso se repite, sólo que ahora con la diferencia del color: ahora viste de azul. Con el paso de los años va perdiendo a su familia, por muerte o desintegración. Ahora quiere salir. “No, pos también me pelié con la licenciada, la de prevención, le dije que al salir iba a seguir asaltando, que nunca trabajé, y que aquí no aprendí a hacer nada útil, no pos así cómo quería que me ayudara, que debía recapacitar, ya portarme bien, ¡chale!, yo no entiendo, si uno les dice las cosas como son, se enojan y dicen que uno es cínico, qué, ¿quieren oír puras mentiras como las que todos cuentan?”. Sin embargo Toledo se decía a sí mismo, en ocasiones en voz alta, que cuando saliera de prisión sería lo que era antes de entrar a ella: asaltante. Sólo que ahora había aprendido que la prisión no es nada bueno: “Yo aquí ya no regreso... prefiero que me maten. Sí, si ya la veo perdida, antes que entregarme prefiero que me maten. ¿Qué otra cosa puedo hacer al salir? Nunca he hecho nada, no sé trabajar en nada”. A los pocos días, o al mes de esta reflexión en voz alta, le llegaron sus beneficios. Una vez
EL SIMULACRO DE LA READAPTACIÓN
473
a punto de la readaptación, se le canalizó al Centro de Reinserción Social —hoy ya no existe—, y a los pocos días salió de prisión, preliberado. Posteriormente me enteré que era vendedor ambulante en el Sistema de Transporte Metropolitano de la ciudad de México, el metro. Para entender la finalidad del castigo en nuestro momento cultural, sobre el fin de la prisión, debemos intentar aprehenderlo más allá del concepto de readaptación, que como hemos visto fue una construcción cultural, y por tanto arbitraria, sin embargo, esta postura fatalmente nos lleva a la respuesta que da Nietzsche, a la pregunta ¿por qué se castiga en la actualidad?, “En la actualidad es imposible decir de modo determinado por qué se castiga”.42 La readaptación como finalidad de la prisión no es más que una imagen, pero ¿imagen de qué? ¿de una realidad profunda o de ningún tipo de realidad? La readaptación no tiene que ver con el delincuente y su acto, sino con su imagen. No importa si el pálido delincuente, llámese el Maguey o Toledo, se readapta, importa la imagen del delincuente vencido, derrotado, detenido, sufriendo, pero no la imagen del delincuente, sino de algunos delincuentes. Por eso es que la idea de la readaptación, en la práctica, ha dejado de tener sentido, y sin embargo, se conserva a falta de otra cosa, es preferible creer en la readaptación a creer en la nada, a pensar que la pena contemporánea carece de sentido. Porque esto nos llevaría a tener que admitir que castigamos sin sentido, a tener que presentar la prisión antes que representar lo que debería ser. A monstruar, mostrar, la prisión, porque la realidad, su realidad, es monstruosa:43 Bien venido al castillo de los monstruos, se lee a la entrada del dormitorio número cuatro de la Penitenciaría del Distrito Federal. En el momento actual, la readaptación no tiene que ver con ningún tipo de realidad, es ya un puro simulacro de realidad.44 Nada tiene que ver con funciones de corrección, pero sí con funciones no sólo distintas, sino 42 Nietzsche, Friedrich, La genealogía de la moral, trad. de José Mardomingo Sierra, Madrid, Edaf, 2000, p. 128. 43 Cfr. Maffesoli, Michel, en apuntes tomados del Seminario: Diálogos del Nuevo Siglo. El barroco y la Posmodernidad, impartido los días 24 al 27 de septiembre del 2001, dentro del Programa de Posgrado en Ciencias Políticas y Sociales de la UNAM, en colaboración con la Embajada de Francia en México y la UAM-X; del mismo autor El instante eterno. El retorno de lo trágico en las sociedades posmodernas, trad. de Virginia Gallo, Espacios del Saber 19, Buenos Aires, Paidós, 2001. 44 Cfr. Baudrillard, Jean, Cultura y simulacro, 5a. ed., trad. de Antonio Vicens y Pedro Rovira, Barcelona, Kairós, 1998, p. 18.
474
DANTE LÓPEZ MEDRANO
contrarias. Queda entonces develado el orden de lo simbólico de la institución carcelaria, es decir, de las diversas funciones que se reducen a dicho orden. Esto significa que gran parte de la realidad carcelaria está constituida por una dimensión simbólica. Por una red simbólica, donde se combina un componente funcional y un componente imaginario. Un componente imaginario fundamental de la cárcel es la peligrosidad. Es el núcleo que condensa el sentimiento de “in-seguridad”. Sin embargo, la peligrosidad no está encerrada en los muros carcelarios, no tendría por qué estar ahí, si del delincuente se hace un uso económico y político. La peligrosidad/in-seguridad está en la calle, no es en los espacios cerrados donde nos sentimos “in-seguros” sino en los espacios abiertos. Por su parte, en nuestro país, la práctica policíaca no produce en el imaginario social sentimientos de seguridad, a lo más se vuelve tolerable por el miedo al delincuente: “...el peligro de sufrir un delito sí que tiene un peso simbólico de consideración y que en la medida en la que desconfianza en las autoridades más próximas al ciudadano está atravesada por la imagen de agentes corruptos e ineficientes, un tal peso simbólico se agrava”. El espacio carcelario transforma el conflicto social o aun personal logrando que el monstruo se vuelva inconfundible: dando sentido a su historia de vida, sometiéndolo a los medios masivos de comunicación, diagnosticándolo, inscribiéndose en su cuerpo... Pero nada nos dice de aquellos que nos son atrapados por sus redes, de lo que se denomina la cifra obscura de la criminalidad. Pero tampoco nada tiene que hacer al respecto, y decimos que nada tiene que hacer el espacio carcelario pues ya lo ha hecho, al ser resultado de un proceso de institucionalización. Se ha instituido en las estructuras sociales y en las estructuras mentales adaptadas a esas estructuras. La cárcel, entonces, no nos habla de ninguna realidad, construye su realidad, y se ve reforzada por la comunicación científica en este campo del conocimiento sociológico que suele ser presentada como un producto terminado, ocultando sus condiciones de producción, o como señala Bourdieu: “El producto acabado, el opus operatum, oculta el modus operandi”.45 El científico social del campo carcelario poco o nada suele decir de sus compromisos, intereses o ganancias, aún rituales o simbólicas —ejemplo el reconocimiento: “escribo para que me quieran”, se lee como 45 Bourdieu, Pierre, Cuestiones de sociología, trad. de Enrique Martín Criado, Madrid, Istmo, col. Fundamentos, núm. 166, 2000, p. 233.
EL SIMULACRO DE LA READAPTACIÓN
475
epígrafe a un texto—, produciendo la imagen de un acto totalmente desinteresado. De igual forma oculta sus operaciones concretas de investigación, que lo hacen ser sospechoso de “producir teorías ya acabadas” y solamente buscar su validación a través de ejemplos.46 El campo carcelario, como lo conocemos, es pues un puro simulacro. Simulacro, como en su momento lo fueron las persecuciones de brujas y sus enjuiciamientos. A grado tal que hoy presenciamos el retorno de los discursos tanto de quienes estaban a favor de la persecución de las brujas como de los opositores. Uno de estos últimos, Juan Wiero, escribió, en su obra titulada Sobre los artificios del diablo así como sobre los encantamientos y envenenamientos, editado en 1563: “Todo ello conduce forzosamente a la conclusión de que personas ignorantes atribuían, hasta ahora, ciertos acontecimientos al diablo y su séquito, sin percatarse de que, tras las apariencias de verosimilidad, todo se esfuma en simulacros, encantamientos, mentiras embustes y artificios diabólicos”.47
46 47
Idem. Citado por Baschwitz, Kurt, Brujas y procesos por brujería, 2a. ed., trad. de Ana Grossman, Barcelona, Luis de Caralt, 1998, p. 142.
!
LA TEORÍA REFERENCIAL-REALISTA DE LA INTERPRETACIÓN JURÍDICA Carlos I. MASSINI-CORREAS* SUMARIO: I. Las aproximaciones hermenéutica y semántica. II. La visión semántico-referencial del lenguaje. III. La noción de interpretación. IV. La interpretación jurídica. V. Críticas a esta teoría. VI. Consideraciones sobre “falsos profetas”. VII. Resultados de la indagación realizada.
I. LAS APROXIMACIONES HERMENÉUTICA Y SEMÁNTICA En los últimos años han proliferado de un modo notable las presentaciones autodenominadas “hermenéuticas” de la filosofía y la teoría del derecho;1 en efecto, desde Dworkin, Fish y Marmor2 en el ámbito cultural anglosajón, Kaufmann y Hassemer3 en Alemania, hasta Viola, Zaccaría y D’Agostino4 en Italia, pasando por un larga serie de autores que escriben
* Universidad de Mendoza, Argentina. 1 Véase Massini-Correas, C. I., “La filosofía hermenéutica y la indisponibilidad del derecho”, Persona y Derecho, núm. 47, Pamplona, 2002, pp. 257-278. 2 Véase Dworkin, R., Law’s Empire, Cambridge, Harvard U. P., 1986 y Marmor, A., Interpretation and Legal Theory, Oxford, Clarendon Press, 1992. 3 Kaufmann, A., Filosofía del derecho, trad. de L. Villar Borda y A. M. Montoya, Bogotá, Universidad Externado de Colombia, 1999; y Hassemer, W., “Hermenéutica y Derecho”, Anales de la Cátedra Francisco Suárez, núm. 25, Granada, 1985, pp. 63-85. 4 Véase Viola, F. y Zaccaria, G., Diritto e interpretazione. Lineamenti di teoria ermeneutica del diritto, Roma-Bari, Laterza & Figli, 2001; D’Agostino, F., “Hermenéutica y derecho natural. Después de la crítica heideggeriana de la metafísica”, en Rabbi-Baldi, R. (ed.), Las razones del derecho natural, 2000, pp. 301-314; y Zaccaria, G., Ermeneutica e giurisprudenza. I fondamenti filosofici nella teoria de Hans Georg Gadamer, Milán, Giuffrè Editore, 1984. 477
478
CARLOS I. MASSINI-CORREAS
en España,5 México6 y Argentina, se han propuesto recientemente muy numerosas aproximaciones al estudio del derecho que asumen en una medida relevante los supuestos de la filosofía hermenéutica, en especial en la versión elaborada por Hans-Georg Gadamer.7 Estas propuestas tematizan, como no podría ser de otro modo, la problemática de la interpretación jurídica (en adelante i.) enmarcándola en los cánones propios de esa perspectiva y presentando una concepción del derecho en la cual la temática y la perspectiva interpretativas adquieren carácter central y determinante. Ahora bien, sucede que este approach a la temática de la i. jurídica presenta, al menos en una primera consideración, algunos puntos oscuros y varias aporías, que generan en los estudiosos numerosas e importantes incertidumbres y otras tantas perplejidades. La primera de estas incertidumbres la genera el estilo expositivo propio de la filosofía hermenéutica; efectivamente, siguiendo la modalidad de su principal inspirador, Gadamer, conocido por la complejidad innecesaria que imponía a sus explicaciones,8 los iusfilósofos hermenéuticos han introducido una farragosidad e imprecisión en sus textos que, en muchos de los casos, los vuelve difícilmente comprensibles.9 Esto dificulta enormemente la comprensión del fenómeno de la i., en especial de la i. jurídica, sobre todo si se pretende alcanzar una conceptualización detallada y precisa de las modalidades interpretativas, de los caracteres propios de la i. jurídica, de sus requisitos y de sus métodos y directivas. Por otra parte, por más que muchos de sus cultores lo nieguen, existe en la filosofía hermenéutica un trasfondo al menos tendencialmente rela5 Véase Osuna-Fernández Largo, A., Hermenéutica jurídica. En torno a la hermenéutica de Hans Georg Gadamer, Valladolid, Universidad de Valladolid, 1992. 6 Véase Beuchot, M., Perfiles esenciales de la hermenéutica, México, UNAM, 2002. 7 Acerca de la filosofía hermenéutica, véase el muy completo libro de Grondin, J., Introducción a la filosofía hermenéutica, trad. de A. Ackermann Pilári, Barcelona, Herder, 1999. Véase también: Bengoa, J., De Heidegger a Habermas. Hermenéutica y fundamentación última en la filosofía contemporánea, Barcelona, Herder, 1992 y Ferraris, M., Historia de la hermenéutica, trad. de A. Perea Cortés, México, Siglo XXI, 2002. 8 Véase Gadamer, H. G., Mis años de aprendizaje, trad. de R. Fernández, Barcelona, Herder, 1996, pp. 53 y 54. Esta complejidad expositiva ha llevado a Hans Urs von Balthasar a hablar del “cuchicheo impenetrable de la hermenéutica”; “Prólogo”, Antología de Josef Pieper, trad. de J. López de Castro, Barcelona, Herder, 1984, p. 11. 9 Un ejemplo de esto es el trabajo de Paul Ricoeur, “L’herméneutique et la méthode des sciences sociales”, en Amselek, P. (ed.), Théorie du droit et science, París, PUF, 1994, pp. 15-25.
LA TEORÍA REFERENCIAL-REALISTA
479
tivista e historicista,10 que dificulta enormemente las posibilidades de alcanzar una fundamentación objetiva de la normatividad jurídica y de su i.11 Ahora bien, una cierta objetividad de las interpretaciones que se realizan en el ámbito jurídico es constitutivamente necesaria, toda vez que, de lo contrario, no sería posible establecer un criterio para la estimación de las diferentes i. y todas ellas resultarían, de este modo, de igual valor, con lo que se recalaría en un mero decisionismo voluntarista y el consiguiente abandono de cualquier racionalidad en los contenidos del derecho.12 Dicho en otras palabras: una i. jurídica resultaría válida sólo por la autoridad de quien la formula, pero nunca por la corrección o adecuación de su contenido, con lo que se eliminaría toda la dimensión crítica “material” del ámbito del pensamiento acerca del derecho. Además, la misma i. desaparecería en cuanto tal, toda vez que resultaría sustituida por una mera elección u opción acerca del sentido de los textos jurídicos, sin que apareciera en ese acto el carácter “mediador”13 de la i., pues no existirían términos entre los cuales mediar, y todo quedaría reducido a la decisión, por principio infundada y arbitraria, del ocasional intérprete.14 Aquellas incertidumbres y estos problemas15 hacen conveniente ensayar una presentación alternativa del fenómeno de la i. jurídica, que no sólo supere esas ambigüedades y aporías, sino que trascienda también los cánones reduccionistas de las presentaciones analíticas de la temática de la i. jurídica, que abocan en la mayoría de los casos a un completo escepticismo y a la consiguiente contracción del fenómeno interpretativo a una mera elección injustificable entre alternativas lógicamente posibles.16 Dicho de otro modo, se trata de presentar una teoría de la i. y en especial de 10 Véase Derisi, O. N., “Verdad, historia y hermenéutica”, Sapientia, Buenos Aires, núm. 122, 1976, pp. 243-250. 11 Véase Massini Correas, C. I., “La filosofía hermenéutica y la indisponibilidad del derecho”, Persona y Derecho, Pamplona, núm. 47, 2002, pp. 257-278. 12 Véase Serna, P., “Hermenéutica jurídica y relativismo. Una aproximación desde el pensamiento de Arthur Kaufmann”, Horizontes de la filosofía del derecho. Homenaje a Luis García San Miguel, Alcalá de Henares, Universidad, 2002, pp. 737-765. 13 Véase Corominas, J., Diccionario etimológico de la lengua castellana, Madrid, Gredos, 1976. 14 Ésta es la tesis sostenida expresis verbis por Hans Kelsen; véase Teoría pura del derecho, trad. de R. Vernengo, México, Porrúa, 1995, pp. 349 y ss. 15 En este punto, Véase Llano, A., “Filosofía del lenguaje y comunicación”, Sueño y vigilia de la razón, Pamplona, EUNSA, 2001, pp. 83 y ss. 16 Véase Guastini, R., “Escepticismo y cognitivismo en la teoría de la interpretación”, Ideas y Derecho, Buenos Aires, núm. II-2, 2002, pp. 31-48.
480
CARLOS I. MASSINI-CORREAS
la i. jurídica que, superando las versiones reductivas y escépticas de la filosofía jurídica analítica, no deba caer necesariamente en las imprecisiones y oscuridades impenetrables de la hermenéutica. En esta tarea, se recurrirá a ciertos elementos gnoseológicos y metodológicos de la semántica contemporánea, corrigiéndolos en cuanto suponen, en algunos autores, una aceptación dogmática del no-cognitivismo ético como trasfondo filosófico17. En especial, se hará referencia a los trabajos sobre i. de los iusfilósofos polacos Jerzy Wróblewski18 y Georges Kalinowski,19 así como del norteamericano Michael S. Moore, quienes han abordado la problemática de la i. jurídica con un rigor y una sistematicidad que suelen estar ausentes en las presentaciones más habituales de la problemática. Pero no obstante estas referencias, corresponde consignar especialmente que las ideas que a continuación se exponen acerca de la i. jurídica, son atribuibles exclusivamente al autor de estas líneas. II. LA VISIÓN SEMÁNTICO-REFERENCIAL DEL LENGUAJE Desde que Charles Morris sistematizó, en su obra de 1938 Foundations of the Theory of Signs, las líneas generales de la semiótica contemporánea, se ha considerado que la semántica es aquella parte de la teoría de los signos que hace referencia y estudia las relaciones entre los signos y los objetos a los que se refieren: “La semántica [escribe Morris] se ocupa de la relación de los signos con sus designata y, por ello, con los 17 Acerca de la controversia hermenéutica-analítica en filosofía del derecho, véase Jori, M. (ed.), Ermeneutica e filosofia analitica. Due concezione del diritto a confronto, Turín, Giappichelli, 1994. 18 De este autor (Jerzy Wróblewski), se tendrán especialmente en cuanta sus trabajos “L’interpretation en droit: théorie et idéologie”, Archives de Philosophie du Droit, París, núm. XVII, 1972, pp. 51-69; “Semantic Basis of the Theory of Legal Interpretation”, en Logique et Analyse, Paris-Louvain, núm. 21-24, 1963, pp. 397-416; y “Legal Decision and its Justification”, en Hubien, H. (ed), Le raisonnement juridique, Bruselas, Émile Bruylant, 1971, pp. 409-419. 19 Los principales trabajos de este autor (Georges Kalinowski) en materia de interpretation jurídica son: “Philosophie et logique de l’ìnterpretation en droit. Remarques sur l’interprétation juridique, ses buts et ses moyens”, Archives de Philosophie du Droit, París, núm. XVII, 1972, pp. 39-49; “L’interprétation du droit: ses règles juridiques et logiques” Archives de Philosophie du Droit, París, núm. 30, 1985, pp. 171-180 y “Interpretation juridique et logique des propositions normatives”, Logique et Analyse, núm. 2 (nouvelle série), Paris-Louvain, 1959, pp. 128-142.
LA TEORÍA REFERENCIAL-REALISTA
481
objetos que pueden denotar o que, de hecho, denotan”.20 Ahora bien, una buena parte de la semiótica y la filosofía del lenguaje contemporáneas, ha distinguido, inspirándose en este punto en las ideas de Gottlob Frege,21 entre las funciones semánticas de significación (o sentido) y de designación (o referencia). En el presente contexto, la significación es la función semántica por la cual los signos y en especial las palabras se relacionan significativamente, i. e., haciendo conocer su significado, con los conceptos y las proposiciones del entendimiento.22 Esto quiere decir que la significación no es sino la relación de una palabra con un concepto u otro producto mental, de modo que, v. gr., el nombre “ruiseñor” significa el concepto del pájaro de ese nombre, y la proposición “el ruiseñor canta”, significa la proposición en la cual se vincula el concepto de ruiseñor con el concepto correspondiente a la acción de cantar. Por su parte, la función semiótica de designación consiste en la relación semántica entre las palabras y las realidades conocidas por los conceptos y proposiciones correspondientes;23 de este modo, la palabra “ruiseñor” no sólo significa el concepto por el que conocemos a ese pájaro, sino que designa o refiere a un pájaro de esa especie, que se constituye de ese modo en su designatum. Pero es importante destacar ahora que la función semántica de designación no es posible sin la de significación; en efecto, no se podrá designar con la palabra “avión” a ningún individuo o clase de individuos si no existe previamente en nuestro intelecto el concepto de avión.24 En este sentido, la doctrina del lenguaje que aquí se propone, se opone claramente a la semántica neopositivista de Morris y
20 Morris, Ch., Fundamentos de la Teoría de los Signos, trad. de R. Grasa, Barcelona, Paidós, 1994, p. 55. Sobre la semiótica de Morris, véase, Bertuccelli Papi, M., ¿Qué es la pragmática?, trad. de N. Cortés López, Barcelona, Paidós, 1996, pp. 25 y ss. 21 Véase Frege, G., “On Sense and Meaning”, Philosophical Writings of Gottlob Fregue, Geach, P. y Black, M. (eds.), Oxford, Blackwell, 1992, pp. 56 y ss. Acerca de las ideas de Frege en este punto, véase Laurier, D., “Philosophie du Langaje”, en Engel, P. (ed.), Précis de Philosophie Analytique, París, PUF, 2000, pp. 92 y ss. 22 Véase Kalinowski, G., Sémiotique et philosophie, París, Hadès-Benjamins, 1985, pp. 129 y ss. 23 Véase Beuchot, M., Aspectos históricos de la semiótica y la filosofía del lenguaje, México, UNAM, 1987, pp. 89 y ss. 24 M. S. Moore se manifiesta en contra de esta afirmación, en su trabajo “Law as a Functional Kind”, en George, R. P. (ed.), Natural Law Theory. Contemporary Essays, Oxford, Clarendon Press, 1994, pp. 204 y ss.
482
CARLOS I. MASSINI-CORREAS
Carnap, para la cual es posible la existencia de la función semántica de designación sin necesidad de la mediación del significado.25 Pero además, y con el propósito de clarificarlos, es preciso agregar a estos argumentos algunas precisiones indispensables. La primera de ellas radica en que, si bien no resulta posible designar sin la mediación de la significación, es posible inversamente significar con una palabra algún concepto, sin que sea necesaria en ciertos casos la existencia de una función designativa; en efecto, con la palabra “minotauro” está claro que se significa el concepto del conocido monstruo mitológico, sin que, sin embargo, se designe propiamente y en sentido “fuerte” a ningún individuo que pueda ser reconocido como un minotauro.26 La segunda precisión consiste en que una misma palabra puede tener diferentes significados; a fin de reducir el número de expresiones [escribe Georges Kalinowski] se confiere frecuentemente más de un sentido a una misma expresión. En consecuencia, la mayor parte de las expresiones... tienen dos o más de dos significaciones: son multívocas o, dicho de otro modo, polisémicas. Por sí misma, la polisemia no es un mal. Ella es, en realidad, un bien: nos proporciona, como hemos dicho, una economía de palabras. Pero es un bien en la medida en que no constituya un obstáculo a la comprensión. La polisemia es entonces fuente de ambigüedad, de malentendidos o bien de oscuridad. Corresponde al intérprete eliminarlas, si ello es posible, cosa que, lamentablemente, no siempre tiene lugar.27
La tercera de las precisiones se refiere a que si bien es posible significar sin designar, la designación aparece como una función semiótica de mayor relevancia que la significación; efectivamente, está claro —afirma Kalinowski— que “los hombres no elaboran sus lenguajes, naturales o artificiales, principalmente para significar sin designar, sino que, por el contrario, los crean, de un modo u otro y en la gran mayoría de los ca-
25 Véase Carnap, R., Autobiografía intelectual, trad. de C. Castells, Barcelona, Paidós-ICE, 1992, pp. 110 y ss. 26 Véase. Gilson, E., Lingüística y filosofía, trad. de F. Béjar Hurtado, Madrid, Gredos, 1974, pp. 59 y ss. 27 Georges Kalinowski, “Interpretation juridique et logique des propositions normatives”, en Logique et Analyse, cit., nota 19, pp. 172 y 173.
LA TEORÍA REFERENCIAL-REALISTA
483
sos, para hablar de cosas o de estados de cosas realmente existentes”,28 i. e., para designar objetos que existen con alguna independencia de nuestros actos de conocimiento. Esto es así, toda vez que los significados de las palabras o bien son abstraídos de la realidad, o bien son construidos a partir de conocimientos previamente abstraídos de la realidad, como sucede en el caso de una significación sin referencia directa o “fuerte”. Dicho de otro modo, la significación aparece como algo posterior al conocimiento, toda vez que no resulta posible significar sin un conocimiento previo de la noción significada y, en el caso de las palabras que no sólo significan sino que también designan, sin el conocimiento de las realidades designadas.29 De las afirmaciones precedentes se siguen necesariamente dos corolarios principales: (a) que el proceso semántico se encuentra constitutivamente vinculado al proceso de conocimiento, si bien el sentido de esos procesos resulta ser exactamente el inverso: el conocimiento parte de la realidad, para pasar a las nociones abstraídas o construidas a partir de ella y de allí a los nombres que manifiestan o transmiten a otros lo conocido; el proceso semántico, a la inversa, parte de las palabras-signos, para pasar a la significación de los conceptos y de allí a la designación, directa (“fuerte”) o indirecta (“débil”), de las realidades extramentales,30 y (b) que el reconocimiento de la función de designación de las palabras supone el igual reconocimiento de la posibilidad de la verdad como correspondencia o adecuación;31 en este sentido, Jaime Nubiola ha escrito que “mientras que la aproximación lógica se centraba en la sintaxis o coherencia de los resultados y en su posterior verificación o comprobación empírica, en las últimas décadas el énfasis se pone de nuevo en la articulación en el lenguaje de las dimensiones ontológica y epistemológica, en la articulación de mundo y pensamiento que acontece en el lenguaje”.32 Y en otro lugar, este autor agrega que “usamos la expresión ‘es verdadero’ ( o “es falso”) para evaluar o medir la efectiva capacidad de 28 29 30
Georges Kalinowski, Sémiotique et philosophie, cit., nota 22, pp. 165 y 166. Ibidem, pp. 168 y 176. Véase Theron, S., “Meaning in a realist perspective”, The Thomist, Washington, núms. 55-61, 1991, p. 48. 31 Véase Skarica, M., “Intencionalidad y lenguaje”, Philosophica, Valparaíso, núm. 24 y 25, pp. 331-347. 32 Nubiola, J. y Conesa, F., Filosofía del Lenguaje, Barcelona, Herder, 1999, pp. 151 y 152.
484
CARLOS I. MASSINI-CORREAS
las palabras para expresar con claridad un pensamiento y reflejar con cierta precisión una verdad”.33 III. LA NOCIÓN DE INTERPRETACIÓN Habiendo estudiado en sus líneas generales el proceso semántico del lenguaje, corresponde ahora el análisis de la noción de i. que se corresponde con la doctrina semántica hasta ahora desarrollada. En este sentido, se comenzará por precisar que se entiende por i. la actividad por la cual se capta o aprehende el significado de un texto determinado.34 Pero usualmente, también se asigna derivativamente ese nombre al resultado o producto de la actividad interpretativa, como cuando se habla de “la interpretación propuesta por tal o cual jurista”.35 Dicho de otro modo, en caso de la i. nos encontramos frente a un especial proceso cognoscitivo, por el cual, a partir de la aprehensión de ciertos signos articulados, se accede al significado al que ellos remiten. Ahora bien, está claro que en el caso de la i., entendida como actividad, se está en presencia de un acto de conocimiento;36 efectivamente, el conocimiento de una realidad cualquiera puede alcanzarse de dos modos diferentes: (a) por percepción y abstracción directa; y (b) por comunicación de otros sujetos cognoscentes. Dicho de otro modo, es posible acceder al conocimiento de una proposición verdadera, ya sea porque percibimos de modo directo, por nuestra propia experiencia, la relación de adecuación entre el concepto-sujeto y el concepto-predicado, ya sea porque alguien nos lo comunica a través de los signos del lenguaje. En este último caso, siempre será necesario algún tipo de i., aunque sea muy elemental, para acceder al significado de las expresiones por las que otro sujeto nos transmite la información que, una vez comprendida, pasará a integrar nuestro acervo cognoscitivo. Esto significa que por la mediación del lenguaje nos resulta posible enriquecer nuestros conocimientos y que esa mediación supone un acto 33 Nubiola, J., “La verdad en el lenguaje”, Anuario Filosófico, núm. XXXII-3, Pamplona, 1999, p. 737. 34 Véase Viola, F. y Zaccaria, G., Diritto e interpretazione, cit., nota 4, p. 106. 35 Véase Hernández Marín, R., Interpretación, subsunción y aplicación del derecho, Madrid, Marcial Pons, 1999, pp. 29 y ss. 36 Véase Betti, E., Voz “Interpretación”, Gran Enciclopedia Rialp, Madrid, Rialp, 1981, t. XII, pp. 857-859.
LA TEORÍA REFERENCIAL-REALISTA
485
interpretativo de los signos lingüísticos que nos haga posible acceder a las afirmaciones significadas por ese lenguaje. Si esto es así, resulta que la i. es un medio de conocimiento, una vía de acceso al contenido de las proposiciones que el emisor del mensaje lingüístico quiso transmitirnos. Esto no supone que en el conocimiento interpretativo no exista un elemento de construcción o de elaboración por parte del sujeto que conoce.37 Este elemento está presente en todo tipo de conocimiento, tal como lo han reconocido aún las más clásicas de las teorías del conocimiento, desde Aristóteles hasta nuestros días.38 Esta dimensión constructiva del conocimiento mediado por la i. ha sido puesta especialmente de relieve por la filosofía hermenéutica contemporánea, la mayoría de las veces sobredimensionando su importancia y, por lo tanto, deslizándose hacia el relativismo.39 Ahora bien, este conocimiento, que podemos denominar interpretativo, se produce a través de un proceso que resulta inverso al camino genético del lenguaje; tal como lo ha puesto de relieve Emilio Betti, el iter causal del lenguaje sigue la secuencia “realidad-pensamiento-palabras”, mientras que el iter interpretativo se presenta según la secuencia inversa “palabras-pensamiento-realidad”.40 Dicho de otro modo, el sujeto cognoscente-intérprete parte del conocimiento directo de las palabras para pasar, por la mediación de la i., al concepto o proposición y de allí a la realidad por ellos referida o designada. De este modo, lo que resulta ser el objeto propio de la i. son las palabras-signos, a partir de las cuales se alcanza el significado o sentido, radicado en los conceptos o proposiciones, que se refieren a su vez a las estructuras de la realidad.41 37 Esta dimensión constructiva de la i. es considerado central, entre otros, por Greenavalt, K., “Constitutional and Statutory Interpretation”, en Coleman, J. and Shapiro, S., The Oxford Handbook of Jurisprudence and Philosophy of Law, Oxford, Oxford University Press, 2002, pp. 270 y ss. 38 Véase Fabro, C., Percepción y pensamiento, trad. de J. F. Lisón Buendía, Pamplona, EUNSA, 1978, pp. 83 y ss.; asimismo: Moreau, J., De la connaissance selon Thomas d’Aquin, París, Beauchesne, 1976, pp. 61 y ss.; y Pouivet, R., Après Wittgenstein, Saint Thomas, París, PUF, pp. 48 y ss. 39 Véase Coreth, E., Cuestiones fundamentales de hermenéutica, trad. de M. Balasch, Barcelona, Herder, 1972, pp. 202 y ss. 40 Véase. Betti, E., L’ermeneutica comme metodica generale delle scienze dello spirito, Roma, Città Nuova Editrice, 1990, pp. 63-65. 41 Véase Llano, A., “Filosofía del lenguaje y comunicación”, Sueño y vigilia de la razón, Pamplona, EUNSA, 2001, pp. 83-109.
486
CARLOS I. MASSINI-CORREAS
Esto es lo que justifica la relación existente entre i. y verdad, ya que lo que se pretende conocer a través de la i. es el contenido verdadero o falso de las proposiciones por las que se conocen —en el caso de ser verdaderas— estados de cosas reales.42 De esta vinculación constitutiva entre i. y verdad, se sigue la necesidad de recurrir a la función semántica de la designación o referencia para que la i. alcance su objetivo: conocer algún aspecto o dimensión de la realidad mentada por el texto. Por otra parte, esta vinculación es la que hace posible distinguir entre interpretaciones correctas e incorrectas, acertadas o fallidas, adecuadas o inadecuadas. Resulta claro que sin el baremo indispensable de la referencia a la realidad, todas las interpretaciones, por diversas que fueran, resultarían exactamente equivalentes y del mismo valor cognoscitivo, con la consiguiente necesidad de la adopción de una concepción decididamente relativista y decisionista de la i.43 IV. LA INTERPRETACIÓN JURÍDICA Una vez precisado en concepto general de i., corresponde pasar al análisis de la i. propia del ámbito jurídico, en especial la de los textos jurídico-normativos. En este caso, es necesario observar, en primer lugar, que la i. de las normas jurídicas tiene un carácter eminentemente práctico, i. e., versa sobre textos práctico-normativos y tiene por finalidad conocer el contenido de una norma para la ordenación de la actividad humana jurídica.44 Escribe a este respecto Kalinowski que “la i. jurídica es la i. práctica por excelencia... Su fin no es la captación del sentido auténtico en vistas a la contemplación intelectual, sino la determinación de la regla de comportamiento, sin la cual la acción, exigida imperiosamente por la vida, no puede ser correctamente consumada”.45 Wróblewski
42 Véase Mura, G., “Ermeneutica e ontologia della parola”, en A. Lobato (ed.), Homo Loquens, Bologna, ESD, 1989, pp. 93 y 94. 43 Véase Beuchot, M., Tratado de hermenéutica analógica, México, UNAM-Itaca, 2000, pp. 50 y 51. 44 Véase. Massini Correas, C. I., La prudencia jurídica. Introducción a la gnoseología del derecho, Buenos Aires, Abeledo-Perrot, 1984. 45 Kalinowski, Georges, “Philosophie et logique de l’ìnterpretation en droit. Remarques sur l’interprétation juridique, ses buts et ses moyens”, op. cit., nota 19, pp. 45 y 46. Véase Vigo, R. L., De la ley al derecho, México, Porrúa, 2003, pp. 32 y ss.
LA TEORÍA REFERENCIAL-REALISTA
487
llama “operativa” a esta modalidad de la i., pero su noción es, en lo esencial, muy similar a la de Kalinowski.46 Por otra parte, es conveniente considerar que la i. jurídica paradigmática es la que lleva a cabo el juez en el marco de la aplicación de normas jurídicas generales a casos jurídicos concretos, i. e., máximamente determinados. Y esto es así, en razón de que las restantes modalidades de la i. jurídica se ordenan, de un modo u otro, a condicionar o conformar la i. que habrá de realizar el juez en el marco de su tarea aplicativa. Efectivamente, la i. jurídica doctrinaria o científica, que llevan a cabo los juristas, tiene como finalidad influir en un sentido determinado sobre las decisiones de los magistrados judiciales.47 Otro tanto ocurre con la que realizan los abogados asesores al aconsejar a sus clientes acerca del sentido de sus actividades: ellos realizan una determinada i. de la normativa jurídica previendo e intentando determinar cuál habrá de ser la que adoptará en definitiva el juez de la causa. Pero lo que interesa especialmente en este apartado es precisar cómo juegan, en el caso de la i. jurídico-práctica- judicial, las notas de la i. que hemos analizado en el punto precedente. En este sentido, es posible sostener, recurriendo a las ideas centrales de Michael S. Moore,48 que la significación práctico-operativa de los textos legales49 depende principalmente de su referencia; “En la semántica realista que yo sostengo [escribe Moore] lo que significan frases constitucionales como “igual protección”, resulta completamente articulada por el descubrimiento de la naturaleza del derecho moral o cualidad al que ellas se refieren... Mejor aún, estas palabras o frases toman su significado de su referencia, cualquiera que ella resulte ser”.50
46 Wróblewski, Jerzy,L’interpretation en droit: théorie et idéologie”, op. cit., nota 18, pp. 54 y ss. 47 Véase. Batiffol, H., “Questions de l’interpretation juridique”, en APD, núm. XVII, París, 1972, pp. 13 y ss. 48 Véase Moore, M. S., “Law as a Functional Kind”, Natural Law Theory. Contemporary Essays, Oxford, Clarendon Press, 1994, pp. 188 y ss. 49 Acerca de la noción de texto y, en especial, de texto legal, véase. Moore, M. S., “Interpreting Interpretation”, en Marmor, A. (ed.), Law and Interpretation. Essays in Legal Philosophy, Oxford, Clarendon Press, 1995, pp. 1-29. 50 Moore, M. S., “Natural Rights, Judicial Review, and Constitutional Interpretation”, en Goldsworthy, J. y Campbell, T. (eds.), Legal Interpretation in Democratic States, Aldershot, Ashgate-Dartmouth, 2002, p. 209.
488
CARLOS I. MASSINI-CORREAS
Esta escuela de la i. jurídica, que puede denominarse “escuela referencial-realista de la interpretation jurídica”, sostiene por lo tanto que los enunciados jurídico-normativos no sólo tienen un significado sino una designación, i. e., que se refieren a ciertas realidades y, por consiguiente, que cuando las normas expresan correctamente esa realidad referida son verdaderas y, a la inversa, cuando la reproducen incorrectamente, son falsas. Respecto de la designación de las normas jurídicas, Georges Kalinowski ha escrito que la proposición o enunciado proposicional ‘a debe hacer x’ es normativa o deóntica, es una norma-proposición. Ella significa un juicio-proposición normativa (deóntica), un juicio-norma, y designa una relación normativa (deóntica), a saber, una relación de obligación de hacer, obligación de no hacer, etcétera. Como se ve claramente aquí el paralelismo entre lo óntico y lo deóntico alcanza el nivel semántico, tanto en materia de significación como de designación.51
Ahora bien, esas relaciones deónticas que son el designatum de las normas jurídicas, pueden ser de dos categorías: (a) relaciones que existen naturalmente o por sí mismas, entre el modo de ser propio del hombre y el valor de ciertas acciones en orden al progreso o retroceso de su humanidad; y (b) relaciones establecidas por los legisladores humanos en razón de las exigencias de la vida en sociedad o, dicho en otras palabras, del bien común de la sociedad política.52 De este modo, v. gr., la relación entre el sujeto humano y la tortura, acción axióticamente disvaliosa por sí misma, es de “deber no hacer”, mientras que la que existe entre un sujeto y el respeto a la vida ajena, acción axióticamente valiosa por sí misma, es de “deber hacer”, todo ello con independencia de la actividad legislativa de los órganos del Estado o de los usos de la sociedad.53 Pero a su vez, esta actividad legislativa del Estado puede ser de dos tipos diferentes pero complementarios: (a) de recepción y explicitación de las relaciones deónticas naturales, así como de establecimiento de las sanciones 51 Kalinowski, Georges, “Ontique et déontique”, Rivista Internazionale di Filosofía del Diritto, núm. IV-LXVI, Milán, Giuffrè, 1989, p. 443. 52 Véase Massini Correas, C. I., El derecho natural y sus dimensiones actuales, Buenos Aires, Ábaco-Universidad Austral, 1999, pp. 188 y ss. 53 Véase. Massini Correas, C. I., “Significación y designación de las normas. La contribución de Georges Kalinowski a la semántica normativa”, Boletín Mexicano de Derecho Comparado, México, núm. 106, 2003, pp. 80 y 81.
LA TEORÍA REFERENCIAL-REALISTA
489
necesarias para asegurar su cumplimiento; y (b) de determinación de aquellas acciones axióticamente neutras que conviene promover, permitir o prohibir, habida cuenta de las circunstancias y de los requerimientos concretos de la vida buena en sociedad.54 Y si se trata de establecer el estatuto óntico de las relaciones deónticas que son el designatum de las normas, es preciso consignar que se trata de relaciones inmateriales, pero no por ello menos reales, habida cuenta de que su existencia es independiente de que las pensemos o no; efectivamente, la relación deóntica de “deber no hacer” que existe entre el correspondiente sujeto y la acción de torturar, no existe sólo porque la pensemos o hayamos decidido que así sea, sino que la pensamos y decidimos a su respecto precisamente porque existe. No se trata, por lo tanto, de meras relaciones de razón. El que uno de los términos de la relación, en este caso la acción, tenga una existencia meramente posible no cambia en nada la cuestión, toda vez que los entes posibles son entes reales, de existencia potencial, pero no por ello menos reales.55 De aquí se sigue que cualquier i. jurídica, en especial jurídico– normativa, que procure conocer el significado de un texto normativo, habrá de referirse en última instancia a las relaciones deóntico–normativas, naturales o positivas, que son el designatum de las normas–proposiciones. Dicho en otras palabras, la significación práctica de las normas habrá de ser indagada con referencia a las relaciones deónticas que son su designatum. Así, v. gr., el significado de las expresiones “ardid o engaño” que utiliza el artículo 172 del Código Penal argentino para calificar a una conducta como “estafa” y atribuirle una pena, no puede ser establecido sin una remisión a aquella clase de actividades que habitualmente se designan con el nombre de “engaño” o de “ardid”; el concepto significado con estas palabras remite naturalmente a ese tipo de conductas y, por lo tanto, es necesario tener algún conocimiento de ellas para poder interpretar lo que el Código Penal argentino quiso decir con esas palabras. Y en el caso de la i. de los textos constitucionales concernientes a los derechos humanos, corresponderá hacer referencia a las relaciones deónticas existentes entre los hombres y sus bienes humanos básicos, bienes que son el 54 Véase Kalinowski, G., “Loi juridique et loi logique. Contribution à la sémantique de la loi juridique”, Archives de Philosophie du Droit, París, núm. 25, 1980, pp. 130 y 131. 55 Véase Kalinowski, G., “De la signification des normes juridiques. A propos de l’article de J. Wróblewski ‘The Problem of the Meaning of the Legal Norm”, Pro manuscripto, p. 3.
490
CARLOS I. MASSINI-CORREAS
fundamento transpositivo de esos derechos;56 de este modo, para comprender el significado del “derecho a trabajar” resultará indispensable la aprehensión de la realidad que se designa con el término “trabajo”, así como de la relación que existe entre este tipo de actividad y la perfección humana. A esto hace referencia, entre varios otros, Karl Larenz, cuando habla de los “criterios teleológico-objetivos de interpretación”, estableciendo que ellos radican en la “naturaleza de la cosa”, i. e., en los datos fundamentales de la naturaleza corporal y espiritual del hombre y en la estructura constitutiva de las instituciones jurídicas. La referencia a estos criterios —sostiene Larenz— supone una orientación, tanto para el legislador como para el juez que interpreta y aplica en derecho, “que trasciende la mera facticidad y que penetra en la esfera de lo que es capaz de sentido y de valor”.57 Con esta referencia a la “naturaleza de la cosa” Larenz designa, con otras palabras, lo mismo que Kalinowski cuando habla de las estructuras deónticas cognoscibles en la realidad, y está también remitiendo a lo que la tradición iusnaturalista llama “justo natural” como criterio central de la i. jurídica.58 V. CRÍTICAS A ESTA TEORÍA La teoría o doctrina semántico-realista de la i. jurídica ha sido objeto de numerosas impugnaciones desde muy diferentes perspectivas filosóficas y doctrinarias. Por ello, y a los efectos de esclarecer y fundamentar dialécticamente esta teoría de la i. jurídica, se hará referencia y se debatirá en lo sucesivo con tres de estas impugnaciones: la elaborada por Riccardo Guastini en su libro Le fonti del diritto e l’interpretazione,59 la desarrollada por Andrei Marmor en su obra Interpretation and Legal
56 Véase Massini Correas, C. I., Los derechos humanos en el pensamiento actual, Buenos Aires, Abeledo-Perrot, 1994, pp. 146 y ss. 57 Larenz, K., Metodología de la ciencia del derecho, trad. de M. Rodríguez Molinero, Barcelona, Ariel, 1980, p. 414. Véase Vallet de Goytisolo, J., Metodología Jurídica, Madrid, Civitas, pp. 393 y ss. 58 Véase Ollero, A., “Hermenéutica jurídica y ontología en Tomás de Aquino”, Interpretación del derecho y positivismo legalista, Madrid, Editorial Revista de Derecho Privado, 1982, pp. 43-53. 59 Guastini, R., Le fonti del diritto e l’interpretazione, Milán, Giuffrè, 1993.
LA TEORÍA REFERENCIAL-REALISTA
491
Theory60 y la articulada por Brian Bix en su libro Law, Languaje and Legal Determinacy. En primer lugar, en la mencionada obra de Guastini, se efectúa una acerba crítica a lo que llama “primer concepto de interpretación”, según el cual “la atribución de significado a una fuente “clara” sería una actividad cognoscitiva, consistente en descubrir un significado preexistente en un cierto texto, y no en decidir qué significado (de entre los muchos posibles) convenga a ese texto determinado. Se sobreentiende —concluye— que la atribución de significado a un texto “claro” es una cuestión susceptible de ser verdadera o falsa”.61 Y más adelante agrega que “la teoría cognitiva —o, más comúnmente, “formalista”— de la interpretación sostiene que esta es una actividad de tipo cognoscitivo: interpretar es verificar (empíricamente) el significado objetivo de los textos normativos y/o la intención subjetiva de sus autores... Esto equivale a decir que los enunciados de los intérpretes (el texto ‘T’ significa ‘S’) son enunciados del discurso descriptivo, o sea, enunciados de los cuales se puede comprobar la veracidad o falsedad”.62 El autor italiano sostiene que esta opinión, que no atribuye concretamente a ningún filósofo o estudioso, se funda sobre “asunciones falaces”,63 tales como serían las siguientes: a) que las palabras tienen un significado propio o intrínseco, dependiente de una relación natural entre palabra y realidad; b) que las autoridades normativas tienen una voluntad unívoca y reconocible, siendo el objetivo de la i. el descubrir simplemente esta voluntad preexistente; y c) que todo texto normativo admite una y sólo una i. verdadera.64 Ahora bien, está claro que es posible sostener una teoría “cognitiva” de la i. y especialmente de la i. jurídica, que no defienda ninguna de esas tres afirmaciones “falaces” y que, no obstante, afirme que la i. jurídica es un acto del conocimiento práctico que, en cuanto práctico, contiene necesariamente un elemento volitivo o electivo. Esto es lo sostenido por la 60 Marmor, A., Interpretation and Legal Theory, Oxford, Clarendon Press, 1992; hay traducción castellana de M. Mendoza Hurtado, Barcelona, Gedisa, 2000. 61 Guastini, R., op. cit., nota 59, p. 329. Véase Guastini, R., “Escepticismo y cognitivismo en la teoría de la interpretación”, Ideas y Derecho, Buenos Aires, núm. II-2, 2002, pp. 31-48. 62 Ibidem, p. 335. 63 Idem. 64 Idem.
492
CARLOS I. MASSINI-CORREAS
teoría “referencial de la i. jurídica” que se ha desarrollado precedentemente y que afirma el carácter relativamente convencional de los signos lingüísticos, que la referencia de las normas jurídicas no lo es hacia meros actos de voluntad, sino hacia relaciones normativas reales, y que en la mayoría de los casos es posible encontrar más de una interpretation “correcta” de las normas jurídicas. En este último sentido, John Finnis ha sostenido, criticando la posición de Ronald Dworkin, que hay muchas formas de obrar mal y actuar mal; pero en muchas, tal vez en la mayoría de las situaciones de la vida personal y social, hay un buen número de opciones “correctas” (es decir, no malas) que resultan incompatibles entre sí. Las principales elecciones personales o las decisiones sociales autoritativas, pueden reducir grandemente esta variedad de opciones para la persona que ha asumido algún compromiso o para la comunidad que acepta tal autoridad. Pero aún así, esas elecciones o decisiones, aún cuando resulten razonables, no son en la mayoría de los casos exigidas por la razón. No están precedidas por ningún juicio racional acerca de que esta determinada opción sea la única respuesta correcta o la mejor solución”.65
La impresión que surge inmediatamente, tanto de la exposición y como de la crítica realizadas por Guastini a la teoría “cognitiva” de la i. jurídica, así como algunas otras exposiciones y críticas, v. gr. la realizada por Ulises Schmill,66 es la de que ellas han sido elaboradas sin un estudio detallado de las versiones más difundidas de la semántica cognitivista, como las de Georges Kalinowski, Michael S. Moore y John Finnis. En realidad, la descripción de Guastini de la teoría que llama “cognitiva” es una simplificación de la doctrina positivista-exegética67 de la interpretación jurídica, cuyos trazos centrales han sido caracterizados admirablemente por Francesco D’Agostino,68 pero es claro que las críticas referidas a ella no pueden ser legítimamente extendidas a todas las
65 Finnis, J., “Derecho natural y razonamiento jurídico”, Persona y Derecho, Pamplona, núm. 33, trad. de C. I. Massini Correas, 1995, p. 39. 66 Schmill, U. y Cossío, J. R., “Interpretación del derecho y concepciones del mundo”, en Vázquez, R. (ed), Interpretación jurídica y decisión judicial, México, Fontamara, 1998, pp. 57-37. 67 Véase Husson, L., “Analyse critique de la méthode de l’exégèse”, Nouvelles études sur la pensée juridique, París, Dalloz, 1974, pp. 173-196. 68 D’Agostino, F., op. cit., nota 4, p. 303.
LA TEORÍA REFERENCIAL-REALISTA
493
concepciones cognitivistas, en especial a la versión que se ha desarrollado más arriba. Por su parte, el filósofo del derecho israelí Andrei Marmor ha elaborado unas críticas más cuidadas y precisas, que tienen como objetivo principal la semántica realista y la teoría de la i. jurídica de Michael Moore, en especial las ideas desarrolladas en su trabajo “A Natural Law Theory of Interpretation”, publicada hace unos años en la Southern California Law Review.69 Marmor inicia su crítica puntualizando que “es bastante claro que la explicación realista del significado de “derecho” es incompatible con las tesis principales del positivismo jurídico, al menos como son sostenidas por Hart, Kelsen y Raz... El convencionalismo defendido por el positivismo jurídico y el realismo acerca del significado de “derecho” —concluye— son directamente opuestos”.70 Y más adelante, Marmor sostiene que el realismo respecto del significado de “derecho” apoyaría una doctrina del derecho natural, en caso de ser verdadero. Si hubiera una realidad objetiva que hiciera que las proposiciones jurídicas fueran, de manera definida, verdaderas o falsas, entonces tendría sentido afirmar que la verdad de los enunciados de LP (todos los enunciados sobre aquello que la ley ordena en un sistema jurídico dado) podría ser descubierta o revelada, del mismo modo como se descubre una ley de la naturaleza.71
Una vez expuesto el evidente carácter contradictorio del iuspositivismo y de la teoría realista de la semántica jurídica, el profesor de Tel Aviv inicia el desarrollo de sus críticas a esta última doctrina; la primera de ellas se refiere a que existen numerosas normas jurídicas que aparecen como neutras o irrelevantes desde el punto de vista moral, como por ejemplo las referidas a una mera coordinación de las acciones sociales, tal como ocurre en las reglas del tránsito.72 Ahora bien, desde el punto de vista de Marmor, si las normas jurídicas han de ser verdaderas o falsas, “un realista tendría que mostrar que el principio de bivalencia (verdade69 Moore, M. S., “A Natural Law Theory of Interpretation”, Southern California Law Review, San Diego, núm. 58, 1985, pp. 279-398. Véase una crítica integral a las ideas de Moore en Bix, B., “Michael Moore Metaphysical Realism”, Law, Language and Legal Determinacy, Oxford, Clarendon Press, 1995, pp. 133-177. 70 Marmor, A., op. cit., nota 60, p. 123. 71 Idem. 72 Ibidem, p. 124.
494
CARLOS I. MASSINI-CORREAS
ro-falso; CIMC) vale con respecto a los enunciados acerca del derecho, aun cuando el caso no se pueda decidir a partir de fundamentos morales”.73 Y como resulta que, según Marmor, esto no puede demostrarse, habría quedado refutada de ese modo la concepción realista acerca de los enunciados jurídicos. Ahora bien, sucede que en lo que respecta a todo el amplio ámbito de las acciones en principio éticamente neutras es posible establecer positivamente varias soluciones alternativas y excluyentes; v. gr., la circulación vial por la derecha o por la izquierda, de tal modo que cualquiera de las opciones que se establezca, ella resultará jurídicamente correcta y, por lo tanto, verdadera. Esto significa que la existencia de soluciones positivas acerca de cursos de acción éticamente irrelevantes o neutros, no invalida en ningún sentido la concepción semántica realista.74 La segunda de las objeciones formuladas por Marmor radica en que quien aceptara la teoría semántica realista “tendría que rechazar toda contradicción entre el derecho y la moral... Si se sostiene —afirma el profesor israelí— que el principio de bivalencia se aplica al derecho, se sigue que, al menos, la ley no puede ordenar un conjunto de exigencias inconsistentes. Pero esto es, sin más, falso. Los sistemas jurídicos incluyen a menudo prescripciones inconsistentes en sentido moral e incluso lógico”.75 El problema que se le plantea a esta objeción radica en que Marmor se mueve, al elaborarla y presentarla, en dos planos diferentes que, pareciera, confunde: ellos son el plano deóntico y el plano fáctico. La verdad o falsedad de las normas jurídicas se plantean en el plano de las proposiciones deónticas, razón por la cual una proposición normativa, v. gr. “todo hijo debe matar a su madre” es evidentemente falsa en el plano deóntico, aún cuando en el plano fáctico existiera una comunidad en la que esa norma hubiera sido establecida positivamente. Se tratará, en ese caso, de una norma jurídicamente falsa, aunque establecida positivamente. Esta solución resulta impensable para un iuspositivista consecuente como Marmor, para quien “jurídico” es sinónimo de “positivo”, y por lo tanto se le hace inconcebible la posibilidad de una norma “jurídica” que sea “no positiva”, así como de una norma “positiva” que sea “no jurídi73 74
Idem. Véase en este punto, Finnis, J., Natural Law and Natural Rights, Oxford, Clarendon Press, 1984, pp. 103 y ss. 75 Marmor, A., op. cit., nota 60, pp. 124 y 125.
LA TEORÍA REFERENCIAL-REALISTA
495
ca”. Pero para un iusnaturalista, también consecuente, que parte del supuesto de la unidad del orden ético, resulta claro que una norma como la del ejemplo no es propiamente “jurídica” ni estrictamente “derecho”, sino sólo de un modo derivativo, impropio o analógico.76 Dicho en otras palabras: esta segunda impugnación realizada por Marmor a la semántica jurídica realista sólo tiene sentido dentro del marco de un pensamiento cerradamente iuspositivista, pero no bien se sobrepasan estos márgenes, la propuesta realista se vuelve completamente razonable. En la tercera de las impugnaciones que vamos a considerar,77 Marmor comienza por aceptar la existencia, siguiendo aquí la terminología de Herbert L. A. Hart, de una moral crítica al lado de la moral positiva, de modo tal que la moral positiva de un pueblo concreto en un tiempo determinado puede ser evaluada desde los parámetros de la moral crítica y, por lo tanto, resultar verdadera o falsa. Pero, según Marmor, esto no puede ocurrir con el derecho, toda vez que en este último caso se está en presencia de un producto “puramente cultural”, que no tiene un equivalente crítico con el cual cotejarlo valorativamente. En rigor, afirma Marmor, el único modo en que puede criticarse al derecho es a partir de baremos externos al derecho, más concretamente a partir de criterios morales, esencialmente distintos —según Marmor— de los jurídicos. “¿Por qué es posible —afirma este filósofo— concebir que ciertos dominios normativos, como la moral, tienen aspectos críticos inmanentes o autónomos, mientras que otros, tales como el derecho, sólo pueden ser valorados críticamente desde la perspectiva de otros dominios críticos? Nos inclinamos a ver la razón de ello en el hecho de que el derecho, a diferencia de la moral, es una creación humana, un producto de la cultura”.78 Nuevamente es posible percibir, en esta tercera impugnación, que Marmor hace partir su argumento desde premisas estrictamente iuspositivistas que se dan por supuestas, específicamente la que sostiene que el derecho es una realidad puramente cultural. En este sentido, un iusnaturalista coherente aceptará que en el derecho se da un elemento o dimen76 Véase la argumentación desarrollada en Massini Correas, C. I., “Justicia y derecho en ‘Ley natural y derechos naturales’ de John Finnis”, Sapientia, Buenos Aires, núm. 207, pp. 563-568. Véase asimismo: Hervada, J., Introducción crítica al derecho natural, Pamplona, Eunsa, 1981, pp. 41 y ss. 77 Existe una cuarta objeción, referida específicamente a la Teoría de la “clases naturales” de H. Putnam, que dejaremos aquí de lado por elementales razones de espacio. 78 Marmor, A., op. cit., nota 60, p. 134.
496
CARLOS I. MASSINI-CORREAS
sión cultural, pero negará decididamente que el derecho revista carácter meramente cultural; para estos últimos pensadores, toda realización cultural humana tiene una base o fundamento natural, i. e., se constituye a partir y desde una estructura básica de carácter no-cultural, desde una índole o modo de ser propio del hombre que sirve de marco y de cimiento a toda epifanía cultural.79 Así, v. gr. es evidente que en toda la legislación acerca de la paternidad influyen elementos culturales, que marcan las particularidades que adopta esta institución en cada uno de los derechos históricos; pero también resulta innegable que esa regulación tiene por fundamento y marco la realidad natural de la paternidad, sin la cual todas las particularidades de la legislación carecerían de sentido. Por todo esto, en una perspectiva iusnaturalista, la crítica del derecho positivo no se lleva a cabo desde una instancia externa, sino de una dimensión estrictamente interna o inmanente al derecho, i. e., desde los parámetros del derecho natural.80 El derecho natural es por tanto jurídico y, en rigor, más jurídico desde el punto de vista de los contenidos que el derecho positivo; este último no es más que la recepción, precisándolos y sancionándolos, de los contenidos del derecho natural, o bien la determinación y precisión de lo que resulta indiferente desde la perspectiva de lo justo natural. De este modo, todo el derecho positivo puede ser valorado en su verdad o falsedad desde el criterio intrínsecamente jurídico del derecho natural.81 Y es por ello que las comparaciones que efectúa Marmor con realidades tales como el juego y el arte82 resultan improcedentes, toda vez que se trata de ámbitos de la realidad extraños en cuanto tales al orden ético–práctico, al que pertenecen tanto el derecho, como la moral personal o la política.83 En definitiva, no parece que las impugnaciones articuladas por Riccardo Guastini y Andrei Marmor alcancen a confutar la teoría realista o referencial de la i. jurídica, sino que antes bien, el mismo análisis y consideración de estos argumentos sirve de confirmación acerca de la adecuación y pertinencia de esta perspectiva. En rigor, todas las críticas estudiadas parten de la asunción de los supuestos centrales del positivismo 79 80
Véase. Llano, A., Humanismo cívico, Barcelona, Ariel, 1999, pp. 154 y ss. Véase Murphy, M., Natural Law and Practical Rationality, Cambridge, Cambridge University Press, 2001, pp. 40 y ss. 81 Véase Rentto, J. P., Match or Mismarriage? A Study on Ontological Realism and Law, Helsinski, Acta Societatis Fennicae Iuris Gentium, 1992, pp. 174 y ss. 82 Marmor, A., op. cit., nota 60, pp. 131 y 135. 83 Véase Finnis, J., Aquinas. Moral, Political and Legal Theory, Oxford, Oxford University Press, 1998, pp. 20-55.
LA TEORÍA REFERENCIAL-REALISTA
497
jurídico y se formulan desde ellos, pero en cuanto se trasciende este punto de partida y se abre el entendimiento a una perspectiva menos reduccionista, queda en evidencia su debilidad y la deficiente justificación racional de la mayoría de sus afirmaciones. VI. CONSIDERACIONES SOBRE “FALSOS PROFETAS” Una nueva y más extensa crítica de la doctrina realista de la i. jurídica, es la efectuada por el profesor de Minnesota, Brian Bix,84 con especial referencia a las ideas desarrolladas por Michael S. Moore, y expuestas en su largo ensayo “Michael Moore’s Metaphysical Realism”,85 del que sólo se podrá dar aquí un breve esbozo. Bix comienza su exposición afirmando que “para aquellos de nosotros que pensamos que Moore tal vez sea un falso profeta, la mejor estrategia para refutar sus argumentos es combatirlos en su fuente: el realismo metafísico”;86 y más adelante, resume esta última doctrina sosteniendo que la teoría metafísico-realista del significado está basada en la idea de que una palabra se refiere a una clase (kind) natural o acontecimiento que sucede en el mundo y no es arbitrario que poseamos un símbolo para nombrar a esta cosa. En esta aproximación, nuestro uso de una palabra, y la definición que ofrecemos de ella, no será necesariamente estática, sino que cambiará en la medida en que nuestra comprensión del objeto, acontecimiento, o idea a que el término se refiere, cambie. Moore presenta al ‘convencionalismo’ como la (desfavorable) alternativa a la teoría metafísico-realista del significado: a la inversa del realismo metafísico, una teoría convencionalista ve a las relaciones entre los símbolos y las cosas como esencialmente arbitrarias.87
Luego de estas aserciones preliminares, Bix continúa analizando el pensamiento de Moore a través de algunos ejemplos, como el del signifi84 Acerca de la opinión de este autor sobre de las teorías del derecho natural, véase Bix, B., “Natural Law: the Modern Tradition”, en Coleman, J. and Schapiro, S. (eds.), The Oxford Handbook of Jurisprudence and Philosophy of Law, Oxford, Oxford University Press, 2002, pp. 61-103. 85 Bix, B., “Michael Moore’s Metaphysical Realism”, Law, Languaje and Legal Determinacy, Oxford, Clarendon Press, 1995, pp. 133-177. 86 Ibidem, pp. 133 y 134. 87 Ibidem, pp. 138 y 139.
498
CARLOS I. MASSINI-CORREAS
cado de la palabra “muerte”, intentando demostrar que el significado de las palabras, en especial de los nombres universales, no se corresponde con esencias o clases naturales.88 En favor de esta afirmación, Bix sostiene que la atribución de significado a las palabras es el mero resultado del “modo en que los objetos parecen agruparse para nosotros”; “cómo nuestros conceptos dividen la realidad es arbitrario, en el sentido de que no se puede hablar de ello como ‘verdadero’ o ‘justificado’... Esta es la idea de Wittgenstein de la ‘autonomía de la gramática’”.89 En rigor, para el profesor de Minnesota, la atribución de significados a las cosas del mundo es el producto de nuestras prácticas sociales y no el resultado, como lo piensa el realismo metafísico, del conocimiento de ciertas clases o estructuras existentes en la realidad, que son independientes de nosotros y de cómo las pensemos.90 Más adelante en el mismo artículo, Bix reformula la oposición entre el realismo metafísico y el convencionalismo de raíz wittgensteiniana: “El realista metafísico —afirma— puede decir que hay categorías (que incluyen clases o esencias naturales y clases o esencias morales) cuya existencia y límites son independientes de nosotros. Una de esas categorías corresponde (en cierto sentido) a lo que la mayoría de la gente llama ‘justicia’, aun cuando la mayoría, o incluso todos, pueden estar equivocados respecto a su naturaleza”.91 A esta concepción opone la suya propia, según la cual un wittgensteiniano podría decir que existe algo en nuestro uso de un término (y en nuestra reacción hacia el uso de ese término por otra gente) que nos autoriza a decir cuándo estamos considerando una nueva aplicación (o “interpretación”) del concepto más que un concepto totalmente diferente .... Las referencias a nuestras prácticas, reacciones, convenciones o estipulaciones son las herramientas de las aproximaciones que no son realistas-metafísicas...92
88 Es evidente que se está en presencia de una reformulación de la antigua “cuestión de los universales”; véase, en este punto, Casaubon, J. A., Palabras, ideas, cosas. La cuestión de los universales, Buenos Aires, Candil, 1984. 89 Bix, B., op. cit., nota 85, p. 171. 90 Véase Moore, M. S., “Law as a Functional Kind”, Natural Law Theory..., cit., nota 48, pp. 190 y 191. 91 Bix, B., op.cit., nota 85, p. 175. 92 Idem.
LA TEORÍA REFERENCIAL-REALISTA
499
Y concluye sus argumentaciones sosteniendo que, en el ámbito jurídico estamos preocupados por la divergencia entre lo que los legisladores pretenden y lo que las palabras en sus promulgaciones significan o parecen significar, y acerca del problema de aplicar textos redactados hace tiempo a situaciones actuales. Los realistas metafísicos insinúan que están en condiciones de darnos soluciones simples aun a esos problemas, haciendo que la respuesta a todos los problemas interpretativos dependan de la opinión corriente de los expertos... Como la mayoría de las panaceas, sospecho que las aproximaciones al derecho de los realistas metafísicos son más un fraude que una cura. De lo que Wittgenstein en sus últimos escritos y otros críticos sofisticados del realismo metafísico han estado tratando de persuadirnos, es de que el modo en que nosotros realmente usamos el lenguaje está fundado en nuestras prácticas e inclinaciones y es adecuado a nuestras necesidades. No es necesario —concluye— un apoyo mayor y ni siquiera es posible”.93
Está claro que la posición de Bix en su crítica a Michael S. Moore resulta constitutivamente dependiente de una filosofía del leguaje estrictamente wittgensteiniana,94 posición que, en los términos en que se plantea la cuestión de los universales, es radicalmente nominalista o conceptualista.95 Ahora bien, resulta indiscutible que esta concepción del lenguaje se opone diametralmente a la sostenida por el realismo metafísico en cualquiera de sus versiones,96 pero esta comprobación no argumenta nada en contra de la verdad de esta última posición; en rigor, sólo justifica lo que ya se sabía de antemano: que son dos propuestas contrarias y recíprocamente incompatibles, pero mientras no se acredite concluyentemente la verdad de la concepción convencionalista, no quedará excluida la posibilidad de la verdad del realismo metafísico. En realidad, toda la argumentación de Brian Bix puede sintetizarse en una de sus afirmaciones finales: aquella según la cual no sólo no es necesario para la i. del lenguaje jurídico ninguna referencia a las estructuras 93 94
Ibidem, p. 177. Sobre la filosofía del lenguaje de Wittgenstein, Véase Llano, A., Metafísica y Lenguaje, Pamplona, EUNSA, 1997, pp. 28 y ss. Véase asimismo, Bustos Guadaño, E., Filosofía contemporánea del lenguaje, Madrid, UNED, 1987, pp. 59 y ss. 95 Véase Sanguineti, J. J., Logica filosofica, Florencia, Le Monnier, 1987, pp. 39 y ss. 96 Véase Moore, M. S., “Legal Reality: a Naturalist Approach to Legal Ontology”, en Law and Philosophy, Amsterdam, núm. 21, 2002, pp. 619-705.
500
CARLOS I. MASSINI-CORREAS
de la realidad, sino que esa referencia es radicalmente imposible. Esto significa la adopción de un escepticismo radical en materia ética y jurídica, como consecuencia del cual se aboca necesariamente a un no-cognitivismo ético97 y a la consiguiente negación del carácter cognoscitivo de la i. De este modo, la i. jurídica acabará careciendo de toda objetividad y todas las i. posibles, por contradictorias entre ellas que aparezcan, revestirán un idéntico valor y resultará posible escoger válidamente una cualquiera de entre ellas de modo arbitrario e injustificado. La i. caerá entonces del lado de la mera elección o decisión, sin que tenga cabida en ella la razón cognoscitivamente entendida. Esto no parece preocupar a Bix,98 pero sí resulta inquietante para la doctrina de la i. jurídica, ya que si ella resulta ser no el producto, directo o indirecto, de un cierto conocimiento, sino de simples e infundadas elecciones o decisiones, como podrían ser las que se realizan entre corbatas de un color o de otro, la i. en sí misma acabará careciendo de todo sentido y razón de ser. En efecto, si cada una de las opciones interpretativas vale tanto como la otra, no se ve claramente porqué habremos de indagar, sistematizar, comparar, deliberar y argumentar a favor de una u otra; dicho en otras palabras, porqué habremos de llevar adelante la tarea interpretativa, si en definitiva cualquier resultado al que arribemos valdrá lo mismo que cualquier otro. Más aún, ni siquiera tendrá sentido inventariar toda la serie de soluciones interpretativas posibles, ya que si la opción entre ellas es gratuita, da lo mismo que inventariemos una o catorce, ya que la elección por una de ellas será siempre injustificada e injustificable, con lo que carece de toda relevancia la tarea de precisar las diferentes opciones que pueden resultar de la lectura de un texto legal. Finalmente, tampoco puede recurrirse al argumento pragmático, i. e., al que sostiene que debe elegirse la solución que resulte más útil en cada circunstancia, ya que la determinación de la solución más útil o provechosa requiere necesariamente de una argumentación que remita a datos de la realidad humana, con lo que se volvería a caer en el temido realismo, que tanto molesta a Brian Bix. En definitiva, parece que el verdadero “falso profeta” resulta ser el mismo Bix, quien en su propuesta wittgensteiniana99 de significados convencio97
Véase Cotta, S., “Conoscenza e normatività. Una prospettiva metafisica”, Rivista Internazionale di Filosofía del Diritto, Milán, núm. IV-LXXI, 1994, pp. 555-568. 98 Bix, B., op. cit., nota 85, pp. 176 y 177. 99 Véase Pouivet, R., Après Wittgenstein, saint Thomas, París, PUF, 1997.
LA TEORÍA REFERENCIAL-REALISTA
501
nales o socialmente construidos, no alcanza a proporcionar una respuesta satisfactoria a las múltiples cuestiones que plantea a la inteligencia el complejo problema de la i. jurídica.100 VII. RESULTADOS DE LA INDAGACIÓN REALIZADA Luego de las indagaciones y análisis realizados hasta ahora, es posible proponer ciertos resultados o conclusiones acerca de las relaciones entre la semántica realista y la i. jurídica. La primera de ellas es que la semiótica contemporánea y, en especial sus contribuciones en el campo de la semántica, proporcionan toda una serie de elementos nocionales que resultan de especial utilidad al momento de precisar y solucionar los problemas planteados por la i. jurídica; en ese ámbito, se han considerado especialmente aquí las contribuciones efectuadas desde esta perspectiva por los iusfilósofos Jerzy Wróblewski, Georges Kalinowski y Michael S. Moore. En segundo lugar, ha quedado también en claro que al aplicar la semántica al caso de las proposiciones normativas es posible mostrar que los textos normativos no sólo tienen un significado, sino también una referencia, i. e., designan realidades, en este caso relaciones deónticas de prescripción, prohibición o permisión, relaciones que no revisten carácter empírico, pero que no por ello resultan menos reales; más aun, la referencia determina de modo relevante el significado (que es el objeto de la tarea de i.) de modo tal que para conocer este último resulta indispensable indagar la designación o referencia propia de cada norma; dicho en los expresivos términos de Karl Larenz, indagar la “naturaleza de las cosas” a la que cada norma constitutivamente remite. Por otra parte, se ha mostrado también que la i. consiste en el proceso cognoscitivo por el cual se aprehende el significado de un texto, significado que hace posible conocer la realidad a la que esa significación se refiere; de este modo, la i. deviene un modo de conocer o de comprender la verdad o falsedad de ciertas afirmaciones; este modo de conocer se contrapone al conocimiento directo de las realidades, que es el objeto propio de la explicación;101 además, en el caso especial de los textos jurí100 Véase Batiffol, H., “Questions de l’interpretation juridique”, Archives de Philosophie du Droit, París, núm. XVII, 1972, pp. 9-27. 101 Véase Von Wright, G. H., Explicación y comprensión, trad. de L. Vega Reñón, Madrid, Alianza, 1979.
502
CARLOS I. MASSINI-CORREAS
dicos, más concretamente de los textos normativos, resulta evidente que la i. tiene un carácter práctico, i. e., ordenada a la aprehensión de verdades prácticas, directivas o estimativas del obrar humano; por ello, esta i. no tiene por finalidad conocer solamente lo que el legislador quiso originariamente decir, sino encontrar la norma adecuada, i. e., justa, para la regulación de cada caso; esta norma adecuada a la solución prudente de un caso jurídico, que no es sino la significación correcta del texto normativo, se conoce principalmente por la indagación de su referencia, i. e., por la investigación y aprehensión de las relaciones deónticas reales, sean estas de carácter constitutivamente jurídico (natural) o bien de carácter positivo, establecidas estas últimas por la autoridad a los fines de determinar, en orden al bien común, lo que naturalmente resulta indeterminado. Finalmente, es posible sostener que las críticas dirigidas a esta teoría referencial-realista de la i. jurídica, al menos las que han sido analizadas en este trabajo, no parece que hayan logrado desvirtuar sus afirmaciones centrales, ya que estas impugnaciones alcanzan su sentido sólo dentro de un marco de comprensión estricta y rígidamente iuspositivista del derecho y de la i. jurídica, así como de una concepción nominalista o al menos convencionalista de la significación del lenguaje, además de conducir a resultados paradójicos y dejar sin respuesta razonable a la mayoría de las cuestiones planteadas por la i. jurídica. Todo esto pone en evidencia que la teoría referencial-realista conduce a soluciones que no sólo proporcionan respuestas plausibles a la problemática de la i. jurídica, sino que, además, revisten un carácter, al menos en principio, estrictamente iusnaturalista;102 pero esto último no puede constituir por sí mismo una objeción a esa teoría interpretativa, sino que antes bien aparece, en la medida en que resulta sólidamente fundada, como una razón más a favor de la larga tradición filosófica del derecho natural.103
102 Véase George, R. P., “Natural Law, the Constitution, and the Theory and Practice of Judicial Review”, The Clash of Ortodoxies, Wilmington-Delaware, ISI Books, 2001, pp. 169 y ss. 103 Acerca de la tradición del derecho natural y del sentido que ha de darse a esta expresión, Véase Boyle, J., “Natural Law and the Ethics of Traditions”, Natural Law Theory, pp. 3-30. Asimismo, véase MacIntyre, A., Tres versiones rivales de la ética. Enciclopedia, genealogía y tradición, trad, de R. Rovira, Madrid, Rialp, 1992, pp. 166 y ss.
LA ESTRATEGIA DE LA VIOLENCIA POLÍTICA Y LA CONTRAVIOLENCIA TERRORISTA Klaus MÜLLER UHLENBROCK* SUMARIO: I. El pronóstico del fin del sistema estatal. II. La teoría del partisano y el diagnóstico de lo político después del fin del sistema estatal. III. La irregularidad del terrorismo internacional y la criminalización del enemigo. IV. Bibliografía.
I. EL PRONÓSTICO DEL FIN DEL SISTEMA ESTATAL En el prólogo del tratado El concepto de lo político de 1963, Carl Schmitt desarrolla la tesis sobre el fin del sistema de Estado1. Tal situación exige una nueva respuesta a los asuntos constitutivos del Estado y de la política porque la tesis de la disolución de la estatalidad enfrenta a los contemporáneos al desafío de elaborar una nueva concepción de lo político independientemente del modelo del Estado que fue instaurado en Europa central como representación de la unidad política, después de las guerras devastadoras de religión, que terminaron con las decisiones de la paz de Westfalia.2 * Facultad de Estudios Superiores Acatlán, UNAM, México. 1 El autor escribió el prólogo de 1963 en el sentido de un comentario actualizado acerca de la reedición de su obra El concepto de lo político de 1932, señalando que quiere ante todo delimitar un ámbito propio de cuestiones de la ciencia del derecho político. La versión en español se consulta en: Schmitt, El concepto de lo “político”, México, Folio ediciones, 1985, pp. 3-13. 2 Sobre la paz de Westfalia de 1648 véase: Langer, Der westfälische Frieden. Pax europaea und Neuordnung des Reiches, Berlín, Brandenburgisches Verlagshaus, 1994; Reinhard, Geschichte der Staatsgewalt. Eine vergleichende Verfassungsgeschichte Europas von den Anfängen bis zur Gegenwart, Frankfurt, Büchergilde Gutenberg, 2000; y Müller Uhlenbrock, La teoría contractualista del Estado y de la sociedad en Hobbes, México, UNAM, 2003. 503
504
KLAUS MÜLLER UHLENBROCK
Una remembranza hacia la historia confirma el esfuerzo conceptual continuo de una nueva definición de lo político porque en el mundo de las transformaciones sociales se escenifican permanentemente procesos de disolución de las constelaciones establecidas del poder, dando como resultado la reforma de la Constitución política. El campo de lo político cambia continuamente basados en las fuerzas y los poderes que se unen y se separan entre sí con el fin de conservarse. La tesis del fin de la estatalidad implica el enfrentarse con la teoría política desarrollada en la historia de cuatrocientos años sobre el racionalismo occidental. Durante siglos se defendió la pretensión legal y legítima del Estado institucional, como modelo de unidad y monopolio de la decisión política, mediante procesos específicos de racionalización. La afirmación de la disolución y la destitución de dicho Estado a partir de la segunda mitad del siglo XX representa la separación con respecto a una historia de 400 años, convirtiendo al sistema del Estado en una tradición. La parte europea de la humanidad vivió, hasta hace poco tiempo, en una época cuyos conceptos jurídicos estaban totalmente marcados por la impronta del Estado y presuponían al Estado como modelo de la unidad política. La época de la estatalidad está ya arribando a su fin: sobre esto no corresponde derrochar palabras. Con ella desaparece la estructura íntegra de conceptos relativos al Estado, erigida por una ciencia del derecho del Estado e internacional de carácter eurocentrico, en el curso de un trabajo conceptual que duró cuatro siglos. El Estado como modelo de la unidad política, el Estado como titular del más extraordinario de todos los monopolios, o sea del monopolio de la decisión política, esa brillante creación del formalismo europeo y del racionalismo occidental, está por ser destronado.3
En Europa central, el Estado representa la institucionalización de la unidad política del sistema social de necesidades (System der Bedürfnisse).4 A través de las ciencias del Estado y del derecho internacional, el 3 4
Schmitt, op. cit., nota 1, p. 4. La expresión “el sistema de las necesidades” se encuentra en la tercera parte de los Principios de la filosofía del derecho de Hegel. Como primer momento de determinación de la sociedad civil (bürgerliche Gesellschaft) señala el autor: “La mediación de las necesidades y la satisfacción del individuo por su trabajo y por el trabajo y la satisfacción de necesidades de todos los demás: el sistema de las necesidades”. Con respecto al sistema de las necesidades, Hegel distingue entre la sociedad y el Estado. Hegel, Principios de la filosofía del derecho, Barcelona, Los Libros de Sísifo, 1999, p. 310.
LA ESTRATEGIA DE LA VIOLENCIA POLÍTICA
505
Estado se justifica al afirmar que el proceso de pacificación de las relaciones sociales se pudo alcanzar sólo a través del Estado como forma de organización política. La imposición y la aceptación del monopolio estatal de la toma de decisiones implica, al mismo tiempo, la impresión hacia el exterior de una unidad territorial pacificada por medio de un soberano que se afirma frente a otros soberanos. El reconocimiento mutuo de los soberanos obtiene su expresión política en el derecho internacional europeo. La forma de la racionalización jurídica y de la legitimización estatal son el núcleo de una concepción clásica basada en la “posibilidad de distinciones claras y unívocas”.5 La pacificación de las relaciones sociales internas, aunada a la representación exterior de la unidad política, incluyen la declaración de enemistad y la disposición de hacer la guerra. Por lo tanto, la guerra es la forma regulada de una medición de fuerzas con medios militares entre Estados soberanos, ya que las guerras interestatales están controladas por criterios unívocos mediante los cuales se determinan no sólo el inicio y el fin de la disputa militar sino también las formas de ocurrencia del conflicto. Asimismo, el Estado separado puede participar en el conflicto mediante la declaración de guerra o distanciarse del mismo declarando su neutralidad. Con respecto a la guerra entre Estados, no sólo se distingue la guerra de la paz, sino también lo militar de lo civil. El combatiente encargado por el Estado se viste, de manera general, con uniforme y se presenta públicamente con armas que son usadas en contra de los enemigos militares, pero no en contra de la población civil desarmada. “Interno y externo, guerra y paz; durante la guerra, militar y civil, neutralidad y no neutralidad; todo esto es claramente distinto, no puede ser confundido”.6 El derecho internacional define y regula jurídicamente el status político de los conflictos entre Estados en los cuales el enemigo es señalado de manera unívoca como tal, es decir, no como un delincuente sometido a la persecución jurídica. Por medio de tal distinción clara y unívoca no se puede evitar la guerra, pero con base en ella se posibilita la “protección (Hegung) con medidas del derecho internacional”,7 según la cual la guerra no se termina solamente a través del acuerdo de paz sino también se limita con respecto a sus efectos crueles. Al rechazar las confusiones y aceptar de distinciones claras y unívocas, Carl Schmitt plantea la pro5 6 7
Schmitt, op. cit., nota 1, p. 5. Idem. Idem.
506
KLAUS MÜLLER UHLENBROCK
puesta de una relativización paulatina de la enemistad, y solamente mediante estos criterios se puede efectuar el “progreso en un sentido humanitario”.8 De este modo, las fórmulas jurídicas del derecho internacional europeo revelan, de manera efectiva, tal progreso; así se presentó en Europa el caso raro de que el enemigo ya no fue combatido como delincuente y que la guerra y la enemistad fueron limitadas y circunscritas de manera jurídica. El ejemplo en Europa respecto a la protección de los efectos de la guerra entre Estados documenta, a pesar de la continuidad de la disposición a la guerra, un progreso humanitario con base en la existencia del Estado y de la soberanía. La existencia del modelo de la decisión estatal soberana constituye, por ende, el presupuesto para delimitar la guerra; y de tal manera el jurista del Estado termina el prólogo al concepto de lo político señalando: “Quien demuele las distinciones clásicas, y las limitaciones construidas sobre ellas, de la guerra entre Estados, debe saber lo que hace”.9 II. LA TEORÍA DEL PARTISANO Y EL DIAGNÓSTICO DE LO POLÍTICO DESPUÉS DEL FIN DEL SISTEMA ESTATAL Cuando en 1963 se desarrolla el pronóstico del fin del sistema estatal, se publica también el tratado sobre la Teoría del partisano, que continúa, de manera explícita, mediante el subtítulo Notas complementarias al concepto de lo político, la línea de argumentación respecto a lo político.10 El autor aquí hace referencia a la constitución contemporánea de lo político. Las reflexiones sobre el pirata y el corsario antes mencionadas en El giro hacia el concepto discriminatorio de la guerra extienden el interés hacia el partisano. En dicha teoría se describe el desarrollo del concepto de enemigo “convencional” y “verdadero” al enemigo “absoluto”. Con base en la línea genealógica, empezando por Clausewitz, Engels y Lenin y continuando con Stalin y Mao, Schmitt reconstruye este desarrollo con referencia al partisano, el cual se caracteriza por las teorías de guerra de Stalin y Mao como una combinación del partisano con pretensiones revolucionarias en el mundo con el defensor originalmente nacionalista y autóctono, es decir, el partisano patriótico. 8 9 10
Ibidem, p. 6. Idem. Schmitt, Teoría del partisano. Notas complementarias al concepto de lo “político”, México, Folio Ediciones, 1985.
LA ESTRATEGIA DE LA VIOLENCIA POLÍTICA
507
Según su esencia política se puede determinar el fenómeno del partisano por medio de cuatro criterios: el primero se refiere a la irregularidad del combate, el segundo a la mayor movilidad en la conducción de la lucha, el tercero a la actividad política maximizada y el cuarto al carácter telúrico del partisano. De acuerdo a lo anterior, el partisano combate, con base en los poderes e ideologías políticos, aplicando medios irregulares en contra de un enemigo regular y verdadero. El señalamiento del enemigo como “verdadero” se refiere a la ausencia del concepto total de enemistad, porque el partisano guarda, a pesar del manejo de ideologías revolucionarias, todavía una relación autóctona con una parte de la tierra, lo que restringe el modo de la enemistad. El partisano moderno, al servicio de la revolución mundial, está caracterizado por la intensidad extre ma de la ac ti vi dad po lí ti ca y se di ri ge, con ba se en su mo vi li dad mayor y su táctica irregular de combate, a la enemistad absoluta. Sólo el vínculo autóctono con el suelo nacional permite evitar la declaración absoluta de enemistad. De ahí que Schmitt descubre la transfor mación del enemigo verdadero en un enemigo absoluto en la politización leninista del revolucionario profesional, que elimina el tipo del combatiente autóctono y nacionalista de la teoría política. El desarrollo real de lo político hacia la declaración absoluta de enemistad significa al mismo tiempo el desencademiento de la guerra irregular. El partisano, dedicado a la realización del fin político y comprometido con una tercera persona interesada, realiza el combate sin uniforme y con armas que no demuestra públicamente; finalmente se apropia de la obra destructiva de los revolucionarios profesionales que persiguen el principio abstracto del asunto revolucionario sin el vínculo nacionalista al suelo autóctono. Según Schmitt se revela aquí la “carencia” del pensamiento concreto entendido en el sentido de un orden estatal, y justamente eso niega aquel progreso humanitario analizado con base en la fórmula de la protección y restricción de la guerra como el acto decisivo de la humanidad occidental: la renuncia a la criminalización del enemigo. El partisano como figura actuante en el campo político funge, para Carl Schmitt, como el último representante de lo político exponiéndose en su papel de combatiente al peligro y al riesgo y realizando de tal manera el nexo entre lo político y la situación límite. En el curso del desarrollo político mundial de los últimos doscientos años, el combatiente nacionalista de resistencia y de liberación —marcado por su carácter telúrico en su irregularidad de partisano— se transformó en un partisano
508
KLAUS MÜLLER UHLENBROCK
con orientación revolucionaria. Este desarrollo condiciona la transformación del enemigo verdadero en enemigo absoluto. La totalización de la enemistad se refuerza todavía a través del desarrollo técnico e industrial de los sistemas de armamento y, adicionalmente, por la realidad de la Era nuclear. La lógica técnica de la aniquilación absoluta corresponde a la totalización del enemigo. Continuando la tesis de Hobbes y Hegel que vincularon el tipo del armamento con la esencia de riesgo del combatiente, Schmitt afirma que tal lógica de correspondencia de la situación límite no resulta de la constitución antropológica de los hombres malignos y perversos sino que se expresa en tal lógica la “ineluctabilidad de una obligación moral”. Eso significa concretamente que las armas extraconvencionales exigen hombres extraconvencionales. Ellas no las presuponen, por cierto, como postulado de un futuro lejano, más bien sugieren que en realidad ellos están ya entre nosotros. El extremo peligro no está ubicado por lo tanto ni siquiera en la existencia de medios destructivos totales o en una intencional perversidad humana. Está en la ineluctibilidad de una obligación moral. Aquellos hombres que usan esos medios contra otros hombres se ven obligados a destruir a esos otros hombres, es decir, a sus víctimas, incluso moralmente; deben estigmatizar a la parte adversaria como criminal e inhumana, como un no-valor absoluto, porque de otra manera ellos mismos serían criminales y monstruos. La lógica del valor y del no-valor extiende toda su devastadora consecuencialidad y obliga a la creación continua de nuevas y más intensas discriminaciones, criminalizaciones y desvalorizaciones, hasta llegar a la destrucción completa de toda vida indigna de existir.11
III. LA IRREGULARIDAD DEL TERRORISMO INTERNACIONAL Y LA CRIMINALIZACIÓN DEL ENEMIGO
Con la reinstauración de la discriminación y criminalización absoluta del enemigo, la teoría del partisano, elaborada 40 años antes como análisis del concepto de lo político, hace referencia a las condiciones durante la Guerra Fría y al enfrentamiento de diferentes sistemas políticos e ideológicos, y describe el proceso de erosión del sistema estatal que continúa y culmina al inicio del siglo XXI. La disolución del conflicto Este-Oeste no representa ningún acto de emancipación política en el sentido mun11
Ibidem, p. 188.
LA ESTRATEGIA DE LA VIOLENCIA POLÍTICA
509
dial, porque en realidad sólo se liberó una nueva lógica militar con base en la declaración de la enemistad. Si el partisano que combate por medios irregulares en contra de un enemigo regular fue señalado como la figura representativa política de la Guerra Fría, entonces el terrorista internacional representa la forma intensificada actual del combate irregular bajo las condiciones del mundo globalizado. El terrorismo político-internacional se basa en la estrategia de escenificar, a pesar de la carencia de recursos, el ataque hacia centros simbólicos de Estados altamente poderosos, calculando el efecto de la multiplicación de los medios. Así como el partisano pone entre paréntesis la regulación de la conducción de guerra entre Estados, de la misma manera actúa el terrorista haciendo caso omiso total de un conflicto delimitado y regulado. Pero a diferencia del partisano que requiere del apoyo de la población civil y quien evita, por eso, el uso de la violencia irregular en contra de personas civiles, el terrorista demuestra su desinterés absoluto con respecto a la distinción entre la esfera civil y la militar. De manera indiscriminada y brutal, el terrorista hace uso de medios no convencionales de combate, ataca metas simbólicas de manera inesperada e incógnita —porque él no se distingue como combatiente de la población civil— provocando así un terror que los medios intensifican por sus constantes repeticiones a manera de espectáculo. A los actos del terrorismo político internacional realizados en las metrópolis del hemisferio occidental los Estados responden con la guerra en contra del terror. Dado que no se puede identificar al adversario, la guerra se lleva a cabo de manera preventiva durante un tiempo imprevisible y potencialmente en todo el mundo. Tal constelación política contemporánea documenta no otra cosa que la disposición a la declaración absoluta de enemistad. Las acciones militares regulares en forma de una invasión territorial, realizadas por los poderes estatales que pretenden legitimar su acción bélica a través de la formación de una coalición internacional, provocan la resistencia de grupos que proclaman el heroísmo nacional en contra del enemigo invasor. De tal manera, los Estados identificados como agresores se enfrentan al desafío desastroso y sangriento de mantener una ocupación de territorios supuestamente identificados como base del terrorismo internacional. Sin embargo, la guerra de la coalición internacional de Estados contra naciones soberanas no provoca solamente el surgir de grupos de resistencia que recurren con sus contraataques a la lucha irregular de los partisanos, sino que promueve también la división entre
510
KLAUS MÜLLER UHLENBROCK
los po de res que for man par te del he mis fe rio oc ci den tal. La ero sión del sistema político mundial —sostenido esencialmente por los criterios del racionalismo occidental— se manifiesta mediante la disposición de aprovechar la disyuntiva a favor de intereses de Estados particulares. Consecuentemente, los Estados en su calidad de agresores carecen de legitimidad para atacar al terrorismo entendido como una amenaza del sistema mundial de Estados. El proceso de erosión de la formación de los Estados en el sistema mundial se expone a través del discurso de los así llamados failing States o los rogue States. A través de dicho discurso, siguiendo el modelo de la teoría occidental de civilización, se reconoce que la unificación de las sociedades, en amplias zonas del mundo, mediante la formación de Estados ha fracasado. Por un lado la declaración absoluta de enemistad a través de Estados con proyectos hegemoniales, las cuales perciben a amplias partes del mundo como una amenaza potencial al orden social logrado con base en la existencia del Estado, y por otro lado la enemistad absoluta declarada por grupos siniestros sin una base territorial fija, documentan el desencadenamiento actual de la enemistad absoluta, que puede llegar a intensificarse aun más. El desarrollo político en el siglo XXI se concentra, aparentemente, en la disposición de llevar a cabo guerras santas o guerras justas para las cuales no existen medios jurídicos de protección y delimitación. IV. BIBLIOGRAFÍA HEGEL, G. W. Friedrich, Principios de la filosofía del derecho, Barcelona, Los Libros de Sísifo, 1999. LANGER, Herbert, 1648. Der westfälische Frieden. Pax europaea und Neuordnung des Reiches, Berlín, Brandenburgisches Verlagshaus, 1994. MÜLLER UHLENBROCK, Klaus, La teoría contractualista del Estado y de la sociedad en Hobbes, México, UNAM, 2003. REINHARD, Wolfgang Geschichte der Staatsgewalt. Eine vergleichende Verfassungsgeschichte Europas von den Anfängen bis zur Gegenwart, Frankfurt, Büchergilde Gutenberg, 2000. SCHMITT, Carl, El concepto de lo “político”, México, Folio Ediciones, 1985. ———, Teoría del partisano. Notas complementarias al concepto de lo “político”, México, Folio Ediciones, 1985.
ACERCA DE LAS NORMAS DERIVADAS Pablo E. NAVARRO* SUMARIO: I. Introducción. II. Coherencia y normas derivadas. III. La validez de las normas derivadas. IV. Sistemas normativos abiertos. V. Conclusiones.
I. INTRODUCCIÓN El convencionalismo es una de las tesis características del positivismo jurídico contemporáneo.1 Esta tesis destaca la relación entre la existencia del derecho y sus fuentes sociales, señalando que la validez de las normas jurídicas depende de prácticas de reconocimiento específicas de cada comunidad.2 Sin embargo, el énfasis en el aspecto convencional del derecho es, algunas veces, desafiado por las normas derivadas, es decir, por aquellas normas que son consecuencia de otras normas expresamente formuladas por las autoridades. En un trabajo reciente, Andrei Marmor formula el problema de la siguiente manera:3 * Consejo Nacional de Investigaciones Científicas y Técnicas, Argentina. 1 Coleman, Jules, The Practice of Principle, Oxford, Oxford University Press, 2001, pp. 65-148; y “Incorporationism, Conventionality, and the Practical Difference Thesis”, en Coleman, Jules (ed.), Hart’s Postscript, Oxford, Oxford University Press, 2001, pp. 114-121; Marmor, Andrei, “Constitutive Conventions” y “Conventions and the Normativity of Law”, Positive Law and Objective Values, Oxford, Oxford University Press, 2001, pp. 1-48, Shapiro, Scott J., “The Difference that Rules Make”, en Bix, Brian (ed.), Analyzing Law. New Essays in Legal Theory, Oxford, Oxford University Press, 1998, pp. 33-62. 2 Por supuesto, diferentes teorías pueden discrepar acerca de cuáles son los hechos que explican la existencia del derecho. Al respecto, véase: Raz, Joseph, “Legal Positivism and the Sources of Law”, The Authority of Law, Oxford, Oxford University Press, 1979, pp. 37-52. 3 Marmor, Andrei, “Exclusive Legal Positivism”, Positive Law and Objective Values, op. cit., nota 1, p. 69. 511
512
PABLO E. NAVARRO
“La idea básica es más bien simple, y puede ser considerada de acuerdo con un fundamento convencional del derecho: supóngase que un sistema jurídico, digamos, Si contiene las normas Ni… n. Supóngase además que las normas Ni… n implican la verdad de otra norma, digamos, Nx. ¿No podríamos concluir que Nx es también jurídicamente válida en Si?” Esta pregunta es respondida de manera diferente por los teóricos del positivismo jurídico. Por ejemplo, la incorporación de las normas derivadas ha sido identificada como un rasgo característico del positivismo jurídico incluyente.4 Por el contrario, quienes defienden una versión excluyente del positivismo jurídico rechazan la validez de estas normas. Andrei Marmor es un ejemplo paradigmático de positivista excluyente, y sostiene que la incorporación de las normas derivadas conduce a una confusión entre el derecho que tenemos y el que deberíamos tener.5 El propósito central de este trabajo es defender la validez de las normas derivadas. Los juristas admiten diferentes tipos de normas implícitas en el ordenamiento jurídico,6 pero en este trabajo el análisis se restringirá a la validez de las normas lógicamente derivadas, es decir, a normas que son consecuencia lógica de otras normas expresamente formuladas por las autoridades normativas.7 Este trabajo intenta lograr dos objetivos específicos. En primer lugar, se sostiene que la solución de Marmor al problema de las normas derivadas es inadecuada y que la coherencia no desempeña ningún papel relevante en la incorporación de las normas derivadas. En segundo lugar, se analiza una estrategia típica del positivismo excluyente para dar cuenta de normas que, sin pertenecer al sistema jurídico, son jurídicamente vinculantes. Este argumento se basa en la naturaleza abierta de los sistemas jurídicos, y en la posibilidad de que normas que no forman parte de un sistema sean “adoptadas” por jueces y órganos de adjudicación para la justificación de sus decisiones institucionales.
4 Véase, Raz, Joseph, “Authority, Law and Morality”, Ethics in the Public Domain, Oxford, Oxford University Press, 1994, pp. 210 y ss. 5 Marmor, Andrei, “Exclusive Legal Positivism”, Positive Law and Objective Values, cit., nota 1, pp. 69 y 70. 6 Guastini, Ricardo, Distinguiendo, Barcelona, Gedisa, 2000, p. 358. 7 La literatura acerca de la lógica deóntica, su naturaleza y posibilidades, es abrumadora. Para una discusión clásica de sus principales problemas, véase: Hilpinen, Risto (ed.), Deontic Logic. Introductory and Systematic Readings, Dordrecht, Reidel, 1971; Hilpinen, Risto (ed.), New Studies in Deontic Logic, Dordrecht, Reidel, 1981.
ACERCA DE LAS NORMAS DERIVADAS
513
II. COHERENCIA Y NORMAS DERIVADAS Para Marmor, aceptar la validez de las normas derivadas presupone que el derecho es coherente. Marmor distingue correctamente entre la coherencia como un valor en el proceso de interpretación del derecho y la coherencia de un sistema de normas. Esta distinción es importante ya que ambos problemas aparecen muchas veces confundidos por la ambigüedad de la expresión “interpretación del derecho”, esta expresión se refiere tanto a la identificación de las normas o su sistematización. Identificar una norma es paradigmáticamente la operación semántica de asignar significado a un texto o formulación normativa, mientras que la sistematización se refiere a la operación conceptual de derivar las consecuencias lógicas de un conjunto de normas, dado que no existen relaciones lógicas entre textos, sino entre sus significados, se sigue que la sistematización presupone que ya hemos interpretado lo que significan ciertos textos. Por consiguiente, el problema de la validez de las normas derivadas surge sólo una vez que se ha superado la etapa de interpretación de los textos normativos. Por ello, Marmor señala que aunque la coherencia es un valor importante en la interpretación del derecho, en el problema de las normas derivadas el presupuesto es mucho más fuerte y se refiere a la consistencia de las normas de un sistema jurídico. Luego añade:8 “la única cuestión que debemos analizar ahora es si tiene sentido asumir que el derecho es necesariamente coherente, en sentido lógico o en algún otro sentido. Una respuesta negativa es difícilmente rechazable”. Revisemos las premisas cruciales de este argumento. Por una parte, la validez de las normas derivadas requiere la coherencia de los sistemas jurídicos. Por otra parte, los sistemas jurídicos no son necesariamente coherentes. Aunque Marmor tendría que defender ambas premisas para mostrar que la incoherencia de un sistema normativo es una condición suficiente para negar la validez de las normas derivadas, su análisis no proporciona tal argumento, y por ello, sus afirmaciones quedan indeterminadas y sin fundamento. En particular, Marmor no parece advertir una dificultad central de su estrategia: las inconsistencias lógicas en un sistema normativo dependen de las relaciones de consecuencia lógica entre las normas. Por ello, no parece plausible admitir que los sistemas jurídi8 Marmor, Andrei, “Exclusive Legal Positivism”, Positive Law and Objective Values, op. cit., nota 1, p. 69.
514
PABLO E. NAVARRO
cos pueden ser incoherentes, y, al mismo tiempo, negarse a admitir la validez de las consecuencias lógicas de las normas formuladas. Marmor sostiene que la validez de las normas derivadas implica asumir que el derecho es necesariamente coherente. Sin embargo, Marmor no afirma que el derecho es necesariamente incoherente. A su vez, tampoco ofrece un análisis de lo que ocurre en aquellas situaciones en las que, por razones contingentes, el sistema jurídico regula coherentemente el comportamiento. No intentaremos remediar estos defectos de la argumentación de Marmor. Más bien, en esta discusión se dejará de lado la cuestión de si los sistemas jurídicos son necesariamente coherentes o incoherentes, y sólo analizaremos si es posible admitir normas derivadas en sistemas normativos incoherentes.9 Una inconsistencia normativa puede ser explícita o implícita. La inconsistencia es explícita cuando el conflicto normativo se produce entre dos o más normas expresamente formuladas por una autoridad normativa. Por ejemplo, cuando una norma expresamente obliga o permite una conducta que otra norma expresamente señala como prohibida. Para la solución de este tipo de conflictos, los juristas emplean criterios formales como la fecha de la promulgación de la norma (e. g. lex posterior), o el rango jerárquico de las normas incoherentes (e. g. lex superior). Estos criterios presuponen que el conflicto se produce entre normas formuladas ya que se refieren al momento de la promulgación de la norma o la competencia jerárquica de la autoridad que han formulado las normas en conflicto. Ahora bien, ¿por qué el reconocimiento de una incoherencia explícita en un sistema impide atribuir validez a las normas derivadas? Es importante advertir que un conflicto normativo puede estar “encapsulado” en un determinado caso, es decir, las normas en conflicto pueden regular otras situaciones de manera coherente. En esta situación, aunque 9 Una reconstrucción precisa de las inconsistencias en los sistemas jurídicos requiere introducir herramientas lógicas desarrolladas por la lógica deóntica, pero a efectos de evitar tecnicismos, no se proporcionará una definición explícita. Más bien, el aparato analítico que se emplea es intuitivo y sólo es necesario enfatizar que, cualquiera sea la reconstrucción que se utilice, una contradicción normativa genera un problema práctico ya que introduce exigencias incompatibles de conducta. Por razones de simplicidad, las expresiones “contradicción normativa”, “incoherencia normativa”, “inconsistencia normativa”, etcétera, serán empleadas como sinónimos. Acerca de la noción de inconsistencia normativa, véase: Wright, Georg von, Norm and Action, Londres, Routledge & Kegan Paul, 1963, p. 203; Alchourrón, Carlos y Bulygin, Eugenio, Normative Systems, pp. 62-64, 186 y187.
ACERCA DE LAS NORMAS DERIVADAS
515
el sistema es incoherente porque hay al menos un caso regulado de manera inconsistente, es posible identificar casos que las normas regulan de manera coherente. Para estas situaciones, el rechazo de las normas derivadas no puede basarse en el hecho de que el sistema normativo es incoherente. Por supuesto, de un conjunto de normas explícitamente incoherente se siguen normas derivadas incoherentes, pero del simple hecho de que un sistema sea explícitamente inconsistente no se sigue, sin premisas adicionales, que no pueda reconocerse la validez de sus normas derivadas. Tal vez quien niega la validez de las normas derivadas ha cambiado implícitamente de significado atribuido a “validez”. Uno de los significados usuales de la expresión “norma válida” se refiere al hecho de que una norma pertenece a un cierto sistema jurídico. En este sentido, la afirmación de que las normas derivadas son válidas en un sistema incoherente sólo significa que las consecuencias lógicas de un conjunto incoherente de normas también son parte de ese conjunto. Esta noción de validez, sin embargo, tiene que distinguirse cuidadosamente de otra que señala que las normas válidas son obligatorias, e. g. las normas válidas imponen soluciones concluyentes a un problema normativo. En este sentido de “validez”, las normas derivadas de un conjunto incoherente no pueden ser válidas ya que impondrían soluciones concluyentes incompatibles y esta posibilidad se encuentra excluida por la noción misma de “solución concluyente”. Pero, este argumento no prueba que las normas derivadas no pueden ser válidas sino más bien muestra únicamente que no se puede regular válidamente el comportamiento mediante exigencias incompatibles. Quienes niegan la validez de las normas derivadas parecen pasar por alto el importante papel que ellas cumplen en sistemas normativos que son implícitamente incoherentes. Una inconsistencia es implícita cuando las consecuencias lógicas de un conjunto de normas correlacionan a un mismo caso con soluciones normativas incompatibles. A diferencia de las incoherencias explícitas, en el caso de este tipo de conflictos, la única manera de advertir que un sistema normativo es inconsistente es identificando las consecuencias lógicas que se derivan de las normas expresamente formuladas. Considérese, por ejemplo, las siguientes normas.
516
PABLO E. NAVARRO
1) Es obligatorio encender la calefacción y cerrar la ventana (i. e. O p&q) 2) Si la ventana no está cerrada, la calefacción debe apagarse (i. e. ¬q à O ¬p) Al respecto, Ota Weinberger señala:10 Es bastante usual que dos normas de este tipo sean válidas, al mismo tiempo, en el sistema y nadie las considera inconsistentes. Sin embargo, conforme a los sistemas estándar hay al menos una contradicción latente entre ellas, y surge una contradicción efectiva tan pronto ¬ q se produce. De (1) se sigue ‘Op’ y de (2) y ‘¬q’ se sigue ‘O¬p’, y esas conclusiones son incompatibles. Una conclusión importante puede extraerse de este ejemplo. Las normas derivadas no solo son compatibles con un sistema normativo incoherente sino que ellas sirven para mostrar si estos sistemas son inconsistentes. Si las normas derivadas no formasen parte del sistema, entonces no habría razón para sostener que el sistema es incoherente ya que el conflicto surge únicamente al desplegarse las consecuencias lógicas de las normas expresamente formuladas. En otras palabras: la coherencia no parece suministrar un argumento para rechazar la validez de las normas derivadas sino más bien parece que sólo cuando se incorporan las normas derivadas es posible determinar la coherencia de un sistema normativo. Este análisis muestra que Marmor no tiene razón en su rechazo de la validez de las normas derivadas. Por consiguiente, en contra de su sugerencia de que “la única cuestión que debemos resolver es si tiene algún sentido asumir que el derecho es necesariamente coherente”, la pregunta relevante es completamente diferente. El problema crucial es si los órganos de adjudicación, e. g. los jueces, pueden desconocer las consecuencias lógicas de las normas válidas en la justificación de sus decisiones jurídicas. Si se admite que estos órganos no pueden ignorar la solución que establecen las normas lógicamente derivadas, entonces se ha introducido una premisa decisiva para aceptar la validez de las normas derivadas. La razón es clara: los jueces están obligados a aplicar normas válidas, y luego de aceptar que las normas derivadas son vinculantes, la carga de la prueba recae sobre quienes niegan que ellas sean normas válidas. En resumen: Marmor proporciona una respuesta errónea porque introduce una pregunta equivocada. El problema no es si los sistemas jurídi10 Weinberger, Ota, “The Significance of Logic for Modern Legal Theory”, Law, Institution and Legal Politics, Dordrecht, Kluwer, 1991, p. 84.
ACERCA DE LAS NORMAS DERIVADAS
517
cos son coherentes o no lo son o qué relación existe entre normas derivadas y coherencia de los sistemas normativos. Más bien el problema es si las normas derivadas son obligatorias para los jueces. En la próxima sección se analizará la naturaleza vinculante de las normas derivadas y se considerará si una convención jurídica contingente puede explicar su validez jurídica. III. LA VALIDEZ DE LAS NORMAS DERIVADAS Una intuición básica acerca de la validez de las normas es que esta característica está intrínsecamente conectada tanto con la justificación de las decisiones institucionales como con una reconstrucción sistemática del derecho.11 Una norma es jurídicamente válida sólo si posee una cierta propiedad P, que es decisiva para determinar si esa norma pertenece al sistema jurídico. Una reconstrucción filosófica de la validez de las normas, a menudo, intenta ofrecer criterios que pueden encontrarse en todos los sistemas jurídicos (e. g. relaciones genéricas entre normas), dejando de lado las diferencias particulares. Por el contrario, un estudio muy detallado de los criterios de validez que están vigentes en una cierta comunidad necesariamente individualiza normas específicas, doctrinas y costumbres particulares. Por ejemplo, en Argentina, una descripción verdadera de las fuentes del derecho no puede ignorar la estructura federal del Estado Argentino, el control difuso de constitucionalidad de las normas, etcétera. En este nivel de análisis es muy fácil encontrar diferencias entre dos sistemas jurídicos ya que la identidad de un sistema jurídico se define por esos criterios específicos. El análisis detallado de las prácticas específicas y convenciones de validez puede arrojar luz sobre un argumento simple en favor de la validez de las normas derivadas. Este argumento es similar al invocado por los partidarios del positivismo incluyente cuando insisten en la incorporación de normas morales al ordenamiento jurídico. La validez de las normas derivadas puede ser un hecho contingente; es decir puede ser el resultado de una práctica social que expresa el punto de vista de los órganos de adjudicación de justificar sus decisiones en normas derivadas. Dado que la validez jurídica depende de convenciones, puede existir 11
Raz, Joseph, “Legal Validity”, The Authority of Law, cit., nota 2, pp. 146-153.
518
PABLO E. NAVARRO
en una comunidad una práctica social que establezca que las normas derivadas son jurídicamente vinculantes. Por ejemplo, el Código de Comercio argentino no establecía expresamente que el transportador debe indemnizar a los herederos de un individuo fallecido durante la ejecución del contrato de transporte. Pero, los jueces señalaron que el artículo 184 del Código de Comercio prevé el “caso de muerte” del viajero “acaecida durante el transporte en ferrocarril”. Y como producida esa circunstancia sólo sus herederos pueden reclamar por el mal cumplimiento del contrato de transporte, es lógico concluir que el transportador se encuentra obligado hacia ellos como lo estaba con respecto al causante “al pleno resarcimiento de los daños y perjuicios” sufridos (CNCiv., Sala A, Julio 7 1964). ED, 9-32.
Por supuesto, no siempre que los jueces mencionan la relevancia de la lógica se están refiriendo a las normas derivadas. Además, los jueces no siempre identifican correctamente a las normas que se derivan de un conjunto de normas expresamente formuladas por la autoridad. Sin embargo, ninguno de estos hechos alcanza para negar que es posible encontrar una comunidad en la que los jueces reconocen a las normas derivadas como partes del sistema jurídico. Lo que importa remarcar es que la incorporación de las normas derivadas puede producirse en virtud de una práctica de adjudicación que reconozca la validez de esas normas. En este caso, las normas lógicamente derivadas puede fundarse en reglas convencionales establecidas por las prácticas judiciales, i. e. en una fuente social. Sin embargo, aunque exista una práctica judicial que reconoce el carácter vinculante de las normas derivadas podría sostenerse que, en esos casos, los jueces no están aplicando normas existentes sino que ellos están modificando el derecho. En otras palabras: ¿es posible sostener que los jueces, al aplicar normas derivadas como justificación de sus decisiones, están en realidad creando derecho? Así, ¿no podría defenderse que, al igual que ocurre con la aplicación de pautas morales, los jueces tienen discreción para desarrollar el derecho mediante la identificación y aplicación de normas derivadas? Al respecto es importante recordar la siguiente afirmación de Raz:12 12 Raz, Joseph, The Concept of a Legal System, 2a. ed., Oxford Oxford University Press, 1980, p. 40.
ACERCA DE LAS NORMAS DERIVADAS
519
Si los jueces aplican una norma supuestamente jurídica (1) que fue creada con la intención de crear derecho o que es generalmente considerada como derecho; y (2) la razón para la aplicación es que la norma satisface la condición (1), entonces los jueces están aplicando una norma jurídica que ya existía, y no una norma creada por ellos mismos. (itálicas añadidas).
Es posible que, en un sistema jurídico particular, los jueces consideren a las normas derivadas como jurídicamente vinculantes y acepten que deben aplicarlas, excepto en aquellos casos en que existan otras razones jurídicas más importantes. Así, cuando encontramos una convención judicial que reconoce la relevancia jurídica de las normas derivadas tenemos buenas razones para sostener que (a) los jueces no crean derecho sino que aplican normas que existen desde antes de sus decisiones, y (b) esas normas forman parte del sistema jurídico. Esta respuesta se basa en dos tesis: Por una parte, es posible que existan convenciones sociales que atribuyen validez a las normas derivadas y, por otra parte, las normas derivadas han sido incorporadas al sistema en virtud de las prácticas judiciales de reconocimiento de su relevancia jurídica. Ambas tesis pueden ser cuestionadas. En primer lugar, puede sostenerse que una convención social que reconociese la validez de las normas derivadas sería una práctica que se auto-refuta. Esta objeción ha sido usualmente desarrollada para mostrar que un sistema jurídico no puede incorporar convencionalmente a normas morales.13 Así, una convención que estableciese que debemos decidir conforme a lo que establece la moral no determina normativamente el comportamiento. Al respecto, Marmor señala:14 “El punto esencial es, sin embargo, este: las convenciones no pueden constituir una práctica que consista en expectativas de la gente involucrada en la práctica de hacer lo que ellos tienen razón para hacer con independencia de la práctica”. Sin embargo, esta estrategia no parece adecuada para decidir acerca de la validez de las normas derivadas. Las consecuencias lógicas no dependen de un cierto balance de razones o acuerdos sociales, sino únicamente de las reglas de inferencia de un sistema. Así, si una convención 13 Véase, Bayón, Juan Carlos, “Derecho, Convencionalismo y controversia”, en Navarro, P. y Redondo, M. C. (eds.), La relevancia del derecho, Barcelona, Gedisa, 2002, pp. 57-92. 14 Marmor, Andrei, “Exclusive Legal Positivism”, Positive Law and Objective Values, cit., nota 2, p. 53.
520
PABLO E. NAVARRO
estipula que todos los automovilistas deben conducir por la derecha, extraer una conclusión lógica acerca de mis obligaciones específicas sobre el tráfico no es destruir la fuerza práctica de nuestras convenciones sino más bien reconocer sus efectos. Por consiguiente, aunque la incorporación de normas morales no pueda justificarse en prácticas convencionales, la validez de las normas lógicamente derivadas no parece incompatible con el fundamento convencional del derecho. En segundo lugar, otra objeción importante a la validez de las normas derivadas se basa en que el carácter vinculante de las normas derivadas puede ser explicada de manera más satisfactoria por otra reconstrucción conceptual. Así, aunque encontremos prácticas sociales que atribuyen relevancia jurídica a las normas derivadas, ello todavía no muestra que esas normas forman parte de un sistema jurídico. Es frecuente, señalan los partidarios del positivismo excluyente, que los jueces tengan que justificar sus decisiones en normas que no forman parte del sistema, e. g. normas de derecho extranjero. ¿Acaso no puede suceder lo mismo con las normas derivadas? En la próxima sección analizaremos esta pregunta. IV. SISTEMAS NORMATIVOS ABIERTOS El problema de las normas derivadas se origina cuando se afirma que los jueces reconocen su relevancia jurídica, pero, al mismo tiempo se sostiene que los criterios de validez no las incorporan a los sistemas jurídicos. ¿Qué explicación puede encontrarse para esta situación? Siguiendo a Joseph Raz, podría responderse que el derecho es un sistema normativo abierto, i. e. una de sus principales funciones es conferir fuerza vinculante a normas y principios que no pertenecen al sistema jurídico.15 Conforme a este enfoque, las normas derivadas serían similares a normas extranjeras que los jueces deben aplicar para justificar sus decisiones. Las normas extranjeras pueden ser jurídicamente vinculantes, pero ellas no se consideran parte de los sistemas jurídicos. De igual manera, aun si los jueces basan sus argumentos en normas lógicamente derivadas, este hecho no puede ser considerado como una prueba de la validez de las 15 Raz, Joseph, Practical Reason and Norms, 2a. ed., Princeton, New Jersey, Princeton University Press, 1990, pp. 152-154. También, “The Institutional Nature of Law”, The Authority of Law, cit., nota 2, pp. 119 y 120; y “Legal Validity”, The Authority of Law, nota 2, p. 149.
ACERCA DE LAS NORMAS DERIVADAS
521
normas derivadas. En otras palabras, la naturaleza abierta de un sistema jurídico puede explicar la fuerza vinculante de las normas derivadas sin asumir que ellas son parte de un sistema jurídico. Las normas derivadas son “adoptadas”, al igual que otras normas que los jueces invocan para justificar decisiones. Hay diferentes tipos de normas adoptadas y no es sensato asumir que existe un criterio formal que nos permita separar adecuadamente las normas válidas de otras que son vinculantes sin pertenecer al sistema jurídico. Al respecto, Raz sostiene que la distinción debe estar basada en las diferentes razones que justifican la aplicación de ambos tipos de normas16. Sin embargo, Raz parece sugerir un criterio formal cuando propone un test para determinar si una norma es adoptada. Así, afirma que las normas son “adoptadas” por un sistema jurídico si y sólo si (i) ellas son nor mas ex tranjeras válidas y vigentes, y la razón por la que se las adopta es que se reconoce la importancia de regular ciertos casos mediante esas normas extranjeras (ii) ellas son normas que fueron creadas por (o con el consentimiento de) los sujetos normativos,17 utilizando poderes normativos que un sistema jurídico otorga a los individuos con el propósito de que ellos puedan arreglar sus propios asuntos de la manera que crean más conveniente. Luego añade la primera mitad del test se aplica a normas que se identifican mediante la aplicación de reglas de Derecho Internacional Privado, y la segunda parte se refiere a contratos y normas que regulan a compañías comerciales, etcétera. La distinción entre normas válidas y normas adoptadas explica dos papeles diferentes que el derecho juega en las sociedades contemporáneas. Por una parte, el derecho opera como un sistema perentorio mediante las normas creadas por las autoridades jurídicas. Estas normas son promulgadas con el propósito de motivar conductas, es decir, guiar acciones que las autoridades consideran socialmente relevantes. Por otra parte, el derecho juega un “papel de apoyo, reconociendo y reforzando otras normas, 16 Raz, Joseph, Practical Reason and Norms, cit., nota 15, p. 153; id., “The Institutional Nature of Law”, The Authority of Law, cit., nota 2, p. 120. 17 Raz, Joseph, “The Institutional Nature of Law”, The Authority of Law, cit., nota 2, p. 120. Las mismas ideas son reproducidas verbatim en Raz, Joseph, Practical Reason and Norms, cit., supra. Para una crítica, véase: Moreso, José Juan and Navarro, Pablo, “The Reception of Norms, and Open Legal Systems”, en Paulson, Stanley L. y Litschewski Paulson, Bonnie (eds.), Normativity and Norms. Critical Perspectives on Kelsenian Themes, p. 287.
522
PABLO E. NAVARRO
prácticas e instituciones”.18 En este caso, las autoridades no están interesadas en la motivación de acciones específicas, sino que dejan abierto a los individuos la decisión acerca de qué conductas son más útiles para conseguir ciertos propósitos privados. Sin embargo, el test que ofrece Raz agrupa a normas de tipos muy diferentes, ocultando el hecho de que algunas de ellas son necesariamente miembros de cualquier sistema jurídico mientras que otras sólo tienen una contingente fuerza vinculante. Debe destacarse que la función que el derecho cumple al reconocer fuerza vinculante a las normas extranjeras o cuando adopta un test moral de validez es una cuestión contingente, mientras que el reconocimiento de la fuerza vinculante de contratos y otros acuerdos privados es, en cierta medida, necesaria. En otras palabras, aun cuando parezca posible y viable un sistema jurídico que no reconozca ningún valor al derecho extranjero, no parece posible que exista un sistema que no reconozca a los individuos poderes normativos. Las reglas de cambio no surgen sólo para conferir poderes públicos sino también para hacer posible que los individuos se vinculen mediante acuerdos privados, e. g. contratos, testamentos, etcétera. Por consiguiente, aun si tanto las normas extranjeras como los acuerdos privados son normas adoptadas, las razones que justifican su relevancia jurídica son de naturaleza completamente diferente. Aunque tanto las normas extranjeras como los acuerdos privados son considerados vinculantes porque es una función del derecho reconocer y apoyar otro tipo de regulaciones, la recepción de normas extranjeras es un fenómeno contingente, pero la adopción de contratos y otros acuerdos privados parece una rasgo necesario de nuestros sistemas jurídicos. Podemos ahora reconsiderar si las normas derivadas son normas adoptadas y, si la respuesta fuese afirmativa, si ellas son necesariamente adoptadas o contingentemente adoptadas por prácticas específicas de nuestros sistemas jurídicos. Parece claro que las normas lógicamente derivadas no pueden ser incluidas en ninguna de las categorías señaladas por Raz. A su vez, dado que su test está formulado mediante un bicondicional, parece inevitable concluir que las normas derivadas no puedan ser consideradas como “normas adoptadas”. Por ello, si las normas derivadas no pueden ser calificadas como normas adoptadas, pero a la vez se reconoce su relevancia jurídica, la solución más simple del enigma es 18
Raz, Joseph, “Promises in Morality and Law”, Harvard Law Review, 95, 1982, p. 933.
ACERCA DE LAS NORMAS DERIVADAS
523
reconocer que su relevancia jurídica surge de su pertenencia o validez en un sistema jurídico. Sin embargo, podría señalarse que el criterio para reconocer las normas adoptadas que propone Raz es defectuoso. En este caso, hay que preservar la idea de la adopción de las normas derivadas y modificar la propuesta de Raz para incluir a las normas derivadas. Ahora bien, ¿qué razón justifica esta solución? En el caso del derecho extranjero o de las normas contractuales, se encuentra en juego el papel de apoyo que el derecho ofrece a los individuos en sus intentos de regular sus conductas en áreas que el derecho deja sin determinar normativamente. Pero no parece que esas razones puedan invocarse en el caso de las normas derivadas. Admitir la relevancia de las consecuencias lógicas de las normas formuladas no es apoyar a los individuos en la regulación de ciertas relaciones sociales. Más bien, identificar y aplicar las normas derivadas parece una tarea conceptualmente ligada al reconocimiento de la validez de las normas expresamente formuladas por la autoridad. Como bien señala Raz, la distinción entre normas explícitas y normas implícitas está presupuesta en por un modelo “comunicativo” de derecho. Según este modelo, el derecho es paradigmáticamente producido por acciones deliberadas, que se manifiestan en la formulación de normas:19 Al referirse al derecho implícito uno tiene en mente… el hecho familiar de que el derecho dice más de lo que explícitamente establece, que hay más en su contenido que aquello expresamente establecido en fuentes tales como la legislación y los precedentes judiciales. Esta idea debe ser evidente por sí misma para cualquiera que conciba al derecho como una creación de acciones humanas, y particularmente, como emergiendo de actos comunicativos tales como la promulgación de leyes o sentencias judiciales. Es un rasgo universal de la comunicación humana que aquello que se dice es más que lo que se estableció expresamente e incluye a lo que está implicado.
Hemos visto que la razón para aplicar normas extranjeras no es que ellas son parte del sistema, sino que otras normas válidas imponen esa obligación. Por el contrario, parece posible que los jueces justifiquen sus decisiones en normas derivadas porque ellos consideran a estas normas 19 Raz, Joseph, “Dworkin: A New Link in the Chain”, California Law Review, LXXIV 1986, pp. 1106 y 1107.
524
PABLO E. NAVARRO
como vinculantes, o como una manera de reconocer la autoridad de las normas formuladas. ¿Por qué sería imposible una comunidad en la que los jueces apliquen las normas derivadas sólo porque ellas son consecuencia lógica de otras normas expresamente formuladas por las autoridades? Si esta comunidad es lógicamente posibles, entonces la validez de las normas derivadas sería un fenómeno posibles, y por esa misma razón sería inadmisible presuponer que ellas son relevantes sólo en virtud de haber sido necesariamente adoptadas en el sistema jurídico. V. CONCLUSIONES Un enfoque positivista del derecho no necesita negar que las normas lógicamente derivadas formen parte del sistema jurídico. La relevancia jurídica de las normas derivadas puede surgir de normas expresamente formuladas, convenciones y otras fuentes sociales. Por ello, aun el convencionalismo, entendido como una concepción específica del positivismo jurídico, es compatible con la validez de las normas derivadas. El rechazo de las normas derivadas es considerado, algunas veces, el precio a pagar por ser un positivista excluyente, pero esta conclusión parece exagerada. Por una parte, el problema de las normas lógicamente derivadas casi nunca es analizado de manera explícita. Por ello, Marmor señala que no está seguro de que esta versión del positivismo sea, en realidad, defendida por algún positivista incluyente.20 Así, parece extraño asegurar que la aceptación (o rechazo) de las normas derivadas es una característica del positivismo incluyente o excluyente. Por otra parte, lo que típicamente caracteriza el desacuerdo entre ambos tipos de positivismo son sus diferentes puntos de vista acerca de las relaciones entre derecho y moral. Por ejemplo, Marmor dice que una marca distintiva de esta discrepancia es la siguiente:21 “El positivismo excluyente niega, mientras que el positivismo incluyente acepta, que puede haber instancias en las que determinar que establece el derecho depende de consideraciones morales acerca de lo que debe resolver”. En este sentido, Jules Coleman resalta la relación entre moral y validez jurídica en su caracterización de ambos tipos de positivismo cuando 20 Marmor, Andrei, “Exclusive Legal Positivism”, Positive Law and Objective Values, cit., nota 1, p. 69. 21 Ibidem, p. 49.
ACERCA DE LAS NORMAS DERIVADAS
525
señala:22 “El positivista excluyente sostiene que todos los criterios de legalidad deben establecer fuentes sociales. El positivista incluyente niega eso, y permite que algunas veces la moralidad de una norma pueda ser una condición de su legalidad”. Estos son sólo unos pocos ejemplos del punto de vista tradicional acerca de la disputa entre ambos tipos de positivismo, y ello explica por qué la validez de las normas derivadas no ocupa un lugar destacado en esta discusión.23 En realidad, sería tentador modelar nuestras concepciones de ambos tipos de positivismo únicamente con relación al desacuerdo sobre el papel de las normas morales. Más allá de la plausibilidad de esta reconstrucción, es importante señalar que el problema de las normas derivadas es lógicamente independiente del problema del papel que la moral juega en la identificación del derecho. Por ello, en tanto que las relaciones de consecuencia lógica no dependen de nuestros puntos de vista morales, la aceptación de la validez de las normas derivadas no debería ser considerada decisiva para tomar partido en la disputa entre positivismo incluyente y excluyente.
22 Coleman, Jules, “Inclusive Legal Positivism”, The Practice of Principle, Oxford, Oxford University Press, 2001 p. 107. 23 Véase también, Gardner, John, “Legal Positivism: 5 ½ Myths”, The American Journal of Jurisprudence, 46, 2001, p. 201; Kramer, Matthew, In Defense of Legal Positivism, Oxford, Oxford University Press, 1999, pp. 197-199.
!
THE POWER OF IMAGE AND THE IMAGE OF POWER: THE CASE OF LAW Ana Laura NETTEL D.* SUMMARY: I. Rendering Space Sacred. II. The Link between God and the Authority of Law. III. Law and Justice the Symbolism of a Link. IV. What is the Power of Image, what Can we do with Images?
Why do people believe that there is an obligation to obey the law? How this belief became so natural in their minds that for the bulk of them there is hardly any sense in asking such a question? What is the message embedded in Western culture that yields to this belief? The question of the nature of the authority of law is pervasive in the history of legal philosophy. The present debate between John Rawls and Jürgen Habermas1 is just an example of the current interest in this subject. Nevertheless, one constant objection can be made to their approaches: they do not give an account of how things actually are. Therefore, the starting point of this paper is to show how law works in social reality. It is a commonplace that modern life is overwhelmed by images; thus it may be worth shedding some light on the role that images play in our perception of law as a means of understanding its authority. The idea that guides this paper is that visual images of law have contributed in a very important way to the creation of a mental image of law that supports the belief in an obligation to obey the law. * Universidad Autónoma Metropolitana Azcapotzalco, México. 1 Rawls, John, Political Liberalism, New York, Columbia University Press, 1996; Habermas Jürgen, Between Facts and Norms, Cambridge, MIT Press, 1988; Modernity and Law, London, Sage Publications, 1996, Droit et morale: Tanner Lectures (1986), Paris, Seuil, 1992; Habermas Jürgen and Rawl, Johns, Debat sur la justice politique, Paris, Editions du Cerf, 1997. 527
528
ANA LAURA NETTEL D.
My contention is that the attitude of obedience towards law, in Western legal systems, is an outcome of the internalization of an image of law that has been paramount in public discourse. Through the analysis of the visual images of law, one can capture the mental image of law transmitted to the bulk of the members of a society and, by the same token, one can grasp the nature of its claim to legitimacy. This must not be confused with the very interesting and much debated question about what is a legitimate authority or the question of when a regime has legitimate authority. So I fancy that the analysis of law’s iconography will lead us in a more realistic way to the understanding of the kind of authority that law claims, hence to the nature of law’s authority. I am interested in the authority of law as a product of Western culture, as a particular way of accessing a type of normative organization. The kind of normative organization that we call law has a discourse of justification, an answer to the fundamental question: why laws? namely, what arguments does law puts forward as justification of its authority. My purpose is then: first, to identify and analyse the visual representations of law and the messages they convey. Second, to strive to find out how they shape the mental image2 we have of law: by following the construction of judicial space and, then, through the iconography of law in order to understand how they build the belief that there is an obligation to obey the law; hence the idea that law has authority. However, as I will be traversing different periods and places (different european countries), the distance between my materials should be justified. Western culture is a unity arising mainly from a common latin origin3 and form judeo-christianity. This unity allows the use of materials from different European sources and periods, as a means of making general assertions about this culture. It would be a titanic task to draw a complete picture of law’s discourse of legitimacy. The length of the period covered —since the beginnings of law in human society—, is one reason; another is the diversity of its discursive forms: political discourse, of course, but also media, art, 2 On the relationship between mental image, visual image and representation, see Denis, M., Image et cognition, Paris, PUF, 1989. 3 See the classic work of Curtius E. R., European Literature and the Latin Middle Ages, New York, Pantheon Books, 1953.
THE POWER OF IMAGE AND THE IMAGE OF POWER
529
education, and so on. I will then limit myself to analysing the message conveyed by some visual images in the period between XIII and XVIII centuries. 4 I. RENDERING SPACE SACRED The tree has been almost universally used to symbolise the link between heaven and earth. Distant cultures like those of the celts, scandinavians, and Americans amongst others, have used, in a similar way, the tree to represent an axle that connects the natural and supernatural and serves as a channel of communication between heaven and earth or men and God. The celts used to judge under an oak, Scandinavians under an ash tree, and Germanic people under a linden tree.5 We can still find old trees like the linden tree of Bordesholm, Schleswig-Holstein, used by the XV century to serve these purposes. The case of Saint Louis of France who used to judge under an oak is quite famous, at least in France. In the Cour de Cassation of Paris there is a sculpture by Eugène Guillaume after a drawing by Duc (1877-1878) in which Saint Louis of France is represented under his oak tree while judging, to remind us of this historical fact. But representations of the role of trees as a link between men and God are also present in English imagery; an example is the frontispiece of The Shepherds Oracles by Francis Quarles (1645) that shows Charles the First defending the tree of religion.6 In the middle of the scene there is a tree, surrounded by two characters of the church. The tree’s branches represent the virtues: faith, charity, hope, obedience, good work. To the right, we can see Charles the First brandishing a sword reinforced by another and bigger sword that comes from the upper right side of the image, in order to mean that God is also present in this fight. 4 The images I analyze in this paper come mainly from Robert Jacob’s Images de la justice, Paris, Le Léopard d’Or, 1994, and Jonathan P. Ribner’s Broken Tablets: The Cult of Law in French Art from David to Delacroix, Berkeley, University of California Press, 1993. For a general survey of the field, cfr. Law and the Image, by Douzinas, C. and Nead, L. (ed.), Chicago, Chicago University Press, 1999. 5 See R. Jacob, Images de la justice, cit., footnote 4, p. 39 and ff.; see also the entry “arbre” in Chevalier, J., and Gheerbrant, A. (eds.), Dictionnaire des symboles, Paris, Laffont, 1982, pp. 62 and ff. 6 Reproduced in Philippe, R., Affiches et caricatures dans l’histoire, Paris, Fernand Nathan, 1981, p. 77.
530
ANA LAURA NETTEL D.
Later a column, called the column of the world, replaces the tree.7 These are stone columns called columns of the world or Justice columns, like the X century column of the market of Treve.8 Many mythologies associate God with judgement because God is by definition He who sees and knows everything, and hence is the only being capable of Justice. The idea presented through judging under a tree is that judges are simple intermediaries of God, so that whilst judging, they are acting outside their human condition. This idea is reinforced by taking the act of judging outside the common place of everyday life and delimiting it’s location with a fenced-in enclosure around the tree where the trial goes on. The space is thus rendered sacred; the act of judging —a divine task par excellence— takes place out of the profane place of human concerns. Rendering sacred the trial place conveys the message of law’s transcendental character and hence the requirement of compliance with law’s decrees is justified.9 A 1513 miniature (from the Swiss chronicle by Diebold Schelling), of the extramural session of the Mulhouse tribunal (manuscript dated 1513, Luzern Korporationgemeinde), is a wonderful illustration of the rendering sacred the space of trials. In this image, the trial was located outside the walls of the city. Taking it far away from the city was then a way of symbolising that it is God who judges by means of his intermediary. It might be interesting to recall that, up to the early Middle Ages, the resolution of conflicts was negotiated between parties and that an institution was created for this purpose only in the late Middle Ages.10 The sacred character of the place of trials, and hence the sacred character of the act of judgement, is perpetuated today in Courts and Tribunals, where we often find a bar or railing separating the space of the trial from the general public. Sometimes, in XVIII century’s imagery, a big room was simply divided by a fence that separated laymen from those who were taking part in the proceedings of judgement. This is the case in 7 On this substitution, see R. Jacob, Images de la justice, cit., footnote 4, p. 44; the substitution of the tree by a column is also pervasive in the art of the Renaissance; see in particular F. Francastel, Peinture et société, Lyon, Audin, 1951, p. 61. 8 For the general meaning of columns, see Onians, J., “The Strength of Columns and the Weakness of Theory”, The Art of Interpreting, by Scott, S. C. (ed.), University Park, Pennsylvania University Press, 1995, pp. 30-39. 9 Cfr. Eliade, M., Le Sacré et le profane, Paris, 1965. 10 Foucault, Michael, “La vérité et les formes juridiques”, Dits et Ecrits 1954-1988, Paris, Gallimard, 1994, vol. II, p. 570-588.
THE POWER OF IMAGE AND THE IMAGE OF POWER
531
a Dutch engraving of this period which shows how the place of trials was allocated at that time in a Court in Holland11 Another reminiscence of the fenced-in enclosure is the term “barrister” for lawyers who plead in higher Courts. The first meaning of the French term for bar, “Parquet” is “little park”; the Robert dictionary explains that it is an ancient word (1366) that designates the place where judges or lawyers are positioned in a Court. Today’s term barre or barreau is a metonymy that permits the designation of the Office of the Attorney General by the word “parquet.” A painting by Schopin, now destroyed (commissioned in 1844 by the Chamber of Commerce of Rouen) represents, as do many other paintings of this period, an oath. Schopin’s painting depicts the oath at the swearing in of the first consular judges at Rouen in 1563. In this image, there is a variant of the enclosure, consisting of a bar made of pillars that we can often find in today’s judicial architecture too. Sometimes the sacred character of the place of trials is also pointed out by a difference of height; the judge is usually at a higher level and in a large seat from which he can dominate the scene, where lawyers often present their arguments. In a lower level, a special place in the scene of the trial is devoted to those people who are under oath. The frequent representation of oaths is another clue for the understanding of the transcendental character of the message embedded in the image of law. As we know, the oath still has great importance in the proceedings today, even in lay societies. The presence of oaths in the imagery of law was already present at the end of the XV century. In a chronicle by Diebold Schilling, we already find a representation of The oath of the ladies of Bubenberg, which is part of the collection of Berne’s municipal library. Grandiose architecture in judicial and legislative buildings is another visual way to convey the message of Law’s authority. In each capital we visit, we are impressed constantly by the buildings where judicial and legislative powers are exerted. All of them share a monumental architecture designed to transmit the idea of overwhelming power.12 11 Engraving reproduced in Robert Jacob’s Images de la Justice, Paris, Le Léopard d’Or, 1994, p. 96. 12 Cfr. “Le gigantesque”, Comunications, num. 42, 1985. On judiciary architecture in particular, see the collective volume published by the Association française pour l’histoire de la justice, La Justice en ses temples, Paris, Errance, 1992, as well as part III of Law and the Image, Douzinas, C. and Neal, L. (ed.), op. cit., pp. 117 and ff.
532
ANA LAURA NETTEL D.
II. THE LINK BETWEEN GOD AND THE AUTHORITY OF LAW It is certainly not a new idea that, during the Middle Ages, the source of authority was placed in God. However, what seems to me important is to show how the link between God and political authority works. And also how this link gives rise to a long chain of arguments that are present even nowadays due to less well-known links which produce the conviction of the transcendence of law in our imagination. 13 The first image I want to consider comes from a XIII century copy of the Gratian Decree, (book of canon law): the Investiture by Christ of spiritual and temporal powers.14 The scene is organised by a capital H placed in the middle that symbolises the “humanum genus”, and starts the first sub-division of the book: mankind is governed by two types of law: natural law and custom. This representation soon became a convention and fixed code. But what is important is the message: spiritual power comes directly from God, of course, but so does temporal power. This is going to become the most important and constant theme of the imagery of law. The means of conveying this link are manifold: at times, the delegates of both powers share the baton of command. In other cases, we can find a key or two keys being given to the spiritual power, whilst a sword is given to the temporal power (or two swords, one for each of them). In XIV century iconography, the sword is used for both spiritual and terrestrial orders. The symbol of the sword plays a very important role in the iconography of law up until the present times. What we must keep in mind is that this symbol purportedly comes directly from God. This imagery is common to the Gratian Decree all over Europe and to the Saxons Mirror (Sachsenspiegel) which are the most well known and praised works of judicial literature from the Middle Ages, and hence those that were copied the most at this period. The subject of a XIII century image from the Décret Gracien, located at the municipal library of Troyes, is also the spiritual and temporal powers, but this time there is an interesting rhetorical resource. To show the 13 The link between transcendence and law has been advocated by Legendre, P., Le désir politique de Dieu: Etude sur les montages de l’Etat et du droit, Paris, Fayard, 1988; the relation to images has been deepened in Dieu au miroir: Etude sur l’institution des images, Paris, Fayard, 1994. 14 B. N. Beaune.
THE POWER OF IMAGE AND THE IMAGE OF POWER
533
link among them, the artist has represented the continuity between both powers by means of the visual continuity of the Ten Commandments. In early representations of trials, we find as well four different levels of power linked by a vertical. This is the case of an Italian XIV century illumination called the World Tribunal.15 The theme of the investiture of spiritual and temporal powers is emphasized in this illumination, through the King’s sword: judicial power, religious and political power and of course divine power. God the father is above with the keys of heaven in one hand and a book that might be the Bible in the other. “The justice of men endorsed by Christ” could be the title of a painting by the German school (early XV century at Wurzbourg, Bisch Fliches Ordinarial). A case is brought before a judge who is siting on a large seat; this is one of the symbols of authority, constantly present in susequent images of Justice. Christ is sitting above with two swords pointing to his ears, two swords that represent again both orders: spiritual and earthly. The sword is an important symbol in many traditions, it is also always related to power, but in the Western judeo-christian world it is also related to the two attributes of God: his power and kindness.16 During the XVI century, the presence of Christ or God became even more frequent in the images of trials. This association again conveys the same implicit message: judges are simple intermediaries, illuminated by God. They exert God’s judgment in human affairs. In an image of the XVI century, a judge sits under the gaze of the Christ of the Apocalypse.17 The same elements are in a vertical line: the trial, the judge in his seat and above these the transcendental element: Christ in heaven with the sword. It is interesting to note that in XVII century engravings of civil procedural stages, we have again at the top of the scene a cloud representing God and the sword. But a novelty appears the rare presence, at this period, of the scales.18 From XVIII century imagery, it is worth recalling a frontispiece representing Canon law and civil law in “Legal Vocabulary” edited by Philipe Vicat.19 15 From an exemplar of the Gratian Decree, Italian illumination from the XIV century, Public library of Geneva, reproduced in Images de la justice, cit., footnote 4, p. III. 16 Philon’s De cherubin, 21-27; also Cfr. the entry “épée” in J. Chevalier and A. Gheerbrant (eds.), Dictionnaire des symboles, op. cit., pp. 407 and ff. 17 Urlich Tengler, Der neu Layenspiegel, Augsbourg, 1511, fol. 34. 18 Cfr. the entry “balance”, ibidem, p. 99 and ff. 19 Lausanne, 1759.
534
ANA LAURA NETTEL D.
I have so far been analysing images of a period in which the divine source of political power, and hence of law, was not contested. But does the suppression of the monarchy by divine grace imply an abandonment of the justification of law’s authority on its transcendence? Revolutionary iconography shows us the contrary. In spite of an evident ideological opposition to the King’s investiture with legislative supremacy, the association of divinity or divinities with law, that is, the idea of transcendence as a means of stemming the authority of law is constantly present in revolutionary iconography too.20 In the famous engraving Declaration of the Rights of Man and Citizen, by L. Laurent after Jean François Lebarbier (1793), we can see a representation of the Declaration of the Rights of Man and Citizen written in roundheaded tablets recalling Moses’ tablets. At the top of the scene among the clouds, we see the eye of God encircled by characteristic flashes of lightning. On top of two columns framing the tablets, two personifications: on the right, an angel with a sceptre, symbol of authority and, on the left, a personification of liberty. In the middle of these tablets is the lictors’ rod, symbol of authority, and on the top of it the Phrygian cap, symbol of liberty of the revolutionary sans-culottes. The representation of the Declaration of the Rights of Man and Citizen in roundheaded tablets was not the product of chance or the artist’s idea; it was part of an official discourse. The Legislative Assembly decreed in 1792 that its insignia would take the form of the tablets of law. In a print by L. J. Allais, commemorating the Festival of Unity and Indivisibility in August 1793, the second year of the French Republic, one can also see on the left-hand side, the Republican Constitution as Mosaic tablets, emerging from the mountain amongst lightning. On the right-hand side, encircled by astrological signs, the lictors’ Rod is placed over the level of equality and crowned by the Phrygian hat. The characteristic transcendental message of law’s authority by an allusion to God is also present in the Hommage to the National Assembly. A print commemorating the National Assembly represents the French Constitution as a pyramid encrusted with portraits of the heroes of the revolution.21 At the bottom, we can see the French people surrounding the pyramid. At the top the lily flower, symbol of French royalty, ema20 21
Cfr. Jonathan P. Ribner, Broken Tablets, cit., footnote 4. Ibidem, p. 22.
THE POWER OF IMAGE AND THE IMAGE OF POWER
535
nates celestial light and illuminates the whole scene. The print was made in 1791, one year before the abolition of the monarchy, but it gives us the opportunity to ask whether the idea of the General Will is also to be considered as a transcendental source of legitimacy? III. LAW AND JUSTICE THE SYMBOLISM OF A LINK After this survey of several centuries, we have gathered many symbols still constantly associated today with the images of justice. Justice is considered an attribute derived from God’s perfect judgement, as he is the only being able to see everything. God being just par excellence is the first source of justice to which we can appeal, according to Western Judeo-Christian tradition. Following the development of iconic language, we can see how one naturally passes from the linking of God with law to the association of law with justice and hence to internalize the idea that there is an obligation to obey the law. How is this shown by the most well known representations of Justice? The reference is Cesare Ripa’s work22 written in Italian in 1597 and translated into English, French, German and Spanish. It is interesting to notice that Ripa’s Iconology was not originally illustrated; it was a classification and description of images; called by Panofsky iconography.23 But most of the following editions of Ripa’s work are illustrated with a variety of styles according to the time of publication. Ripa’s allegory of Justice describes it as a woman dressed in white and blindfolded. In her right hand she supports a bundle of lictors’ rods held by a rope, in the left hand she holds a torch, and beside her, is an ostrich, or a sword and a pair of scales. In Hertel’s edition (1758-1960), the description is enriched by other attributes such as a crown, a skull and a dog lying at her feet. Ripa says that this is the kind of justice exerted by judges in Court. The white of her dress symbolises that judges must be without moral blemish. She is blindfolded to symbolise that she must not be misled by the senses, but also to symbolise that Justice must use nothing but pure reason whilst making judgements, and that justice is impartial. The 22 Ripa, C., Iconologia, 1597. I have consulted the Spanish translation, Madrid, Akal, 1987, 2 vols. 23 Panofksy, E., Studies in Iconology, New York, Harper and Row, 1972, p. 3.
536
ANA LAURA NETTEL D.
scales are in themselves a metaphor for justice, which indicates that each person must receive no more and no less than what is due to him or her. It is also very important from the viewpoint of the rhetoric of image that most representations of justice have the same symbols of authority in common. First, the bared upright sword which here represents the rigour of justice that must not hesitate to punish; second, the lictors’ rods that were the old Roman symbols of power to show that punishment must be given; third, the sceptre, symbol of authority par excellence; and finally the crown. Symbols, that as we noted before, are also pervasive in the representations of Christ or God the father. Through all of these symbols, we can easily follow some lines of association that are present in our perception of the image of law, even if we are not always aware of them. IV. WHAT IS THE POWER OF IMAGE, WHAT CAN WE DO WITH IMAGES? Until now we have analysed images which contained a number of lines of association leading us to the implicit message conveyed. Let us now try to find an explanation for the means by which images accomplish such an important role. Images do much more than illustrate verbal discourse and they do it in a very efficacious way that is reached in verbal language by a mechanism that I have called elsewhere the implicit mode.24 Indeed, images are not mere illustrations of what we think. Thus the role they play cannot be perceived as a secondary role in communication.25 So what is the power of images?26 To my mind their power is a very special one, it is the power of “demonstration” in the sense of proving by showing. How does this work? First, when we look at an image we often feel as if we were present within the scene that is taking place; it is the power of the image that positions us in the attitude of being a witness. The reason is probably 24 Nettel, A. L., Pouvoir et Légitimité: La stratégie planificatrice au Méxique: 1982-1988, Paris, l’Harmattan, forthcoming. 25 See Gombrich, E. H., “The Visual Image: Its Place in Communication”, in his book The Image and the Eye, Oxford, Phaidon Press, 1982, p. 137 and ff. 26 For two different approaches, see Freedberg, D., The Power of Images: Studies in the History and Theory of Response, Chicago, Chicago University Press, 1989, and Marin, L., Des pouvoirs de l’image, Paris, Seuil, 1993.
THE POWER OF IMAGE AND THE IMAGE OF POWER
537
that images are things that give us something to see. After all, as the lawyers’ saying runs: “what is seen is not to be judged”. Second, the power of images also comes from the concealment of the enunciation. Through this analysis of images along several centuries, we have highlighted that images “show” what they represent. When looking at an image, we usually refer to it by saying, for example: “here is Christ endowing...” This is the common way by which images function. For when we look at an image, we react as if there was no author, and we feel as if we were present in the scene represented. But if instead, while presenting an image we say: “Here, the author wanted to tell us that...” the receptor’s attitude changes immediately because the author comes on the scene. Indeed, in most kinds of images, the narrator (who might coincide often but not always with the author) is not, so to say, explicit.27 It is this absence that facilitates our ability to enter into the image and feel that we are discovering what we see, as if we were there. It is only in special circumstances that we are aware of the presence of the author and, by the same token, of the fact that the work has been conceived and realised by him with a deliberated intention. This happens, for example, when we go to an exhibition. Because, on those occasions, we are aware of the fact that the paintings we are looking at are the work of an author, and this is why we see them as expressing an intention and we interpret them in those terms. How often do people feel annoyed in front of abstract art because they are told that these works do not have any meaning? Nevertheless, they insist on trying to find out the artist’s intentions. The third point is that our most common attitude towards images is uncritical.28 This might be for many reasons from the rapidity with which we have to look at them (for example in the underground, or when we are driving) to the ability of the creator to make them striking. But the question is that, normally when we look at an image, we absorb the message without questioning it, without the attitude of someone who is 27 See Marin, L., Détruire la peinture, Paris, Galilée, 1977, p. 61 and ff., who showed that in classical representative painting there is a denial of the subject of the enunciation. 28 For a different account of the same observation, cfr. Douzinas, C., “Prosopon and Antiprosopon: Prolegomena for a Legal Iconology”, Law and the Image by Douzinas, C., and Neal, L. (ed.), op. cit., note 4, p. 55.
538
ANA LAURA NETTEL D.
aware of being in front of a proposition. There might be multiple reasons for this, as I have said, but two paradoxical features of images seem to me important. The first feature is that images are transmitted, so to say, via a direct channel to our minds without the filter of consciousness. Consequently, in order to analyse an image and, hence, question it, we need a higher degree of awareness that implies a special effort of attention and sometimes a specific training. And second, that images penetrate very deeply into our minds because we take as premiss what we see in the image, and we consider the conclusion to which we are driven as our own, without realising that it is the consequence that follows from the image itself.29 This is one of the main rhetorical mechanisms of images. So the uncritical attitude stems from the fact that we are not capable of facing what I call the “pictorial arguments”30 i. e. the premiss given by the image and the conclusion that follows. By accepting what we see in the image because of the “witness effect”, we are accepting what follows from it and this is the implicit message. Indeed, as the conclusion to which visual images drive us, implicit messages are those that are not stated but are presupposed in an assertion. The canonical example is “Peter stopped smoking”, the implicit message: “Peter used to smoke”,31 if we accept the first one, we automatically accept, so to speak, the second. The question is that by saying “Peter stopped smoking”, I am not presenting to the listener the “Peter used to smoke”, proposition, which he might be reluctant to accept. This may suggest a similarity with Helmholtz’ idea of perceptions as “conclusions of unconscious inference”.32 I do not have any competence to discuss whether unconscious inferences exist or not, but I do not think that what I am saying implies the idea of unconscious inference. What I am saying is much more modest: if we quite easily believe what we see, as I think we do, then we even more easily believe what follows from it.
29 Cfr. Miles, M. R., Image as Insight: Visual Understanding in Western Christianity and Secular Culture, Boston, Beacon Press, 1985, in particular chap. 3 “The Evidence of Our Eyes”, p. 41 and ff. 30 Pictorial and not image arguments because it takes in account the pragmatic part of visual images. 31 See Ducrot, O., Dire et ne pas dire, Paris, Hermann, 1980, p. 232. 32 Cfr. J. Bouveresse, Langage, perception et réalité. Tome 1. La perception et le jugement, Nîmes, Editions Jacqueline Chambon, 1995, in particular chap. 1.
THE POWER OF IMAGE AND THE IMAGE OF POWER
539
The period I have insisted on mainly, might suggest that the image of law I have stressed was mainly valid for the Middle Age and Renaissance, up to the French Revolution. However, most of these symbols have been used after the period under consideration: the image of justice with round-headed tablets is still pervasive during the nineteenth century. A representation of Justice by Baron Gérard (La Justice, Département des Arts Graphiques, Louvre) can be mentioned among others. And an exemple of what I called the “transcendent argument” is still present in a XX century painting by Léon Bonnat, La Justice (Museum of Beauvais), who was by the way the official portraitist of the Third Republic. Furthermore, if these images played an important part in Courts (paintings and sculptures), today it is by monumentality in judicial architecture that the sense of transcendence is conveyed. As far as law books are concerned, the traditional role of frontispiece is now played by the cover illustration... It is striking how many recent books in this field still use the images and symbols I have analysed. This is the case in particular for the column. From this point of view, there is a continuity between, say, Annibale Carracci who represented Justice in an engraving as holding a column, and the cover design of a Marmor’s book Law and Interpretation33 showing columns. Significantly, the photographer of the picture is Joseph Raz, himself a prominent philosopher of law. Indeed, my aim in analysing these images was not only to stress that during this epoch authority whether spiritual, political or judicial was justified by a link with God. My purpose was to show how iconographic language was a powerful means of building a mental image of law. An image where the idea of its transcendence, whether we call it God, Christ, Justice, General Will or whatever, is the ground of our allegiance to the authority of law in Western culture: what I have proposed to call the “transcendental argument of legitimacy”. Restating the argument it says: law being the means of rendering God’s will or the good of the community transcends the individual’s immediate interests. This analysis led us to identify the implicit message —imbedded in law’s iconography— which contributes to the formation of the acceptance of its legitimacy, hence to the belief that there is an obligation to obey it.
33
Marmor, A., ed., Law and Interpretation, Oxford, Clarendon Press, 1995.
!
LA SEMÁNTICA DE LA DERROTABILIDAD María Inés PAZOS* SUMARIO: I. Introducción. II. Derrotabilidad de conceptos. III. Teorías de estereotipos y ejemplares. IV. Conclusiones. V. Bibliografía.
I. INTRODUCCIÓN En esta presentación analizo algunas teorías semánticas no clásicas con el fin de usarlas para explicar y resolver algunos problemas que el tema de la derrotabilidad muestra en la concepción tradicional del significado. Parto de una definición de derrotabilidad de enunciados y una de derrotabilidad de conceptos que implican que la propiedad de ser derrotable existe cuando los hechos o propiedades derrotantes (excepciones) están determinados como tales y no cuando las excepciones están indeterminadas. Sostengo que la semántica clásica que identifica el significado de los términos de clase con conjunto de propiedades necesarias y suficientes para la pertenencia a la clase (o aplicación del término) y el significado de los enunciados como condiciones de verdad no da cuenta de la determinación de las excepciones a los enunciados o conceptos derrotables y que ella debe ser reemplazada por una concepción no basada en conjuntos de propiedades. Con el fin de buscar alternativas a la semántica clásica, examino brevemente las teorías de estereotipos y ejemplares para establecer en qué medida ellas pueden ayudar en el proyecto de explicar el fenómeno de la derrotabilidad y qué propiedades de ellas deben considerarse requisitos de la concepción semántica que reemplace a la clásica. * Centro de Investigación y Docencia Económicas, México. 541
542
MARÍA INÉS PAZOS
En el año 1948, en “The Ascription of Responsibility and Rights”,1 H. L. A. Hart dijo: La consideración del carácter derrotable de los conceptos jurídicos... pone de manifiesto cuán equivocado sería sucumbir a la tentación, ofrecida por las modernas teorías del significado, de identificar el significado de un concepto jurídico, digamos “contrato”, con la formulación de las condiciones en las cuales se sostiene que los contratos existen. 2
Así, Hart fue el primero en señalar que el problema de la derrotabilidad, al menos en contextos jurídicos, ocasionaba problemas a la concepción del significado que aquí llamaré “concepción tradicional”. Él mismo no enfrentó la tarea de reconstruir la teoría del significado y aún hoy en día en filosofía del derecho, en general, suele presuponerse la teoría tradicional sin cuestionarla. Como he sostenido antes,3 estoy de acuerdo con Hart en que la derrotabilidad pone en serios problemas a la teoría tradicional del significado y considero que es necesario enfrentar la tarea de reemplazarla. El desafío de reconstruir la teoría semántica no es novedoso sino que ha sido enfrentado desde la filosofía del lenguaje y se han desarrollado propuestas en muchas direcciones. En este trabajo analizaré sucintamente una de esas direcciones en algunas de sus formulaciones y mostraré el modo en que tales desarrollos son aptos de dar cuenta del problema de la derrotabilidad. El resultado no será una teoría completa del significado, sino sólo la justificación de la tesis de que deben continuarse las investigaciones en esa dirección, y la presentación de algunas condiciones que la teoría debe satisfacer, en particular, aquellas condiciones requeridas para dar cuenta del problema de la derrotabilidad de conceptos. II. DERROTABILIDAD DE CONCEPTOS En el artículo citado, Hart sostuvo que los conceptos jurídicos eran sistemáticamente derrotables y analizó a modo de ejemplo el concepto 1 Hart, H. L. A., “The Ascription of Responsibility and Rights”, Proceedings of the Aristotelian Society, 49, 1948-1949, reimpreso en Flew, A. (ed.), Logic and Language, Oxford, Basil Blackwell, 1960. 2 Op. cit., nota 1, traducción de Germán Súcar y Agustín Iglesias. 3 “Derrotabilidad sin indeterminación”, de próxima aparición en Doxa, Cuadernos de Filosofía del Derecho.
LA SEMÁNTICA DE LA DERROTABILIDAD
543
de contrato del derecho inglés. El concepto de contrato sería derrotable, debido a la siguiente situación: el derecho contiene ciertas condiciones necesarias para su existencia, de algunas de ellas podría hacerse una lista. Sin embargo, la presencia de tales condiciones, aunque sea necesaria, no puede garantizar que algo sea calificado como un contrato, porque es necesario determinar que no ocurra ninguna excepción. Para que algo sea un contrato es necesario tanto que ocurran las condiciones mencionadas antes, como que no ocurran excepciones. La ausencia de cada una de las excepciones entonces es también condición necesaria. Pero no puede hacerse una lista completa de las excepciones (ellas configuran una “lista abierta”), de modo que no pueden determinarse las condiciones necesarias para que algo sea un contrato. Así, el concepto de contrato es derrotable, porque aun dadas las condiciones necesarias conocidas, siempre es posible que ocurra alguna de las excepciones de la lista abierta, es decir, de la lista indeterminada de excepciones posibles. Tales hechos volverían inaplicable el concepto de contrato al objeto particular que satisficiera las condiciones positivas necesarias, es decir, tales hechos derrotarían al concepto. Pero el concepto de contrato se aplica de hecho a situaciones reales sin necesidad de contar con esa lista que es imposible completar; la inexistencia de la lista no vuelve inaplicable el concepto, como se muestra en el hecho de que los jueces a diario toman decisiones respecto de la existencia de contratos sin necesidad de constatar la ausencia de cada una de las excepciones posibles en particular, ausencia que no podría constatarse por no conocerse la lista de excepciones. De modo que es posible conocer el concepto de contrato sin contar con esa lista. Por lo tanto, el significado de conceptos jurídicos como el de contrato no puede consistir en una lista de condiciones necesarias y suficientes para su aplicación. Un intento de dar ese conjunto de condiciones, sostiene Hart, distorsionaría los conceptos. La derrotabilidad del concepto de contrato puede verse como una relación entre dos conjuntos de entidades. Aquellas que satisfacen cierto conjunto de condiciones necesarias conocidas y aquellas que además de satisfacerlas son contratos. La idea de que los conceptos son derrotables depende de la asociación de un conjunto de condiciones necesarias para pertenecer a una clase, con el hecho de que aun dadas tales condiciones respecto de un objeto éste podría no pertenecer a ella. ¿Por qué entonces se asocian las condiciones con la clase? La hipótesis que he defendi-
544
MARÍA INÉS PAZOS
do antes4 es que bajo tales condiciones, los objetos normalmente pertenecen a la clase. Por ejemplo, una transacción hecha entre al menos dos personas mayores de edad, que voluntariamente consienten en realizar ciertas acciones lícitas que se otorgan derechos y obligaciones mutuos normalmente es un contrato, aunque podría haber condiciones atípicas en las cuales no lo fuera. Este tipo de asociación entre clases no ocurre sólo en ámbitos jurídicos. La idea de derrotabilidad entendida como una relación entre dos clases, una de las cuales contiene elementos que normalmente pertenecen a la otra, ocurre de manera sistemática entre los conceptos del lenguaje ordinario. El ejemplo más conocido es el de la relación entre el concepto de ave y el de volar (o entidades que vuelan). Las aves normalmente vuelan. Esto es, las entidades que cumplen el conjunto de propiedades {ser ave} normalmente pertenecen al conjunto de las entidades que vuelan (concepto de “volador”). Sin embargo, hay algunas propiedades que, cuando concurren junto con la propiedad de ser un ave, excluyen a su portador del conjunto de las cosas que vuelan. Son excepciones al concepto de “volador” las propiedades de ser pingüino, ser avestruz, ser recién nacido, tener un ala rota, etcétera. ¿Hay algún modo de garantizar que algo que pertenezca a la clase de las aves también pertenezca al grupo de las entidades voladoras? Mi tesis es que sí. No es necesario verificar la inexistencia de excepciones porque hay otra propiedad que muchas de esas entidades comparten y que garantiza que no son entidades excepcionales. No todas las aves vuelan, pero sí lo hacen las aves que nos imaginamos cuando pensamos en el concepto general, preteórico, ordinario de ave. Lo hacen aquellas que representan nuestro paradigma o ejemplar típico de ave, aquel que usaríamos para transmitir o enseñar el concepto a alguien que lo desconociera. A esas aves, a las que responden al concepto de ave paradigmática o ejemplar, las llamamos aves “normales”. Cuando decimos que las aves normalmente vuelan, lo que queremos decir es que las aves “normales” siempre vuelan, aunque pueda haber casos atípicos, como el de los pingüinos o los kiwis, que no lo hagan. En muchas ocasiones, cuando usamos oraciones de forma general tales como “las aves vuelan”, lo que queremos decir no es que todas ellas 4
Véase nota 3.
LA SEMÁNTICA DE LA DERROTABILIDAD
545
vuelen, sino que normalmente (las aves normales) lo hacen. En ese sentido la oración es verdadera. También lo son oraciones como “los peces nadan”, “cuando llueve refresca” o, en el ámbito jurídico, “los menores son incapaces” y “el que mata voluntariamente a otro comete homicidio simple”. No es necesario que existan de hecho entidades excepcionales, es decir, pingüinos o menores emancipados para afirmar que el concepto correspondiente (volador, incapaz) es derrotable. Es suficiente que ellos puedan existir. El concepto de volador es derrotable porque puede haber pingüinos y el de incapaz porque los menores pueden ser emancipados. Usaré las siguientes definiciones: Derrotable: Un concepto V es (genuinamente) derrotable respecto de otro A si y sólo si A determina una clase de elementos que normalmente son V y además es posible que existan elementos en A que no son V. Cuando, siendo un concepto V derrotable respecto de otro P, de hecho ocurre que hay un elemento en P que no es V, decimos que el concepto V ha sido derrotado por ese hecho. Hecho derrotante: A los hechos que si ocurrieran derrotarían a un concepto los llamamos hechos derrotantes de ese concepto. Si el significado de un concepto fuese equivalente al significado de una formulación de un conjunto de condiciones necesarias y suficientes para su aplicación, entonces un concepto no existiría (los términos que lo nombraran no tendrían significado) a menos que existiera una formulación de aquellas condiciones de aplicación. Llamaremos “regla semántica” a una oración que vincule un término de clase (el nombre de un concepto que determina una clase de entidades) con una descripción de un conjunto de condiciones de aplicación suficientes y necesarias para pertenecer a ese concepto. Si la formulación de las condiciones necesarias y suficientes estuviera semánticamente indeterminada en la regla semántica, entonces el concepto definido por ellas estaría igualmente indeterminado. La concepción semántica que llamo tradicional sostiene que el significado de un término de clase (un concepto) equivale a un conjunto de propiedades necesarias y suficientes para pertenecer a esa clase. Conocer o entender un concepto significa conocer o entender el conjunto de propiedades que un objeto debería tener para pertenecer con seguridad y necesidad a esa clase. Definiré a la concepción tradicional del significado como aquella que sostiene la siguiente tesis:
546
MARÍA INÉS PAZOS
Tesis tradicional (TT). El significado de una expresión lingüística equivale al significado de la formulación de las condiciones de aplicación de esa expresión (o del concepto nombrado por ella). En el caso de los conceptos de clases tal formulación contiene una lista de propiedades necesarias y suficientes para que un objeto pertenezca a la clase.5 La forma típica de una regla semántica como la exigida por TT es: (RS) x es un G si y sólo si tiene las propiedades A, B y C. (variaciones: podría exigirse que x tuviera A o B o C; que tuviera o bien A y B o bien C; que tuviera al menos dos de las tres propiedades, etcétera). Bajo esta noción de significado, y bajo el supuesto de Hart de que las excepciones configuran listas abiertas (no se puede hacer una lista de ellas), es claro que es imposible encontrar una regla semántica que establezca el significado de los conceptos derrotables. Esto es así porque si un concepto es derrotable cuando es posible que haya excepciones, si la ausencia de cada excepción posible constituye una condición necesaria para pertenecer al concepto y si las excepciones no pueden listarse, entonces no es posible formular el conjunto de condiciones necesarias y suficientes para pertenecer a un concepto derrotable. Por eso, la aplicación de la teoría tradicional del significado arroja como consecuencia directa que los conceptos derrotables están indeterminados, porque la regla semántica para un concepto derrotable sólo podría dar un significado parcial: una lista de condiciones necesarias entre las que se incluyera la negación de las excepciones conocidas. Como no se podrían indicar en la regla toda las excepciones porque ellas “configuran listas abiertas”, entonces el conjunto de condiciones necesarias nunca configuraría uno de condiciones suficientes para pertenecer a la clase. Sin embargo, si fuera así, esto es, si las excepciones no estuviesen determinadas, entonces no podría afirmarse que existen elementos, hechos o entidades que a pesar de satisfacer un conjunto de condiciones para pertenecer a una clase A (como la de ser menor o ave), no pertenecen a 5 Estrictamente no se requiere que sea una lista de propiedades que deba darse en conjunción en el objeto analizado, puede ser cualquier combinación lógica de propiedades y también puede tratarse de propiedades negativas. Como toda combinación posible es expresable en términos de conjunciones y negaciones por medio de las llamadas “formas normales” (conjunciones de disyunciones o disyunciones de conjunciones) basta con decir que la formulación de las condiciones de aplicación podría indicar una conjunción o en una disyunción de propiedades, de conjuntos de propiedades o de disyunciones de propiedades. Lo que es necesario es que tal disyunción o conjunción exista y que sea única.
LA SEMÁNTICA DE LA DERROTABILIDAD
547
otra V (como la de ser capaz o volar) debido a que se trata de uno de los casos anormales derrotantes del concepto V. No podría afirmarse esto porque si el concepto V estuviese indeterminado respecto de todos los casos anormales, entonces no estaría determinada ni la pertenencia ni la no pertenencia de esos elementos. La derrotabilidad no podría establecerse. Así, si los conceptos derrotables estuvieran indeterminados respecto de sus excepciones, no serían derrotables según la definición que hemos dado. Obviamente, para cada excepción que se detecte puede extenderse la regla semántica incluyéndola como condición necesaria negativa. Sin embargo, no puede darse una regla que contemple todas las excepciones, porque la formulación de la regla es un acto lingüístico que supone el reconocimiento de aquellas, y muchas de ellas son imprevisibles (no podemos anticipar todas las excepciones posibles a que un ave vuele) Por otra parte, si se sostuviera la existencia de la regla semántica aunque de hecho no se la pudiera formular (por una incapacidad epistemológica de los sujetos) entonces por una parte esto comprometería a sostener el carácter finito de las excepciones (o al menos de los tipos de excepciones) y por otra, a creer en la existencia de algo (una regla semántica) sin evidencia alguna a favor. Pero esa conclusión se opone a la afirmación intuitiva y estándar de que en los casos de derrotabilidad (genuina) hay excepciones. Usualmente se sostiene que es en virtud de esos hechos excepcionales que el concepto es derrotable y no en virtud de hechos cuya pertenencia a la clase no está determinada y que, dada esa indeterminación, ni pertenecen ni no-pertenecen a ella. Si en cambio abandonamos la TT y afirmamos que el significado puede estar determinado aun en ausencia de una regla semántica como la mencionada, ello nos permitirá sostener simultánea y consistentemente que, res pec to de los con cep tos de rro ta bles, aun que no exis ta una regla que fije las excepciones, de cualquier modo su significado está determinado y por lo tanto también las excepciones. De hecho, si no lo estuvieran, no diríamos que son excepciones sino únicamente que no está determinado si constituyen excepciones o no. La crítica más común a la concepción tradicional del significado argumenta que el lenguaje natural es tal que normalmente no puede darse una lista de condiciones suficientes y necesarias para la aplicación de los conceptos, sin que tal situación afecte la capacidad de los usuarios del
548
MARÍA INÉS PAZOS
lenguaje de hacer uso correcto de las expresiones que representan esos conceptos. Este hecho es exactamente el mismo que Hart rescató respecto de la noción de contrato y de los conceptos jurídicos en general: la ausencia de una regla semántica no obstaculiza la aplicación de los conceptos. En muchos casos los jueces dictaminan que algo es un contrato o que no lo es sin plantearse antes el problema de precisar el significado del término. Por supuesto, es posible que surjan dudas en casos marginales, respecto de los cuales sí existe indeterminación. Un concepto derrotable, como cualquier otro, también puede estar indeterminado. Un ave u otro animal, digamos un murciélago, que parece levantar vuelo pero que a los pocos metros está nuevamente en tierra porque no tiene fuerza suficiente para mantenerse en el aire ¿vuela? Parece que no ¿y una que sólo alcanza a trasladarse 100 metros? No sé. Quizás si mi compelieran a responder diría que volaría si se esforzara, pero ahora no vuela, o tal vez que “no vuela del todo”, o que “casi vuela”. Ahora bien, que un concepto (como ocurre con la mayoría de ellos) esté en alguna medida indeterminado no implica que las excepciones sean casos de indeterminación. Los objetos que siendo aves, tienen alguna propiedad excepcional que los excluye de la asociación estándar entre el concepto de ave y el de volar, no es el caso que no se sepa si vuela o no. No se puede anticipar qué propiedades hagan a un objeto tan diferente de las aves paradigmáticas que ya no las asociemos con el vuelo, pero eso no vuelve indeterminado el hecho de que, cuando tienen tales propiedades, ya no las incluiremos en la asociación y no estaremos hablando de ellas cuando afirmemos “las aves vuelan”. Por supuesto, tampoco diremos que no vuelan, simplemente no estaremos hablando de ellas. Si vuelan o no es un asunto independiente que habrá que verificar a su turno. Los pingüinos y las aves que por una falla genética nacen sin plumas y las que tienen huesos compactos (en lugar de huecos) no están incluidos en la oración “las aves vuelan” porque no son aves normales, ejemplares o paradigmáticas, y no porque esté indeterminado si la oración los incluye. El concepto de incapaz es derrotable respecto del de menor, porque los menores normalmente son incapaces pero no siempre. El concepto de incapaz no es un concepto vago ni ambiguo. No está indeterminado o, dicho con más exactitud (dado que la determinación es una propiedad gradual), es un concepto bastante preciso.
LA SEMÁNTICA DE LA DERROTABILIDAD
549
¿Qué excepciones, harían que consideráramos que un menor no está alcanzado por la frase “los menores son incapaces”? Las que están expresas en la ley, para empezar. Pero tal vez también otras no previstas e imprevisibles. ¿Qué diríamos de una persona que por una variación genética crece físicamente, madura psicológicamente y aprende mucho más rápido que nosotros, y que a los 12 años ha terminado su segundo doctorado en física nuclear con una apariencia física de 30 años? ¿No diríamos que es un caso tan diferente de los casos normales de menores que no es alcanzado por la norma “los menores (normalmente) son incapaces”? No abundaré en ejemplos que apoyen mi explicación de la derrotabilidad, porque mi interés en este parágrafo no es fundamentar la tesis de que ella no es un tipo de indeterminación sino una situación semántica diferente. Mi objetivo es, en cambio, plantear el problema: Considerada la derrotabilidad como lo he hecho, la semántica tradicional no es apta para dar cuenta del problema, sino que su aplicación sólo puede explicarla como un tipo de indeterminación. Sin embargo la indeterminación y la derrotabilidad son problemas diferentes y la concepción del significado debe reflejar y explicar esa diferencia. No tiene más que dos alternativas quien está comprometido con la semántica tradicional. Debe abandonar la tesis de que los conceptos derrotables son conceptos con excepciones, sosteniendo en cambio que no hay genuinas excepciones sino sólo indeterminación; o debe abandonar o la tesis de la inexistencia de listas cerradas de ellas (sosteniendo que es posible listar las excepciones). En cambio, si se abandona la semántica tradicional se estará en condiciones de dar cuenta de ambas. III. TEORÍAS DE ESTEREOTIPOS Y EJEMPLARES 1. Estereotipos Tomaré de Hilary Putnam lo que llamaré una “teoría de estereotipos”.6 Aunque el autor desconfía de las reglas semánticas, nos aproxima al concepto de significado que intenta elucidar proponiendo una primera definición aproximativa de un concepto en particular. Su propósito es 6 Putnam, Hilary, “Is Semantic Possible?”, Concepts, Core Readings, Margolis, Eric y Laurence, Stephen (eds.), The MIT Press, 1999, pp. 177-187.
550
MARÍA INÉS PAZOS
mostrar los elementos que considera que integran el significado más bien que comprometerse con una forma general de las definiciones. Afirma: X es un limón =Df X pertenece a una clase natural cuyos miembros normales tienen cáscara amarilla, gusto ácido, etcétera.7
En esta definición, ser un limón (un ave, etcétera) no implica tener las propiedades descritas en la definición, sino sólo ser un elemento de una clase cuyos elementos normales tienen esas propiedades. El primer problema que se presenta es respecto de la noción de clase natural. Para Putnam, las clases naturales dependen de teorías científicas. Los miembros de una clase natural tienen en común algo, una “naturaleza esencial” que explica las características compartidas por los elementos normales (explica por qué los limones son amarillos y tienen gusto ácido). Pero cuál sea esa naturaleza esencial, como también si existe una clase natural que contenga a los objetos de cuyo nombre intentamos elucidar el significado son, según él cuestiones de investigación científica. Las personas ordinariamente no conocen la “naturaleza esencial” de los objetos, sino que los reconocen como pertenecientes a cierta categoría por medio de ciertas características de los miembros normales de ésta (ser amarillo, ácido, etcétera). Una primera consecuencia de esta noción de significado es que aunque las clases están asociadas a ciertos tipos de propiedades, no todos los elementos de la clase los poseen. Así, ser amarillo no resulta ser una propiedad necesaria de los limones sino sólo contingente. Esto da cuenta adecuadamente del hecho de que aunque asociamos con los conceptos algunas propiedades, como las de volar o cantar respecto de las aves, que las aves particulares y los diferentes tipos de aves canten o vuelen es contingente y podría no ocurrir, como en el caso de los pingüinos. Por otra parte, conocer las propiedades de los limones normales no resulta suficiente para clasificar algo como un limón, justamente porque puede haber elementos anormales en la clase. Por eso el criterio es insuficiente para identificar la referencia de la clase. Eso podría no ser un problema grave para la teoría si simplemente pretendiera dar cuenta de la situación de individuos que en el supermercado intentan distinguir las limas de los limones. Pero sí lo es si pretende dar cuenta del significado, 7
Ibidem, p. 178. La traducción es mía.
LA SEMÁNTICA DE LA DERROTABILIDAD
551
porque el significado de limón debe fijar la extensión de la clase y distinguirla de las otras, de lo contrario, no sería el significado del concepto. Las personas pueden confundir una lima con un limón justamente porque son clases diferentes. Si el concepto precisara esa distinción entonces la gente no podría equivocarse en la clasificación porque no habría una clasificación correcta. Ahora bien, volvamos al concepto de normalidad. Un limón normal es un elemento de una clase cuyos elementos normales tienen tales y cuales características. ¿Cuál es la función del concepto de normalidad en esta noción de significado? Tal como está expresada parece que el ser normal consiste o al menos implica tener ciertas propiedades específicas. De los limones en general no sabemos nada, pero los normales son amarillos, ácidos, etcétera. ¿Son estas propiedades necesarias de los limones? La definición anterior, tal como está formulada, implica una respuesta afirmativa. Pero justamente para evitarla es que la autora más adelante la modifica levemente para dar cuenta de que aun los elementos normales podrían carecer de las características distintivas de la clase. Esto es así porque, en la concepción que analizamos, esas características son explicables a partir de cierta naturaleza esencial de los elementos de la clase pero que no son necesarias respecto de esa naturaleza como lo muestra el hecho de que haya elementos anormales o atípicos. Si no son necesarias podrían no ocurrir en cualquiera de los elementos de la clase en particular no las tuviera aunque sí tuviera las propiedades esenciales. Sin embargo, las propiedades de la definición juegan una función muy especial en la teoría de Putnam. Ellas determinan un estereotipo. El estereotipo es un conjunto de propiedades que aprendemos a usar como criterio para clasificar a los objetos y es también el mecanismo por medio del cual se nos enseñan los conceptos. Aún cuando se trate de un conjunto de información que no contiene propiedades ni necesarias ni suficientes para pertenecer a una clase, es un tipo de información importantísima en la adquisición del lenguaje y en la actividad diaria de aplicarlo. Señala Putnam que el hecho más importante del que debe dar cuenta cualquier teoría semántica es el de que el significado de las palabras puede ser transmitido, y de que normalmente ello se puede hacer, de modo aproximado pero efectivo, mediante la transmisión de un pequeño grupo de información, de una teoría simplificada de lo que es un elemento de la clase que describe sus elementos normales. Describe un estereotipo de limón, de tigre, de ave, etcétera.
552
MARÍA INÉS PAZOS
Afirma además la autora, que sabemos que el estereotipo no es la teoría correcta acerca de la clase. Sabemos que ser un limón no consiste en ser una fruta amarilla y ácida. Si con el tiempo todos los limones crecieran azules reconoceríamos que nuestro estereotipo es inadecuado y lo modificaríamos para que nos resultara útil a los fines de identificar los limones verdaderos. A los hechos cuya descripción permite transmitir el uso de una palabra,Putnam los llama hechos nucleares (core facts). El estereotipo es uno de ellos, el único necesario y además normalmente el único usado, dado que por lo general por sí solo es suficiente para comunicar, al menos aproximadamente, un significado. 2. Análisis El hecho de que, al menos en muchos casos, aprendemos el significado mediante el traspaso de cierta información mínima, que consiste de hecho en una breve descripción que comparten ciertos ejemplares típicos de una clase (estereotipos) parece obvio. Es además verdad que normalmente usamos el lenguaje y que por lo tanto en algún momento lo hemos aprendido. Es un hecho que de algún modo lo adquirimos y que lo enseñamos y también lo es que ese hecho requiere una explicación. Es verdad también que la teoría semántica tradicional no puede dar cuenta de ese hecho porque, según ella, concepción el significado equivale a un conjunto (o combinación) de propiedades necesarias y suficientes que por lo general en los hechos no conocemos o al menos nuestra incapacidad de hacerlas explícitas parece indicar que no las conocemos. Si no las conocemos, no las podemos aplicar. Por otra parte, tampoco las podemos enseñar. ¿Cómo es entonces que aprendemos a usar el lenguaje correctamente? La teoría de estereotipos da una respuesta muy atrayente que además explica no sólo que aprendemos y usemos el lenguaje, sino por qué funciona el modo usual de transmitir el significado: describir algunas características de la clase. En eso consisten por ejemplo las definiciones lexicográficas, las de diccionario, que no son otra cosa que descripciones aproximadas de algunos elementos de la clase nombrada por la expresión que se pretende definir.
LA SEMÁNTICA DE LA DERROTABILIDAD
553
Es fácil describir lo que hacemos cuando aplicamos conceptos o transmitimos significados como una conducta de usar y transmitir estereotipos. Además, como los estereotipos son conjuntos de propiedades, del mismo modo que en la concepción tradicional, pero no necesarias ni suficientes sino meras propiedades usadas como criterio para clasificar provisoriamente los objetos (mientras un experto no nos demuestre que estábamos equivocados), es fácil explicar que algo no pertenezca a la clase aunque tenga las características estereotípicas. También explica que podamos equivocarnos en la clasificación aun usando correctamente la información de que disponemos acerca del significado. Si las propiedades fuesen necesarias y suficientes y si corroboráramos que un objeto, digamos un candidato a limón, las tuviera al momento de clasificarlo, entonces no podríamos equivocarnos poniendo una lima en nuestra bolsa de limones. En la teoría clásica los errores de clasificación sólo pueden deberse a aplicaciones incorrectas del lenguaje y no a hechos contingentes tales como que una lima tuviera todas las propiedades típicas de un limón. La concepción también da cuenta de nuestra dificultad para ver como necesarias a las características que usamos para clasificar los objetos y en general para detectar propiedades necesarias. Sin embargo, hay elementos paradójicos en esta teoría. El principal es que ella sostiene que nuestras operaciones de aplicar conceptos son siempre provisionales, porque nuestra información sobre el significado es siempre insuficiente para asegurar la clasificación. Eso sugiere que no conocemos el significado, sino a lo sumo una parte de él. Pero dado que todo lo que sabemos acerca de los objetos que clasificamos puede conducirnos a una identificación errónea, y dado que además no contamos con ningún criterio de corrección de la clasificación, porque por hipótesis lo que conocemos del significado son los hechos nucleares: el estereotipo, entonces tal vez no sepamos nada del significado. Dicho de otro modo, si sólo conocemos características contingentes de los elementos de una clase, y si ser necesario equivale a ser verdadero en virtud del significado mientras que las propiedades contingentes no derivan del significado, sino que deben determinarse por métodos sintéticos, entonces conocer únicamente propiedades contingentes implica no conocer nada acerca del significado.
554
MARÍA INÉS PAZOS
Cuando reconocemos que algo tiene las propiedades de ser amarillo, ácido y de piel rugosa, todavía no sabemos si pertenece a la clase natural cuyos miembros normales tienen esas propiedades, porque no sabemos nada de esa clase natural, en particular, no conocemos la naturaleza esencial de sus elementos, y menos aún si el objeto amarillo, ácido y rugoso que está en el cajón bajo el letrero “limones” las posee. Ni siquiera sabemos si existe una clase natural cuyos elementos normales tienen esas propiedades. Sólo sabemos que a las cosas con esas características se las suele clasificar bajo ese rótulo. Si quisiéramos saber si es un limón tendremos que buscar el dictamen de un científico, alguien que conozca la clase natural de los limones y cuente con mecanismos para determinar si nuestro candidato a limón tiene las propiedades esenciales de la clase. Parece que no estamos ante una teoría del significado, sino ante una explicación de cómo es posible que, a pesar de no conocer los significados de las palabras, las usemos con cierta efectividad y transmitamos el mecanismo para usarlas. Tal vez normalmente las usemos mal y quizás nunca hayamos comprado genuinos limones, pero eso no es relevante mientras el vendedor no lo sepa, mientras el dueño de los limoneros no cuestione su propiedad de ser limoneros y mientras el pastel de limón agrade a los niños. Putnam afirma que su teoría consiste simplemente en una hipótesis empírica, la parte central de la cual afirma que en conexión con casi cualquier palabra... hay ciertos hechos nucleares tales que... no se puede transmitir el uso normal de la palabra sin transmitir esos hechos nucleares”.8 Pero tal afirmación es compatible con sostener que los estereotipos no consisten, ni siquiera parcialmente, en el significado, y que transmitirlos o usarlos no es usar significados. El mismo autor agrega “Si la hipótesis es verdadera, entonces no importa si se elige llamarla «teoría del significado» o no. La cuestión es explorarla y explicar este fenómeno empírico”.9 Tiene razón. Sin embargo, la hipótesis no nos da respuesta a la pregunta de qué es el significado ni explica cómo es posible que todos, durante todo el tiempo, dejemos en manos de supuestos especialistas la tarea de determinar si son verdaderas o falsas nuestras clasificaciones de objetos, en cambio de actuar autónomamente en la aplicación de catego8 9
Ibidem, p. 184. Idem.
LA SEMÁNTICA DE LA DERROTABILIDAD
555
rías al mundo que manipulamos. Bajo esta concepción, vivimos confiando no sólo en hipótesis acerca del comportamiento de los objetos, lo que suele admitirse que es verdad, sino acerca de lo que los objetos mismos son, porque nadie conoce el significado de las palabras que usa. La obvia alternativa de transformar los estereotipos en conceptos nos volvería a llevar a la tesis clásica, dado que ellos consisten simplemente en conjuntos de propiedades. 3. Ejemplares Las concepciones basadas en ejemplares, cuya explicación tomo de Edward Smith y Douglas Medin,10 sostienen que los conceptos consisten en sus ejemplares o instancias más bien que en una abstracción hecha a partir de ellos. No se trata de todos los ejemplares, lo que haría al significado equivalente a la referencia, sino o bien a algún ejemplar en particular o a un subconjunto de ejemplares de la clase. Este enfoque involucra varias concepciones, lo que todas ellas tienen en común es que consideran que los conceptos son representados por alguno o varios ejemplares, aunque varían en la cantidad y también en el modo de representar los ejemplares mismos. El rasgo que los autores en que me baso encuentran común es la reducción del nivel de abstracción respecto de la concepción clásica. El nivel de abstracción más bajo consiste en considerar los conceptos representados por uno o varios ejemplares individuales. En niveles medios de abstracción se admite que alguno o varios de los ejemplares sean descritos por medio de propiedades, lo que los transforma en conceptos ellos mismos, dado que representan no a un objeto en particular sino a todos aquellos alcanzados por la descripción. Otro rasgo que los autores atribuyen a estas concepciones es la de representar los conceptos de modo disyuntivo. Un objeto pertenece a cierta categoría cuando tiene cierta relación con al menos uno de los ejemplares que la representan. Consideremos un ejemplo: El concepto de pájaro equivale a una disyunción entre las siguientes categorías: tordo, cuervo, gorrión, “Piolín”. Con excepción del último caso, que es un individuo, los otros ejemplares pueden ser representados, 10 “The Exemplar View”, Concepts, Core Readings, Margolis, Eric y Laurence, Stephen (eds.), The MIT Press, 1999, pp. 208-221.
556
MARÍA INÉS PAZOS
a su turno, o bien por medio de ejemplares individuales de ese subconjunto, o bien por medio de una descripción sumaria de esa clase. Obviamente distintas concepciones pueden sostener o que cada disyunto debe ser representado por un individuo, o que todas deben representarse con un conjunto de ellos, o que todas deben describirse mediante una lista de información, o cualquier combinación posible de las alternativas anteriores. Por ejemplo, una representación posible para pájaro sería: Pájaro tordo
cuervo
gorrión
Individuo 1 Individuo 2
carnívoro plumaje negro pico cónico y grueso alas de un metro de envergadura
Ejemplar 1 Ejemplar 2
piolín
Una variedad interesante de este tipo de concepciones el “modelo de mejores ejemplares” (best-examples model) según el cual los ejemplares que representan la clase deben ser aquellos que son típicos de ella. Ellos son ejemplares que muestran cierto parecido de familia reflejado en que todos comparten una número crítico de propiedades con cada uno de los demás ejemplares del concepto, aunque no se requiere que entre sí todos tengan un conjunto de propiedades comunes. En nuestro ejemplo, los cuervos deben compartir cierta cantidad mínima de propiedades comunes con cada uno de los tordos, otra cantidad mínima con los gorriones y otra con Piolín, pero no es necesario que el mismo conjunto de características lo comparta con todos. Para determinar si un objeto cualquiera pertenece a la categoría pájaro, se determina si se asemeja lo suficiente a al menos uno de los ejemplares que representan el concepto de pájaro. Dado el problema obvio de cómo determinar una similitud suficiente a alguno de los ejemplares, puede reformularse el criterio de un modo un poco más sofisticado requiriendo que el objeto asemeje más a alguno de los ejemplares de pájaro que a alguno de una categoría de contraste.
LA SEMÁNTICA DE LA DERROTABILIDAD
557
Por ejemplo, tomamos al individuo “Roberto” y consideramos a qué otros ejemplares se asemeja. Si se parece más a Piolín, a alguno de los ejemplares de tordo o de gorrión o tiene el conjunto de las propiedades que caracterizan a los cuervos, antes que asimilarse a los ejemplares que determinan una clase excluyente respecto de la de los pájaros, entonces Roberto es un pájaro. Un contrato tal vez signifique algo similar a una compraventa, a un arrendamiento o a un préstamo bancario. Las diferentes maneras de entender a los ejemplares que disyuntivamente representan el concepto son tan diferentes entre sí que la elección entre ellas origina teorías con características muy distintas. Imaginemos que consideramos a los ejemplares simplemente como subconjuntos de una clase genérica, cada una de ellas descrita al modo clásico. En tal caso, la concepción colapsaría en una concepción clásica donde la propiedad necesaria y suficiente para pertenecer a la clase fuera ser elemento de una de las subclases. Por ejemplo, supongamos que una mascota es representada como ser un gato o un perro, y que gato y perro son definidos por medio de descripciones. Gato: felino, mamífero carnívoro, de aproximadamente medio un metro del hocico a la cola y pelaje suave. Perro: mamífero canino, doméstico, carnívoro, de la familia de los cánidos, de entre 1 y 30 kilogramos de peso, que ladra. En este caso ser una mascota equivaldrá a tener o bien las propiedades que definen al perro o bien aquellas que definen al gato. Esta modalidad de la teoría debe ser abandonada si se pretende buscar una alternativa a la concepción tradicional. En el extremo de la falta de abstracción podríamos imaginar una teoría de ejemplares donde cada uno de ellos fuese simplemente un individuo particular. Digamos que un individuo aprende a lo largo de su vida que Roky, Wendy, Ladrador, Dina... y Alf son buenos ejemplos de perros. Luego, cada vez que se le presenta un candidato los compara con cada uno de los perros ejemplares que conoce y si se parece lo suficiente a alguno lo categoriza del mismo modo. Eventualmente lo agregará también como perro ejemplar. Con el tiempo su clase puede volverse muy grande, tanto que la capacidad de procesamiento podría resultar insuficiente. 4. Análisis Si excluimos la variante que colapsa con la concepción tradicional, en todas las demás parece haber elementos altamente intuitivos. La idea de
558
MARÍA INÉS PAZOS
que clasificamos por comparación con ejemplares típicos es apta para explicar muchos de los aspectos en que la teoría clásica falla. En particular, explica por qué no podemos indicar un conjunto de características necesarias y suficientes: si la clasificación es una cuestión de semejanza o diferencia, entonces tal vez no sea posible determinar la variedad de maneras en que algo puede alejarse de los ejemplares típicos y tal vez un objeto pueda resultar muy parecido a otro sin que comparta con él muchas propiedades. Otra ventaja es que no se requiere en absoluto el uso de la noción de propiedad. Cuando vemos dos cosas como similares tal vez no sepamos en qué se parecen, pero tampoco necesitamos saberlo para reconocerlas como similares. Otras veces podemos ver dos objetos como diferentes sin ser capaces de mencionar en qué se distinguen. Aunque en la presentación de las distintas variantes de la concepción basada en ejemplares es tentador recurrir a la noción de propiedad para dar cuenta del modo en que los ejemplares se relacionan entre sí o con los candidatos a pertenecer a la categoría general, lo cierto es que no es necesario usarla. Por el contrario, a mí me parece que la postulación de las concepciones basadas en ejemplares como alternativas a la semántica tradicional indica con bastante claridad una línea de elaboración que excluye la noción de propiedad de la articulación de todas ellas. La idea que me sugiere es la de que el mecanismo básico en la acción de clasificar objetos es el de comparación de un objeto con otro u otros considerados ejemplares para determinar entre ellos una relación de semejanza-diferencia. Pero esta relación, si ha de reemplazar a una concepción basada en propiedades, debe a su turno excluirla. La relación de semejanza-diferencia debe verse como una noción básica, simple en el sentido de que no puede o no es necesario descomponerla en semejanza respecto de propiedades en particular. Tal vez una vez que hemos reconocido que los objetos son muy diferentes, un análisis posterior nos permita indicar en qué se distinguen, pero la posibilidad de hacerlo no es un requisito para la comparación. Podemos ver diferentes un cuadrado de un círculo sin tener el concepto de línea recta o curva que nos permitirían expresar al menos una de las diferencias (el tipo de línea con que están dibujados). Finalmente, quisiera considerar el punto del grado de abstracción. Según Smith y Medin un punto esencial en todas las concepciones de ejemplares es que todas ellas reducen en nivel de abstracción de los ejempla-
LA SEMÁNTICA DE LA DERROTABILIDAD
559
res respecto de la concepción tradicional. Quisiera sugerir que tal cosa no es necesaria para que una teoría semántica determine el significado como similitud con uno o alguno de los ejemplos típicos de una clase. Esto es así porque los ejemplares no necesitan ser individuos particulares (lo que obviamente reduciría el grado de abstracción), pero la alternativa no es la de admitir descripciones genéricas al tipo clásico. Quiero proponer que dar una lista de propiedades no es el único modo de abstraer. Un ejemplar no necesita ser o un individuo, un conjunto de individuos, o una lista de propiedades. Propongo que una alternativa es una idea o modelo en la mente con el que comparamos los objetos reales. Pero tal idea no es la idea de un individuo particular ni la de un conjunto de propiedades, es también una noción básica o simple de la que no podemos dar una descripción pero que es suficiente para efectuar clasificaciones. “Esto es un pájaro” no necesariamente significa que se parece a alguno de los individuos ejemplares, significa que lo veo más parecido a un pájaro que a un pez aunque no sepa en qué, y aunque cuando me pregunten cuáles son las propiedades que lo hacen más similar a un pájaro sea incapaz de indicar los rasgos en los que se asemeja. Mi idea paradigmática de pájaro no es la de algo que canta, ni tampoco la de algo que es ovíparo, ni una disyunción entre esas u otras propiedades. Todo lo que puedo decir es que aquella paloma bajo el alero del tejado satisface perfectamente mi paradigma de pájaro, mientras que la gallina que duerme en la azotea de mis vecinos no. Aun los conceptos que parecen complejos porque cuando analizamos de cerca sus ejemplares vemos que tienen multiplicidad de propiedades pueden ser básicos en el sentido de que el significado no se lo atribuimos como resultado de tales propiedades, sino que lo percibimos como un todo. El concepto de rojo puede ser tan básico como el de pájaro en nuestro esquema real de conceptos. IV. CONCLUSIONES Si un concepto equivale a la formulación de una lista de propiedades necesarias y suficientes para pertenecer a él, entonces si no puede darse la lista no podrá completarse la formulación y a lo sumo obtendremos una definición parcial, un concepto indeterminado.
560
MARÍA INÉS PAZOS
Bajo esta concepción, no puede haber listas indeterminadas de excepciones a la pertenencia a una clase, porque eso equivaldría a una indeterminación en el concepto y por tanto a la indeterminación respecto de la pertenencia a la clase. Si está indeterminado el hecho de si un convenio realizado entre un ser humano y una avanzada computadora capaz de tener fines, tomar decisiones y actuar conforme a ellas es un contrato, entonces que una de las partes sea una computadora no es una excepción al concepto de contrato, sino que no se sabe si lo es o no. En cambio, si admitimos una concepción semántica en la que no se exija para que algo pertenezca a una clase que cumpla ciertas condiciones específicas, conjuntivas, disyuntivas, afirmativas o negativas, sino cierta relación con un estereotipo o un ejemplar paradigmático de la clase, entonces tal vez podamos determinar si el convenio con la computadora se asemeja o no lo suficiente al estereotipo o al ejemplar paradigmático. Bajo una concepción de estereotipos como la de Putnam seguramente concluiríamos que el convenio no cumple el estereotipo y en consecuencia diríamos que no parece ser un contrato, lo ubicaríamos provisoriamente fuera de la clase hasta que un experto pudiera determinar si la naturaleza esencial de los contratos permite convenios con ordenadores. El resultado no me parece satisfactorio porque no da cuenta de la idea de que nuestras nociones preteóricas, los criterios de clasificación que usamos, son capaces de tratar y evaluar situaciones no previstas en listas de propiedades. Pero la noción de estereotipo, aunque da cuenta mejor que la teoría clásica del uso real de los conceptos, mantiene como criterios de aplicación de los conceptos las listas de propiedades que definen los estereotipos particulares. La noción de ejemplar parece más viable porque permite comparar los casos nuevos con los ejemplos paradigmáticos de manera más libre, sin el requisito de la lista de propiedades. Tal operación puede hacerse comparando los candidatos nuevos con instancias individuales o con subclases de la clase genérica. ¿Se parece nuestro convenio con la computadora a un contrato ejemplar? Por supuesto depende de lo que sea un contrato ejemplar, de si es una disyunción entre ejemplos paradigmáticos genéricos o individuales, o de si se trata de una idea abstracta (pero que no consista en una combinación de propiedades) con la que podamos hacer la comparación. Pero el hecho de que la propiedad “ser un acuerdo
LA SEMÁNTICA DE LA DERROTABILIDAD
561
entre seres humanos” no sea desde el principio un límite permite flexibilidad en la comparación. La nueva semántica tiene que ser capaz de dar cuenta de que las excepciones sean tales aunque no figuren en una lista cerrada. Éste es uno de los requisitos para que nuestra teoría pueda dar cuenta de la derrotabilidad. Pero no es la única. Debe darse cuenta del hecho básico de Putnam: de que los conceptos pueden ser enseñados, y de que las listas de información son útiles para transmitir si bien no necesariamente conceptos, al menos sí su uso aproximado. También debe ser capaz de dar cuenta de que hay propiedades necesarias y propiedades contingentes de las cosas. Tal vez para dar cuenta de la necesidad se requiera que en algunos conceptos haya un contenido mínimo de información contenida en propiedades. Tal vez un perro sea principalmente algo similar a un perro paradigmático, pero que necesite además ser un animal. El contenido de información en términos de propiedades no puede ser excluido a priori de la teoría semántica, pero es claro que no debe ser el componente central. Mi propuesta es que las nociones centrales deben ser las de ejemplar típico o paradigmático, asociado el concepto de normalidad, y la relación de semejanza. La teoría queda aún por desarrollar. V. BIBLIOGRAFÍA HART, H. L. A., “The Ascription of Responsability and Rigths”, Logic and Lenguage, Oxford, Basil Blackwell, 1960. PAZOS, María Inés, “Derrotabilidad sin indeterminación”, Doxa, Cuadernos de Filosofía del Derecho, vol. 25, 2002. Putnam, “Is Semantic Possible?” Concepts, Core Readings, MORGOLIS, Eric y LAURENCE, Stephen (ed.), The MIT Press, 1999. SMIT y MEDIN, “The Exemplar View”, Concepts, Core Readings, MORGOLIS, Eric y LAURENCE, Stephen (eds.), the MIT Press, 1999.
!
RAZONES Y NORMAS* María Cristina REDONDO** SUMARIO: I. Introducción. II. Primera parte. Universalismo vs. particularismo. III. Segunda parte. Las razones jurídicas. IV. Reflexiones finales. V. Bibliografía.
I. INTRODUCCIÓN En la filosofía moral contemporánea existe un profundo debate acerca del carácter particular o universal de las razones justificativas. En la base de esta discusión se encuentran no sólo concepciones incompatibles acerca del alcance de las razones sino, sobre todo, visiones opuestas acerca de la racionalidad práctica en general y de lo que caracteriza un modelo plausible de toma de decisiones. En la primera parte de este trabajo, presentaré los dos modelos de razones para la acción propuestos respectivamente por el universalismo y el particularismo. Al respecto, intentaré mostrar cómo ellos se relacionan con la noción de norma y de razonamiento práctico basado en normas. Para empezar, distinguiré tres sentidos en los que la idea de “universalidad” puede ser relacionada con las normas y las razones. Sobre la base de esta distinción criticaré aquellas teorías que reducen la contraposición entre razones universales o particulares a una discusión meramente lógica —acerca del carácter derrotable o inderrotable de las normas que las expresan— o exclusivamente semántica —acerca de la mayor o menor abstracción de los contenidos normativos—. Por mi parte, intentaré defen* Agradezco a Ricardo Caracciolo y a Eugenio Bulygin quienes discutieron una versión preliminar de este trabajo y me hicieron importantes sugerencias. ** Consejo Nacional de Investigaciones Científicas y Técnicas, Argentina.
563
564
MARÍA CRISTINA REDONDO
der que la diferencia fundamental radica en el alcance de la relevancia (universal o particular) de las razones y que, a su vez, la relevancia universal de las razones —que no es un rasgo lógico ni semántico— no debe ser confundida con el peso (absoluto o pro tanto) de las mismas. En la segunda parte del trabajo, proyectaré las tesis del universalismo y del particularismo al ámbito de la teoría jurídica. Al hacerlo se verá que, si bien con un lenguaje diferente, allí se plantea una discusión similar a la entablada en la filosofía moral. A mi juicio, así justamente puede entenderse el debate sobre la diferencia entre reglas y principios jurídicos introducida por Ronald Dworkin. En relación a este debate, la distinción de diversos sentidos de universalidad permitirá mostrar cómo algunas posiciones que explícitamente defienden una posición universalista (en un sentido sólo lógico o semántico del término), desde el punto de vista de la relevancia asignada a las razones jurídicas resultan comprometidas con una posición particularista. Antes de presentar la discusión universalismo-particularismo vale la pena determinar con mayor precisión el tipo de tesis que están en cuestión y el tipo de desacuerdo que hay entre ellas. Esta precisión es fundamental porque de ella depende el tipo de argumentos que serán considerados pertinentes para avalar —o desacreditar— una u otra tesis. Asimismo, la falta de acuerdo sobre este punto significaría que los participantes sostienen un dialogo sin sentido. El actual debate entre universalismo y particularismo en el ámbito de la filosofía práctica es, en gran medida, una discusión metafísica sobre la posibilidad de establecer relaciones nomológicas entre ciertas propiedades naturales, por una parte, y ciertas propiedades morales por otra, o, también, acerca de la fuente de la relevancia moral de ciertas propiedades naturales. Desde esta perspectiva, la discusión particularismo-universalismo no parece directamente aplicable o relevante en el ámbito jurídico. Sin embargo, es también indudable que la reflexión sobre la naturaleza de las razones para la acción en general es de sumo interés para las teorías jurídicas contemporáneas que ven en la noción de razón justificativa un concepto clave para comprender el derecho. Si el derecho es analizado como un conjunto de normas que pretenden ofrecer razones justificativas, será necesario tomar partido acerca de qué tipo de razones éste ofrece y, en consecuencia, con qué procedimiento de toma de decisiones nos compromete.
RAZONES Y NORMAS
565
Al momento de afrontar la pregunta acerca de qué concepción de las razones y del razonamiento caracterizan mejor a las razones y a los argumentos jurídicos creo que es útil no confundir tres tipos de discursos —y de discusiones— que, aun estando relacionados entre sí, comportan objetivos claramente diversos. Me refiero a la distinción entre discursos analítico-conceptuales, descriptivo-explicativos y evaluativo-justificativos. Teniendo esto en cuenta, cabe destacar que la oposición entre universalismo y particularismo tal como aquí la analizo es expresión de un desacuerdo filosófico, i. e. analítico-conceptual, y que el presente trabajo consistirá exclusivamente en un intento de establecer cuáles son los modelos conceptuales que cada una de estas posiciones propone para luego intentar reconocer qué teorías jurídicas se comprometen con una u otra posición. Es notorio que existen diversos modos de entender el análisis conceptual y, en este caso específico, es posible que estemos frente a un desacuerdo también sobre este punto. Sin intención de entrar en esta cuestión, considero importante advertir que, en lo que sigue, entenderé las dos propuestas que compiten como dos modelos ideales que, si muestran ser lógica y empíricamente posibles, i. e. internamente coherentes y de implementaron factible por parte de sujetos reales, pueden defenderse o justificarse sobre la base de consideraciones de valor. En pocas palabras, asumiré que estamos ante dos reconstrucciones racionales de una serie de conceptos, y no ante dos análisis hermenéutico-interpretativos que explican o dan sentido a una práctica argumentativa más o menos extensa, tal como los sujetos de esa práctica se ven a sí mismos. Sin subestimar la importan cia de es te úl ti mo ti po de aná li sis con cep tual, en tien do que la alternativa de tratar las posiciones presentadas como modelos ideales es la única que puede revestir interés en un estudio de teoría general del derecho. Como reiteradamente se ha señalado, el estudio del derecho desde una perspectiva general no está relacionado a una específica práctica argumentativa; por el contrario, pueden relevarse diversas prácticas consolidadas, notablemente diferentes, como por ejemplo, las del derecho anglosajón y las desarrolladas en los ordenamientos así llamados “continentales”. Asimismo, es notorio que existen enteros sectores de los ordenamientos jurídicos en los que los operadores tienden a seguir reglas en sentido “estricto” mientras que en otros, ya sea de facto, o en virtud de una expresa autorización jurídica, la práctica del dintinguishing es ampliamente usada. En otras palabras, desde un punto de vista feno-
566
MARÍA CRISTINA REDONDO
menológico es factible ofrecer ejemplos de prácticas en las que los operadores del derecho, y especialmente los jueces, se ven a sí mismos con funciones diferentes y que avalan alternativamente distintos modelos argumentativos. Por este motivo, creo que esta discusión reviste interés para la teoría jurídica sólo en la medida en que ella se interprete como un debate entre dos modelos ideales o patrones bajo los cuales es posible analizar y practicar el derecho. II. PRIMERA PARTE. UNIVERSALISMO VS. PARTICULARISMO Una razón para la acción, y en esto acuerdan particularistas y universalistas, es una consideración relevante a favor o en contra de llevar a cabo una determinada acción. Esta dimensión de fuerza o relevancia es unánimemente admitida como el aspecto central del concepto de razón. Ser una razón para actuar es ser relevante para determinar cómo se debe actuar. Llamar a algo “una razón para actuar” y luego no conferirle importancia alguna en el razonamiento práctico que conduce a tomar una decisión acerca de qué se debe hacer, significaría que no hablamos sinceramente, o que no usamos en serio la expresión “razón”. El universalismo y el particularismo discrepan sobre el alcance y la fuente de la relevancia de las razones. Según el universalismo, la relevancia de las razones es uniforme e invariable, y, en este sentido, universal. Esta característica se explica porque las razones tienen su fuente en normas y las normas son el contenido de condicionales universales, i. e. cuantificados universalmente, que correlacionan la presencia de ciertas propiedades o circunstancias con determinadas consecuencias deónticas. Por el contrario, según el particularismo, la existencia de razones es siempre relativa a un caso concreto y no a normas universales. Cualquier propiedad, según sea la situación individual, puede devenir relevante, i. e. puede constituir una razón. Pero dicha relevancia es siempre contextual y, en este sentido, particular. 1. El universalismo En relación al universalismo, dos observaciones son pertinentes. La forma lógica que el universalismo atribuye a las normas nada implica con respecto al estatuto metaético de dichas normas. Es decir, una con-
RAZONES Y NORMAS
567
cepción universalista de las normas es compatible con el realismo, el anti-realismo, el cognoscitivismo, el no-cognoscitivismo, etcétera. Al mismo tiempo, dicha forma lógica universal nada dice acerca del específico peso o fuerza de las normas.1 Es decir, en una concepción universalista, las normas pueden tener fuerza absoluta o pro tanto, o pueden carecer por completo de peso. Por ejemplo, una norma injustificada (inválida) carece de fuerza justificativa y no constituye una razón. Entre las normas justificadas, aquellas de más alto rango (o peso insuperable) se dice que constituyen razones absolutas, que vencen cualquier otra posible razón. Aquellas con fuerza limitada o superable constituyen razones pro tanto que pueden ser vencidas o derrotadas por otras consideraciones con las que compiten.2 Es digno de destacar que aun si la mayor parte del análisis del seguimiento de reglas centra su atención en normas absolutas, las normas universales no son necesariamente de este tipo. Es más, cuando lo que interesa es el contraste entre una concepción universalista y una particularista de las razones, la forma más atractiva de universalismo es la que admite que las normas, sin dejar de ser universales, no constituyen razones insuperables. En otras palabras, el universalismo se encuentra en mejor posición para discutir con el particularismo cuando admite que las razones, aún si tienen relevancia invariable y uniforme, pueden ser vencidas por otras razones, y no determinar lo que se debe hacer todas las cosas consideradas. Un norma con fuerza limitada o superable es universal si y sólo si en toda ocasión en la que se dan las condiciones de su antecedente, estamos autorizados a aplicar su consecuente, es decir, podemos extraer la conclusión deóntica. El punto crucial en este caso es que el deber establecido en el consecuente no es un deber absoluto ni concluyente. El universalismo y el particularismo discuten sobre la fuente y el alcance (universal o no) de la relevancia de las razones, y no sobre su específico peso. Ambas posiciones pueden admitir la existencia de razones de diverso peso, incluyendo razones absolutas, sólo que, en un caso, las razones son universales porque tienen una fuente y un alcance universal, en el otro son sólo particulares porque tienen una fuente y un alcance contextual. 1 2
Véase Shafer Landau, R., “Moral Rules”, Ethics, 107, 1997, pp. 584 y 585. Se advierta que el análisis que propongo no coincide exactamente con el propuesto por Shafer Landau.
568
MARÍA CRISTINA REDONDO
En todo caso, en una concepción universalista de las razones, razones y normas universales son las dos caras de una misma moneda. En virtud de esta relación especial entre razones y normas, el termino “razón” es ambiguo. A veces designa la relación universal establecida por una norma, a veces, se refiere a los rasgos o propiedades previstos en el antecedente de una norma, y en otras ocasiones, se refiere a situaciones individuales, a casos de instanciación del antecedente de una norma. En otras palabras, las razones pueden ser entendidas como normas, como propiedades, o como hechos normativos individuales, es decir, hechos que pueden ser identificados sólo en virtud de la aplicación de una norma. A pesar de que es realmente difícil evitar esta ambigüedad, a lo largo de este trabajo intentaré mantener siempre la distinción entre la noción de norma, que en una visión universalista es un condicional cuantificado universalmente y que relaciona ciertas condiciones con una consecuencia deóntica, y la noción de razón para la acción, que hace referencia a propiedades o circunstancias relevantes desde un punto de vista práctico, y que, en una visión universalista, tienen su fuente en una norma universalmente válida. 2. Predicados universales, cuantificadores universales y relevancia universal Al menos tres diferentes sentidos de “universalidad” como atributo de normas merecen ser claramente distinguidos. Primero, “universalidad” puede significar generalidad semántica. En este sentido, una norma universal no se refiere a un caso particular sino a una clase de circunstancias. Bajo este presupuesto, la generalidad semántica de una norma es una propiedad gradual: una norma N1 es más general que otra norma N2 si la clase de casos que regula N1 es más amplia que la clase de casos regulada por N2.3 Existe un segundo sentido en el que la universalidad puede ser una propiedad crucial de las normas: una norma puede ser universal en un sentido lógico. Esto sucede cuando la forma lógica atribuida a una norma es la de un condicional universalmente cuantificado, como opuesta a la 3 Acerca de este sentido semántico de universalidad, véase Alchourrón, C. y Bulygin, E., Normative Systems, Viena-Nueva York, Springer Verlag, 1971, p. 78.
RAZONES Y NORMAS
569
de un condicional derrotable (defeasible).4 Conforme a este segundo sentido, las normas establecen una correlación —entre la presencia de ciertas condiciones y una consecuencia deóntica— que admite la aplicación de la ley del refuerzo del antecedente, y el esquema de razonamiento modus ponens. Es decir, en toda ocasión en la que se dan las condiciones mencionadas en el antecedente podemos obtener el consecuente. Estos dos sentidos —lógico y semántico— de universalidad son claramente parte del concepto de norma en una concepción universalista: las normas establecen relaciones universales entre ciertas propiedades deónticas —el carácter obligatorio, permitido o prohibido de una clase de acciones— y un caso genérico identificado a través de propiedades universales. Un tercer sentido de universalidad hace referencia a la relevancia de las normas en nuestra deliberación práctica, moral o jurídica. Afirmar que una norma (semántica y lógicamente universal) es universalmente relevante significa que, dadas sus condiciones de aplicación, ella constituye una razón uniforme e invariablemente relevante. Es decir, la instanciación del antecedente de la norma comporta siempre una contribución (negativa o positiva) en relación a un resultado práctico.5 Este sentido de universalidad, ciertamente, no es parte necesaria del concepto universalista de norma,6 y presupone que la norma es válida o está justificada. Este último es un elemento central para explicar la concepción universalista de las razones para la acción, ya que una razón es uniforme e invariablemente relevante si, y sólo si, la norma en la que se basa está justificada. En esta perspectiva, decir que en ciertas circunstancias hay una razón (pro tanto o absoluta) para hacer algo, presupone que en dichas circunstancias es aplicable una norma válida que establece el deber (pro tanto o absoluto) de actuar en ese sentido.7 A su vez, afirmar que 4 Acerca de este sentido lógico de universalidad, véase Alchourrón, C., “Detachment and Defeasibility in Deontic Logic”, Sudia Logica, 57, 1996, pp. 5-18. 5 Esto descarta una lectura probabilística de la relación entre antecedente y consecuente, ya que esta última es compatible con que la contribución de la instanciación del antecedente sea igual a cero. Cfr. Shafer Landau, R., op. cit., nota 1, p. 585. 6 Las normas, aun si universales, no son siempre analizadas como constituyendo razones para la acción. Por ejemplo, una concepción externalista de los deberes establecidos por normas niega que ellos impliquen razones para actuar. 7 Sólo este tercer sentido de “universalidad” se relaciona con la clásica tesis de la universalización que se discute en la filosofía moral. Cfr. Meggle, G., “The Universalizability Problem in Moral Philosophy”, en Egidi, Rosaria, Dell’Utri, Massimo y Caro, Mario de (eds.), Normatività, fatti, valori , Roma, Quodlibet, 2003, p. 71 y 79.
570
MARÍA CRISTINA REDONDO
una norma constituye una razón —en este sentido universalista— significa que las propiedades contenidas en su antecedente son uniforme e invariablemente relevantes al momento de decidir cómo actuar. Adviértase que la noción de universalidad de la relevancia incluye una referencia temporal. La relevancia universal de una norma N excluye la posibilidad de que, dadas sus condiciones de aplicación en t-1 y en t-2, ella constituya una razón en t-1 y no en t-2. Consecuentemente, la concepción universalista de las razones supone un doble compromiso. Ante todo, asume una premisa conceptual: una noción universalista de norma. En segundo termino, asume una premisa existencial: sostiene que hay algunas normas que son válidas o justificadas, i. e. que constituyen razones uniforme e invariablemente relevantes.8 Como vemos, el núcleo de la propuesta universalista con respecto a la noción de razón para la acción está relacionada a la idea de relevancia universal de ciertas normas que les sirven de base; sin embargo, esta concepción requiere también la universalidad semántica y lógica de dichas normas. Ello es así porque en esta concepción las razones presuponen relaciones nomológicas, y la universalidad semántica y lógica son rasgos necesarios de los condicionales que expresan tales relaciones. En otras palabras, la identificación de una razón uniforme e invariablemente relevante supone la relevancia de una norma semántica y lógicamente universal. En lo que sigue, siempre que use la expresión “razones universales” sin ulterior especificación estaré refiriéndome a razones que tienen su fuente en normas universalmente válidas o relevantes.9 3. El particularismo El particularismo desafía y se opone a una concepción universalista de las razones. Ninguna propiedad es uniforme e invariablemente relevante. 8 Sólo un número finito de normas independientes pueden ser relevantes o justificadas. Una posición que admitiese que cualquier norma, o todas las normas posibles, constituyen razones para la acción, colapsaría en el particularismo y se distinguirá de él sólo en su presentación formal. 9 Adviértase que, aun si en esta perspectiva la relevancia universal de una norma implica su universalidad lógica y semántica, la implicación en dirección opuesta no se sostiene. Es decir, la universalidad semántica no implica universalidad lógica, y esta última no implica universalidad de la relevancia. Al final del trabajo volveré sobre este punto.
RAZONES Y NORMAS
571
Una misma característica, dependiendo de las circunstancias, puede constituir una razón sea a favor o en contra de realizar un tipo de acción, o puede ser absolutamente irrelevante. El contexto es el que determina si una propiedad es relevante (es o no una razón), y en qué sentido lo es (a favor o en contra) y qué peso tiene (limitado o insuperable). Por este motivo, las razones para la acción existen y se pueden identificar sólo en relación a cada situación particular en la que se debe decidir cómo actuar. Ello explica el valor mutable que una misma propiedad asume en nuestro razonamiento práctico.10 Debe subrayarse que los particularistas no son escépticos respecto de la existencia de razones ni de la posibilidad de responder a la pregunta acerca de cómo debemos actuar, todas las cosas consideradas. Ellos, en cambio, sí son escépticos en relación a la existencia de normas universales que establezcan una correlación necesaria entre ciertas circunstancias de hecho y ciertas consecuencias deónticas. Desde su perspectiva, no es posible ni tiene interés alguno buscar —o establecer— relaciones normativas, legaliformes en sentido estricto. El particularista defiende una concepción holista y contextualista en la que cualquier propiedad o circunstancia puede adquirir o perder relevancia según sean las características concretas del caso individual. El particularismo no tiene razón alguna para rechazar la universalidad semántica de los predicados o de los enunciados prácticos. Lo que esta posición excluye es la universalidad de una especifica relación que va de la presencia de ciertas propiedades naturales a ciertas consecuencias deónticas. Ninguna propiedad natural tiene aptitud suficiente para garantizar la obtención de una consecuencia evaluativa o deóntica. Asimismo, merece la pena destacar que la tesis particularista no desafía necesariamente la universalidad lógica o la posibilidad de argumentos deductivos en contextos prácticos. De hecho, el particularismo puede expresar su propuesta al menos en dos modos alternativos. Si el concepto universalista de norma se da por sentado y no se pone en discusión, entonces el particularismo está obligado a ser escéptico con respecto a la relevancia práctica —o la validez— de tales normas universales. El particularismo estaría diciendo que cuando decidimos cómo actuar, y buscamos razones en pro o en contra de una acción, no hay normas válidas que puedan guiarnos. De hecho, no seguimos ni tenemos por 10
Véase Dancy, J., Moral Reasons, Oxford, Blackwell, 1993, p. 61.
572
MARÍA CRISTINA REDONDO
qué seguir normas. En esta hipótesis, el particularista está aceptando un concepto universalista de norma para después afirmar que las normas así entendidas, no están justificadas, y por ello no tienen —ni hay motivo para que tengan— alguna función práctica, i. e. no juegan ningún papel en nuestro razonamiento práctico. En todo caso, al admitir que las normas son universales, se admite también, tácitamente, que a ellas sería aplicable la ley del refuerzo del antecedente y el modus ponens. Lo que sucede es que los razonamientos y las conclusiones que sería formalmente posible articular a partir de ellas estarían desprovistos de todo peso o valor práctico. El modus ponens autoriza a obtener conclusiones, pero una conclusión lógica —resultante de un argumento deductivo— no debe confundirse con una razón para actuar, y menos aún con una razón concluyente-resultante de un balance de razones. Un enunciado, ya sea una premisa o una conclusión de un argumento deductivo, expresa una razón para la acción según sea, no la teoría lógica, sino la teoría de las razones que se asuma. Conforme a una teoría particularista, las razones para la acción tienen su fuente, no en normas universales (porque no hay normas universales que puedan considerarse válidas o justificadas) sino en contextos particulares. Un modelo correcto de razonamiento práctico no sigue normas y no es deductivo. Sólo frente a un caso individual podremos identificar si hay razones y si ellas son suficientes para hacer o dejar de hacer algo, es decir, para llegar a una conclusión acerca de lo que se debe hacer. Pero este razonamiento y esta conclusión no pueden aplicarse a ningún otro caso diferente. Esta presentación separa netamente las cuestiones lógico formales de las cuestiones prácticas y constituye un modo de poner de manifiesto que la perspectiva particularista no está poniendo en tela de juicio un concepción universalista clásica de la lógica, sino una concepción universalista clásica de las razones para la acción. No obstante esta presentación sea posible, no creo que sea el mejor modo de entender la tesis particularista. Si la disputa entre las dos concepciones en cuestión tiene en su base un desacuerdo filosófico (entendido como desacuerdo conceptual), no parece adecuado interpretar el particularismo como si éste aceptase una concepción universalista de las normas y discutiese sólo la validez o relevancia práctica de tales normas. En otras palabras, no parece adecuado presentar a los particularistas como “universalistas escépticos”, que es como deben ser interpretados a la luz de la caracterización anterior.
RAZONES Y NORMAS
573
Los particularistas están tratando de ofrecer un modo diferente de entender nuestro razonamiento práctico. Ellos, en realidad, están rechazando la propuesta filosófica del universalismo en relación a las normas, el razonamiento práctico y las razones para la acción, y, al mismo tiempo, están argumentando a favor de un nuevo modo de entender estos conceptos. Desde este punto de vista, si se acepta una concepción derrotable de las normas, el particularismo no necesita ser escéptico con respecto a ellas. Cuando las normas son concebidas como el contenido de condicionales derrotables, las condiciones establecidas en el antecedente no son condiciones suficientes para obtener el consecuente. Esta concepción resulta apropiada para el particularismo justamente porque le permite mostrar que puede dar cuenta de la noción de norma y de razonamiento apoyado en normas, sin traicionar su tesis sustantiva referida a la fuente de las razones para la acción y a las características de nuestro razonamiento práctico. En esta perspectiva, las normas no son más relaciones universales legaliformes, sino meros resúmenes o recordatorios del “tipo de importancia que una propiedad puede tener en circunstancias apropiadas”.11 Estas normas, en un determinado contexto, pueden expresar condiciones suficientes para sus consecuentes deónticos, pero ciertamente no expresan condiciones suficientes en cualquier contexto. Una concepción derrotable de las normas implica que aun si recurriésemos a ellas para identificar razones, éstas no son ni uniforme ni invariablemente relevantes. Adoptando esta posición se está suscribiendo una tesis sobre la forma o status lógico de las normas que confiere sustento a la tesis práctica y sustantiva del particularismo. Esto es, rechazando el concepto universalista de norma —y con él también las características del razonamiento que se basa en normas universales— se cancela la premisa fundamental en la que se apoya la tesis del carácter universalista de las razones. 4. Razonamiento práctico apoyado en normas (universales y derrotables). Razonamiento práctico no apoyado en normas El contraste entre universalismo y particularismo parece ser sustancial y profundo, ya que sostienen tesis opuestas acerca de los rasgos centrales de nuestra racionalidad práctica. En este sentido, dicho contraste no pue11
Ibidem, p. 67; también p. 70.
574
MARÍA CRISTINA REDONDO
de ser reducido a una discusión acerca de la derrotabilidad lógica de las normas y del “razonamiento práctico” apoyado en normas. Para empezar, debe advertirse que el carácter derrotable de las normas y del razonamiento práctico que se apoya en normas es sólo una de las características necesarias para hacer compatible la existencia de normas con la concepción particularista de las razones. Es verdad que en esta perspectiva el razonamiento basado en normas es derrotable, pero también es analógico.12 El carácter derrotable explica por qué, aun si las con diciones del antecedente de una norma se concretan, a la luz de circunstancias nuevas o inusuales, la norma resulta inaplicable. Es decir, no podemos obtener a partir de ella una conclusión. A su vez, la aplicación analógica de normas muestra porque, aun si las condiciones de aplicación de la norma no se dan, en presencia de condiciones similares podríamos igualmente aplicar la norma y obtener la conclusión. Independientemente de esto, entiendo que caracterizar el debate universalismo-particularismo en términos del tipo de lógica o condicionales lógicos aplicable a las normas resulta engañoso. Es verdad que cada una de estas posiciones concibe de modo diferente —e incompatibles entre sí— el “razonamiento práctico apoyado en normas”; en un caso es deductivo, en el otro no. Ahora bien, se ha puesto énfasis en destacar que las normas entendidas como condicionales derrotables y el tipo de razonamiento práctico a ellas conectado, no garantizan enunciados concluyentes acerca de lo que se debe hacer,13 y esto es ciertamente correcto. Sin embargo, ello sugiere que, en contraste, las conclusiones obtenidas a partir de normas concebidas como condicionales inderrotables, i. e. universales, sí garantizan o determinan la verdad de enunciados concluyentes en relación a qué se debe hacer; lo cual es claramente falso.14 Como vimos, la posición universalista admite que la forma lógica del condicional cuantificado universalmente captura exitosamente la idea según la cual las razones basadas en normas son uniforme e invariablemente relevantes. Sin embargo, esta relevancia estable o universal, que es parte esencial del concepto universalista de razón, no es sinónimo de 12 Véase Hage, J., Reasoning with Rules. An Essay on Legal Reasoning and Its Underlying Logic, Dordrecht, Kluwer Academic Publishers, 1997, p. 123. 13 Cfr. Moreso, J. J., Conflitti tra principii costituzionali”, Ragion Pratica, 18, 2002, p. 210. 14 Las normas determinan lo que se debe hacer concluyentemente sólo si son concebidas como constituyendo razones insuperables, i. e. absolutas.
RAZONES Y NORMAS
575
fuerza absoluta o concluyente. Las razones, aunque universalmente relevantes, pueden ser derrotables o superables, es decir, pueden ser razones pro tanto. Esto invita a distinguir dos tipos de derrotabilidad. El primero hace referencia a una concepción de las normas y del razonamiento práctico apoyado en normas. En esta perspectiva las normas no tienen un antecedente cerrado y admiten siempre nuevas excepciones que alteran su identidad y, consecuentemente, su aplicabilidad. Este carácter (abierto o derrotable) del antecedente de la norma es apto para expresar el carácter no universalmente relevante de las propiedades en él previstas. Esto, necesariamente, se refleja en el carácter no deductivo del razonamiento práctico apoyado en tal tipo de normas. El segundo tipo de derrotabilidad, en cambio, no hace referencia a una concepción derrotable de las normas, sino a la posibilidad de conflicto entre dos o más normas universalmente válidas, i. e. normas en sentido “estricto”. En situaciones de conflicto, diversas normas, incompatibles entre sí, se aplican al mismo caso concreto, y la resolución del mismo deja intactas la identidad y aplicabilidad de las normas involucradas.15 La concepción universalista de las razones ha sido correctamente relacionada con un modelo deductivo de razonamiento. Ello es así porque, en una situación individual, una razón universal existe si, y sólo si, tal situación es un caso de aplicación del antecedente de una norma universalmente válida. Podemos decir que en esta hipótesis el silogismo deductivo ofrece un modelo para reconstruir la existencia de una razón para la acción a partir de la aplicación de una norma.16 No obstante esto, el universalismo no está comprometido a aceptar este modelo de razonamiento como el único modelo de razonamiento práctico. En la medida en que el universalismo admita: a) la posibilidad de que existan razones en conflicto, i. e. que normas válidas incompatibles se apliquen a la misma situación17 y 2) la posibilidad de que dichas razones (y las respectivas nor15 16
Véase Hage J., op. cit., nota 12, p. 124. Von Wright, en diversos trabajos, sugiere esta función reconstructiva al analizar la así llamada “inferencia práctica” como un patrón que permite comprender y explicar la acción humana intencional. Por ejemplo, véase Wright, G. H., von, “On So-called Practical Inference”, Practical Reason. Philosophical Papers, Ithaca, Cornell University Press, 1983, pp. 18 y 19. 17 Muchos universalistas niegan la existencia de conflictos de razones. En situaciones de aparente conflicto lo que en realidad sucede es que ignoramos cuáles son exactamente las razones aplicables. Tenemos un problema, no práctico, sino epistémico. Sin
576
MARÍA CRISTINA REDONDO
mas) no estén jerarquizadas, i. e. que no haya normas ulteriores que determinen qué razón (o norma) prevalece en caso de conflicto; el universalismo debe admitir que, en estos casos, la pregunta acerca de cómo actuar, no se puede responder a través de la aplicación deductiva de una norma. En estas situaciones, normalmente se hace referencia a un modelo comparativo de “razonamiento práctico”, a un “balance” en el que se sopesan razones. La estructura de este razonamiento no es la de un argumento aplicativo de una norma (ni derrotable ni inderrotable) , y su conclusión no está determinada por principios lógicos, sino por el peso o importancia relativa de las razones que entran en consideración.18 Teniendo esto en consideración, al menos dos advertencias son oportunas. En primer lugar, es verdad que los universalistas afirman que detrás de una razón hay siempre una norma universalmente válida que expresa un conjunto de propiedades relevantes, pero esto no significa que dicha norma exprese todas las propiedades que pueden ser relevantes en un caso individual. En segundo lugar, es verdad que los universalistas sostienen que hay normas universalmente válidas y que ellas constituyen razones universales, es decir, uniforme e invariablemente relevantes, pero ello no significa que dichas normas tengan necesariamente peso absoluto o concluyente. En otras palabras, la presencia de una razón universal es totalmente compatible con la presencia de otras razones universales que, por sí mismas, no determinen qué se deba concluyentemente hacer. embargo, no hay ninguna razón por la cual el universalismo esté obligado a negar la existencia de genuinos conflictos prácticos. 18 Véase Raz, J., Practical Reason and Norms, Princeton, Princeton University Press, 1990, p. 46. Con respecto al criterio de resolución de los conflictos de razones de primer grado. Algunos autores entienden que los modelos de razonamiento derrotable permiten justamente expresar o dar cuenta, en términos lógicos, de este tipo de conflicto. Esta propuesta lógica no demuestra sino que presupone que las normas no indican propiedades uniforme e invariablemente relevantes, y las trata como condicionales derrotables. En otras palabras, esta propuesta lógica, ciertamente factible, es admisible sólo si se demuestra, independientemente, que la concepción universalista de las normas debe ser desechada. En este caso, efectivamente, no cabría distinguir entre conflictos y excepciones, y ambas cosas podrían ser expresadas en términos de derrotabilidad lógica de normas. De lo contrario, dentro de una concepción universalista de las razones y de las normas, una situación de conflicto no puede, bajo pena de contradicción, ser tratada como un caso de derrotabilidad de las normas y del razonamiento práctico basado en ellas. Siendo así, el “razonamiento práctico” entendido como un modelo comparativo o balance de razones en conflicto no puede ser presentado como un “razonamiento práctico” derrotable, i. e. apoyado en normas derrotables.
RAZONES Y NORMAS
577
Cuando hay un conflicto de razones sin que a su vez haya una norma jerarquizadora —i. e. cuya aplicación resuelva el conflicto— la pregunta acerca de cómo debemos actuar, por hipótesis, no puede determinarse a través de un razonamiento que apoya en una única norma, sino que requiere un balance de las razones en conflicto.19 En resumen, sería engañoso y parcial equiparar tout court el universalismo con el rechazo de la derrotabilidad y el particularismo con el rechazo de la deducibilidad. Los universalistas (si no son absolutistas) pue19 Por supuesto, dentro de una concepción universalista, la fuerza relativa de las razones y el resultado del balance no pueden depender del contexto individual de decisión. Al respecto, una teoría moral, o jurídica, universalista puede hacer hipótesis de diferentes clases de situaciones conflictivas y ofrecer sutiles distinciones, dependiendo, no del caso particular, sino del tipo de razones que entren en conflicto. La imaginación de casos posibles puede ayudar a refinar una propuesta universalista acerca de cómo se deben resolver los conflictos de razones. Sin embargo, las teorías universalistas no están constreñidas a brindar un conjunto definitivo, o una jerarquía última, de razones. Sobre este punto, es necesario distinguir la propuesta filosófico-conceptual del universalismo (o del particularismo) por una parte, y los problemas epistemológicos que ellas tienen que afrontar. El universalismo puede admitir la necesidad u oportunidad de cambiar (o especificar) la actual formulación de una norma. Pero, en este caso, a fin de evitar una conclusión particularista, es decisivo tener en cuenta el fundamento de dicha revisión. El cambio de formulación sólo puede llevarse a cabo a fin de identificar o expresar mejor la norma universal presupuesta. El particularismo, por el contrario, puede aceptar la modificación de normas válidas (en la medida en que las conciben como condicionales derrotables) y, en todo caso, dichas modificaciones son necesarias para captar mejor, no una norma universal, sino el caso individual. Sobre este tema una posición diferente puede verse en Moreso, J. J., Conflitti tra principii costituzionali”, Ragion Pratica, 18, 2002, pp. 201-221; Celano, B., “«Defeasibilty» e bilanciamento. Sulla possibilità di revisioni stabili”, Ragion Pratica, 18, 2002, pp. 223-239, y Moreso, J. J., “A proposito di revisioni stabili, casi paradigmatici e ideali regolativi: replica a Celano”, Ragion Pratica, 18, 2002, pp. 241-248. Estos autores no distinguen entre la revisión de contenidos normativos y la de formulaciones normativas. Desde su punto de vista los conflictos de razones conducen siempre a la revisión de los contenidos normativos. Adicionalmente, ellos presuponen que la propuesta universalista en tanto ideal racional depende no de su posibilidad lógica o conceptual, sino de la posibilidad epistémica de conocer o identificar una tesis final o definitiva de relevancia. En otras palabras, depende de la posibilidad de identificar un conjunto de revisiones estables (o re-formulaciones) de normas. Tal como Celano correctamente afirma, la posibilidad de una revisión final (estable) no ha sido probada. No obstante ello, la idea de una tesis final de relevancia, i. e. el concepto de razón uniforme e invariablemente relevante, es lógicamente posible. Al respecto: Celano, B., op. cit., supra, p. 236. En mi opinión, la posibilidad de la propuesta conceptual universalista es la única condición necesaria para que el universalismo pueda ser admitido como un ideal racional.
578
MARÍA CRISTINA REDONDO
den aceptar que hay razones derrotables (pro tanto), lo que ellos claramente rechazan es que la forma lógica de las normas sea la de una condicional derrotable. Asimismo, los particularistas pueden aceptar la deducibilidad, lo que ellos claramente rechazan es que la identificación de una razón para la acción pueda entenderse sobre la base de un razonamiento deductivo a partir de una norma.20 Por último, ambas posiciones admiten que en presencia de un conflicto de razones no jerarquizadas, el razonamiento apoyado en normas no es el modelo apropiado para determinar que se debe hacer concluyentemente. 5. Algunas consecuencias destacables En primer lugar cabe notar que, a diferencia de la generalidad semántica de una regla o un principio, el carácter universal de una razón es una propiedad todo o nada: una razón, o bien es invariable e uniformemente relevante, o bien no lo es. Ello significa que, en relación a un determinado ámbito de razones, no es posible sostener una posición más o menos universalista, porque no es una cuestión de grado. Este carácter todo o nada se explica porque, en una perspectiva universalista, las razones presuponen y tienen su fuente en normas entendidas en sentido “estricto”, y esta caracterización de las normas no es gradual: la relación existente entre ciertas circunstancias o propiedades y una consecuencia deóntica, si es nomológica, es una relación necesaria o universal, de lo contrario no es una norma. En contraste, el particularismo (en el caso en que acepte relacionar su posición con una concepción de las normas) requiere una concepción derrotable y contradice una concepción “estricta” de las mismas. De ello se sigue que las concepciones universalista y particularista de las razones son concepciones excluyentes entre sí. Como he dicho antes, las concepciones universalistas de las normas y de las razones pueden considerarse dos caras de una misma moneda. Las posiciones que tratan de defender el carácter derrotable de las normas preservando una concepción universalista de las razones parecen no ser 20 Argumentos adicionales en los que se destaca que el particularismo no pone en cuestión cierto tipo de razonamiento ceteris paribus, y que puede aceptar las generalizaciones inductivas y explicativas pueden encontrarse en Little, M., “Moral Generalities Revisited”, en Hooker, Brad and Little, Margaret (eds.), Moral Particularism, Oxford, Oxford University Press, 2000, pp. 290 y 291; 298-303.
RAZONES Y NORMAS
579
conscientes de esta relación y por ello resultan a primera vista inconsistentes. Más adelante volveré sobre este punto. En cualquier caso, es necesario advertir que no estoy equiparando el particularismo con una concepción derrotable de las normas (o el universalismo con una concepción estricta de las mismas). El universalismo y el particularismo son teorías que reflexionan sobre las características de la relevancia práctica de ciertas propiedades y no se reducen a una concepción sobre la estructura lógica de las normas. De lo dicho sólo se sigue que el universalismo implica una concepción —universalista— de las normas. En rigor, el particularismo podría prescindir de la noción de norma. Ahora bien, si acepta una, ésta debe ser una concepción derrotable, que es incompatible con la concepción universalista. Una segunda consecuencia de este contraste entre universalismo y particularismo es tá re la cio na da con la dis tin ción en tre la exis ten cia e identidad de un contenido normativo, por una parte, y su formulación y aplicación en un caso individual, por otra.21 Si la idea de la existencia e identificación de un contenido normativo —y de una razón— independiente de los casos individuales no es admisible, entonces no hay esperanza para el universalismo. Conforme a una posición universalista las normas gobiernan los casos individuales precisamente porque, independientemente de ellos, dichas normas establecen qué propiedades son relevantes para decidir cómo actuar. Si la existencia y/o identidad de la norma —y consecuentemente de las propiedades relevantes— dependiese del caso individual sería más bien sorprendente decir que las normas regulan tales casos. En contraste, desde una perspectiva particularista, la existencia e identidad de una razón, y por consiguiente la existencia e identidad de la norma derrotable correlativa, se determinan en el mismo momento o contexto en que tal norma se aplica para decidir como actuar. En otras palabras, el universalismo presupone 21 Al respecto, resulta particularmente interesante advertir la ambigüedad de la expresión “identificación” paralela a la distinción de dos sentidos de la noción de interpretación. Por una parte, al hablar de identificación se hace referencia a un proceso de atribución de significado cuyo resultado determina la identidad de una norma. O, por el contrario, puede hacerse referencia a un proceso (o a su resultado) a través del cual se intenta captar o conocer la identidad preexistente de una norma. En el primer caso, la identificación es necesaria e infalible pues sin ella no hay normas; en el segundo, es contingente y falible pues las normas (frutos de una autoridad, de la naturaleza de las cosas, de una práctica, etcétera) existen independientemente de la tarea del intérprete que las identifica.
580
MARÍA CRISTINA REDONDO
no sólo la distinción sino también la independencia entre la existencia e identidad de los contenidos normativos (fuente de razones para la acción) y su formulación y aplicación en un caso concreto. El particularismo, en cambio, aun cuando acepte hablar de normas, presupone lo contrario: la existencia e identidad de la norma derrotable que indica qué debemos hacer, depende absolutamente del contexto particular en el cual ella debe ser aplicada. Como veremos más adelante, algunas posiciones no captan este contraste y pretenden defender el carácter universal de principios normativos cuya existencia y/o identidad se hacen depender del caso individual. Como debería resultar obvio, estos principios pueden llamarse universales sólo en un sentido semántico o lógico, i. e. se expresan a través de predicados universales y se les atribuye la estructura de un condicional inderrotable. Sin embargo, en tanto expresión de razones para la acción, llamarles universales es retórico. La universalidad semántica, o lógica, de un principio no garantiza que él exprese una razón universal. De hecho, la universalidad semántica, o lógica, de los principios puede generar la expectativa de que ellos expresen razones para la acción también universales, pero justamente esa expectativa es la que se frustra cuando se admite, por ejemplo, que la identidad de los principios se fije en cada contexto de decisión. Inmediatamente conectada a esta distinción se encuentra otra que es generalmente usada en la teoría jurídica: la distinción entre los conceptos de excepción y de conflicto. Tanto las excepciones como los conflictos pueden estar basados en razones, la diferencia crucial es que las razones que ponen en evidencia excepciones determinan la identidad de una norma, mientras que las razones que ponen en evidencia conflictos, no. Las excepciones, sean implícitas o explícitas, forman parte del contenido —implícito o explícito— de las normas o principios. En cualquier caso, las excepciones impiden que un contenido normativo sea aplicable a un caso, i. e. el caso excepcional, y ello significa que impiden que el contenido normativo constituya una razón en dicho caso. En contraste, las razones que generan conflictos dejan intacta la identidad de la norma —y de la razón— con la cual entran en conflicto, y compiten con ella. Teniendo en cuenta esta diferencia, debería resultar claro que el universalismo puede aceptar que el contexto de aplicación de una norma sea una fuente potencial de razones particulares que compiten con las razones
RAZONES Y NORMAS
581
universales22 pero nunca podría admitir que un contexto particular sea fuente de excepciones a las normas aplicables. Afirmar que una norma existe, o es aplicable, en un caso concreto, pero que dicho caso individual justifica la introducción de una excepción, i. e. admitir que hay una excepción contextual que emerge a partir de las características de la situación individual, es auto-contradictorio. En realidad, es equivalente a admitir que no existe una norma regule dicho caso, o que la norma no es aplicable a él. III. SEGUNDA PARTE. LAS RAZONES JURÍDICAS Es oportuno recordar en este punto que, en un sentido importante, el debate entre universalismo y particularismo no es legítimamente trasladable al ámbito del derecho. Dicho debate, en gran medida, es una discusión metafísica acerca de la existencia de relaciones nomológicas o de sobreviniencia entre ciertas propiedades naturales y ciertas propiedades morales. La teoría jurídica, en cambio, discute sobre instituciones creadas por los seres humanos independientemente de cómo se resuelvan estos problemas metafísicos. No obstante ello, en la medida en que la discusión universalismo-particularismo está relacionada con dos concepciones posibles de las normas y del razonamiento práctico, i. e. dos modelos incompatibles de tomas de decisión, entiendo que no sólo es perfectamente admisible intentar trasladar la cuestión al terreno jurídico, sino que además los argumentos que se plantean en la filosofía moral merecen detallada atención dentro de la teoría jurídica. 1. El universalismo en el ámbito jurídico El análisis del derecho desde la perspectiva de una teoría sobre las razones para la acción es complejo porque, en este enfoque, una norma valida no sólo constituye sino que también presupone y representa razones subyacentes.23 Conforme a una concepción ampliamente aceptada, la no22 Esto significa que una concepción universalista (o particularista) de las razones puede aceptarse en relación a un determinado ámbito de razones y no de otro. Sobre este punto véase Shafer Landau, R., op. cit., nota 1, 1997. 23 Según la teoría de Joseph Raz, una regla valida constituye una razón excluyente junto con una razón de primer orden ordinaria. Este tipo de razones se denominan razones protegidas. Véase Raz, J., op. cit., nota 18, capítulo 2.
582
MARÍA CRISTINA REDONDO
ción de regla jurídica está necesariamente ligada a la exclusión de estas razones subyacentes. Aplicando las distintos sentidos de universalidad antes destacados, puede decirse que, en una perspectiva universalista, las normas jurídicas: 1. Son contenidos semánticos universales y 2. Tienen la forma lógica de un condicional estricto, y 3. Si válidas, expresan razones uniforme e invariablemente relevantes, resultantes de un balance de razones preexistentes que subyacen a ellas. Las dimensiones semántica y práctica de las normas explican por qué su identidad puede ser considerada función de ambas cosas: del sig ni fi cado de las ex presio nes lin güísti cas a tra vés de las cuales se expresan, y/o de las razones subyacentes que ellas, en línea de principio, presuponen y representan.24 En la medida en que una norma jurídica representa razones preexistentes, i. e. ya consideradas por la autoridad que las crea, al momento de identificar una norma, dichas razones quedan excluidas. Pero también por el mismo motivo, i. e. porque las normas representan razones subyacentes, estas últimas pueden considerarse el contenido implícito de las normas.25 En otras palabras, puede admitirse que la identidad de las normas jurídicas universales sea sensible a las razones subyacentes que, en esa medida, son altamente importantes para conocer cuál es el derecho existente. Las normas jurídicas, como toda norma en general, son normalmente entendidas como constituyendo un específico modelo de toma de decisión. Dicho modelo puede variar según sea el tipo y el peso de las razones que dichas normas constituyan. En todo caso, desde una perspectiva universalista, decidir un caso siguiendo normas que establecen razones universales implica decidir tomando siempre en consideración —como uniforme e invariablemente relevantes— las propiedades previstas en el antecedente de las normas jurídicas. Ciertamente, razones independientes pueden competir con las razones jurídicas, pero sin alterar su identidad y relevancia, y, obviamente, ellas deberían ser tenidas en cuen-
24 Sobre este punto: Ródenas, A., “Entre la transparencia y la opacidad. Análisis del papel de las reglas en el razonamiento judicial”, Doxa, 21-I, 1998, p. 117. Ródenas discute sobe un problema diferente, pero ella distingue claramente la dimensión semántica de la dimensión práctica de las normas. 25 Estos casos de divergencia entre lo que es requerido por la norma explícita y lo que está justificado por sus razones subyacentes han sido llamados “experiencias recalcitrantes” de infra- y sobre inclusión. Véase Schauer, F. (1991) pp. 31-34.
RAZONES Y NORMAS
583
ta al momento de establecer qué se debe hacer concluyentemente, i. e. todas las cosas consideradas. El proceso de toma de decisiones apoyado en normas jurídicas ha sido interpretado en modos diferentes, y en estas interpretaciones es especialmente discutido el rasgo excluyente que se atribuye a las razones apoyadas en reglas jurídicas.26 Conforme al análisis que he presentado, la concepción universalista de las razones constituidas por normas jurídicas presupone necesariamente el carácter excluyente de éstas en relación a cualquier consideración contextual. Pero, se advierta, dicho carácter no se refiere a su fuerza o peso frente a otras razones, sino a la identidad de los contenidos normativos y la existencia de las razones que ellos constituyen. No cabe duda que una posición universalista podría proponer, además, que las normas jurídicas siempre vencen, o impiden considerar, otras razones. Pero ésta no es una tesis necesaria del universalismo y bien podría rechazarse sin renunciar al carácter universal de las razones. Una razón universal, entonces, no requiere la exclusión de ninguna razón que sea relevante al momento de decidir, excluye sí que dichas razones puedan alterar su existencia y contenido.27 La tesis del universalismo aplicada en el ámbito jurídico es que las razones jurídicas son universales. Esta posición, sin embargo, no atribuye a estas razones un peso determinado ni tiene por qué comprometerse con una específica teoría acerca del origen o las condiciones de validez de las normas que dan lugar a razones jurídicas. En otras palabras, una teoría universalista es compatible tanto con una concepción jusnaturalista como positivista de las normas jurídicas. El punto determinante es que dichas normas, si son válidas, establecen propiedades uniforme e invariablemente relevantes. Esta tesis tiene dos implicaciones. En primer lugar, implica que los contenidos normativos, i. e. identidad de las normas válidas, no dependen de los contextos individuales de aplicación. Si la identidad de una norma jurídica —sea ella considerada una función del 26
Véase Schauer, F., Playing by the Rules. A Philosophical Examination of Rule-Based Decision-Making in Law and in Life, Oxford, Clarendon Press, 1991, especialmente capítulo 5. Bayón, J. C., “Sobre la racionalidad de dictar y seguir reglas”, Doxa, 19, 1996, pp. 143-162. 27 En el texto estoy únicamente analizando lo que se requiere para que las normas jurídicas constituyan razones de tipo universalista, sin tener en cuenta ningún otro aspecto de las razones jurídicas. Según Joseph Raz, si se quiere dar cuenta de la pretensión de autoridad del derecho, la existencia e identidad de las normas jurídicas no puede establecerse considerando razones morales. No trataré aquí esta cuestión.
584
MARÍA CRISTINA REDONDO
significado de una formulación y/o de las razones subyacentes— pudiese ser establecida en función de las características de cada caso individual, la propiedad de relevancia universal de las normas desvanecería.28 Esto es así, porque las razones jurídicas dependerían totalmente del contexto particular. Por este motivo, una concepción universalista de las razones jurídicas es compatible con la mayor parte de las teorías jurídicas excepto con aquellas que adoptan una teoría contextual del significado, en general, o de la interpretación jurídica en particular. En segundo lugar, si las normas jurídicas son universalmente relevantes, entonces ellas no pueden ser representadas a través de condicionales derrotables.29 Las razones jurídicas, en esta perspectiva, requieren la universalidad lógica de su fuente normativa. Es decir, tales normas deben ser representadas a través de condicionales estrictos que expresan condiciones suficientes para una consecuencia deóntica. En este punto es atinente recordar que, si bien la concepción universalista de las razones supone que las normas son concebidas como condicionales universales, estas ideas no son equivalentes. La universalidad de las razones incluye un elemento de estabilidad temporal que es ajeno al concepto de condicional cuantificado universalmente y la prueba cabal es que se puede adoptar una concepción de las normas como condicionales estrictos sin adoptar una concepción universalista de las razones. Ello es justamente lo que sucede cuando se 28 En qué medida los contenidos normativos son función de la intención del legislador, del significado usual, del significado jurídico, de las razones subyacentes, etcétera, dependerá de la específica teoría de la interpretación que se adopte. En cualquier caso, vale la pena subrayar que el rechazo de una teoría “contextual” de la interpretación —que es el único compromiso universalista en este punto— no conduce a una específica teoría de la interpretación jurídica; en particular, no veo porqué deba conducir a la teoría de Hart tal como parece seguirse del análisis de Schauer. Véase Schauer, F., Playing by the Rules. A Philosophical Examination of Rule-Based Decision-Making in Law and in Life, Oxford, Clarendon Press, 1991, p. 213. 29 Una parte importante de teóricos jurídicos defiende que el carácter derrotable de las normas puede estar basado sólo en consideraciones jurídicas y no morales. Tomada literalmente, esta posición parecería defender un tipo, específicamente jurídico, de particularismo. Sin embargo, es altamente probable que aun si se habla del carácter derrotable de las normas, en realidad se hace referencia al carácter provisorio de las formulaciones jurídicas. El universalismo no necesita negar que, como cualquier otro ti po de empresa cognoscitiva, la identificación de normas jurídicas en casos particulares pueda fallar. Por ello, las formulaciones —y no las normas— son revisables, pueden ser precisadas o puestas en cuestión. No obstante, si ésta es la tesis, es equívoco presentarla como una concepción derrotable de las normas jurídicas.
RAZONES Y NORMAS
585
niega la independencia entre la identidad de la norma jurídica, y su formulación —identificación, interpretación— en un caso particular. Cuando la identidad de una norma se hace depender de, o más aun si se equipara a, su interpretación en un caso concreto, la indepencencia antes mencionada colapsa. La norma puede ser correctamente caracterizada como un condicional “estricto”, pero no puede decirse que ella establezca razones universales, i. e. uniforme e invariablemente relevantes. 2. El particularismo en el ámbito jurídico La mayor parte de las propuestas particularistas en la teoría jurídica están justificadas en argumentos morales relacionados con problemas de equidad,30 aunque no es inusual que estos problemas sean presentados como si fuesen dificultades semánticas. En cualquier caso, no cabe duda que hay genuinos problemas semánticos que dan apoyo a la tesis particularista.31 En otras palabras, razones favorables a esta posición pueden encontrarse en los debates relativos tanto a 1) la identificación-interpretación del derecho como a 2) la conexión entre derecho y moral. En ambas perspectivas el punto crucial se refiere a la posibilidad y/o a la plausibilidad de identificar reglas jurídicas independientemente de consideraciones contextualmente relevantes, y en ambas discusiones se han ofrecido argumentos que apoyan, sea una tesis particularista necesaria y aplicable al derecho en general, sea una tesis particularista contingente y aplicable sólo a determinados sectores del ordenamiento jurídico. Desde un punto de vista del problema de la identificación-interpretación del derecho, todas la teorías que presentan como inevitable la consideración de factores pragmático-contextuales en la identificación del derecho están obligadas a asumir una concepción particularista de las razones jurídicas. Ello es así porque, salvo como una apelación mera30 Por ejemplo, Solum, L. B., Equity and the Rule of Law”, en Shapiro, Ian (ed.), The Rule of Law. Nomos, XXXVI, Nueva York-Londres, New York University Press, 1994, pp. 120-147. 31 En rigor, si las tesis escépticas que avalan la indeterminación radical del significado tienen razón, la tesis universalista probablemente podría todavía defenderse como parte de una concepción ética realista, independiente de toda actitud o conocimiento humanos, acerca de las razones morales, pero sería claramente implausible en el ámbito de una concepción positivista del derecho y de las razones jurídicas.
586
MARÍA CRISTINA REDONDO
mente retórica, no tiene sentido afirmar que las razones jurídicas son uniforme e invariablemente relevantes al mismo tiempo que se afirma que dichas razones sólo pueden ser correctamente identificadas teniendo en cuenta las características concretas del caso individual. Ciertamente, el particularismo es una teoría acerca de las razones para la acción y no acerca de los significados o de la interpretación en el derecho. Sin embargo, puede afirmarse que es la posición que necesariamente deberían adoptar algunas teorías del significado y/o de la interpretación jurídicas una vez que se admite que el derecho puede ser analizado como constituyendo o pretendiendo constituir razones para la acción. Por ejemplo, 1) las teorías “realistas” o “escépticas” de la interpretación jurídica, según las cuales la interpretación judicial es infalible, puesto que es ella la que confiere significado a las disposiciones jurídicas, 2) las posiciones “interpretativistas” o “hermenéuticas”, según las cuales la identidad de las normas resulta al menos parcialmente de la actividad del intérprete32 o 3) las teorías “contextualistas” que defienden que una correcta identificación del derecho exige tener en cuenta el contexto de aplicación33 están comprometidas con una interpretación particularista de las razones que ofrece el derecho. En la medida en que se acepta alguna concepción de este tipo, es imposible identificar contenidos normativos fuera de un contexto de aplicación. Como ya he mencionado anteriormente, esta imposibilidad a veces se defiende como una tesis teórica de alcance general, aplicable a todo el derecho; a veces, en cambio, se propone como una tesis que, contingentemente, puede aplicarse a específicos ámbitos del derecho, como por
32 Como ejemplo de teorías escépticas, véase Tarello, G., Diritto, enunciati, usi. Studi di teoria e metateoria del diritto, Bologna, il Mulino, 1974; y Guastini, R., Dalle fonti alle norme, 2a. ed., Turín, Giappichelli, 1992. Un ejemplo de teoría hermenéutica: Viola, F. y Zaccaria, G., Diritto e interpretazione. Lineamenti di teoria ermeneutica del diritto, Roma-Bari, Laterza, 1999. Un caso paradigmático de teoría interpretativa del derecho es Dworkin, R., Law’s Empire, Londres, Fontana Press, 1986. 33 Esta concepción contextual del significado, o de la interpretación de las normas jurídicas, no debe ser confundida con la idea según la cual la misma expresión usada, por ejemplo, en un contexto de derecho penal tiene un significado diferente a aquél que le corresponde en un contexto de derecho civil. En este último caso, la idea de contexto no hace referencia a los casos individuales sino a áreas o secciones del derecho. Véase Endicott, T., 2002, pp. 946-955.
RAZONES Y NORMAS
587
ejemplo el derecho constitucional,34 el derecho penal,35 o a tipos específicos de formulaciones jurídicas, como aquellas que expresan estándares altamente abstractos.36 Desde el punto de vista del problema de la relación entre derecho y moral, la adhesión a un enfoque particularista es consecuencia de un argumento de dos etapas. En primer lugar, un argumento que establece una conexión— o bien necesaria, o bien meramente convencional —entre la moral y la identificación del derecho, i. e. una relación interpretativa entre derecho y moral. En segundo lugar, aunque no menos importante, un argumento a favor de una concepción particularista de la moral. En otras palabras, la tesis de la conexión necesaria, o convencional, entre derecho y moral no conduce al particularismo si la moral es concebida en modo universalista, o si dicha conexión no es interpretativa —que es la que incide en la identidad del derecho—, sino ideal o justificativa37. También desde este punto de vista la tesis particularista puede proponerse con alcance global, o local, y con status necesario, o contingente. Estamos ante una tesis global y necesaria cuando un razonamiento o evaluación moral se concibe como un paso ineludible en la identificación de una razón jurídica válida. Estamos frente a una tesis local y contingente cuando las razones morales se consideran incorporadas al derecho como una cuestión de hecho, por ejemplo, en virtud de una especifica remisión por parte del derecho, o de la presencia de conceptos moralmente controvertidos. En este último caso, cuando la tesis se defiende con alcance local, se estaría implícitamente aceptando que ambos tipos de razón son necesarios para analizar el derecho, ya que en algunas ocasiones éste establece razones universalmente relevantes y en otras no.38 Si esta explicación es correcta, el particularismo, sea por razones semánticas o morales, es una posición ampliamente aceptada en la teoría jurídica, aun cuando probablemente pocos o prácticamente ningún teóri34 Véase, por ejemplo, Schauer, F., “The Jurisprudence of Reasons”, Michigan Law Review, 85, núm. 6, 1987, p. 869. 35 Por ejemplo, Moreso, J. J., “Principio de legalidad y causas de justificación. (Sobre el alcance de la taxatividad)”, Doxa, 24, 2001, pp. 536-545. 36 Véase Hart, H. L. A., 1961, pp. 131-133. 37 Sobre los diferentes tipos de relación entre derecho y moral: Nino, C. S., Derecho moral y política, Barcelona, Ariel, 1994. También Alexy, R., “On Necessary Relations Between Law and Morality”, Ratio Juris, 2, núm. 2, 1989. 38 Schauer, F., op. cit., nota 34, p. 869.
588
MARÍA CRISTINA REDONDO
co de los que quedan abarcados por esta caracterización estén dispuestos a auto catalogarse como particularistas. 3. El debate en la teoría jurídica De hecho, en la teoría jurídica, la distinción entre estas dos concepciones de las razones ha sido presentada en términos de un contraste entre dos tipos de normas: las reglas y los principios. Sobre este tema, la propuesta de Dworkin ha sentado las bases de un debate todavía vigente acerca de la estructura y la función de ambos tipos de normas. En este debate, muchos autores entienden que la diferencia entre reglas y principios es sólo una cuestión de grado: los principios son más abstractos, más vagos, y determinan en menor medida que las reglas un resultado. En otras palabras, ellos sitúan la diferencia en la generalidad semántica —o del contenido— de cada tipo de norma. Con respecto a esta tesis, algunas consideraciones son pertinentes. Si esta propuesta es correcta, la distinción entre reglas y principios no tiene una repercusión práctica destacable. La diferencia en la generalidad del contenido de las reglas y de los principios no determina una disparidad en el tipo de razones al que ellos dan lugar. En otras palabras, la diferencia práctica entre reglas y principios, si existe, no queda capturada por esta divergencia semántica. Como muchos autores han sugerido, la heterogeneidad entre reglas y principios radica en el modo en que dichas normas funcionan en el razonamiento práctico.39 Si lo que interesa analizar son los diversos modos en que el derecho puede proponer razones para la acción, entonces la variabilidad de generalidad semántica no sólo es, como vimos, irrelevante, sino también engañosa. Es engañosa porque al subrayar el status semánticamente universal de los principios se sugiere erróneamente un compromiso con una concepción universalista de las razones jurídicas. Sin embargo, a tenor de lo que he tratado de mostrar, dicho compromiso no existe al menos en dos casos: 1) cuando dichos principios son considerados normas derrotables y 2) cuando su existencia o contenido depende total o parcialmente del contexto individual de aplicación. La idea (equivocada) de que podemos preservar un modelo universalista de las razones aun cuando aceptamos que las normas son 39 Atienza, M. y Ruiz Manero, J., Las piezas del derecho. Teoría de los enunciados jurídicos, Barcelona, Ariel, 1996, capítulo 1.
RAZONES Y NORMAS
589
derrotables pasa por alto la conexión necesaria entre los diversos sentidos de “universalidad” en tanto propiedad de las normas, i. e. ignora la conexión necesaria entre lo que he llamado “las dos caras de la misma moneda”. Esto es, que las razones universales presuponen normas cuantificadas universalmente, ya que las normas derrotables no expresan razones uniforme e invariablemente relevantes. A su vez, la idea (también equivocada) según la cual podemos preservar un modelo universalista de las razones aun cuando aceptamos que la identidad de los contenidos normativos puede cambiar en cada contexto de decisión judicial, confunde los diversos sentidos de “universalidad” en tanto propiedad de las normas: los principios son contenidos universales, i. e. que se expresan a través de predicados universales, pero ellos no constituyen razones uniforme e invariablemente relevantes puesto que su existencia y/o contenido no es estable. En resumen, la mayor parte de las teorías jurídicas que tratan este tema subrayan el carácter universal de los principios incorporados al derecho. Sin embargo, no es claro que ellas adopten una concepción universalista de las razones que dichos principios ofrecen. Desde este punto de vista, posiciones como las de Dworkin o del positivismo inclusivo (que a primera vista abrazan una posición universalista) tienen que aceptar una de las siguientes tesis incompatibles entre si. Por una parte, si ellas insisten seriamente en que las normas jurídicas pueden ser derrotables en virtud de la aplicabilidad de normas o principios morales, ellas deberían reconocer que las así llamadas “normas” jurídicas no constituyen razones universales. Las así llamadas normas —jurídicas —serían sólo formulaciones provisorias de genuinas normas universales —morales— que, si aplicables a un caso objeto de decisión, pueden derrotar las formulaciones jurídicas, impidiendo que éstas constituyan razones, o alterando dichas razones en el caso en cuestión. Esta posición es universalista, pero en relación a la normas morales, no a la normas jurídicas. Por otra parte, si ellas no están dispuestas a aceptar esta consecuencia, e insisten en que las normas jurídicas constituyen razones universales, entonces tienen que admitir que los principios morales no derrotan las normas jurídicas introduciendo excepciones que modifican sus contenidos. Estos principios morales entran en conflicto con las normas jurídicas dejando intacta su identidad y su relevancia. En pocas palabras, estas posiciones o bien defienden el carácter universal de las razones jurídicas, en cuyo caso las normas jurídicas no pueden
590
MARÍA CRISTINA REDONDO
ser normas derrotables, o bien defienden que las normas jurídicas son derrotables, en cuyo caso deben admitir que las únicas razones universales son las constituidas por las normas morales. De esta advertencia no debe inferirse que el abandono de una concepción derrotable de las normas jurídicas sea suficiente para garantizar una concepción universalista de las razones jurídicas. La admisión de la universalidad lógica de las normas jurídicas puede ser tan engañosa como la de su universalidad semántica. Las posiciones que defienden el carácter universal de las reglas y/o principios, unido al carácter constitutivo de la interpretación judicial no necesitan negar que dichas reglas y/o principios puedan ser representados lógicamente como condicionales universales. Sin embargo, las razones que ofrece el derecho según este punto de vista satisfacen exactamente el rasgo que define a las razones en una perspectiva particularista. Es decir, la existencia y/o contenido de las mismas depende de quien debe decidir en una situación particular. Estas posiciones están negando uno de los presupuestos básicos de la concepción universalista de las razones: la estabilidad de los contenidos normativos sin la cual no es posible la uniformidad e invariabilidad de su relevancia. Creer que una concepción inderrotable o lógicamente universal de las normas conlleva una concepción universalista de las razones significa confundir la noción de universalidad lógica de las normas con la de universalidad de la relevancia de las razones. Además, pasa por alto el tipo de conexión que existe entre los dos sentidos de “universalidad”. La universalidad de la relevancia implica la universalidad lógica, pero no a la inversa. 4. ¿Dos presentaciones equivalentes? A este punto podría pensarse que, aquello que en la reflexión de la filosofía moral parece constituir una oposición interesante y profunda, en el terreno de la teoría jurídica se convierte en una distinción inocua y meramente formal. Dado que, de hecho, es siempre posible reinterpretar una disposición jurídica a la luz del caso individual, la única diferencia entre una posición universalista y otra particularista es de presentación. Un universalista debe presentar su reinterpretación como fruto de un esfuerzo cognoscitivo en relación a una norma preexiste, y admitir que el abandono de una interpretación precedente está basado en un error; mientras que la misma operación llevada a cabo por un particularista
RAZONES Y NORMAS
591
puede ser abiertamente presentada como un cambio de norma y de las razones jurídicas por parte del intérprete, teniendo en consideración las características del caso que toca resolver. La adopción de una u otra teoría no parece marcar alguna diferencia. En todo caso, el derecho —para bien o para mal— se puede manipular, sólo que dicha manipulación o adecuación se presenta de diferente manera. Estas apreciaciones son en parte verdaderas y ponen de relieve, sobre todo, las dificultades que debe afrontar el universalismo, que asume la existencia y la posibilidad de conocer normas universales. El modelo universalista no sólo no garantiza que a través de su implementación se evite el resultado de que el derecho sea efectivamente tratado como un conjunto de razones particulares, sino que no es claro que pueda siquiera funcionar como un ideal posible.40 Sin embargo, cabe aquí recordar algo que ya se ha señalado antes. En tanto ideales, las posiciones comparadas representan dos diferentes modelos de procesos de toma de decisión, a través de los cuales probablemente se puede llegar a resultados idénticos. El valor o interés del contraste universalismo-particularismo, suponiendo que lo tengan, debe buscarse exclusivamente en el propio proceso decisorio que ellos proponen. Concretamente, de acuerdo al ideal particularista, las consideraciones relevantes para tomar una decisión no deben estar basadas en una exigencia de coherencia con el pasado. Asimismo, si bien nada obsta a que dos casos similares en aspectos “relevantes” sean decididos de la misma manera, los aspectos o propiedades relevantes no son aquellos preestablecidas por normas, es decir, dos casos no son similares porque ambos caen bajo las condiciones de aplicación de la misma norma o principio, sino porque la sensibilidad y el adiestramiento del decisor después de conocer en detalle cada caso particular podrá llegar a la conclusión de que ellos merecen una decisión similar. En este modelo el decisor debe verse a sí mismo, no como aplicador de criterios establecidos en otra sede u otro tiempo sino como autoridad competente en el establecer cuáles son las razones existentes para decidir en un modo u otro. Este modelo de toma de decisión se puede ayudar con la invocación de normas, que el decisor debe concebir siempre como derrotables, cuyo conte40 Ya he mencionado la tesis de Celano según la cual el universalismo no constituye un ideal posible. Cfr. Celano, B., “«Defeasibilty» e bilanciamento. Sulla possibilità di revisioni stabili”, Ragion Pratica, 18, 2002.
592
MARÍA CRISTINA REDONDO
nido exige siempre revisión a la luz del caso individual, o que él contribuye a precisar en el caso concreto.41 Por el contrario, en el modelo de un decisor universalista, la decisión está basada en una exigencia de coherencia con decisiones anteriores, en casos similares en sus propiedades relevantes. Además, las propiedades relevantes para juzgar dos casos como similares están dadas por el hecho de que ambos caen bajo la aplicación de la misma norma o principio. El decisor no se ve a si mismo como competente para establecer cuáles son las propiedades jurídicamente relevantes sino como aplicador de una norma preexistente que establece dichas propiedades.42 En este caso, el decisor no puede ayudarse con normas, sino que debe hacer referencia a ellas, y no puede presentarlas como derrotables, ni puede admitir, sin frustrar el ideal universalista, que su contenido depende del caso en particular, o que él las constituye en algún modo. IV. REFLEXIONES FINALES Es usual atribuir al derecho una pretensión de relevancia práctica, i. e. de constituir razones para la acción. En una lectura universalista, dicha tesis significa que el derecho propone normas que pretenden constituir razones invariable y uniformemente relevantes en todos los casos individuales en que son aplicables. Una posición particularista es crítica en relación a esta pretensión. Por ejemplo, siguiendo el hilo de algunos de los argumentos antes mencionados, ella puede sostener que esta pretensión entra en conflicto con lo que se supone una adecuada concepción de la racionalidad humana, que no se ata a leyes universales, sino que es sensible a las características únicas de los casos individuales en los que se decide cómo actuar. Desde otra perspectiva, podría argumentar que es una pretensión autofrustrante, porque presupone una concepción errónea de 41
Un modelo particularista debe confiar en las virtudes y la preparación del decisor. Cfr. Solum, L. B., “Equity and the Rule of Law”, en Shapiro, Ian (ed.), The Rule of Law. Nomos, XXXVI, Nueva York-Londres, New York University Press, 1994. 42 Siguiendo a Schauer, se puede decir: “…rules entrench the status quo and allocate the power to the past and away from present…the allocation of power here is temporal”. Schauer, F., op. cit., nota 34, 1991, p. 160. “Secondly…rules can allocate power horizontally, determining who, at a given slice of time, is to detrmine what. …the ‘No vehicles in the park’ regulation… allocates power away from the partk-user and to de rule maker.” Schauer, F., op. cit., nota 34, p. 161.
RAZONES Y NORMAS
593
aquello en que consiste comprender un “significado”, concretamente, ignora sus raíces radicalmente contextuales; o bien, que simplemente es parte de una teoría jurídica incorrecta, que no advierte la inevitable conexión del derecho con razones morales que existen y se identifican frente a cada caso individual. Posiciones como éstas estarían denunciando que si el derecho tuviese la pretensión de constituir razones universales, estaría generando una expectativa que no puede, y tampoco es razonable, satisfacer. Tal como he afirmado al inicio de este trabajo, entiendo que es importante tener en cuenta la distinción entre problemas y discursos analítico-conceptuales, descriptivo-explicativos y evaluativo-justificativos. Gran parte del debate acerca de las razones y el razonamiento práctico en general es ambigua en este sentido, y no es siempre fácil situar el nivel ni el objetivo de la discusión que se está desarrollando. Por ejemplo, en relación al derecho, la tesis particularista puede ser interpretada como una tesis descriptiva en la que se afirma que, como una cuestión de hecho, el derecho contemporáneo de los Estados democrático-constitucionales funciona como un conjunto de razones de tipo particularista que se apoyan en una concepción derrotable de las normas; o por el contrario, puede ser entendida como una toma de posición evaluativa que alienta y defiende un tratamiento particularista de las razones que propone el derecho. En este trabajo he tratado de establecer las diferencias conceptuales existentes entre un modelo universalista y un modelo particularista de las razones. A este nivel conceptual he supuesto que ambos modelos ofrecen una reconstrucción coherente de la noción de razón justificativa, y dado el carácter básico de esta cuestión, resulta difícil encontrar argumentos (i. e. razones) concluyentes a favor o en contra de una de estas posiciones sin presuponer lo que está en cuestión. Es decir, sin presuponer la propia concepción a favor de la cual se está tratando de argumentar. La oposición entre universalistas y particularistas existente en la filosofía moral puede ser entendida como un desacuerdo acerca de la naturaleza de las razones y de la racionalidad humana. Sin embargo, el mismo desacuerdo, aplicado al derecho, tiene un significado y un alcance diferentes. Cuando tratamos o analizamos una institución coercitiva como el derecho desde la perspectivas de las razones para la acción, no estamos hablando de un fenómeno natural, ni acerca de algo sobre lo que no podemos deliberada y directamente influir, sea a través de la crítica o de la defensa teóricas, o de la participación en la práctica concreta. Si ello es
594
MARÍA CRISTINA REDONDO
así, a fin de elegir el mejor enfoque filosófico para analizar el derecho en términos de razones para la acción, es imprescindible pasar a un nivel evaluativo de discurso en el que se hagan explícitos los valores que cada uno de estos modelos promueve, y las ventajas o desventajas que pueden resultar de su implementación. En otras palabras, admitido que ambas propuestas ofrecen modelos posibles para comprender el derecho desde un punto de vista práctico, el tratamiento de las normas jurídicas como constituyendo uno u otro tipo de razón es materia de decisión que deberá ser justificada sobre la base de valores o ventajas externas a dichos modelos. V. BIBLIOGRAFÍA ALCHOURRÓN, Carlos, “Detachment and Defeasibility in Deontic Logic”, Sudia Logica, 57, 1996. ——— y BULYGIN, Eugenio, Normative Systems, Viena-Nueva York, Springer Verlag, 1971. ALEXY, Robert, “On Necessary Relations Between Law and Morality”, Ratio Juris, 2, núm. 2, 1989. ATIENZA, Manuel y RUIZ MANERO, Juan, Las piezas del derecho. Teoría de los enunciados jurídicos, Barcelona, Ariel, 1996. BAYÓN, Juan Carlos, “Sobre la racionalidad de dictar y seguir reglas”, Doxa, 19, 1997. CELANO, Bruno, “«Defeasibilty» e bilanciamento. Sulla possibilità di revisioni stabili”, Ragion Pratica, 18, 2002. DANCY, Jonathan, Moral Reasons, Oxford, Blackwell, 1993. ———, “On The Logical and Moral Adequacy of Particularism”, Theoria, 1999. DWORKIN, Ronald, Law’s Empire, London, Fontana Press, 1986. ENDICOTT, Timothy, “Law and Language”, en COLEMAN, Jules and SHAPIRO, Scott (eds.), The Oxford Handbook of Jurisprudence & Philosophy of Law, Oxford, Oxford University Press, 2002. GUASTINI, Riccardo, Dalle fonti alle norme, 2a. ed., Turín, Giappichelli, 1992. HAGE, Jaap C., Reasoning with Rules. An Essay on Legal Reasoning and Its Underlying Logic, Dordrecht, Kluwer Academic Publishers, 1997.
RAZONES Y NORMAS
595
LITTLE, Margaret Olivia, “Moral Generalities Revisited”, en HOOKER, Brad and LITTLE, Margaret (eds.), Moral Particularism, Oxford, Oxford University Press, 2000. MEGGLE, Georg, “The Universalizability Problem in Moral Philosophy”, en EGIDI, Rosaria; DELL’UTRI, Massimo y CARO, Mario de (eds.), Normatività, fatti, valori , Roma, Quodlibet, 2003. MORESO, José Juan, “Principio de legalidad y causas de justificación. (Sobre el alcance de la taxatividad)”, Doxa, 24, 2001. ———, Conflitti tra principii costituzionali”, Ragion Pratica, 18, 2002. ———, “A proposito di revisioni stabili, casi paradigmatici e ideali regolativi: replica a Celano”, Ragion Pratica, 18, 2002. NINO, Carlos Santiago, Derecho moral y política, Barcelona, Ariel, 1994. RAZ, Joseph, Practical Reason and Norms, Princeton, Princeton University Press, 1990. RÓDENAS, Ángeles, “Entre la transparencia y la opacidad. Análisis del papel de las reglas en el razonamiento judicial”, Doxa, 21-I, 1998. SHAFER-LANDAU, Russ, “Moral Rules”, Ethics, 107, 1997. SCHAUER, Frederick, “The Jurisprudence of Reasons”, Michigan Law Review, 85, núm. 6, 1987. ———, Playing by the Rules. A Philosophical Examination of Rule-Based Decision-Making in Law and in Life, Oxford, Clarendon Press, 1991. SOLUM, Lawrence B., “Equity and the Rule of Law”, en SHAPIRO, Ian (ed.), The Rule of Law. Nomos, XXXVI, Nueva York-Londres, New York University Press, 1994. TARELLO, Giovanni, Diritto, enunciati, usi. Studi di teoria e metateoria del diritto, Bologna, il Mulino, 1974. VIOLA, Francesco y ZACCARIA, Giuseppe, Diritto e interpretazione. Lineamenti di teoria ermeneutica del diritto, Roma-Bari, Laterza, 1999. WRIGHT, Georg Henrik von, “On So-called Practical Inference”, Practical Reason. Philosophical Papers, Ithaca, Cornell University Press, 1983, vol. I.
!
CAOS Y DERECHO María Elodia ROBLES SOTOMAYOR* SUMARIO: I. Origen del conocimiento. II. Hacia la incertidumbre en la elección de los conceptos teóricos fundamentales. III. Caos y derecho. IV. El futuro de las ciencias humanas. V. Bibliografía.
I. ORIGEN DEL CONOCIMIENTO Grecia heredará las bases del pensamiento científico al futuro conocimiento occidental, con las notas de su carácter y personalidad, cuyas directrices continúan siendo fundamento de predicación y explicitación en la actualidad. Es a través de Parménides que el conocimiento se traduce en logos para separar aquello que no lo es, lo que significa ordenar las experiencias a un estado de conciencia intelegible y traducible a través de términos de mayor extensión, esto es, de universalidad. De ahí que los objetos de conocimiento, independientemente de su carácter multiforme, son designados en una sola expresión: ser, indicándose que cuando el hombre tiene conciencia de la existencia, los entes se transforman y adquieren un status diferente, los cuales a través de la luz de la razón pueden ser aprehendidos y comunicados por la vía de la palabra. El problema es que la razón, desde la óptica humana, es considerada como única fuente relevante del conocimiento verdadero, lo que limita y adelgaza en extensión la posibilidad de una mejor comprensión de la episteme, ante el afán de construir un mundo en donde se pueda dominar y controlar al universo conforme a los cánones racionales establecidos artificialmente como única representación lógica. * Facultad de Derecho, UNAM, México.
597
598
MARÍA ELODIA ROBLES SOTOMAYOR
Lo anterior refleja el esfuerzo de Parménides por fijar a la existencia en un principio de unidad inmóvil, lo que se traduce en su primer canón: lo que es, es, y abundando en el segundo; lo que no es, no es, fundamento indiscutible que eleva al causalismo a ley universal, indicándose que la misma esencia del ser, como cualidad intrínseca, se rige por Diké, donde el todo cumple la ley de ajustamiento conforme al principio de identidad. El paradigma adopta como modelo a la circunferencia, dentro de ella está el ser, fuera es la nada, los mismos dioses son parte del conocimiento ya que representan los procesos que encaminan a la búsqueda de la verdad, cuyas imágenes establecen los diversos estados: sensorial, sentimiento, voluntad, para superarlos y con ello alcanzar el saber. Esta percepción armoniosa de la construcción del pensamiento arriva al modelo estático perfecto, el cual contiene la verdad en sí, como único camino para llegar al conocimiento, originándose diversas líneas interpretativas futuras de lo científico que guardaran similitud en el modo de predicarlo. Cambiarán los métodos, sin embargo, su discurso es el mismo; la unidad como principio de identidad con la afirmación de que ésta lo contiene todo, óptica que conduce a la construcción de modelos dogmáticos en los espacios culturales modernos, observándose la continuidad del pensamiento griego, con la diferencia de adoptar el paradigma de la linealidad del universo y con ello, establecer una estructura conformada a través de jerarquías conceptuadoras. El gran dilema epistemológico que Grecia nos hereda es elegir entre una ontología estática o dialéctica, esta última originada por Heráclito y dogmatizada en Platón, quien quebrantará la concepción del universo entre lo estable y lo que fluye, para convertir al modelo dinámico en un sistema cerrado. Es Heráclito el primer filósofo que aborda el logos y percibe que los hombres son demasiado limitados para comprender la verdad, la cual se oculta en una construcción artificial para que la mente pueda aprehenderla y la inteligencia comprender. De este modo, establece que primero dirigió sus pensamientos al interior para descubrir el yo real; segundo: se hizo preguntas sobre sí mismo; tercero: consideró las respuestas e intentó descubrir el significado de su individualidad. Escuchando al logos descubrió que es el elemento constitutivo real y que todas las cosas son una.
CAOS Y DERECHO
599
De ahí que el logos es el pensamiento humano así como el principio rector del universo, el cual revela que todo está en continuo cambio desprendiéndose de ello tres afirmaciones: — La armonía natural es luchar — Todo está en continuo movimiento y cambio — El mundo es un fuego vivo El todo es la representación de la armonía de los contrarios donde la tensión es interna y los contrarios idénticos, esto es, son aspectos diferentes de la misma cosa. De ahí que todo lo que existe está en proceso de cambio y, de la tensión de la lucha de los contrarios, se produce una serie de actos de justicia, colocando por primera vez a la justicia en el centro de la reflexión como el principio que garantiza la legalidad del cosmos. Al respecto, la doctora Juliana González, afirma: El logos heracleteano es a la vez: — Ley objetiva de la realidad — Razón humana — Palabra Parménides es el primer filósofo de la razón pura, quien sienta las bases del conceptualismo analítico que impulsa el desarrollo de la lógica a partir de Aristóteles para transformar las leyes del ser en principios fundamentales del pensamiento organizado, erigiendo la ontología frente a la filosofía del devenir y la contradicción, y concluir que el ser y el pensar son lo mismo, Heráclito por su parte, establecerá las bases del eterno fluir aunado a las leyes del movimiento. Para Parménides nunca prevalecerá que las cosas no sean, por lo que aconseja: aparta tu pensamiento de esta vía de investigación y no permitas que el hábito que se origina de la mucha práctica te fuerce a marchar por esta vía... sino juzga mediante la razón (logos), la muy debatida argumentación propuesta por mí”.1 Parménides no consiguió establecer relación lógica entre verdad y su falsificación o status lógico alguno para el mundo de la apariencia... “Si 1 Guttherie W. K. C., Historia de la filosofía, Los primeros presocráticos y los pitagóricos, Grades, Mache, 1984, t. II, p. 35.
600
MARÍA ELODIA ROBLES SOTOMAYOR
esto «no es»”, ¿por qué lo imaginamos? y ¿cuál es la diferencia entre ilusión y la vacía nada? Platón heredará el problema y, partiendo de la concepción de Parménides, ampliará la dicotomía eleata de ser y no ser con una visión tripartita, al incluir el devenir traduciéndolo en conocimiento, ignorancia y creencia. Junto con los pitagóricos señala que el estado ideal del Cosmos es cuando cada cosa está en su lugar, pues interpreta la racionalidad del Cosmos como el resultado de una operación efectuada por un poder ordenador, una figura semítica a la que llama demiurgo, especie de “obrero” que ordena el desorden al crear el Cosmos, palabra que significa en primer lugar belleza, arreglo, orden y en segunda instancia, mundo, es decir, orden del mundo. Al concebir tres niveles principales de jararquización, ubica en el nivel superior a las ideas y formas matemáticas que constituyen los modelos ideales de todas las cosas, esto es, el dominio del orden; en el otro extremo sitúa al caos, estado primordial carente de orden y desorden que escapa de toda descripción, mientras entre esos dos niveles encuentrase nuestro mundo, resultado del trabajo del demiurgo, que tiene un poco de orden y desorden, lo cual no representa una episteme evolutiva. En cambio Heráclito, el profeta, parte de un logos que concibe al Cosmos como el eterno fluir, afirmando que la proyección del ser es la constante transformación, lo que permitirá a Sócrates establecer las bases de la argumentación cognitiva a través del diálogo permanente entre el ser y el devenir, fundamento necesario para la construcción del conocimiento a través de la mayéutica griega, cuyos principios son las bases del silogismo dialéctico, sin que las palabras se reviertan contra el logos y queden reducidas al campo estrecho de la persuasión. Estos principios conceptuadores fundan las bases del pensamiento filosófico-científico que impulsarán la construcción del pensamiento occidental desde la vía de la especulación o desde la vía de la experiencia, observándose que en ambas posturas el problema ontológico se ha dogmatizado hasta el siglo XX, al erigirse modelos estáticos que conciben a la realidad desde una perspectiva mecánica cerrada, que descansa en la concepción platónica o aristotélica para explicar a las ciencias naturales y humanas con las leyes y principios modernos del modelo de Newton. Cabe destacar que independientemente de las diversas corrientes que sirven de referencia para la explicación científica, esto es, el modelismo platónico y su proyección futura, el realismo moderado en Aristóteles,
CAOS Y DERECHO
601
el teocentrismo abstracto, todas estas perspectivas, conciben un mundo estático. Si bien es cierto que se sentaron las bases con los pensadores clásicos, y que en el siglo XVIII, durante lo que fue la llamada Ilustración, surge por toda Europa una distinta manera de pensar impulsada principalmente por la segunda oleada de la revolución científica que conduce a la exaltación de la razón como poderosa herramienta para estudiar a la naturaleza, inaugurando el pensar moderno; esta actitud quedará definida por dos elementos: por una parte, el triunfo de la razón completamente liberada de la religión y por otra, una concepción unitaria de la historia. Es en esta época cuando el pensamiento se libera de toda atadura, gracias a la seguridad que le dieron los éxitos obtenidos del estudio de la naturaleza, combinados con el método experimental y el análisis matemático. La primera revolución científica del XVI y XVII tuvo tanto éxito precisamente porque se estableció por primera vez el método experimental, aunque seguía muy viva la tradición de la matemática griega, a ella se superpuso la práctica del experimento. Así, Galileo estableció su ley de la inercia de validez universal tras hacer medidas cuidadosas, pero decía que: “el libro de la naturaleza está escrito en caracteres matemáticos”. Galileo confirma que no hay nada más en la naturaleza que el movimiento, lo que sentará las bases de la física cuántica que fructificará en el siglo XX. Entre sus experimentos mentales está el llamado principio de la relatividad, el cual aparece en su obra Diálogos sobre los principales sistemas del mundo; el tolomaico y el copernicano, en 1632, indicándose entre muchos conceptos el de ingravidez dinámica que inspirará a Einstein para abrir la era espacial. Pero ha sido el invento del telescopio, el cual tuvo un papel decisivo para establecer el método experimental, lo que lo ayudó a contribuir a la revolución copernicana. Por obra de Copérnico y Galileo se cambió bruscamente de un cosmos cerrado y pequeño —de la época de los griegos— a un universo ilimitado y abierto, durante la Ilustración. II. HACIA LA INCERTIDUMBRE EN LA ELECCIÓN DE LOS CONCEPTOS TEÓRICOS FUNDAMENTALES Es en 1949 cuando Einstein tenderá un puente entre el macrocosmos y el microcosmos para desmoronar el mundo mecánico de Newton y con
602
MARÍA ELODIA ROBLES SOTOMAYOR
ello la certeza de que la ciencia pueda explicar como pasan las cosas, al grado de preguntarnos si el hombre estará en contacto con la “realidad”. La ciencia aristotélica explicó el por qué pasan las cosas, la ciencia moderna que nace con Galileo se preguntará cómo pasan las cosas, lo que significa resolver los problemas en relación entre el observador y la realidad, al percatarse del carácter subjetivo de las cualidades sensibles y concluir que el objeto de conocimiento es la suma de propiedades que existen en la mente humana, como un edificio simbólico convencional. Si la energía radiante no es una corriente continua sino pequeñas porciones discontinuas que ante una pequeña variación se transforma, confirmando que la materia es energía y que el átomo es un microcosmos que tiende un puente al macrocosmos, ello conduce a nuevos campos de conocimiento. De ahí que partir de diferentes campos experimentales da resultados diversos sobre un mismo “objeto”; el que la luz esté compuesta de partículas y en otro caso de ondas, tiene que aceptarse como resultados complementarios, ambos conceptos son necesarios para describir la realidad sin que se tenga que discriminar a un concepto como falso y a otro como verdadero. Lo anterior conduce a que durante el siglo XIX el determinismo sufriera un proceso de erosión dando cabida a las leyes del azar, lo que significa que el mundo no está totalmente sujeto a las leyes universales de la naturaleza, dando lugar al acontecimiento conceptual más importante de la física del siglo XX y que empezó a invadir la esfera del saber: el descubrimiento de que el mundo no está sujeto al determinismo.2 El azar, cuya definición clásica es: la intersección de series causales independientes, lo aleatorio, en oposición al determinismo, independencia del pasado y del futuro;3 se había considerado durante la era de la razón, superstición, vulgo, destino. Hablar del caos del determinismo permite explicar muchos fenómenos que suceden en la naturaleza y en experimentos controlados de laboratorio que se caracterizan por tener un comportamiento que no puede ser 2 Para Pierre Simon Laplace, al referirse al determinismo señala que: “Los acontecimientos actuales tienen con los precedentes un vínculo fundado en el principio evidente de que una cosa no puede comenzar a existir sin una causa que la produzca. Este axioma, conocido con el nombre de principio de razón suficiente, se extiende aun a las acciones que se juzgan diferentes...”. 3 Schifter, Isaac, La ciencia del caos, 3a. ed., México, FCE, 2003, p. 20.
CAOS Y DERECHO
603
descrito por leyes matemáticas sencillas, y el cual emerge de fenómenos cuya evolución es inicialmente determinista. Contrariamente a lo que podría esperarse, al aumentar la cantidad de información disponible no se evita la imposibilidad de conocer la progresión futura del sistema. Dicha evolución queda determinada por su pasado y una de las propiedades peculiares del caos es que la mínima certidumbre en la definición de las condiciones iniciales se amplifica exponencialmente, alcanzando proporciones macroscópicas que impiden conocer lo que sucederá a largo plazo. El descubrimiento del caos determinista ha forzado un cambio sustancial en la filosofía de la ciencia: por una parte, establece límites a nuestra capacidad para predecir un comportamiento; por otra, abre un nuevo espacio para comprender muchos fenómenos aleatorios que suceden en varios campos del conocimiento. La acepción de estos fenómenos entre los científicos no ha sido general. Este caos de que se habla, es relacionado por algunos autores, entre ellos Schifter Isaac, como desorden y aperiodicidad, definiéndonos el desorden de la siguiente manera: En ciertos casos evoca un estado de confusión, una disposición de cosas más o menos irregular, pero independientemente de los giros semánticos, la idea general es que el orden ha sido gravemente perturbado. El desorden se presenta entonces como algo que nunca debió haber existido y en el dominio de la ciencia le acusa de delincuente que viola las “leyes de la naturaleza”.4
De ahí que: la voz “orden”, importada del latín ordo, cuyo sentido arcaico parece ser fila o hilera (concretamente de los granos que forman la espiga del trigo). Poco tardó en aplicarse a filas de legionarios, y desde entonces su significado fluctúa del retrato a la norma. Es ubicación o lugar —tanto en el espacio como en el tiempo— de cualesquiera elementos, y es también regla, mandato.5
Contrario a lo que conocemos como orden, el significado actual es objeto del embate de la incertidumbre. Pues si bien el determinismo dice 4 5
Ibidem, p. 15. Escohotado, Antonio, Caos y orden, 6a. ed., España, Espasa, 2000, p. 11.
604
MARÍA ELODIA ROBLES SOTOMAYOR
que las mismas causas producen los mismos efectos siguiendo todo sistema la pauta de sus condiciones iniciales siendo por ello calculable o adivinable, hoy se observa que no es así. El propio progreso tecnológico empuja a un escenario de perfiles todavía borrosos aunque muy distinto, donde las representaciones de orden deben adaptarse a una situación de pluralidad e inestabilidad. De este modo, una de las primeras sacudidas a la sólida estructura del determinismo la proporcionó la conocida teoría cinética de los gases, desarrollada por J. C. Maxwell y luego perfeccionada por L. Boltzman, en la cual se trata de concebir y analizar los mecanismos ocultos presentes en un gas, y con ello explicar las propiedades manifiestas en el nivel macroscópico (volumen, temperatura, presión). En el campo de las ciencias naturales, el embate contra el determinismo fue similar. Un ejemplo lo constituyen las teorías sobre la genética desarrolladas por Gregor Mendel, formuladas en 1865. La estructura determinista termina por colapsarse con la aparición de la teoría de la mecánica cuántica, en particular con el principio de incertidumbre de Heisenberg, el cual postula que no se puede medir al mismo tiempo la posición y la velocidad de una partícula. De lo anterior se deduce que de acuerdo con la mecánica cuántica, cualquier medida inicial es siempre insegura y que el caos asegura que las incertidumbres sobre pasan la habilidad de hacer cualquier predicción. De acuerdo con el principio de incertidumbre de Heisenberg, el macroorden de la naturaleza dependerá del microcaos de los procesos íntimos de la materia. La naturaleza propia de las cosas, como lo demostró en 1927, radica en dicho principio, sin que ello signifique inmadurez de la ciencia humana, sino reconocer la imposibilidad de determinar el tiempo y el espacio como categorías absolutas y estables. La física cuántica derrumba la vieja ciencia que partía de la causalidad y determinación, para afirmar que la naturaleza no es un orden inexorable de causa y efecto, para admitir la incertidumbre y el campo de las probabilidades, lo que confirma la existencia del libre albedrío, donde el futuro no se puede predecir, porque cuando se manipula el objeto de conocimiento éste cambia, se distorsiona, lo que hace imposible aprovechar la realidad, por lo que habrá de intentar salvarlo con un esquema matemático. De ahí la relatividad de la posición y del movimiento, al observarse que se dan percepciones estáticas aparentes, medibles en el movimiento de la experiencia la cual no puede percibir.
CAOS Y DERECHO
605
Tiempo y lugar existen para el individuo como yo tiempo o tiempo subjetivo, ya que no es mesurable en sí mismo sino a través de nuestras experiencias, cobrando significado cuando se relacionan entre sucesos y sistemas que han si do de fi nidos con las mag ni tu des en con tra das en un sistema con las que aparecen en otro, evento que se conoce como la ley de transformación. Todas las mediciones del tiempo son del espacio y a la inversa, considerarlos separados no es posible, ya que sólo de ambos se conserva alguna “realidad”. Lo anterior, visto desde el ámbito humano sugiere implicaciones importantes, por lo que para introducirnos a tal explicación abordaré a C. S. Pierce, filósofo norteamericano que negaba el determinismo. En el nivel de la técnica fue el primero que hizo uso consciente de la “causalización” en el proyecto de experimentos, esto es, usó el carácter parecido a leyes de posibilidades artificiales para plantear cuestiones más agudas y para obtener respuestas más informativas. Tenía un enfoque objetivo de la probabilidad en la que consideraba la frecuencia pero también comenzó a dar cierto peso subjetivo a la prueba (complementación recíproca). En epistemología y metafísica su concepción pragmática de la realidad hizo verdadera una cuestión que hoy comprobamos en el largo plazo. Pero sobre todo concibió un universo irreductiblemente estocástico. Se ocupó de la medición de la gravedad, para lo cual empleó péndulos de su propio diseño. Sus investigaciones en fotometría fueron intensas. Logró equiparar las longitudes de onda de la luz con la longitud de una vara, un logro que hacía anticuado el uso del metro estándar. En 1892, propuso examinar la doctrina de la necesidad: “es la que el estado de cosas existentes en un determinado momento, junto con ciertas leyes inmutables determina por completo el estado de cosas de otro momento”,6 cuyo autor clásico fue Laplace. Atacó dicha doctrina en la cual todo suceso está determinado por una ley, al escribir en 1893 su obra: República a los partidarios de la necesidad, donde argumentó contra la doctrina de la necesidad, pero su argumento no lo convencía de que el azar no fuera un elemento irreductible de la realidad. Pierce invertía la máxima de Hume: “de que el azar, cuando se lo examina estrictamente, es una mera palabra negativa y no significa ninguna 6 Hacking, Ian, La domesticación del azar. La erosión del determinismo y el nacimiento de las ciencias del caos, España, Gedisa, 1990, p. 31.
606
MARÍA ELODIA ROBLES SOTOMAYOR
fuerza real que tenga su ser en alguna parte de la naturaleza”.7 Afirmaba que la hipótesis de la espontaneidad del azar es una hipótesis cuyas consecuencias inevitables son susceptibles de trazarse con precisión matemática en considerables detalles. Las anteriores explicaciones las podemos tomar como base para estudiar el ámbito humano, el cual, como sabemos, tiene una expresión diferente a la de las ciencias físicas. De este modo, la voluntad libre, lo que conocemos como libre albedrío, constituye un problema candente a causa del conflicto que hay entre la necesidad y responsabilidad humana. Descartes había supuesto que hay dos sustancias esencialmente distintas: espíritu y cuerpo o sustancia pensante opuesta a la sustancia extendida en el espacio. Lo que significa que todo cuanto ocurre en la sustancia espacial está inexorablemente determinado por leyes, es decir, los fenómenos temporoespaciales están determinados. Esto podría dejar un margen a la libertad humana por cuanto ésta es mental. Por otro lado, Kant consideraba como lugar común el hecho de que “todo cuanto ocurre debe estar inexorablemente determinado por leyes naturales”, y la explicación que dio acerca de la autonomía humana era una versión refinada de este punto de vista. Las dos sustancias, la espacial y la mental, quedaban reemplazadas por dos mundos, uno susceptible de ser conocido, el otro incognoscible. Estaba convencido de la realidad de la necesidad al grado de inventar otro universo en el cual pudiera ejercitarse la libre voluntad. Pero ni siquiera ese mundo escapaba a la universalidad, la condición concomitante de la necesidad en la esfera fenoménica; los únicos principios que podían gobernar a los seres racionales tenían que ser ellos mismos universales, exactamente como las leyes de la naturaleza. En un pequeño ensayo sobre las ideas de historia universal, escribió: Es evidente que las manifestaciones de esa voluntad, a saber, las acciones humanas, se encuentran bajo el control de las leyes universales de la naturaleza, lo mismo que cualquier otro fenómeno físico. A la historia corresponde narrar esas manifestaciones, y aunque sus causas serán siempre secretas, sabemos que la historia (simplemente al asumir su posición a la distancia y al contemplar la acción de la voluntad humana en gran escala) aspira a exhibir ante nuestra vista una corriente regular de tendencias en la 7
Ibidem, p. 285.
CAOS Y DERECHO
607
gran sucesión de acontecimientos, de suerte que el curso mismo de los incidentes que, tomados separadamente e individualmente parecerían desconcertantes, incoherentes y sin ley, pero que considerados en su conexión mutua y como las acciones del género humano y no de seres independientes, nunca deja de descubrir el desarrollo permanente y continuo aunque lento de ciertas grandes disposiciones de nuestra naturaleza.8
Para otros filósofos como Xavier Bichat, los fenómenos físicos pueden preverse, pronosticarse y calcularse, pero la vida orgánica es muy diferente, ya que todas las funciones vitales son susceptibles de numerosas variaciones, desafiando todo tipo de cálculos, por lo que sólo tenemos aproximaciones y aun éstas son muy inciertas. Este filósofo se aparta de la doctrina de la necesidad, pues no consideraba que todo hecho producido en el universo esté determinado por leyes, a menos que la doctrina se trivializara y caso por caso se aplicara a una ley especial a cada suceso individual, por lo tanto, su oposición a la ley no era una oposición al orden o a la causalidad, esa oposición no daba cabida al azar. III. CAOS Y DERECHO Volver a Heráclito permite ampliar las bases de la reflexión tradicional y abrir el espacio del conocimiento a horizontes que requieren nuevas respuestas, con el objeto de evitar el discurso científico tradicional que conduce a la homologación de los sistemas jurídicos, cuyas notas conceptuadoras cerradas niegan la realidad; con el objeto de afirmar como única verdad a la realidad artificial, lo que ha evitado la participación de amplios sectores de la sociedad, para subordinarlos a una sola óptica de orden, en el cual se descalifica los posibles argumentos de otros grupos, lo que conlleva a la sectorización y discriminación de ámbitos humanos que no encuentran un espacio en el cual el Estado de cabida a sus pretensiones. De ahí que hoy se viva la mayor de las incertidumbres, al cerrarse los sistemas jurídicos a una sola concepción del mundo, que a pesar de reconocer las diferencias, discrimina y niega cualquier manifestación diversa
8
Ibidem, p. 37.
608
MARÍA ELODIA ROBLES SOTOMAYOR
que cuestione el modelo, lo que ha dado origen a una mayor desigualdad jurídica, política, económica y social. El derecho es un saber que requiere de un sistema que conjugue los opuestos, como parte de su propia naturaleza, donde la argumentación no esté codificada desde su origen en notas conceptuadoras; si así fuese, se estaría evitando el diálogo para disfrazar la imposición. Se requiere de un marco teórico mínimo como referente fundamentador básico para la ciencia, aunado a su revisión en el momento en que es aplicado en la realidad, lo que significa que la norma no siga siendo una maquinaria fría de encuadre para los casos vitales, sino uno de los referentes que apoyan la búsqueda de la verdad. El error actual es entender que el derecho se representa por un conjunto de normas escritas que ante un evento diferente a la realidad debe ajustarse a la realidad artificial, aun en contra de la justicia, al grado de establecer como única verdad científica que todo es conforme a la ley, nada fuera de la misma, concepción pobre que deja en nombre del derecho el que se condene a inocentes por no comprender el formulario artificial mientras los culpables están afuera. Esta dogmatización racional conduce a lo irracional del paradigma, que no contiene en su sistema binario la posibilidad de que el ser jurídico (realidad artificial) y el no ser (posibilidad real jurídica) sean las notas necesarias para un real conocimiento, en donde cada caso requiere de una reflexión amplia del fenómeno para dar respuestas próximas a la verdad, sin ideologizar una vía de comprensión científica, lo cual conduce al fanatismo científico. El problema de la reflexión tradicional es continuar en modelos mecánico-instrumentales que sustituyen la realidad sin responder a la misma, lo que produce limitar al modelo y subjetivizar el razonamiento y a la verdad. Al crear una realidad ortodoxa sin dar cuenta de la realidad en sí, evita explicar el ámbito humano y su complejidad, con el objeto de reflexionar en un campo de mayores posibilidades como elemento constitutivo de la dinámica en el que se sustenta el universo jurídico. Lo anterior significa que los legisladores y jueces deben encontrar un camino donde armonicen sus diferencias para conducir la actividad a un modelo holístico; donde los referentes estables legislados puedan recrearse por los jueces. Ello significa que los sistemas jurídicos implementen procesos de auto-organización, lo cual se conoce como model
CAOS Y DERECHO
609
trough, modelo que implementa un nuevo enfoque sobre la conducta humana, donde se afirma el albedrío. Hoy más que nunca se aprecia el hecho de un exceso de normatividad, el cual conduce cada día más a una disfunción del sistema, confirmándose con ello que: orden más orden = caos, al desarticular al sistema en unidades independientes, contradictorias de un nivel a otro, lo que se traduce en la representación del no derecho, al existir tantos razonamientos contradictorios que pierden unidad y dejan sin identidad el origen de su propia fundamentación. Mientras más complejo sea el sistema será más fácil caer en resultados fallidos, debido a que cualquier sector puede introducir un comportamiento diverso del estipulado; originando un nuevo campo de expectativas que abre una complejidad de posibilidades a nivel mundial, las cuales son hoy el fundamento y no la unidad simple en la que se intenta regular las conductas, produciendo a contrario sensu, un mayor desorden. De ahí que para solucionar las circunstancias que se presenten se requiere de cuatro reglas básicas a cumplir: — La conversión de la organización instrumental-mecánica en la que estamos a un orden espontáneo — El impulso de la autoorganización en vez de la planificación — La estabilidad con un mínimo de reglas para permitir la flexibilidad — La autonomía real y no solo regulada, para evitar la dependencia y con ello terminar con el reducto del súbdito para ser ciudadano Si se busca alcanzar la ciudadanía como realidad se requiere de un espacio con libertad, lo que significa aceptar a la indeterminación como principio de la caología , con el objeto de lograr dar un salto cualitativo que permita la transformación y a su vez afirmar en cada acto el libre albedrío. Aceptar el principio de la indeterminación como parte del ser, abre el proyecto al futuro como posibilidad, lo cual desde una visión del eterno presente como hoy se afirma, ha dejado sin proyecto a la humanidad y le roba su futuro. Admitir el caos es afirmar la libertad en medio de las leyes, observándose que las nuevas teorías como la de los sistemas, la cibernética de segundo grado, la física cuántica, etcétera, permiten comprender que es posible, bajo una red de decisiones descentralizadas, que funcionen las instituciones conforme a reglas sencillas y claras (ralais).
610
MARÍA ELODIA ROBLES SOTOMAYOR
Los sistemas jurídicos lineales requieren de una revisión para abandonar el principio de que el todo es igual a sus partes y las partes al todo, ya que un cambio en el comportamiento de los elementos en un pequeño sector transforma los resultados (efecto mariposa). Lo anterior permite comprender al universo y sus componentes como caos-orden, ser y no ser, elementos que forman parte del sistema y no están separados, lo que significa que el modelo es dinámico, abierto, sin jerarquías, donde todos los factores son uno y permiten entender el fenómeno de la creación y transformación, donde el observante sea sensible a los valores de las variables iniciales y su proyección. Hay que mencionar que actualmente existen aspectos que se están escapando del derecho, la economía está tomando el lugar que a éste le corresponde de manera inusitada, sustentado principalmente por la doctrina neoliberalista, la cual ha suscitado una guerra económica, por medio de la cual el mercado mundial sustituye no sólo a éste, sino también a otras dimensiones como la ecológica, cultural, política y social, provocando con ello que todos estos aspectos se encasillen en uno solo para ser tratados en su conjunto como una empresa. A dicho fenómeno se le conoce como globalización, que significa: “Los procesos en virtud de los cuales los Estados nacionales soberanos se entremezclan e imbrican mediante actores transnacionales y sus respectivas probabilidades de poder, orientaciones, identidades y entremados varios”.9 John Saxe-Fernández califica que es un equivalente a la internacionalización económica, por lo tanto, es un fenómeno íntimamente vinculado con el desarrollo capitalista, intrínsecamente expansivo. La ideología sobre la que se basa es la del incipid vita nova: empieza la vida nueva, bandera y filosofía utilizada por los inversionistas, ejecutivos y políticos transnacionales,10 la cual se estructura de la forma siguiente:11
9 Beck, Ulrich, ¿Qué es la globalización? Falacias del globalismo, respuestas a la globalización, trad. de Moreno, Bernardo y María Rosa Borrás, España, Paidós, 1998, p. 29. 10 Chomsky, Noam y Dieterich, Heinz, La sociedad global, educación, mercado y democracia, 2a. ed., México, Joaquín Mortiz, 1996, p. 155. 11 Cfr. Utilizado a contrario sensu, Vilas, Carlos M., “Seis ideas falsas sobre la globalización. Argumentos desde América Latina para refutar una ideología”, Globalización: crítica a un paradigma, Saxe-Fernández, John (coord.), México, UNAM, Instituto de Investigaciones Económicas, 1999, p. 70.
CAOS Y DERECHO
611
— Es un proceso nuevo, lo cual es contrario, en virtud de que se origina en Europa hacia los siglos XV y XVI — Es un proceso homogéneo — Es un proceso homogeneizador — Conduce al progreso y al bienestar universal — Conduce a la globalización de la democracia Lo cierto es que se escuda en estas nociones vagas, pero ha logrado lo contrario: una concentración sin precedentes de la riqueza, el empobrecimiento y el desempleo o subempleo de la mayoría de la población económicamente activa; condena a millones de seres humanos a que por motivo de la desnutrición disminuyan sus facultades físicas e intelectuales, y a no tener derecho a la salud, a la educación ni a la tierra, sentenciándolos a vivir en la injusticia y sin la posibilidad de un futuro digno y, en lo político, el desmantelamiento de los antiguos Estados de bienestar y un crecimiento desmesurado del poder transnacional, logrando con esto el desmantelamiento del marco constitucional y jurídico de los países. En cuanto al concepto de soberanía política, éste se torna obsoleto, ya que la política nacional-estatal pierde el núcleo de su poder como tal, pues se limita la acción de los gobiernos y los Estados, en cuanto se ponen límites a una política interior para autodeterminarse, se transforman también las condiciones de decisión política, se cambian los presupuestos institucionales y organizativos. Pero también la globalidad significa el que vivamos en una sociedad mundial, lo que implica, según Ulrich Beck, dos ideas básicas: por un lado, un conjunto de relaciones de poder y sociales políticamente organizadas de manera no nacional-estatal (un conglomerado social para el cual las garantías de orden territorial-estatal, así como las reglas de política públicamente legitimada pierden su carácter obligatorio) y, del otro, la experiencia de vivir y actuar por encima y más allá de las fronteras. La unidad de Estado, sociedad e individuo se diluye. En el campo de lo humano será un personaje trabajador productor de ganancias y un ente consumista; con un horizonte mental fijado en la inmediatez, a lo que Heinz Dieterich expresa: La implementación violenta del paradigma antropológico dominado por la ley del valor y el homo oeconomicus como productor y realizador de plusvalía, determina su comportamiento práctico como fundamentalmente uti-
612
MARÍA ELODIA ROBLES SOTOMAYOR
litarista, y en contraposición abierto a cualquier proyecto humanista sobre la socialización y el devenir de la arquitectura humana. Como dice el suministrador estadounidense de personal ejecutivo para empresas transnacionales: “Ningún cliente me ha dicho jamás que quería una persona con buenos valores comunitarios”.12
Ahora el papel de demiurgo, el obrero —a que hicieron alusión tanto los pitagóricos como Platón, y a quien Leibnitz se refiere como a Dios en su Teodicea— será ocupado por la sociedad global, es decir, las empresas transnacionales, y sobre todo aquellas que crean su hogar electrónico en la realidad virtual del cyberspace, donde la identidad del homo abstractus es una dirección electrónica y las relaciones sociales que entabla son constituidas y mediatizadas por la electrónica. Pero un tema por analizar es también el que forma parte de la globalización, el deseo de la internacionalización de la justicia, a través de la creación de tribunales internacionales, verbigracia, tenemos la Corte Penal Internacional y las construcciones de órganos que velan por los derechos humanos. IV. EL FUTURO DE LAS CIENCIAS HUMANAS Sin embargo, es importante preguntarnos actualmente. ¿cuál es el verdadero papel de la ciencia en la época moderna? a la cual todavía no se ha encontrado una respuesta eficaz. Ya que si bien la ciencia puede salvar vidas, también puede matar; ayuda a vivir con dignidad, pero además llega a servir para torturar; a muchos les enseña a enfrentarse con el misterio del mundo, pero otros dicen que les hace perder el sentido de la vida. Ejemplo de ello lo podemos observar con las primeras aplicaciones científicas, las cuales impulsan nuevos tipos de negocios, las comunicaciones mejoran y el comercio es potencia. El higienismo y la medicina, basados en la química, hacen aumentar la población, con la aparición de nuevas clases de industriales y de comerciantes, cuya actividad intensa hace que todo cambie, sirviendo de base a un naciente optimismo. Los adelantos de la química permiten incrementar la producción de alimentos y los de la medicina contribuyen a vencer o mitigar enfermedades.
12
Chomsky, Noam y Dieterich, Heinz, op. cit., nota 10, p. 151.
CAOS Y DERECHO
613
Pero aunque el siglo XX se caracteriza por ese optimismo, también empezaron aparecer terribles consecuencias de la aplicación de la tecnología en el área militar durante la Segunda Guerra Mundial, para terminar en las explosiones de Hiroshima y Nagasaki. Fernández-Raña emite una respuesta de urgencia: “Tenemos que convivir con la inevitable ambivalencia de la ciencia, que da poder al hombre, pero no le enseña a utilizarlo. Por eso, la humanidad necesita alcanzar la madurez: habría que intentar transcurrir por este cambio histórico como pasan los adolescentes por una crisis de crecimiento”.13 Domina en todo el mundo una visión unidimensional de la ciencia en dos versiones aparentemente opuestas, una defendida desde concepciones humanistas, la otra desde filas cientistas. La primera supone que la ciencia es definible por un solo objetivo: el desarrollo tecnológico que permita la producción a corto plazo de artefactos vendibles, medible por indicadores económicos, pero que es una superestructura que no afecta a la profundidad del ser humano; es un punto de vista escaso y limitado. La segunda cree que el único conocimiento válido es el científico y que sólo los expertos, los especialistas en cada ciencia, son quienes pueden resolver los problemas; es una opinión excluyente y totalizadora. Según la primera, la ciencia es poco importante desde el punto de vista vital; según la segunda es lo único importante. Llamar a algo unidimensional equivale a afirmar que es prisionero de una perspectiva estrecha, incapaz de salir de un camino prefijado, que se reduce a un ámbito lineal, que no sabe de la existencia de otras cosas. Su aspecto más definitorio es no poder entender lo que es distinto, ni imaginarse a sí mismo visto desde fuera. Así, puede ocurrir por dos razones contrapuestas: por incapacidad de salir de su única dimensión o por negar la existencia de otras. O sea: por ser estrecho o por ser excluyente. ¿Qué pasa con la humanidad?, parece estar perdida en el laberinto de las ideas y de las aplicaciones científicas, sin las que sería concebible la vida de cualquier sociedad de hoy. Por un lado encontramos el entusiasmo por la ciencia y por el otro su rechazo, de la admiración por sus espectaculares resultados o el repudio como el saber extraño e incomunicable de una casta cerrada. La gente comprende que otorga un enorme poder, pues los países avanzados basan su riqueza en la tecnología que 13 Fernández-Raña, Antonio, Los muchos rostros de la ciencia, México, FCE, 2003, p. 21 y 22.
614
MARÍA ELODIA ROBLES SOTOMAYOR
se sigue de ella. La ciencia y los científicos han quedado implicados directa y abiertamente en los principales desarrollos económicos industriales y militares contemporáneos, pues los descubrimientos científicos han podido modificar profundamente el curso de los acontecimientos económicos y, algunas veces, hasta los sucesos políticos. Pero, a la vez la ciencia inspira temor, como todo lo que es incomprensible o difícil de conocer, por su relación con la carrera de armamentos o con el deterioro del medio ambiente. El cientismo ha calado muy hondo en la sociedad, de manera muy significativa en algunos sectores intelectuales. Una consecuencia inmediata es la relegación de la filosofía, la ética, la literatura y el arte a un papel secundario, como cosas quizá agradables y divertidas, pero sin ninguna validez por sí mismas, aceptables tan sólo mientras no se opongan a lo científico. Se llega así a un relativismo que nos acerca al fin de la ética o, al menos justifica que el reino de la ética del depende, peligrosamente próxima al “todo vale”, ya bien instalado en tantos ambientes. La sociedad se hace amnésica; el sujeto débil, light y acrítico, Finkielkraut lo caracteriza como zombie. Los medios de comunicación, con su énfasis en lo fútil y en la levedad del momento, conducen a la antípoda de la sociedad ilustrada, que era el ideal reinante hasta no hace mucho tiempo. Se dice que no hay una humanidad, sino muchas, repudiando los ideales de solidaridad entre todos los hombres. Bajo la coartada del respeto a los otros pueblos, se esconde un nuevo realismo y una nueva xenofobia, que protesta por la invasión de inmigrantes, los encierra en guetos o procura mantener los intercambios entre los pueblos en el nivel estricto de lo económico. El colonialismo no consideraba del todo humanos a los habitantes del tercer mundo; la naciente cultura de la diferencia sí los acepta como hombres, pero de otro tipo tan distinto que la incomunicación mutua se hace inevitable. Las revoluciones científicas están sustentadas por la búsqueda de la verdad, aunque muchos prostituyan ese propósito, y es muy importante comprender que, como dice Karl Popper en la frase citada: “la búsqueda de la verdad presupone la ética”.14 De ahí que la ética y el derecho requieren asumir su función en un sistema que responda a la justicia del caso y no sólo al encuadre instrumen14
Ibidem, p. 143.
CAOS Y DERECHO
615
tal vacío de realidad, donde la ley de imputación sea el referente argumentativo para la afirmación de la libertad y no sólo una expresión causalista necesaria. Si el universo es un proyecto evolutivo e involutivo, se observa que su propia expresión es sólo un factor de la riqueza en posibilidades, donde el hombre traduce pequeños sectores en la inmensidad de sus expresiones, observándose que la indeterminación juega un papel fundamental para afirmar la existencia, aspecto que confirma que el causalismo y el indeterminismo se implican como necesarios. La sociedad actual requiere de instituciones jurídicas flexibles con el objeto de acoger la indeterminación de las circunstancias y dar nueva lectura a los factores que señalan hacia otra concepción científica, donde la filosofía debe asumir su papel para abarcar las diversas expresiones y encontrar un nuevo camino de mirar las cosas, para interpretarlas, donde se recojan todos los aspectos verdaderos del mundo y no solo los científicos, para convertirse en una vía iluminadora que inspire a buscar mayor verdad. Para ello, el derecho se encuentra en el momento de instrumentar sistemas abiertos que miren por la justicia y no sólo por la ley, con el objeto de otorgarle al ser humano un espacio donde afirme su libertad y viva la democracia con proyección ciudadana real, donde la indeterminación afirme al yo en el otro, y aspiremos al nosotros, con el objeto de encontrar nuestro rostro, haciendo del derecho el lugar común donde las diversas expresiones abran el diálogo, evitándose el silencio que produce la homologación, la cual conduce a la ignorancia, a la violación del principio del conocimiento y la búsqueda de la verdad. V. BIBLIOGRAFÍA BECK, Ulrich, ¿Qué es la globalización? Falacias del globalismo, respuestas a la globalización, trad. de Moreno, Bernardo y María Rosa Borrás, España, Paidós, 1998. CHOMSKY, Noam y DIETERICH, Heinz, La sociedad global, educación, mercado y democracia, 2a. ed., México, Joaquín Mortiz, 1996. ESCOHOTADO, Antonio, Caos y orden, 6a. ed., España, Espasa, 2000. FERNÁNDEZ-RAÑA, Antonio, Los muchos rostros de la ciencia, México, Fondo de Cultura Económica, 2003.
616
MARÍA ELODIA ROBLES SOTOMAYOR
FÉVRIER, Paulette, Determinismo e Indeterminismo, trad. de Raquel Rabiela de Gortari, México, UNAM, 1957. GUTTHERIE, W. K. C., Historia de la filosofía, Los primeros presocráticos y los pitagóricos, Grades, Mache, 1984, t. II. HACKING, Ian, La domesticación del azar. La erosión del determinismo y el nacimiento de las ciencias del caos, España, Gedisa, 1990. SCHIFTER, Isaac, La ciencia del caos, 3a. ed., México, FCE, 2003. VILAS, Carlos M., “Seis ideas falsas sobre la globalización. Argumentos desde América Latina para refutar una ideología”, Globalización: crítica a un paradigma, en SAXE-FERNÁNDEZ, John (coord.), México, UNAM, Instituto de Investigaciones Económicas, 1999.
KELSEN Y EL PROBLEMA DE LA OBJETIVIDAD* Carlos RODRÍGUEZ MANZANERA** En el año de 1952, Kart Gödel (1906-1978) dictó una conferencia sobre el platonismo matemático. Su propósito era el de distinguir entre las matemáticas objetivas relativas a todas las proposiciones verdaderas y las matemáticas subjetivas referidas solamente a las proposiciones que la mente humana puede demostrar. En este mismo año escribe un texto en el cual critica la tesis de Carnap sobre la naturaleza sintáctica de las matemáticas, en realidad nunca estuvo de acuerdo con la tesis de Wittgenstein y Carnap, pues en su opinión las matemáticas no pueden ser reducidas a un lenguaje que solamente sirve para describir la realidad. En este sentido, sostiene que la mente humana hace matemáticas subjetivas, porque no puede aprehender en su totalidad las matemáticas objetivas. Basado en su famoso teorema acerca de la imposibilidad de construir un sistema lógico perfecto por los problemas que se derivan de la incompletitud o de la inconsistencia de las proposiciones, pone de relieve que en toda estructura lógica libre de constradicciones, siempre hay proposiciones que no se pueden probar ni refutar. Por ejemplo: “Carlos, el mexicano, dice que todos los mexicanos mienten”, ¿es verdad o es mentira, lo que dice? Analizando a las matemáticas como un sistema, se da cuenta de que no se pueden crear los teoremas que se quieran, de lo cual resulta que las matemáticas no son una construcción o creación humana, sino tan sólo algo que continuamente se está descubriendo. Los conceptos * Este artículo fue elaborado bajo los auspicios de la Dirección General de Asuntos del Personal Académico, en su programa de formación para los profesores de tiempo completo, de la UNAM. ** Facultad de Derecho, UNAM, México.
617
618
CARLOS RODRÍGUEZ MANZANERA
matemáticos forman una realidad objetiva, que no podemos crear o cambiar, sino sólo percibir y describir.1 Para dar solidez a su argumento reflexiona lo siguiente: a) Si las matemáticas fueran un producto de la mente humana, toda verdad matemática podría ser conocida y demostrada, lo cual no es el caso. b) Un creador siempre es capaz de conocer su propia obra e incluso llevar a cabo los cambios que le parezcan más adecuados, lo cual tampoco se sigue. Gödel sostiene entonces que las matemáticas son tan objetivas como el mundo material, se trata de una realidad externa e inmutable. “Las matemáticas describen una realidad no sensible que existe independientemente de los actos y las disposiciones de la mente y es percibida en forma bastante incompleta, por la mente humana”.2 Las matemáticas serían una parte, quizá la más accesible, de esta otra realidad objetiva: el mundo de las ideas. Hasta aquí Gödel. Es el momento adecuado de establecer una noción relativa a la objetividad acorde con lo dicho hasta el momento. Se entenderá por objetividad en sentido sumamente amplio, aquella característica del conocimiento científico que lo hace ser verdadero, independientemente del sujeto que lo enuncie pues cualquiera puede demostrar, comprobar o verificar las proposiciones enunciadas, siguiendo un procedimiento riguroso. Dependiendo del tipo de verdad enunciada, será la clase del procedimiento a seguir. No obstante lo anterior, quien habla de la objetividad se enfrenta inmediatamente al problema de la subjetividad, es decir, al papel que juega el sujeto en el proceso del conocimiento. Sujeto y objeto son el gran paradigma de la epistemología y la ontología a lo largo del desarrollo de la filosofía. Es pertinente recordar, con relación a este problema, la primera tesis de Marx sobre Feuerbach. En esta tesis, Marx muestra claramente el dilema de estos dos extremos, por un lado se encuentra el subjetivismo idealista, que si bien resalta la actividad del sujeto en el proceso del co1 Hacyan, Shahen, “¿Existen las matemáticas?”, Periódico Reforma, jueves 2 de marzo de 2000. Columna Alpeh cero [hacyan@fénix.ifisicacu.unam.mx]. 2 Idem.
KELSEN Y EL PROBLEMA DE LA OBJETIVIDAD
619
nocimiento, da un tratamiento abstracto a dicha actividad y no la ve como una actividad real, sensorial y concreta, y por ende objetiva, mientras que en la contraparte el objetivismo materialista reduce al sujeto a la contemplación, pues supone que el objeto posee propiedades en sí mismo y no se da cuenta de la actividad sujetiva práctica que el sujeto ejerce sobre él.3 De esta tesis de Marx sobre Feuerbach puede obtenerse la conclusión de que la objetividad tiene que ser resultado de una conjugación e influencia recíproca del sujeto y del objeto. La intersubjetividad se presenta entonces como el puente entre la subjetividad y la objetividad, la posibilidad de un conocimiento cierto y válido para todos los sujetos. Gödel no reduce el sujeto a la contemplación, es decir, no niega la actividad subjetiva práctica que el sujeto ejerce sobre las matemáticas, pero si muestra que ellas poseen propiedades en sí mismas que impiden que el sujeto pueda hacer cualquier cosa con ellas. El derecho siempre ha mostrado a sus estudiosos dos aspectos: uno formal y uno material. Hans Kelsen, sin desconocer la importancia del segundo pero empleando el postulado de la pureza metódica, centra la atención de su Teoría pura en el primero, pues es lo que a su juicio no cambia y puede ser objeto de la ciencia jurídica. Hoy nadie duda en afirmar que para Kelsen, la ciencia del derecho tiene por objeto exclusivamente la forma del derecho (es decir el “deber ser”, el Sollen), pero hoy, en cambio, nadie afirmaría que para Kelsen, la realidad jurídica es pura forma, es decir Sollen, sin la mínima influencia de la realidad del Sein: muy a menudo Kelsen repitió que la suya es una “Teoría pura del derecho” y no una “teoría del derecho puro”.4
En esta vía, la Teoría pura del derecho de Hans Kelsen no es ajena al problema de la subjetividad y de la objetividad. De hecho, la solución a este problema es el hilo conductor para comprender su pensamiento, pues se trata nada más ni nada menos que de establecer en dónde radica la objetividad de la ciencia jurídica.
3 4
Marx, Carlos, Obras escogidas, Moscú, Progreso, 1955, t. II, pp. 401. Losano, Mario G., Teoría pura del derecho. Evolución y puntos cruciales, Bogotá, Temis, 1992, p. 3.
620
CARLOS RODRÍGUEZ MANZANERA
Consiste, este hilo conductor, en comprender “el sentido subjetivo y objetivo” que los humanos dan tanto a los hechos que por sí mismos lo tienen, como a los actos que ellos llevan a cabo. Son, en resumen, tres los momentos en los cuales este hilo conductor del sentido subjetivo y el sentido objetivo se desarrolla en la Teoría pura del derecho:5 a) Hechos y actos sensiblemente perceptibles, localizados en el tiempo y en el espacio, es decir, se manifiestan externamente: un terremoto derriba varios edificios de una ciudad, una persona apaga las dieciocho velitas de su pastel y por último la gente introduce papeles en una caja transparente. b) El sentido subjetivo que los humanos damos a esos hechos y esos actos dotándolos a veces de una “autoatribución” de significado jurídico, es decir, la pretensión de que sean entendidos como regulados por el derecho y por lo tanto produzcan consecuencias jurídicas: los dueños dicen que los edificios estaban asegurados, la persona sostiene que ha llegado la mayoría de edad y por lo tanto puede disponer de los bienes que ha heredado de su madre, la gente piensa que está ejerciendo su derecho de elegir a sus representantes a través de su voto. Es importante esta autoatribución de significado jurídico porque la ciencia del derecho, nos dice Kelsen, se encuentra ante un material que pretende ya tener un significado jurídico. c) El sentido objetivo que las normas dan a ese sentido subjetivo, actuando desde la perspectiva de la ciencia jurídica como un esquema de explicación, que puede coincidir o no con el sentido subjetivo y con la “autoatribución” de significado jurídico en caso de tenerla: las pólizas de seguro se encuentran vencidas y por ello los edificios no estaban asegurados, la persona tiene derecho legítimo para entrar en posesión de la herencia y las boletas al abrir la urna se encuentran en blanco. Ahora bien, este sentido objetivo se adjudica a los hechos y a las acciones humanas mediante un proceso intelectual, tomando como base el derecho y en particular la norma jurídica. Como la norma jurídica es, desde la perspectiva de la ciencia jurídica, la que funciona como un “esquema de explicación conceptual de la realidad”, al proporcionar la “significación objetiva” a los actos o a los sucesos fácticos, surge la pregunta de cuándo se está en presencia de una norma jurídica y Kelsen responde 5
Kelsen, Hans, Teoría pura del derecho, México, Porrúa, 1998, pp. 16 y 17.
KELSEN Y EL PROBLEMA DE LA OBJETIVIDAD
621
que esto se da cuando la norma jurídica es válida. Dos criterios, según Kelsen, son los principales para entender la “validez objetiva” de una norma jurídica: 1) El primero se refiere al aspecto interno de la propia norma jurídica, al deber que ella prescribe, recordando que bajo el concepto de deber queda comprendido para Kelsen lo ordenado o mandado, lo prohibido y lo permitido o facultado. La validez es la existencia de la norma jurídica, si una norma no es válida ha dejado de ser norma, porque la conducta deja de ser ordenada, prohibida o permitida. La norma es válida porque implica un deber. 2) El segundo criterio es el aspecto externo y se encuentra en función de la pertenencia de esa norma a un sistema jurídico. Una norma es jurídica si y sólo si ha sido producida mediante un acto de derecho, en el cual otra norma le ha dado su significación jurídica y por ende su objetividad. Pero este segundo argumento conduce a la necesidad de suponer la existencia de una primera norma que tiene que ser considerada como objetiva en sí misma, pues ya no puede recibir su objetividad de una norma anterior, esto por un lado, pues por el otro, esa primera norma tiene que ser también de acuerdo al criterio arriba mencionado válida en sí misma. Como todos saben esta primera norma recibe varios nombres en la obra de Kelsen: Grundnorm, norma básica fundantental, norma hipotética fundamental, constitución en sentido lógico jurídico y de acuerdo con el “hilo conductor” que se viene siguiendo en esta explicación, esta norma es: El “Primer esquema de explicación” requerido por la ciencia jurídica para poder comprender cómo se dota de sentido objetivo a los actos subjetivos del primer constituyente u órgano de poder primario. Otros dos criterios de validez son complementarios de los anteriores, por una parte se encuentra el de un mínimo de eficacia o cumplimiento de las normas jurídicas así como el orden jurídico que ellas forman y, por otra parte, se encuentra el de la coacción que siendo la nota distintiva del derecho es una persuasión implícita en el sistema de normas que lleva a los sujetos a realizar las conductas obligatorias y a omitir las conductas prohibidas. Por ello un derecho válido es un orden coactivo eficaz. Se dijo al principio de este trabajo que la objetividad depende de que exista un procedimiento riguroso que cualquier sujeto con los conocimientos adecuados puede seguir para llegar a constatar la verdad de lo afirmado. Este procedimiento puede ser de dos clases, pudiéndose llevar a
622
CARLOS RODRÍGUEZ MANZANERA
cabo separada o complementariamente: me refiero a la comprobación y a la demostración. Es en la comprobación en donde la objetividad adquiere su sentido más estricto, pues para que un conocimiento sea verdadero no basta con su demostración o necesidad lógica, sino que se requiere de su verificación en la realidad, bien sea por la vía de la experimentación o de su corroboración en los hechos reales. En el terreno de lo jurídico se habla, por ejemplo, de la contrastación entre los hechos reales y el texto legal. Precisamente Kelsen menciona que la Teoría pura del derecho no hace sino poner de manifiesto la operación que a través de la historia han llevado a cabo los juristas y que consiste en comparar la realidad (lo que es) con las normas jurídicas (lo que debe ser). De esto resulta que la objetividad requerida por la ciencia jurídica se logra mediante una operación intelectual nada simple si se tienen en cuenta todos los problemas relativos a la interpretación del texto legal. La demostración consiste en partir de ciertos principios que se consideran universalmente válidos, evidentes en sí mismos y que se aceptan sin discutir sobre su verdad o falsedad para obtener otras proposiciones que se volverán válidas o verdaderas o correctas en función de su relación en el sistema de proposiciones formado. En esta vía las matemáticas, las lógicas y las geometrías, aportan resultados a los cuales llegará cualquier sujeto, siguiendo las reglas de su demostración. La teoría pura del derecho de Hans Kelsen se mueve al inicio originalmente en esta clase de objetividad demostrativa. Dicha teoría, desde nuestra perspectiva, es el resultado de la elección y el empleo de los tres siguientes postulados de carácter filosófico: 1. Es el método el que determina el objeto de conocimiento. 2. La tajante separación lógica en el ser (Sein) y el deber (ser) (Sollen)6 3. La distinción entre la razón y la voluntad en la descripción y la prescripción de las normas respectivamente. En mi proyecto de tesis doctoral sostengo que es a partir de estos postulados filosóficos, como surgen los postulados de carácter científico jurídico: el de la pureza metódica, la identificación del Estado y del derecho, la coacción y el de la norma básica fundante. Este último es el que más inte-
6 Respetando la discusión acerca de que la noción acerca del deber no implica ninguna entidad metafísica, relativa a un deber ser.
KELSEN Y EL PROBLEMA DE LA OBJETIVIDAD
623
resa en este momento, por relacionarse directamente con los postulados filosóficos. La norma básica fundante es el “primer esquema de explicación en la vía del hilo conductor” del sentido subjetivo y objetivo de los hechos y de los actos, como ser ha venido explicando. “Establecer este presupuesto es una función esencial de la ciencia del derecho. En este presupuesto se encuentra el fundamento del orden jurídico, un fundamento sólo condicional según su esencia y, en este sentido, hipotético”.7 Porque: “Sólo cuando se presupone una norma fundante básica… puede interpretarse el sentido subjetivo de los actos constituyentes, y los actos realizados conforme a la constitución, como su sentido objetivo, es decir, como normas jurídicas válidas objetivamente, y las relaciones constituidas mediante esas normas, como relaciones jurídicas”.8 La norma fundante básica es el primer esquema de explicación, proporciona el sentido subjetivo a los actos del primer constituyente o legislador. Regresando a los tres postulados de los que parte la Teoría pura del derecho, se tiene lo siguiente: El primer postulado es el que sostiene que el método determina el objeto de conocimiento y en el caso de la teoría pura, lo hace a través de la suposición de una primera norma. Esta primera norma se convierte en una necesidad lógica que se impone al pensamiento en virtud precisamente del segundo postulado que establece la separación entre el ser (Sein) y el deber (ser) (Sollen). La validez del derecho no puede reposar en lo que es, sino que se mueve en el campo del deber al suponer una primera norma. “…ya que el fundamento de validez de una norma no puede ser semejante hecho. De que algo sea, no puede seguirse que algo deba ser; así como, de que algo sea debido, no puede seguirse que algo sea. El fundamento de validez de una norma sólo puede encontrarse en la validez de otra norma.”.9 Precisamente surge aquí la relación entre Gödel y Kelsen, pues si desde la perspectiva de la Teoría pura del derecho, una ciencia jurídica solamente puede ocuparse de los aspectos formales de su objeto de estudio y la validez es la forma de ser de las normas jurídicas, las cuales se caracterizan por prescribir un deber, resulta entonces que aparece la necesidad lógica de pensar en una primera norma. Esta primera norma seme7 8 9
Kelsen, Hans, op. cit., nota 5, p. 59. Ibidem, p. 20. Ibidem, p. 201.
624
CARLOS RODRÍGUEZ MANZANERA
jante a los teoremas matemáticos, no es una creación de Kelsen como él mismo lo indica en la primera parte de la famosa nota 122 en su Teoría pura del derecho: “La pregunta: ¿quién presupone la norma fundante básica?, es contestada por la Teoría pura del derecho: quienquiera que interprete el sentido subjetivo del acto constituyente, y de los actos cumplidos conforme a la Constitución, como su sentido objetivo, es decir, como normas objetivamente válidas. Esta interpretación es una función del conocimiento, no una función volitiva”.10 En realidad ese “quienquiera” es el científico del derecho que incluso puede hablar de un sentido subjetivo y de un sentido objetivo de los actos de un constituyente, pero lo importante es reflexionar en que los aspectos formales del derecho y entre ellos la validez objetiva de esta primera norma pensada, se imponen a la mente de una manera tal, que parecería que más que una creación hay tan sólo un descubrimiento. En otras palabras, esto podría dar pie a pensar que algunos conceptos jurídicos forman una realidad objetiva no sensible que no podemos crear o cambiar, sino solamente describir o explicar... “y dado que esa norma (o mejor: su enunciación) es lógicamente imprescindible para la fundamentación de la validez objetiva de las normas jurídicas positivas, sólo puede ser una norma pensada…”.11 De antemano se sabe que Kelsen no se opone a la metafísica y seguramente a la visión platónica que sostendría la existencia de un mundo de las ideas, pero siguiendo la línea de Gödel, me gustaría reflexionar en que esa norma pensada tiene que ser supuesta como “objetiva en sí misma” porque es el “primer esquema de explicación”, es decir, proporciona objetividad a los hechos y actos subjetivos, pero también tiene que ser supuesta como “válida en sí misma” porque es la fuente común y la unidad de la multiplicidad de normas. Lo anterior es “lógicamente imprescindible” para la fundamentación de la validez objetivad de las normas jurídicas positivas. Surge entonces la pregunta “¿la norma básica funtamental?”, es una creación o un descubrimiento de la mente humana. Se podría seguir que de algo sea “lógicamente imprescindible”, resulta que ese algo se impone a la razón. Si se reflexiona sobre lo que se viene sosteniendo se tiene lo siguiente:
10 11
Ibidem, p. 203. Las cursivas son para seguir el hilo conductor de esta explicación. Ibidem, pp. 211 y 212.
KELSEN Y EL PROBLEMA DE LA OBJETIVIDAD
625
Por una parte, Kelsen inicia el desarrollo de su teoría con un postulado que establece que el conocimiento tiene un carácter constitutivo de su objeto de estudio, es decir, lo produce al concebirlo como una totalidad significativa, pero exclusivamente para el conocimiento.12 Sin embargo, para poder realizar esta operación tiene que partir de la suposición de una norma que es “lógicamente imprescindible” para la fundamentación de la validez objetiva de las normas jurídicas positivas. En conclusión, el pensamiento científico de Kelsen se encuentra prisionero de los postulados de los cuales han partido en la explicación del derecho, en forma semejante a la de los sistemas matemáticos, en los cuales los teoremas no pueden quedar al arbitrio humano, como lo ha puesto de manifiesto Gödel. El primero de ellos sostiene que es el método el que determina el objeto del conocimiento y el segundo establece la seriación entre el ser (Sein) y el deber (ser) (Sollen). Ambos postulados se conjugan en la suposición de una primera norma, con la cual la validez del derecho no reposa en lo que es, sino precisamente se mueve en el campo del deber y sirve además de esquema de explicación de la realidad. Sin embargo, surge un problema porque el tercer postulado establece que es la voluntad la que crea el derecho y la razón solamente lo describe y explica. “Normas que prescriban la conducta humana pueden tener su origen únicamente en la voluntad… La razón humana puede comprender y describir pero no prescribir. Pretender encontrar en la razón normas de conducta humana es una ilusión semejante a la de querer obtener tales normas de la naturaleza”.13 ¿Pero qué entiende Kelsen por voluntad?, ¿es la voluntad entendida psicológicamente o es la voluntad construida por la ciencia jurídica? Si la voluntad es la creadora del derecho y ella es entendida en el sentido psicológico, entonces se tiene el problema que desde el ser es creado el deber, rompiendo con el segundo postulado. Ahora bien, es por eso que dicha voluntad tiene que estar autorizada para crear el derecho en la vía de la norma básica fundamental. Pero ¿hasta dónde puede ser mantenido ese enfoque voluntarista?, ¿podría una voluntad irracional crear un sistema de normas jurídicas y un orden, susceptibles de ser el objeto de estudio de la ciencia jurídica? 12 13
Ibidem, p. 85. Kelsen, Hans, ¿Qué es la Justicia?, México, Fontamara, 1991, p. 71.
626
CARLOS RODRÍGUEZ MANZANERA
Kelsen, por necesidades lógicas, se verá obligado a reconocer límites a esta posibilidad, lo cual recuerda una vez más a Gödel. Recordando el hilo conductor del sentido subjetivo y del sentido objetivo proporcionado por las normas, el autor de la Teoría pura del derecho nos dice: “Puesto que la norma fundante básica no otorga a todo acto el sentido objetivo de una norma válida, sino solamente al acto que tiene un determinado sentido, a saber: el sentido subjetivo de que los hombres deben comportarse de una determinada manera”.14 Y esto se sigue para todas las demás normas porque menciona Kelsen los siguientes actos subjetivos carentes de sentido: a) Enunciados declarativos como el de una teoría científica expuesta en la ley. b) Palabras sin sentido en la ley c) Disposiciones entre sí incompatibles, como podría ser el caso de una perturbación mental del juez al dictar una sentencia judicial Textualmente asegura Kelsen: “…no entra en juego ningún sentido subjetivo que pueda ser interpretado como sentido objetivo; no tenemos ningún acto cuyo sentido subjetivo será capaz de ser legitimado por la norma básica”.15 Además, tampoco se aceptarán actos cuyo sentido subjetivo consista en: prescribir lo imposible, como podría ser: se prohíbe envejecer. Comportamiento naturalmente necesarios, sirva de ejemplo, “se ordena abrir los ojos al despertar”. En conclusión, el tercer postulado necesita ser formulado de la siguiente manera: De la voluntad solamente pueden ser obtenidas normas cuyo sentido subjetivo prescriptivo pueda ser interpretado mediante una norma como un sentido objetivo. Sin embargo, esto se sigue que la voluntad no puede ser separada de la creación del derecho, porque necesita manifestarse en un sentido subjetivo prescriptivo, el cual solamente puede estar establecido en forma racional. Ahora bien, esto último apunta al señalamiento de que la voluntad es tomada en la vía de ser una contrucción de la ciencia jurídica. Pero, así como la voluntad en sentido psicológico rompe con el segundo postula14 15
Kelsen, Hans, Teoría pura del derecho, op. cit., nota 5, p. 216. Idem.
KELSEN Y EL PROBLEMA DE LA OBJETIVIDAD
627
do de la separación tajante entre el ser y el deber ser, porque la voluntad se ubica en lo que es y de lo que es no puede obtener un deber, la voluntad como la construcción de la ciencia jurídica también rompe con el tercer postulado, que expresa que de la razón sólo puede obtenerse una descripción y una explicación del derecho, pues solamente la voluntad puede crear normas. De esto se sigue que el primer postulado entra también en franca oposición con el tercer postulado, porque si es el método el que determina el objeto de conocimiento a través de la norma básica fundante, la razón mediante esta suposición ha determinado de antemano la voluntad. No cualquier voluntad puede crear el derecho y además: “La norma puede valer aún cuando el acto de voluntad cuyo sentido constituye, ha cesado de existir. Más: ella adquiere validez justamente cuando el acto de voluntad cuyo sentido constituye, ha dejado de existir”.16 La voluntad queda reducida a un simple impulso, por ello, sostiene Don Luis Recaséns Siches siguiendo a Kelsen, la ciencia jurídica no utiliza la noción psicológica de voluntad, porque ésta constituye un elemento perteneciente al reino del ser o de la naturaleza, además de que una voluntad que no sabe lo que quiere es algo contradictorio.17 El querer en el derecho significa algo distinto de la voluntad psicológica, así en el negocio jurídico se tiene que distinguir claramente entra la voluntad de declarar y la voluntad de cumplir. Esta voluntad de cumplir es imposible de constatarla objetivamente y es, sin embargo, mediante ficciones o presunciones (la firma del contrato), el jurista presume su existencia. Lo mismo sucede en materia penal, nos dice Recaséns, la responsabilidad es una contrucción normativa, pues basta pensar en un caso en el cual los resultados no fueron queridos, ni previstos, pero desde la óptica jurídica debieron serlo y evitado, el juez presume entonces tal acto como habiendo sido voluntario. Concluye Recaséns que la voluntad entendida desde el derecho y la ciencia que lo explica, es una contrucción normativa que representa un punto final y término de imputación. Si esto es así, entonces la razón subrepticiamente crea el derecho. Termina por no hacer lo que el tercer postulado establecía, esto es, no se li16 17
Ibidem, p. 24. Molina Piñeiro, Luis J., El pensamiento filosófico-jurídico y político en Luis Recaséns Siches, México, Porrúa, 2003, véase mi colaboración, pp. 259 y 262.
628
CARLOS RODRÍGUEZ MANZANERA
mita a escribir y explicar el derecho, sino que termina por crear y no solamente suponer la validez del derecho. Kelsen se dio cuenta de esto y al final de su vida sostendrá que el deber solamente puede ser el correlato de un querer y que por ello no puede haber una norma fundamental, porque esta norma no es el sentido de un acto de voluntad real, con lo cual regresa a la noción de la voluntad en sentido psicológico. Yo he hablado de mis anteriores escritos de normas que no son el sentido de actos de voluntad. He presentado mi teoría de la nomra fundamental como si fuera una norma que no es el sentido de un acto de voluntad, sino que es supuesta por el pensamiento. Ahora debo, lamentablemente, aceptar señores, que a esta teoría no la puedo sostener, que debo renunciar a ella. Me pueden creer que no es fácil renunciar a una teoría que yo he representado por decenios.18
La norma fundamental terminará siendo para Kelsen una ficción doblemente contradictoria, pues no es una hipótesis que pueda ser comprobada en la realidad, ya que no hay una voluntad que haya creado esa norma como lo establece el tercer postulado y es contradictoria consigo misma porque supone la autorización ciertamente simulada de alguien que incluso está por encima del legislador humano.19 La objetividad de la Teoría pura del derecho radica en la coherencia de sus postulados y estos entran en contradicción, como ha sido mostrado en este artículo.
18 Cracogna, Dante, Cuestiones fundamentales de la teoría pura del derecho, México, Fontamara, p. 64. 19 Kelsen, Hans, Teoría general de las normas, México, Trillas, pp. 252 y 253.
REGLAS Y PRINCIPIOS. A PROPÓSITO DEL ORIGEN Y CONTENIDO DE LOS PRINCIPIOS JURÍDICOS A PARTIR DE LAS REGULAE IURIS Javier SALDAÑA* SUMARIO: I. Planteamiento del problema. II. Principios y reglas en la jurisprudencia romana. III. Contexto histórico-jurídico de las regulae iuris en el derecho romano clásico. IV. Juristas romanos tardo-republicanos. V. Síntesis. VI. Periodo clásico del derecho romano. VII. Caracteres generales del derecho clásico. VIII. Fuentes del derecho romano clásico. IX. Conclusiones. X. Bibliografía.
I. PLANTEAMIENTO DEL PROBLEMA Uno de los temas que mayor interés ha despertado en los últimos años es, sin duda, el debate establecido entre las posturas de dos de los más importantes filósofos del derecho contemporáneos, H. L. A. Hart, y su sucesor en la cátedra de jurisprudence en la Universidad de Oxford, Ronald M. Dworkin, a propósito de las reglas y los principios del derecho. Según Dworkin, el positivismo, como sistema de reglas, ofrece una exposición inacabada de la forma en la que los jueces razonan al aplicar el derecho. En una de las citas que ya se ha hecho celebre escribía dicho profesor: Quiero hacer un ataque general al positivismo y usaré la versión de H. L. A. Hart como blanco cuando se necesite un blanco particular. Mi estrategia se organizará alrededor del hecho de que cuando los juristas razonan o argumentan acerca de derechos subjetivos y obligaciones, particularmente * Instituto de Investigaciones Jurídicas, UNAM, México. 629
630
JAVIER SALDAÑA
en aquellos casos difíciles cuando nuestros problemas con estos conceptos parecen ser más agudos, hacen uso de patrones que no funcionan como reglas, sino que operan de modo diferente, como principios, políticas, y otros tipos de patrones. El positivismo argumentaré, es un modelo de y para un sistema de reglas, y su noción central de una única prueba fundamental de lo que es el derecho nos fuerza a pasar por alto el importante papel que desempeñan estos patrones que no son reglas.1
La diferenciación entre “principios, políticas y otro tipo de patrones”, resulta poco relevante para lo que aquí queremos destacar; no lo es en cambio la distinción que se hace entre “reglas y principios”. Las primeras son identificadas por el tests de su pedigree (o la manera en la que ellas fueron adoptadas o desarrolladas), que sirve para calificarlas como jurídicamente válidas e inválidas, teniendo poca importancia el contenido de las mismas.2 El propio Dworkin resume esto al señalar que: Decir que alguien tiene una «obligación jurídica» es decir que en su caso «cae» bajo una regla jurídica válida que le exige que haga o se abstenga de hacer algo. (Decir que alguien tiene un derecho subjetivo, o tiene un poder jurídico de algún tipo, o un privilegio jurídico o inmunidad, es afirmar de un modo abreviado, que otros tienen real o hipotéticamente la obligación jurídica de actuar o abstenerse de actuar en ciertas maneras tocante a él). En ausencia de dichas reglas jurídicas válidas, no existe obligación jurídica.3
1 Dworkin, R., ¿Es el derecho un sistema de reglas?, trad. de J. Esquivel y J. Rebolledo, México, UNAM, 1997, p. 18, col. Cuadernos de Crítica. 2 Haciendo la crítica al positivismo jurídico y tomando en cuenta la diferenciación de posturas entre Austin y Hart acerca de lo que las reglas son, Dworkin explica su idea sobre estas reglas escribiendo: “(a) El derecho de una comunidad es un conjunto de reglas especiales usadas por la comunidad, directa o indirectamente, con el propósito de determinar que conducta debe ser castigada o coaccionada por el poder público. Estas reglas especiales pueden ser identificadas y distinguidas mediante criterios específicos y por pruebas (tests) que tienen que ver no con su contenido sino con su pedigree o la manera por la cual ellas fueron adoptadas o desarrolladas. Estas pruebas de su pedigree pueden usarse para distinguir reglas jurídicas válidas de reglas jurídicas espurias (reglas que los juristas y litigantes equivocadamente arguyen que son reglas de derecho) y, también, de otros tipos de reglas sociales (generalmente agrupadas sin discriminación como «reglas morales») que la comunidad obedece pero que no imponen a través del poder público”. Ibidem, p. 10. 3 Ibidem, p. 11.
REGLAS Y PRINCIPIOS
631
En cambio, cuando Dworkin se refiere a los principios, dirá de éstos que deben entenderse como aquel “patrón que debe ser observado, no porque promoverá o asegurará una situación económica, política o social considerada deseable, sino porque es una exigencia de justicia o equidad [fairness] o de alguna otra dimensión de moralidad...4 Para el actual profesor de la Universidad de Londres existe por tanto, en un sentido genérico, una distinción entre unos y otras.5 Los primeros, identificados con una “exigencia de justicia, equidad o por alguna otra dimensión de moralidad”, las otras no. Ayudan a reforzar dicha distinción los ejemplos que el mismo Dworkin señala y de los cuales sólo anotaremos uno de ellos. Éste es el caso Riggs vs. Palmer ventilado en un tribunal de Nueva York en 1889 y en el que se tuvo que decidir si un heredero que aparecía como tal en el testamento de su abuelo tenía derecho a la sucesión después de haber sido él quien lo había privado de la vida. En un primer razonamiento, el tribunal estableció que: “Es ciertamente verdadero que las leyes que regulan la creación, autenticidad y consecuencias jurídicas de los testamentos, y de la sucesión de la propiedad, si se interpretan literalmente, y si su fuerza y efectos no pueden en modo alguno y por ninguna circunstancia ser controlados o modificados, dan la propiedad al asesino”.6 Sin embargo, a posteriori el mismo tribunal agregó: “todas las leyes, así como todos los contratos, pueden ser controlados en su aplicación y efectos por máximas generales y fundamentales del common law. A nadie debe permitírsele obtener provecho de su propio fraude o sacar ventaja de sus propios actos ilícitos o fundar alguna reclamación en sus propias violaciones legales, o adquirir una propiedad mediante un delito propio”.7 El homicida —termina Dworkin— no recibió su herencia. 4 5
Ibidem, p. 19. Al lado de la específica diferencia entre reglas y principios enunciada más arriba, el propio Dworkin establece otras más: “...Ambos conjuntos de patrones apuntan a decisiones particulares sobre la obligación jurídica en circunstancias particulares, pero difieren en el carácter de la dirección que dan. Las reglas son aplicables a la manera «todo o nada». Si se dan los hechos estipulados por una regla, entonces, o bien la regla es válida, en cuyo caso la solución que proporciona debe ser aceptada, o no lo es, en cuyo caso en nada contribuye a la decisión”. Otra diferencia es la relativa a su peso o importancia. “...Los principios tienen una dimensión de la que las reglas carecen —la dimensión de peso o importancia—... Cuando los principios entran en conflicto... quien debe resolver el conflicto tiene que tomar en cuenta el peso relativo de cada uno... Las reglas no tienen esta dimensión... Si dos reglas entran en conflicto una de las dos no es regla válida”. Ibidem, pp. 21-26. 6 Ibidem, p. 20. 7 Idem.
632
JAVIER SALDAÑA
Con éste y otros ejemplos, Dworkin demuestra la operatividad de los principios en el razonamiento jurídico y deja ver también como dicha “exigencia de moralidad” tiene una presencia especialmente significativa en el derecho, particularmente en el razonamiento y decisión jurídica. Éste es el segundo asunto que vale la pena destacar, el hecho que el empleo de los principios jurídicos en la decisión judicial colocan al juez como la figura protagónica del derecho, figura que, habrá que tenerlo siempre presente, la concepción normativista había disminuido, y en culturas jurídicas como la mexicana la había prácticamente hecho desaparecer bajo la falsa creencia de que el juez es sólo la bouche de la loi. Conviene señalar, como puede verse, que en la teoría de principios de Dworkin, resulta especialmente relevante la figura del juez como protagonista del fenómeno jurídico, y concretamente de su razonamiento en la toma de decisiones. La alegoría que emplea Dworkin en otra de sus obras8 llamando al juez “Hércules”, da cuenta de la significativa función que éste desempeña en la determinación o concreción del derecho. Estas tesis encuentran su punto culminante en dos tópicos recurrentes: a) la vinculación entre el derecho y la moral, o mejor, la crítica a la tesis «a-valorativa» del derecho, lo que Bobbio calificaría como la separación entre el derecho que es y el derecho que debe ser,9 y, b) la creación del derecho por parte del juez. Ambos caracteres reflejan que dos de los más importantes postulados del positivismo, a saber, la separación conceptual del de re cho y la moral, y la fun ción mecáni ca del juez en la apli cación del derecho hoy resultan difícilmente sostenibles,10 o cuando menos fuertemente discutibles. Entendiendo a los principios jurídicos como aquellas normas con carácter vinculante (exigen el cumplimiento de un deber), cuyo contenido es necesariamente justo, habiendo sido creados por los juristas a través de una larga experiencia práctica y sirviéndole al juez para resolver un 8 Cfr. Dworkin, R., Los derechos en serio, trad. de Guastavino, M., Barcelona, Planeta-Agostini, 1993, pp. 177 y ss. 9 Este es uno de los caracteres fundamentales del positivismo jurídico según el profesor de la Universidad de Turín y según el cual “...En el lenguaje iuspositivista el término «derecho» carece de toda conotación valorativa o de toda resonancia emotiva: el derecho es derecho prescindiendo de que sea bueno o malo, de que sea un valor o un disvalor”. Bobbio, N., El positivismo jurídico, Madrid, Debate, 1993, p. 141. 10 Para un análisis detallado y agudo de éstas y otras inconsistencias del positivismo jurídico pueden verse en Serna, P., “Sobre las respuestas al positivismo jurídico”, Persona y Derecho, Pamplona, núm. 37, 1997, pp. 283-290.
REGLAS Y PRINCIPIOS
633
caso concreto o iniciar su labor agumentativa, siendo válidos en sí y por sí mismos, adquieren una especial relevancia en la interpretación jurídica, y actuan de manera determinante en la decisión judicial. Por eso, resulta una exigencia necesaria preguntarse sobre el origen histórico de aquéllos. Hasta ahora, buena parte de la bibliografía principialista ha puesto especial énfasis en problemas como la concepción de tales principios; su diferenciación con las reglas; o la clasificación y funcionalidad de éstos, etcétera; sin embargo, han recibido menos atención asuntos tan significativos como el del origen y evolución de dichos principios como fuente del derecho en la jurisprudencia romana. Las líneas que a continuación se exponen tienen este objetivo: referirse a la génesis y evolución histórica de los principios jurídicos en la jurisprudencia romana. II. PRINCIPIOS Y REGLAS EN LA JURISPRUDENCIA ROMANA11 En la investigación histórica sobre los principios jurídicos, buena parte de los teóricos les reconocen como característica importante haber sido elaborados por los juristas romanos a través de un largo proceso histórico de razonamiento, cuando tuvieron que enfrentarse a problemas concretos a lo largo de muchos años, e incluso de siglos. Eduardo García de Enterría, por ejemplo, reseña de mejor manera el valor de la jurisprudencia romana en la creación de dichos principios: “La superioridad del derecho romano sobre otros sistemas jurídicos históricos anteriores o posteriores estuvo justamente, no ya en la mayor perfección de sus leyes... sino en que sus juristas fueron los primeros que se adelantaron en una jurisprudencia según principios, la cual ha acreditado su fecundidad, e incluso, paradojicamente, su perennidad, y hasta su superior certeza, frente a cualquier código perfecto y cerrado de todos los que la historia presenta”.12 Como se puede observar en la cita anterior, uno de los grandes aportes de esta rica tradición romanista fue, sin duda, el de los principios del derecho, cuyo origen se encuentra en un particular periodo de dicha historia jurídica, aquella época que dió nacimiento a la ciencia jurídica y cuyo 11 La dotrina del derecho romano suele distinguir la expresión jurisprudencia entendida en dos sentidos, como ciencia del derecho en general, y también como la opinión o razonamiento de los saben de derecho, los jurisprudentes. En este trabajo nos referiremos a los dos sentidos, la significación del término depende del contexto en el que venga escrito. 12 García de Enterría, E., Reflexiones sobre la ley y los principios generales del derecho, Civitas, 1996, pp. 34 y 35.
634
JAVIER SALDAÑA
esplendor alcanza hasta nuestros días. Según creemos, este periodo fue el derecho romano, particularmente el derecho romano clásico, donde fueron empleados instrumentos técnico jurídicos como las regulae iuris, las que sin crear el derecho, sirvieron muchas veces de punto de partida en la actividad que ejercían los juristas romanos de tal época. Por eso, suele identificarse a las regulae iuris como uno de los sentidos de la expresión principios del derecho.13 Como se intentará mostrar más adelante, las regulae iuris del derecho romano, en especial el clásico, guardan una estrecha relación con lo que hoy conocemos como principios del derecho o principios generales del derecho. Esto es lo que ha motivado el presente trabajo, el cual pretende aproximarse al análisis de las regulae iuris como un concepto cercano a lo que Pound, Esser, Dworkin, Alexy y, en la cultura jurídica mexicana, Rolando Tamayo,14 califican como principios del derecho. Resumiendo, la pretensión del escrito se centra en analizar al menos uno de los muchos sentidos con los que se han calificado a estos principios, éste es, el que los juristas romanos conocieron como regulae iuris, o reglas del derecho romano;15 entendidas éstas como el propio Digesto las explica, 13 Un buen resumen de los diferentes sentidos con los que generalmente se emplea la palabra «principios» lo exponen Manuel Atienza y Juan Ruiz Manero al decir que éstos pueden ser comprendidos como: “a) «principio» en el sentido de norma muy general, entendiendo por tal la que regula un caso cuyas propiedades relevantes son muy generales. b) «principio» en el sentido de norma redactada en términos particularmente vagos, como el artículo 7, apartado 2 del Código Civil español «la ley no ampara el abuso del derecho o el ejercicio antisocial del mismo»... c) «principio» en el sentido de norma programática o directriz, esto es, de norma que estipula la obligación de perseguir determinados fines..., d) «Principio» en el sentido que expresa los valores superiores de un ordenamiento jurídico (y que son el reflejo de una determinada forma de vida), de un sector del mismo, de una institución, etcétera..., e) «Principio» en el sentido de norma dirigida a los órganos de aplicación del derecho y que señala, con carácter general cómo se debe seleccionar la norma aplicable, interpretarla, etcétera..., f) «principio» en el sentido de regulae iuris, esto es, de enunciado o máxima de la ciencia jurídica de un considerable grado de generalidad y que permite la sistematización del ordenamiento jurídico o de un sector del mismo. Tales principios pueden o no estar incorporados al derecho positivo”. Atienza, M., Ruiz Manero, J., Las piezas del derecho. Teoría de los enunciados jurídicos, Ariel, Barcelona, 1996, pp. 3 y 4. Cfr., Ruiz Manero, J., “Principios jurídicos”, El derecho y la justicia, Madrid, Trotta, 1996, pp. 151 y ss. 14 Cfr. Tamayo y Salmorán, R., Razonamiento y argumentación jurídica. El paradigma de la racionalidad y la ciencia del derecho, México, UNAM, 2003, pp. 111-120. 15 Para una visión introductoria cfr. Pugliese, G., “I principi generali del diritto. L’esperienza romana fino a Diocleziano”, en varios autores, I principi generali del diritto, Roma, Accademia Nazionale dei Licei, 1992, pp. 69-87.
REGLAS Y PRINCIPIOS
635
como “la que describe brevemente cómo es una cosa. No que el derecho derive de la regla, sino que ésta se abstrae del derecho existente. Así, pues, mediante la regla se transmite una breve descripción de las cosas”.16 O también como Peter Stein al señalar que éstas son: “reglas detalladas de extensión limitada, generalizaciones que señalaban el camino de una área definida del derecho establecido”.17 Y a continuación establece que “éstas sirvieron como indicaciones o guías, y algunas podían ser directamente aplicadas”.18 Por nuestra parte, agregaríamos la idea de que las regulae iuris de los juristas romanos a las que nos referiremos son normas, (como los principios por su caráter de deber), con un verdadero efecto vinculante (igual que los principios) cuyo valor radica en sí y por sí misma, independientemente de los juristas que las dieron. Para tal efecto hemos creído conveniente desarrollar el trabajo del siguiente modo: explicaremos, de manera general, el contexto histórico en el que surgieron las reglas del derecho; quíenes fueron los juristas romanos tardo-republicanos que las elaboraron; las características generales del derecho romano clásico, y cuáles fueron sus fuentes. Con esto pretendemos confirmar la tesis de que uno de los antecedentes de los principios del derecho fueron las regulae iuris, y que el contenido de éstas es justo o equitativo. Finalmente hemos también de señalar que éste no es un trabajo cuyo enfoque pertenezca al derecho romano, aunque mucho tiene que ver con éste; su orientación es más de filosofía del derecho. III. CONTEXTO HISTÓRICO-JURÍDICO DE LAS REGULAE IURIS EN EL DERECHO ROMANO CLÁSICO
Con algunas diferencias no significativas para lo que aquí nos interesa destacar, la mayor parte de los romanistas contemporáneos dividen la historia del derecho romano en los siguientes periodos históricos: el primero abarcaría de la Ley de las XII Tablas hasta la época clásica de este derecho.19 su inicio se coloca aproximadamente entre los años 16 17
D. 50, 17. I. (Paul. 16 Plaut). Stein, P., Regulae Iuris. From Juristic Rules to Legal Maxims, Edinburgh University Press, 1996, p. 101. 18 Idem. 19 En este periodo de la historia del derecho romano se podrían comprender los dos periodos que Schulz denomina «arcaico» y «helenístico». Cfr. Schulz, F., Storia della
636
JAVIER SALDAÑA
451-450 a. C. extendiéndose hasta el 100 o 130 también antes del nacimiento de Cristo.20 El segundo es el conocido por la mayoría de los autogiurisprudenza romana, Sansoni, Florencia, 1968, pp. 47-64. Cfr. Gaudemet, J., Institutions de L´Antiquité, París, Sirey, 1967, p. 254 y ss. 20 La etapa arcaica del derecho romano estuvo constituida fundamentalmente por un tipo de derecho no desarrollado, característico de una sociedad poco adelantada y cuyas relaciones jurídicas eran plenamente satisfechas por la práctica cotidiana. De este modo, la repetición de comportamientos basados principalmente en el intercambio de bienes de las pequeñas comunidades familiares fue creando un tipo de derecho basado en la costumbre de las mismas prácticas (mores). Guzmán Brito ha señalado, a propósito de este derecho que: “El limitado dinamismo del tráfico jurídico hizo innecesario un desarrollo mayor de la parte más fluida del derecho patrimonial, como es el de las obligaciones. El formalismo externo, más calificable incluso de ritualismo, y una cierta indiferenciación de conceptos y actos jurídicos, son las características más salientes del estilo del derecho arcaico…”. Guzmán Brito, A., Derecho privado romano, Editorial Jurídica de Chile, 1996, t. I, p. 22. Se menciona como primeros encargados de elaborar este derecho arcaico a I collegi sacerdotali. Generalmente se suele poner atención en tres grupos: el de los potífices, los fetiales y los augures. La función principal de los primeros tenía que ver con las ceremonias religiosas que en la ciudad se celebraban, no sólo asistiendo a presidir dichas ceremonias, sino también en dar su parecer sobre ellas. Muchos sacrificios y varios cultos menores eran directamente asistidos por los «pontífices». Cfr. Talamanca, M., (dir.), Lineamenti di storia del diritto romano, 2a. ed., Milán, Giuffrè, 1989, p. 26. Algunos otros autores reconocen cuatro grupos dentro del colegio, agregando los decemviri sacris faciundis, Cfr. infra, nota, 25. Dos más serían las tareas técnicas de este colegio pontifical: “la elaboración y aplicación de la primitiva norma relativa a la vida de la comunidad y la enunciación del calendario”. “El colegio de pontífices en sustancia aparece como el depositario de un saber «técnico» y constituye, desde este punto de vista, el mecanismo apto para garantizar la memoria colectiva de la ciudad”. Ibidem, p. 27. En cuanto al colegio de feziali se refiere, estos eran competentes para las relaciones internacionales de Roma. Su competencia los llevaba a celebrar tratados entre dos comunidades, a potencializar la relevancia internacional que Roma iría aquiriendo, a regular la presencia de extranjeros en el territorio romano, declarar la guerra justa a aquellos pueblos que hubieren ultrajado a ciudadanos romanos, celebrar la paz, las nuevas alianzas, etcétera. Cfr. Idem. La tarea de los augures estuvo relacionada con la búsqueda de fortuna con los dioses y comprender o buscar la voluntad de éstos. Se reconoce entonces que en la etapa arcaica del derecho romano existió una estrecha relación entre el derecho y la religión, confundiéndose los preceptos religiosos con los de derecho. Guzmán Brito menciona como nombres de este periodo a “Marco Porcio Catón padre (234-149 a. C., consul en el 195 y censor en el 184) e hijo (192-152 a. C., ), P. Mucio
REGLAS Y PRINCIPIOS
637
res como periodo clásico del derecho romano, ubicado entre esta última fecha y el 230 d. C.21 El tercer periodo histórico es la época posclásica del derecho romano, marcado por la muerte del importante jurista romano Ulpiano (224), tal espacio abarca todo el tiempo posterior al 230, y llega aproximadamente hasta Justiniano, cerca del 565 d. C.22 En la vida política dichos periodos más o menos coinciden con los años de la Monarquía y final de la República romana; el principado y finalmente el dominato y la época justineanea.23 En estas etapas históricas de Roma se sentarán las bases de todo el derecho ulterior del mundo occidental, el cual se irá formando durante veinte siglos de historia, constituyendo, en expresión de Guzmán Brito, “símbolo y realidad de todo lo que viene expresado en la idea de unidad jurídica”.24 En términos generales, las características del periodo arcaico o preclásico del derecho romano son las siguientes: un derecho arcaico basado en respuestas de los juristas y fórmulas antiguas;25 una organización judicial integrada por un colegio pontifical de corte aristocrático;26 una Escévola (pontífice máximo, consul en el 133 a. C.), M. Junio Bruto y Manio Manilio (cónsul en el 149 a. C.)”. Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 23. 21 Cfr. Ibidem. Hacemos nuestra la fecha señalada por Guzmán Brito aunque reconocemos que algunos otros autores manejan una diferente. Cfr. Morineau Iduarte, M., Iglesias Gonzalez, R., Derecho romano, 3a. ed., México, Harla, 1993, pp. 9 y 17. 22 Para una visión general de las etapas del derecho romano Cfr. Franciosi, G., Corso istituzionale, di diritto romano, Turín, Giappichelli, 1994, pp. 5-26. Cfr. Burillo, J., “The Periods of Roman Law”, Revista de Estudios Histórico-Jurídicos III, Valparaíso, 1978, pp. 13-26. 23 Para una visión general de las características en cada uno de estos periodos, cfr. Talamanca, M., (dir.), Lineamenti di storia del diritto romano, 2a. ed., Milán, Giuffrè, 1989. 24 Guzmán Brito, A., “La función del derecho romano en la unificación jurídica de Latinoamérica”, Materiali I. Derecho romano y unificación del derecho. Experiencia europea y latinoamericana. (Con especial atención a la responsabilidad extracontractual), Roma, Università degli Studi Roma «Tor Vergata», 1999, p. 130. 25 Cfr. en este punto op. cit., nota 19, p. 45 y 50. 26 Cfr. Ibidem, pp. 47-50. Desde sus orígenes y durante los primeros siglos, la “Jurisprudencia se consideraba labor propia de los pontífices. Éstos formaban el más importante de los cuatro colegios sacerdotales, tenían competencia en cuestiones de derecho sagrado y también de derecho civil, ya que el derecho estaba profundamente vinculado a la Religión. Los pontífices eran los supremos intérpretes del fas o voluntad de los dioses y de las antiguas mores o costumbres que formaban el núcleo principal del derecho arcaico. Los sacerdotes guardaban celosamente el calendario judicial, en él se indicaban los días propicios para las contiendas judiciales, sin ofender a los dioses, y el formulario ritual de los actos procesales en las acciones de la ley, en estos actos debían pronunciarse determinadas palabras solemnes, que si se olvidaban o sustituían hacían perder el litigio. La íntima unión del derecho con la religión en el mundo antiguo, hace que los pontífices
638
JAVIER SALDAÑA
cierta tendencia, aunque muy tenue, a distinguir el derecho sacro del derecho profano,27 existiendo una especie de sincretismo jurídico, mezcla de derecho y religión y, finalmente, una especial atención a los asuntos de derecho privado.28 Al final de la República romana, la historia evidenciará cómo Roma, habiendo conquistado a gran parte del mundo conocido, anexando sus pueblos y esteblaciendo relaciones con ellos, sintió la necesidad de construir una nueva cultura jurídica capaz de responder a las exigencias que la realidad presentaba; es así que en este tránsito la práctica jurídica evolucionó hasta llegar a ser el factor principal de la historia del derecho privado romano. Este acontecimiento encuentra su aclaración en último extremo, en la poderosísima revolución económica y social que se consuma coincidiendo con la transformación de Roma en una potencia universal. En un plazo muy corto, Roma como simple centro de Italia pasó a ser el centro de toda la actividad del mundo. Y es natural que semejante extensión de la influencia económica de Roma no pudiera basarse con las rígidas formas del antiguo derecho.29
A partir de aquí asistimos a una transformación del derecho romano y de su reflexión. Los juristas se fueron perfeccionando en el razonamiento; renovando, interpretando sus viejas concepciones y creando un nuevo derecho cuyo objetivo fue el bienestar de la civitas, llevando al derecho a considerarlo como un “arte” propio de una clase privilegiada. Villey ha dibujado este tránsito con especial claridad al señalar que: A pesar del apego que profesan al menos en apariencia a la tradición romana, ya no creen en el sacrosanto valor de los antiguos ritos del derecho quiritario, de la misma manera que ya no creen apenas en la vieja religión romana. Comprenden que el objetivo del derecho es, en definitiva, la utilidad para los hombres, su bienestar, su propiedad, su buen entendimiento, incluso si esta utilidad exige liberarse de las antiguas tradiciones, conserse consideren como intérpretes supremos de las cosas divinas y humanas; por ello, además de aconsejar sobre la acción a ejercitar (agere), indicaban a los particulares los esquemas o fómulas de los contratos y negocios jurídicos que querían realizar (cavere)”. García Garrido, M. J., Derecho privado romano II. Casos y decisiones jurisprudenciales, distribuidora Dykinson, Madrid, 1980, pp. 7 y 8. 27 Op. cit., nota 19, p. 61. 28 Cfr. Villey, M., El derecho romano, México, Publicaciones Cruz O., 1993, pp. 7-17. 29 Jörs, P., Kunkel, W., Derecho privado romano, Barcelona, Labor, 1937, p. 11.
REGLAS Y PRINCIPIOS
639
vadas por una especie de temor religioso, incluso si esta utilidad exige que se rompan las cadenas del formalismo. Y comprenden que importe a la justicia, como dicen los filosófos griegos, mantener entre los ciudadanos una cierta igualdad, proporcional a las cualidades y a la importancia de cada uno; abrir a los extranjeros el campo de la protección judicial; promover el respeto de la palabra dada, el culto de la buena fe, la humanidad, la benevolencia, la “piedad” entre parientes cercanos.30
1. La figura del praetor en la jurisprudencia Figura importante en el surgimiento y desarrollo del arte jurídico romano fue sin duda la del praetor, creada en el 367 a. C. con una finalidad bien específica: la de ordenar los litigios de los particulares a partir del ejercicio de la iurisdictio,31 Ésta tenía lugar en la fase in iure del proceso y se desarrollaba delante del tribunal del praetor, “dado que como los romanos mismos advertían, ius indicaba, en esta concepción, el tribunal mismo como lugar donde el magistrado ejercitaba, en el foro, su actividad jurisdiccional”.32 Esta función llevó a reconocer en la figura del praetor y en el ius que dictaba, una de las principales fuentes de producción o creación del derecho.33 30 31
Villey, M., El derecho romano, cit., nota 28, p. 20. Convendría señalar la distinción existente entre la expresión iurisdictio del derecho romano y la jurisdicción del derecho moderno. “Bajo la expresión jurisdicción se contiene la función judiciaria convenida en su complitud: y a los organos del Estado previstos de jurisdicción y solicitados de resolver con pronunciada autoridad las controversias procesales. Con el término de jurisdicción se designa, después, tales funciones, sea en relación a los procesos privados que a los públicos, y sobre todo penales... La iurisdictio romana se refiere, en modo tendencialmente exclusivo a los procesos privados y comprende solamente la actividad que desarrolla el magistrado en la face in iure del proceso, actividad que permite la impostación de los términos de la controversia...”. Talamanca, M. (dir.), Lineamenti di storia del diritto romano, cit., nota 23, p. 132. 32 “En la fase in iure de la legis actione, el pretor era sobre todo un garante del exacto cumplimiento del rito, que consistía en pronunciar una serie de fórmulas solemnes, que debían ser adaptadas, con pequeños cambios, a las particularidades contingentes del caso concreto...”. Ibidem, p. 134 y 135. 33 Por mencionar un ejemplo tenemos el caso de la creación de fórmulas nuevas que Villey enuncia: “Los pretores, guiados por los jurisconsultos, se mostraron inclinados a admitir nuevas fórmulas orales, en el tiempo de los pontífices. Sea porque el abandono de los viejos ritos había sido el primer paso determinante en el cambio de la emancipación; sea porque las fórmulas escritas parecen descansar, además, en una convención entre los litigantes; la aparición del procedimiento formulario abre un nuevo periodo de creación de fórmulas”. Villey, M., El derecho romano, cit., nota 28, p. 24. Eso último se puede decir
640
JAVIER SALDAÑA
El praetor alcanzó especial relevancia en esta época y en la siguiente, precisamente porque su labor fue eminentemente jurídica, y se tradujo en la creación de nuevas acciones y principios emergidos de las propias necesidades sociales, los que guardaban criterios equitativos como factor común entre ellos.34 La figura del praetor y particularmente su método de razonamiento, entrarán en este dinamismo de las relaciones jurídicas, que tuvieron como base no el formalismo, característico del derecho antiguo, sino un derecho más circunstancial, basado en la complejidad de las relaciones sociales y económicas que el desarrollo de la actividad romana necesitaba. “La práctica, pues, tuvo que señalarse su camino, que era el bastarse a sí misma”.35 De este modo, la interpretación realizada por el praetor pasó de ser puramente estática y subordinada al ius civile, a convertirse en el eje de la creación del derecho, donde caso a caso se ofrecía una respuesta equitativa, convirtiéndose en una interpretación no fija, sino “evolutiva”.36 Basado su razonamiento en criterios eminentemente justos o equitativos, muchas veces estos argumentos llevaron al praetor a proponer una decisión jurídica por encima del texto normativo, pues el objetivo final era alcanzar lo justo en el caso concreto. Dejando la figura del praetor, se suele señalar, en esta primera jurisprudencia preclásica, una serie de rasgos distintivos que llegarán después al derecho clásico. Dentro de tales características podemos mencionar las siguientes.37
del nuevo procedimiento que enriquecerá el derecho con el abandono de las fórmulas orales. Cfr. Ibidem, pp. 21 y ss. Sobre la misma creación del derecho por parte del pretor cfr., Talamanca, M. (dir.), Lineamenti di storia del diritto romano, cit., nota 23, p. 132. 34 En este punto resulta especialmente significativo la función formal, pero sobre todo el contenido que se puede reconocer en el edicto del pretor como un documento en el que la aequitas jugaba un papel preponderante. Cfr. Vacca, L., La giurisprudenza nel sistema delle fonti del diritto romano, Turín, Giappichelli, 1989, pp. 44-49 y los ejemplos citados, especialmente D. 37. 1. 6. (Paul. 41. ed); D. 44. 4.1 (Paul. 71. ed.) y D. 44. 4. 12 (Pap. 3. quaest). 35 Jörs, P., Kunkel, W., Derecho privado romano, cit., nota 29, p. 11. 36 Cfr. Vacca, L., La giurisprudenza nel sistema delle fonti del diritto romano, cit., nota 34, p. 51. 37 En esta parte seguimos a Schulz, op. cit., nota 19. Debemos aclarar que aquí intentaremos destacar sólo aquellas notas comunes y más significativas de los periodos que Fritz Schulz califica como periodo arcaico y helenístico por ser justamente previos al que nos interesa destacar, esto es, el clásico.
REGLAS Y PRINCIPIOS
641
2. Una ciencia del derecho hecha por juristas La jurisprudencia de esta época fue esencialmente aristocrática. Es decir, quienes elaboraron y pensaron el derecho fueron personas pertenecientes a una clase especial, que fue la de los juristas. Así, “los juristas de este periodo provenían de las más respetables familias romanas. Esto confería a la ciencia una atmósfera de distinción que prevalece hasta la terminación del periodo clásico”.38 Fritz Schulz ha hecho notar esto al reconocer que los juristas de esta época tenían como regla general esperar que el caso se presentara, y de decidir caso por caso. El mismo autor señalará posteriormente la aversión que el jurisprudente tenía por la legislación y el especial cuidado que mantenía porque ésta no invadiese el dominio del verdadero derecho del jurista.39 De aquí se entiende que reglas generales abstractas y cerradas no fueron nun ca dedu cidas de las respon sa, pues és tas de cidían ca sos in di vi duales; y las fór mu las de los negocios jurídicos quedaban abiertos a las modificaciones.40 En este periodo histórico, los juristas contaban, en la disputa jurídica, con su auctoritas, por la cual podían crear o modificar el derecho. Así, la legislación estatal (lex rogata) era usada lo menos posible, salvo en los casos en que fuera forzosamente indispensable.41 Esto dió a la jurisprudencia romana un carácter “dúctil” o “menos formalista” en la interpretación y aplicación del derecho. La interpretación, en un tiempo más cercano al periodo clásico, nunca se ocupó de la ley o de los libros de texto, ni de la exposición o discusión del derecho salvo en aquellos casos en que tanto ésta como el responsum sirvieran para el progreso y desarrollo del derecho. En definitiva, lo que más interesaba al jurista tardo republicano o preclásico era salvar al máximo la “pretificación y esterilamiento” del derecho.42 3. Jurisprudencia anti-formalista Una característica importante en este periodo fue, sin duda, la cada vez más disminuida formalidad en el derecho. Esto no significó la supre38 39 40 41 42
Ibidem, p. 47 y 115. Cfr. Ibidem, p. 49. Cfr. Idem. Cfr. Ibidem, pp. 115-118. Cfr. Ibidem, p. 116.
642
JAVIER SALDAÑA
sión de tal carácter, sino el gradual abandono de su rigidez. Los juristas entonces contaron con una mayor flexibilidad en sus interpretaciones, aunque siguieron manteniendo viejas fórmulas jurídicas que venían todavía observando. Schulz señalará que: “después de la lex aebutia, la forma arcaica de las legis actiones vinieron gradualmente sustituidas por fórmulas más flexibles”.43 Conviene hacer notar, en este mismo sentido, que a pesar de este gradual abandono, todavía se conservó mucha de la tradición del formalismo, sobre todo en los asuntos de carácter privado como los contratos y testamentos, en los que fue preferida la fórmula oral a la escrita, quedando esta última apenas como un documento probatorio.44 La oralidad que se mantuvo en el derecho romano al final de la República se basaba en la fuerte tradición griega que en aquel tiempo ya se había instalado en la cultura jurídica, dicha oralidad se apoyó en la contrapo si ción de ar gu men tos y la con secuen te for mu la ción de breves conclusiones a los problemas planteados. Así, la jurisprudencia, que al inicio se caracterizó por un formalismo de las acciones (entendiendo la tendencia a revestir todo lo jurídico de una forma definida) y de la interpretación jurídica (aunque en esta última en menor medida sobre todo por lo que se refiere al derecho privado), fue gradualmente disminuyéndose al final de la República.45
43 44
Cfr. Ibidem, p. 144. Idem. El proceso de oralidad, según Villey, fue probablemene debido a la presencia cada vez mayor de extranjeros dentro del territorio romano pues el pretor nunca quiso proteger más a un ciudadano romano que a un extranjero. En el caso de la propiedad, el juez nunca distinguió entre el peregrino y un ciudadano romano, pues mediante una ficción los equiparaba. Para ilustrar lo anterior Villey propone el siguiente ejemplo: “un peregrino va a buscar al pretor para reclamar la cosa de la que se considera propietario, que se encuentra en manos de otro. Una pretensión de esta clase se admite entre los ciudadanos romanos; en efecto, este romano puede emplear en el tribunal la fórmula oral siguiente: «Yo digo que esta cosas es mía en virtud del derecho quiritario, etc.». De la misma manera el juez aceptará que un peregrino comience una instancia judicial dirigiendo al juez la fórmula escrita siguiente: «Si ocurre que una cosa es de un litigante, en virtud del derecho quiritario, etcétera... el juez condena al demandado a pagarle el valor de esta cosa». Así el proceso se desarrollará en los mismos términos que entre los ciudadanos”. Villey, M., El derecho romano, cit., nota 28, p. 23. 45 Habría que señalar, como se ha apuntado, que dicha oralidad sólo fue mantenida en el campo del derecho privado, pero en el resto del derecho se continuó conservando las fórmulas escritas. Cfr. Ibidem, p. 22.
REGLAS Y PRINCIPIOS
643
4. Actividad dialéctica en la jurisprudencia tardo-republicana Otra característica más en este periodo es el empleo de la dialéctica griega en el razonamiento jurídico, que se “dirigió acertadamente al estudio sistemático de los géneros y especies legales”.46 En este momento, la dialéctica se habría de convertir en el método de discusión y análisis por antonomasia del derecho, que como ciencia práctica buscaba obtener una verdad igualmente práctica del problema. Es cierto, como ha señalado Kunkel, que no existió una ciencia jurídica griega que fuera trasladada a Roma, “pero es un hecho que la retórica de Grecia halló muy buena acogida por ofrecer una serie de puntos de vista nuevos y formular nuevos problemas, y sobre todo el método dialéctico, en el que se basaba la ciencia griega, hubo de adquirir una importancia capital en la evolución de la jurisprudencia romana”.47 Lo anterior parece un lugar común entre los romanistas, quienes reconocen que así como el progreso de la jurisprudencia romana se debió en gran medida al aporte helenístico (recuérdese el uso de las categorías dialécticas genera y species, y los métodos de divisio y partitio), la jurisprudencia romana elaboró sus propios procesos lógicos de razonamiento a partir de los principios dialécticos, “El método y la técnica jurisprudencial son típicamente romanos y en todas sus etapas, desde la jurisprudencia pontifical a la burocrática...”.48 El derecho casuístico para la resolución del caso fue originariamente patrimonio romanista. Conocida y empleada la distinción entre tópica y dialéctica por parte del jurisconsulto romano, lo más significativo de tal empleo fue justamente la elaboración de reglas jurídicas (regulae iuris) que el jurista 46 En este punto puede verse la bien resumida exposición sobre la Dialéctica en el derecho romano en: Magallon Ibarra, J., M., La senda de la jurisprudencia romana, UNAM, México, 2000, pp. 101-123, principalmente, 102 a 106. 47 Jörs, P., Kunkel, W., Derecho privado romano, op. cit., nota 29, p. 31. En este sentido Schipani, citando a Pugliese señalará que éste “puntualiza también la diferencia, y subraya la importancia, entre derecho casuístico jurisprudencial y derecho casuístico judiciario, porque el primero lleva la marca de la jurisprudencia. De hecho, la época clásica fue indudablemente caracterizada por un tal número y de una tal relevancia de preceptos particulares y concretos que no encuentran parangón en los sistemas romanizados modernos…”. Schipani, S., La codificazione del diritto romano comune, Turín, Giappichelli, 1999, p. 10. 48 García Garrido, M. J., Derecho privado romano..., cit., nota 26, p. 18.
644
JAVIER SALDAÑA
extrae inmediatamente de la observación de las relaciones de la vida, y que recoge de la ratio iuris. Tales reglas, como máximas, comenzaron a ser elaboradas al final del periodo republicano, encontrando su mayor auge en el periodo clásico de este derecho.49 En este sentido, los juristas romanos de esta época —señalará Villey— practican menos la deducción que la discusión dialéctica. Cuando el jurista romano da su opinión sobre un caso planteado “se esfuerza por aportarle un tratamiento parecido al que podrían recibir los casos análogos, con el fin de que la justicia sea igual para todos. Así, produce reglas generales; sin olvidar el caso, sin pretender la permanencia de estas reglas”.50 “A lo que el jurista romano aspira es a encontrar, …la regla que resulta de la naturaleza de las cosas, de la naturaleza de las relaciones que la vida crea”.51 IV. JURISTAS ROMANOS TARDO-REPUBLICANOS Estas fueron, en términos generales, algunas de las más significativas características de finales de la República en las que habrían de formarse importantes juristas cuyas enseñanzas servirían para sentar las bases del periodo posterior. La influencia y aportación teórica de ellos llegaría a constituir una verdadera revolución científica en el pensamiento jurídico del mundo antiguo. De estos autores destacan tres figuras especialmente significativas: Quinto Mucio Scevola; Servio Sulpicio Rufo; y Marco Tulio Cicerón.52 Este último, a pesar de no ser jurista (Cicerón reconocía en la actividad jurisprudencial una actividad de segunda importancia después de la oratoria), contaba con la formación y cultura jurídica que harían reconocerlo como uno de los hombres más influyentes de finales de la República romana.
Cfr. Ibidem, p. 22. Villey, M., El derecho romano, op. cit., nota 28, p. 33. Schulz, F., Principios del derecho romano, Madrid, Civitas, 1990, p. 55. Al lado de estos y poco antes de ellos destacan igualmente los nombres de Publio Mucio Scevola; Publio Licinio Crasso Muciano, entre otros. Guarino, A., Storia del diritto romano, 8a. ed., Nápoles, Editore Jovene Napoli, 1990, p. 10. 49 50 51 52
REGLAS Y PRINCIPIOS
645
1. Quinto Mucio Scevola53 Siendo considerado por muchos como el más importante jurista romano, la figura de Quinto Mucio Scevola adquiere una doble importancia. Por una parte, Scevola empleó por primera vez en la sistematización de su obra el método dialéctico heredado de la tradición griega, convirtiendo al derecho en una obra científica que hasta él difícilmente se encuentra en la cultura jurídica romana. Esto lo confirma Stein al señalar que “la primera obra que muestra claros signos del influjo de la filosofía griega es la de Quinto Mucio Scevola...”.54 En tal sistematización se encuentra por primera vez, “una específica e individualizada estructura formal del discurso (generatim), que emerge como caracterizante del «tipo de opera», y al mismo tiempo como caracterizante en modo «constitutivo» del objeto, asentándolo, estabilizando en una forma que se transforma en muy propia”.55
53 Quinto Mucio Scevola fue hijo de Publio Mucio Scevola. Schiavone escribirá en una de sus notas que el primer Quinto Mucio Scevola del que se tiene noticia fue pretor en el 215 (y quizá cónsul en el 220) fue «decemvir sacris faciundis» en el 209. Sus hijos, Publio Mucio Scevola y Quinto Mucio Scevola fueron, el primero pretor en el 179 y consul en el 175; el segundo pretor todavía en el 179 y cónsul en el 174. Uno de los hijos de Publio Mucio fue Publio Mucio Scevola, cónsul y pontífice máximo. Cfr. nota 1 del capítulo primero de Schiavone, A., Guiristi e Nobili nella Roma republicana. Il secolo della rivoluzione scientifica nel pensiero giuridico antico, Bari, Laterza, 1987, p. 192. En el mismo Digesto se puede leer: “La ciencia del derecho civil la han profesado muchas personas importantes, pero ahora se ha de hacer mención de aquellas que gozaron de la máxima reputación en el pueblo romano, para que se vea quiénes y cuán calificados fueron los autores de este derecho que hoy tenemos... Luego, Quinto Mucio, hijo de Publio, que fue pontífice máximo, fue el primero en sistematizar el derecho civil en una obra de diez y ocho libros...”. D. 1. 2. 41. 54 Stein, P., “Lo svolgimento storico della nozione di «regula iuris» in dititto romano”, Antologia giuridica romanistica ed antiquaria I, Milán, Facoltà di Giurisprudenza di Milano, 1968, p. 100. Cfr. también en este punto Vacca, L., La giurisprudenza nel sistema delle fonti del diritto romano, cit., nota 37, p. 68 y ss. 55 Schipani, S., La codificazione del diritto romano comune, op. cit., nota 47, p. 202. Resulta especialmente significativo lo que Sandro Schipani destaca, a propósito del Generatim de Scevola cuando dice que “implicaba el uso de categorías que articulan un todo, y que a su vez reagrupan más especies. Es un término que viene usado también para designar una de las más significativas operaciones lógicas, cuyo conocimiento y clasificación había sido afinada en la dialéctica griega difundida en Roma hasta el fin del siglo II a. C, e integrada en el instrumentario que era retenido como necesario siendo usado para redactar la obra...”. Ibidem, p. 204.
646
JAVIER SALDAÑA
El segundo punto de importancia radica en el hecho de que en la obra de este jurista romano se encuentran ya “fijados los exactos límites... de las nociones jurídicas, que en términos generales eran ya de tiempo conocidas”.56 Fue, probablemente el primero en configurar este derecho como un sistema de conceptos y conjunto de reglas e intituciones.57 Scevola “recoge las reglas que serán utilizadas directamente por los compiladores justinianeos. Tal individualización de las reglas corresponde a la exigencia, difusa durante la tardía república, de dominar la casuística y la compleja forma jurídica derivadas del extenso trafico y actividad creativa del pretor”.58 Ejemplos de esta individuación en la obra de Mucio Scevola los encontramos en el mismo Digesto. En el libro XLI, Título I. Sobre la adquisición de la propiedad de las cosas, se puede leer: “Los fundos ajenos que una persona incluye en la declaración para el censo no por ello se hacen de su propiedad”.59 Igualmente la siguiente: “El propietario de un fundo gravado con una servidumbre de acueducto puede hacer en aquel fundo una acequia por donde quiera, con tal de que no perturbe la servidumbre”.60 Como se puede ver, la labor dialéctica y de sistematización se encontraban ya en el pensamiento de este autor. 2. Servio Sulpicio Rufo Mientras Quinto Mucio Scevola fue calificado como el más importante sistematizador del derecho romano, dándole a éste el carácter de científico, Servio Sulpicio Rufo desarrollará significativamente la técnica de la respuesta. Inscrito en el mismo grupo de juristas que emplearon la dialéctica, “desarrollará un saber científico en donde el punto de apoyo es representado precisamente del análisis de los casos”.61 Su influencia estriba, según reconocerá el mismo Cicerón, en ser el primero y más valioso representante de la dialéctica jurídica, “como el nuevo Prometeo”, ca56 57
Idem. Cfr. Stein, P., “Lo svolgimento storico della nozione di «regula iuris» in dititto romano”, Antologia giuridica romanistica ed antiquaria I, cit., nota 54, pp. 100 y ss. 58 Un detallado análisis de la obra de Quinto Mucio Scevola en Talamanca, M. (dir.), Lineamenti di storia del diritto romano, cit., nota 23, pp. 335-337. 59 D. 41.1.64. (Q. Muc. Scaev. hor). 60 D. 43.20.8. (Q. Muc. Scaev. hor). 61 Vacca, L., La giurisprudenza nel sistema delle fonti del diritto romano, cit., nota 34, p. 55.
REGLAS Y PRINCIPIOS
647
lificativo que resultaba ser poco menos que exagerado según Schulz,62 quien reconociendo lo anterior señalará que el mismo Servio se mostrará muy cauto en el empleo del nuevo método.63 En cualquier caso, Servio Sulpicio Rufo pasará a la historia por haber sido igualmente uno de los primeros juristas en emplear la dialéctica en su razonamiento jurídico y hacer uno de los primeros comentarios al Edicto del pretor.64 Su importancia fue también reconocida por haber dejado un extenso círculo de discípulos que ocuparon las primeras filas entre los juristas de aquella época, y dejar así sentada la influencia de su pensamiento.65 Con estos dos juristas romanos se inicia por tanto una nueva manera de razonar, crear y aplicar el derecho, el cual pasará a ser un arte que como tal no responde a estructuras fijas, sino que va formándose caso a caso, y donde el criterio de individualización del asunto “puede encontrarse en el saber ya sedimentado o necesita adaptaciones, innovaciones, discusiones de principios ya en precedentes individualizaciones pero que no pueden ser aplicadas al caso concreto porque éste se diferencia de otros, sólo aparentemente similares. La argumentación se desata introduciendo distinciones, formulando definiciones, interpretándolas y corrigiéndolas”.66 3. Marco Tulio Cicerón De este mismo periodo histórico conviene destacar la figura de Cicerón, quien a pesar de no ser jurista poseía una gran cultura jurídica. Su importancia para nosotros, como lo han sido los anteriormente citados, es doble:67 por una parte, Cicerón es uno más de los pensadores romanos en el que especialmente se observa el empleo del método dialéctico en sus argumentos como orador. De igual modo, es quien propondrá el 62 63 64 65 66
Cfr. Schulz, cit., nota 51, p. 132. Idem. Cfr. Jörs, P. y Kunkel, W., Derecho privado romano, cit., nota 29, p. 33. D. 1. 2. 43 y 44. Vacca, L., La giurisprudenza nel sistema delle fonti del diritto romano, cit., nota 34, p. 72. 67 Sabemos muy bien que la figura de Cicerón constituye una de las más importantes y significativas personalidades en la retórica y su relación con el derecho. Sin embargo, centraremos nuestra atención sólo en algunos puntos que resultan significativos para nuestro trabajo.
648
JAVIER SALDAÑA
mismo método dialéctico para el razonamiento de la ciencia del derecho,68 particularmente en el derecho civil.69 En este sentido podemos hacer notar lo que Schulz ha apuntado refiriéndose al empleo de la dialéctica por parte del jurista romano. Escribe Schulz que “La distinctio representaba el primero, más no el último paso en el proceso dialéctico. Una vez distinguidos los géneros y las especies, la tarea siguiente era descubrir el principio que lo gobernaba”.70 La búsqueda del o de los principios que regían el derecho. Se ve con claridad
68 “Casi todas las cosas que ahora están incluidas en artes, estuvieron dispersas y disociadas en otro tiempo; por ejemplo, en la música, los números y las voces y los modos; en la geometría, las líneas, las formas, los intervalos, las magnitudes; en la astrología, la revolución del cielo, el orto, el ocaso y los movimientos de las estrellas; en la gramática, el estudio a fondo de los poetas, el conocimiento de las historias, la interpretación de las palabras, el sonido preciso de pronunciarlas; en este mismo método de decir, finalmente, de excogitar, ornamentar, disponer, recordar, actuar, les parecían en otro tiempo a todos cosas ignoradas y latamente diseminadas. Fue empleado, por consiguiente, cierto arte de fuera, tomado de cierto género diferente que para sí asumen todos los filósofos, para que conglutinara el asunto desperdigado y desunido, y lo concatenara en un cierto método. Sea ésta, por lo tanto, la finalidad del derecho civil: la conservación, en los asuntos y las causas de los ciudadanos, de la equidad legítima y usada. Entonces deben ser distinguidos los géneros, y reducidos a número cierto y a cantidad pequeña. El género es eso que abarca dos o más partes, semejantes entre sí merced a cierta comunidad, pero diferentes en apariencia; las partes son las que están subordinadas a esos géneros de los cuales emanan; y debe ser expresada con definiciones cuál fuerza tienen todos los que son nombres de los géneros o de las partes: la definición es, en efecto, una como explicación breve y circunscrita de las cosas que son propias de lo que queremos definir. A estas mismas cosas les añadiría yo ejemplos, si no viera ante quiénes es sostenido este discurso; concluiré ahora con brevedad lo que he planteado: si, en efecto, me fuera lícito hacer eso que ya hace tiempo medito, o si cualquier otro, estando yo impedido, lo hiciera antes, o, estando yo muerto, lo realizara-primero, repartir todo el derecho civil en géneros, que son muy pocos; luego distribuir los miembros, por así decir, de esos géneros; declarar entonces con una definición la fuerza propia de cada uno- tendríais un arte perfecto del derecho civil, más opulento y magno que difícil y obscuro…”. Ciceron, Dell’oratore, 1, 188-190. Versión de Gaos Schmidt, A., México, UNAM, 1995, pp. 64 y 65. 69 En opinión del propio Schulz esta tesis era «inmadura e inadecuada». Cfr. op. cit., nota 19, p. 133. Sin embargo, una de las más importantes virtudes de Cicerón no fue tanto la propuesta de sistematizar el derecho civil, sino la de crear una técnica, y más específicamente, la creación de una técnica lógica, “el centro del análisis ciceroniano era por tanto, el problema de la fundación de una ciencia y, en particular, de la ciencia jurídica”. Scarano Ussani, V., L’ars dei giuristi. Considerazioni sullo statuto epistemologico della giurisprudenza romana, Turín, G. Giappichelli, 1997, p. 15. 70 Cfr. Ibidem, p. 124.
REGLAS Y PRINCIPIOS
649
como el método dialéctico helenístico propuesto para el derecho, ofreció en general un estudio sistemático de los géneros y de las especies jurídicas.71 La segunda nota relevante en la figura de Cicerón es, como lo ha puesto de relieve Schipani,72 ser uno de los primeros en emplear el término de principium en toda su forma y con todo su significado, como “la parte inicial” de algo,73 no con un sentido de generalidad, sino en un contexto más específico y concreto. Probablemente en la mente de Cicerón el principio tuvo como función, en la vida práctica, ser la parte con la que se comenzaba una argumentación, particularmente una argumentación jurídica. Se puede observar, al menos en uno de los textos referidos por Schipani relativos a Cicerón, el uso de la expresión principio como lo que inicia algo. En la Rhetorica ad Herennium I, III, se ve lo siguiente: “Inventio in sex partes orationis consumitur: in exordium... Exordium est principium orationis...”.74 Principio y regla en Cicerón Cicerón es quien entonces emplea lo que se conoce como principio, o en latín principium “como lo que da inicio a algo”. Insistiendo en ser éste una “ilustración breve y concisa de los caracteres específicos de una cosa que queremos definir”.75 Asi, la relación que guarda con las reglas es muy clara, mientras que éstas mantuvieron siempre un contenido justo o equitativo, sirvieron también como principios concretos, los que sintetizando lo dispar, iniciaban a partir de ellos la labor interpretativa y argumentativa de los casos planteados. De este modo, mediante el principio se transmite una breve descripción de la cosas a modo de resumen.
71 72
Cfr. Ibidem, p. 121. Cfr. Schipani, S., La codificazione del diritto romano comune, cit., nota 47, p. 83-117. 73 Cfr. Ibidem, p. 87. 74 Ciceron, Rhetorica ad Herennium, I-III, translation by Harry Caplan, Harvard University Press, 1968, p. 8. 75 Cfr. Schipani, S., La codificazione del diritto romano comune, cit., no ta 47, p. 87 y ss.
650
JAVIER SALDAÑA
V. SÍNTESIS Lo hasta aquí expuesto, permite afirmar que al término de la República, el razonamiento jurídico romano potencializado por el empleo del método dialéctico en su exposición inició una “labor de articulación de las distintas cuestiones y problemas, reuniendo lo semejante y separando lo dispar”,76 conduciendo así, como lo ha hecho notar Schulz, a la composición y elaboración de las regulae iuris, o reglas del derecho romano.77 Los datos parecen indicar que fue al final de la República e inicios del Principado (inicios del periodo clásico del derecho romano) donde se comenzará a observar la elaboración de una nueva jurisprudencia sustentada en buena medida en la formulación de regulae iuris,78 las cuales vinieron siendo cristalizadas a través de mucho tiempo y del empleo de la dialéctica en su razonamiento práctico. Quinto Mucio Scevola, Servio Sulpicio Rufo y el propio Marco Tulio Cicerón, representan los más claros ejemplos de los juristas de esta época en los que es posible ver tales características; es decir, el uso de la dialéctica como manera del razonamiento jurídico y la elaboración de diversas reglas del derecho, regulae iuris. Las afirmaciones anteriores coincidirán con las formuladas por Peter Stein cuando señala que “a partir de Quinto Mucio Scevola se hace del derecho una ciencia en la que la técnica usada para este fin viene tomada casi en su mayoría de la filosofía griega”.79 Y que fue también en esta época “donde comienza a observarse el empleo de definitiones (regulae), como “expresiones que explican detalladamente sin pecar de exceso o defecto”,80 las cuales servían para aclarar pero sobre todo resolver el problema planteado a partir de criterios jurisprudenciales.81 76 77 78
Jörs, P., Kunkel, W., Derecho privado romano, cit., nota 29, p. 31. Cfr. op. cit., nota 51, p. 127. Aquí hacemos nuestra la crítica que el propio Schulz formula a la expresión «jurisprundencia de reglas y jurisprudencia de principios», al señalar que entre los principios romanos encontramos ciertamente breves formulaciones proverbiales (al estilo de lo que es una regla como breve máxima), pero el término regla o definición nunca fue limitado sólo a esto. Cfr. Ibidem, p. 128. 79 Stein, P., “Lo svolgimento storico della nozione di «regula iuris» in dititto romano”, Antologia giuridica romanistica ed antiquaria I, cit., nota 54, p. 100. 80 Idem. En este sentido cfr. también Scarano Ussani, V., L’ars dei giuristi. Considerazioni sullo statuto epistemologico della giurisprudenza romana, cit., nota 69, p. 8. 81 En este punto conviene hacer notar que la homogeneización que suele hacerse entre definiciones y reglas en el derecho romano, a mi modo de ver es incorrecta, pero con-
REGLAS Y PRINCIPIOS
651
Algunas definiciones y reglas servían entonces más para resolver el caso concreto, aunque no limitaban la posibilidad de “reconocer los géneros y las especies” de los casos futuros. De ahí que el origen primario de las definiciones o reglas haya sido el de servir, en un contexto específico, para resolver el caso suscitado. Su sentido primigenio estaba muy lejos de ser visto con las pretensiones de generalidad al estilo de una norma jurídica moderna. Por eso el derecho de esta época, pero sobre todo del alto periodo clásico, ha sido calificado como eminentemente jurisprudencial-casuístico. Stein señalará en este sentido que fue Labeone el primero en usar la palabra regulae para describir definiciones de derecho, atribuyendo a la palabra un particular significado.82 Independientemente de que este jurista sea o no el primero en emplear la expresión regulae, lo cierto es que el uso y manejo de las regulae iuris está ya presente en la reflexión sobre el derecho de esta primera gran época. Estas primeras formulaciones, por tanto, sirvieron en la resolución del caso concreto, actuando a la vez como medida standard en los casos venideros. Tales ideas, se confirmarán en el esplendor del derecho romano, como lo fue el derecho clásico. Probablemente en este periodo comenzaron a gestarse reglas que posteriormente formalizarían los juristas romanos tardoclásicos como las siguientes: “La equidad debe observarse en todos los órdenes, pero especialmente en el derecho”, (D. 50,17,90, Paul. 15 quaest.); “Cuando se es oscuro lo que se ha hecho, debe de interpretarse según la voluntad del que lo hizo” (D. 50,17,168,1, Paul.1 ad Plaut.); “En los casos dudosos, debe seguirse la opinión más humanitaria”, (D. 34,5,10,1, Ulp. 6 disput.); “Es de derecho que el dolo del vendedor no perjudiqua al comprador de buena fe” (C. 4,48,3.); “Lo que se debe en virtud de una obligación natural puede ser objeto de compensación” vendría igualmente señalar que la doctrina romanistica por mucho tiempo identificó definiciones y reglas, aunque los estudios contemporáneos han puesto de relieve la diferenciación entre ellas, pero no hasta el punto de establecer en forma categórica sus precisos contornos. Al respecto se ha señalado que “si no cabe negar que en el plano terminológico los juristas romanos tanto hablan de definitio como de regula o sententia en el sentido genérico de «máximas» —obras del mismo género contenido son intituladas indiferentemente con los términos «definitiones», «regulae», «sententiae»—, sin embargo, no debe creerse que, en línea conceptual no supieran distinguir entre definitio en setido lógico y regula…”. Iglesias-Redondo, J., Definiciones, reglas y máximas jurídicas romanas, Madrid, Civitas, 1986, pp. 15 y 16. 82 Stein, P., “Lo svolgimento storico della nozione di «regula iuris» in dititto romano”, Antologia giuridica romanistica ed antiquaria I, cit., nota 54, p. 100.
652
JAVIER SALDAÑA
(D. 16,2,6 Ulp. 30 ad Sab.) “En los contratos de debe atender más a la verdad de la cosa, que a lo escrito”, (C. 4,22,1.) “No es víctima de un crimen quien pudiéndo evitarlo no lo hace”, (D. 50,17,109, Paul. 5 ad ed.); “En todas las obligaciones no sujetas a término la deuda existe desde el primer día”, (D. 50,17,14, Pomp. 5 ad Sab.) “La interpretación del fraude en derecho civil siempre debe hacerse considerando no sólo el resultado, sino también la intención” (D. 50,17,79, Pap. 32 quaest.). VI. PERIODO CLÁSICO DEL DERECHO ROMANO El periodo que va del 130 a. C al 230 d. C. será caracterizado unánimemente por la doctrina como la etapa de mayor esplendor de la jurisprudencia romana. En opinión de algunos, “comparable en su ámbito a lo que fue la época de Sócrates, Platón y Aristóteles para la filosofía”.83 Las bases de este derecho estaban ya asentadas en la última parte del periodo anterior, llegando a construir un derecho eminentemente jurisprudencial cuya fuerza radicaba en la autoridad sapiencial del jurista romano. Esta característica ha sido especialmente destacada recientemente al señalar que “...es posible afirmar, sin temor de exagerar, que entre el primer siglo antes de Cristo y el primer siglo después de Cristo se concluyó una evolución tal vez ya iniciada en el II siglo antes de Cristo, la jurisprudencia romana realizó un importante y evidente cambio de su status teórico. La condujeron, de seguro, a un nivel espistemológico parangonable, saber no homogéneo a aquél de la disciplina racional de la cultura helenística”.84 VII. CARACTERES GENERALES DEL DERECHO CLÁSICO Habrá que señalar que muchas de las características jurídicas romanas descritas en la última parte de la República se encontrarán presentes en el periodo clásico. El caso de la vieja jurisprudencia aristocrática se ve notablemente disminuida, adquiriendo mayor fuerza la auctoritas de los juristas, constituyendo un verdadero derecho hecho por especialistas en el que la figura del jurisprudente era altamente considerada. Igualmente, los juristas del periodo clásico continuaron aplicando en sus razonamien83 84
Guzmán Brito, A., Derecho privado romano, cit., nota 19, p. 24. Scarano Ussani, V., L’ars dei giuristi. Considerazioni sullo statuto epistemologico della giurisprudenza romana, cit., nota 69, p. 1.
REGLAS Y PRINCIPIOS
653
tos el método dialéctico, formulando distinciones y elaborando principios y definiciones que eran propuestas como fórmulas de solución a los casos planteados. El interés por la dialéctica fue disminuyendo pero no perdiéndose; en este momento, el derecho había adquirido autonomía propia, empeñándose no tanto en su especulación teórica, cuanto en su aplicación concreta; “las cuestiones de detalle eran las que realmente interesaban al jurista romano y el método que era aplicado quedaba en el fondo casuístico”.85 Por otro lado, el formalismo continúa en una decadencia gradual, aunque en la interpretación del derecho el jurista continúa empleándolo de manera significativa. En este contexto, será la figura del jurista y su labor jurisprudencial la nota que identificará el periodo clásico del derecho romano, llegando a constituir un auténtico derecho de juristas, de especialistas, formado por un “estamento profesional y tecnificado de estudiosos del derecho, que por lo demás fueron sus creadores: los juristas (jurisprudentes)”,86 y su disciplina, la jurisprudencia, la fuente más importante del derecho. Por eso, con razón se ha llegado a aceptar en forma casi unánime que la relación jurista-derecho se mantiene durante esta época -la clásica del derecho romano- de un modo unitario; la jerarquía de las fuentes del derecho privado no experimenta una transformación sustancial, pues a pesar de los cambios de orden político, la jurisprudencia continúa siendo la verdadera fuente de cuya actividad se deriva el derecho privado; los procedimientos, tanto internos como externos, para la elaboración de las instituciones y la formulación de los criterios sobre lo justo, presentan también una apreciable continuidad, que se remonta a los veteres; la organización procesal formularia permanece igualmente a pesar de las innovaciones introducidas a través de la cognitio extra ordinem. Todo ello permite la subsistencia de un modelo de ordenamiento de carácter exquisitamente jurisprudencial.87
Dos notas significativas podemos destacar de este sistema de juristas: la interpretación del derecho y la importante labor creativa del mismo; ambas, tuvieron como protagonista al jurista, quien las aplica en los campos por 85 86 87
Cfr., op. cit., nota 19, p. 233. Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 23. Fernández Barreiro, A., “El modelo romano de derecho de juristas”, Revista de Estudios Histórico-Jurídicos I, Valparaíso, 1976, p. 31.
654
JAVIER SALDAÑA
antonomasia del derecho: el privado y el procesal (en éste es donde con especial claridad se puede observar la labor creativa del jurista). El resto del derecho, sobre todo el que procedía de los conductos oficiales primero leyes y plebiscitos, después senado-consultos y constituciones imperiales, tienen carácter secundario, pues en principio, los órganos investidos de poder político permanecen ajenos a un orden esencialmente interindividual como es para los romanos el derecho privado. La intervención «oficial» en el campo del derecho privado no fue, por tanto, de carácter «legislativo», sino judicial y procesal, pero siempre en función de la actividad decisoria de la jurisprudencia en torno a los conflictos derivados de las relaciones interindividuales, que el proceso se limita a tutela.88
VIII. FUENTES DEL DERECHO ROMANO CLÁSICO Un breve análisis de las fuentes del derecho en el periodo descrito nos permitirá puntualizar con más detalle nuestras anteriores afirmaciones sobre el papel protagonista del jurisprudente en el derecho romano, y de manera especial el criterio justo o equitativo con el que orientaban su argumentación y su respuesta jurisprudencial. 1. Ius Parece factor común aceptar que la palabra Ius de los juristas romanos atravesó por diferentes momentos, los más significativos son haber pasado de un ámbito religioso a uno puramente humano. “...el ius empieza por estar en estrecha relación con la religión, y se habla de un ius divinum para designar prescripciones pertenecientes a los ritos religiosos, de los que los antiguos juristas, que solían reservarse a la vez el cargo religioso de «pontífices», se ocupaban especialmente”.89 Después, si algo habría de caracterizar al derecho romano fue la laicizzazione90 del ius, el cual “significó lo justo, formulado por los que saben de ello: los iuris prudentes. Los juristas romanos conciben el ius como la disciplina de lo justo y la iuris prudentia (jurisprudencia o ciencia del derecho) como la 88 89 90
Ibidem, p. 34. D’Ors, A., Derecho privado romano, 5a. ed., Pamplona, Eunsa, 1983, p. 45. Pugliese, G., Istituzioni di diritto romano, 2a. ed., Turín, Giappichelli, 1990, p. 38 y ss.
REGLAS Y PRINCIPIOS
655
ciencia de lo justo y de lo injusto, donde ciencia (scientia) equivale a ars o arte”.91 “La misma auctoritas de los juristas que profieren las responsa se apoya en la reverencia religiosa ...”,92 sin confundir lo religioso con lo puramente secular. De este modo, “la conciencia progresiva de esta secularidad del derecho permite la formación del propio ius civile”.93 Este ius civile fue el derecho por por excelencia de Roma, era el derecho sobre el que los juristas debían declararse en el caso concreto (ius dicere, indicium).94 “El derecho consiste en juicios, pero estos se fundan en los criterios de justicia formulados por los prudentes... el ius consiste en soluciones convenientes y no puede ser injusto”.95 En este contexto, el ius es conforme con la justicia al buscarse y obtenerse por un juicio prudencial (aquello que según Ulpiano indica como est constans et perpetua voluntas ius summ cuique tribuendi),96 y en una explicación más precisa, el ius o derecho es objeto de la justicia. 2. Ius y aequitas Conviene destacar, en la evolución del derecho romano, la profunda relación que existió entre el ius y la equidad. El ius fue igualmente identificado como la disciplina de la aequitas, como aquel arte de lo bueno y de lo justo (ius est ars boni et aequi)97 D.1.1.pr. (Ulp. 1.inst.) edificándose el derecho sobre estas bases profundamente equitativas. La equidad constituye un criterio inspirador de la actividad del magistrado en la corrección de la injusticia que tantas veces derivaba de la rígida aplicación del ius civile.98 Para algunos, esta idea evidenciaría la unión entre lo jurí91 Hervada, J., Lecciones propedéuticas de filosofía del derecho, Pamplona, Eunsa, 1992, p. 172 y 173, y la bibliografía ahí contenida. 92 D’Ors, A., Derecho privado romano, cit., nota 89, p. 46. 93 Idem. 94 Parece que en épocas relativamente tardías, el ius tuvo distintos significados como normativo, de derecho subjetivo, como ciencia, arte, etcétera, pero de manera significativa la de cosa o realidad justa. Cfr. Hervada, J., Lecciones propedéuticas..., cit., nota 91, p. 174. 95 D’Ors, A, Derecho privado romano, cit., nota 89, p. 44. 96 D. 1. 1. 10. pr. (ulp. 1.reg = Inst. 1,1. pr. 3,1). 97 Para un análisis general del origen y desarrollo del ius romano, Cfr. Guarino, A., Storia del diritto romano, cit., pp. 121-150. 98 Vacca, L., La giurisprudenza nel sistema delle fonti del diritto romano, cit., nota 34, p. 49.
656
JAVIER SALDAÑA
dico y lo moral.99 “Corresponde a los estudioso modernos explicitar o precisar las razones de justicia, que se encuentran en la base de la particular solución sugerida por el jurista”.100 Muchos serían los ejemplos que nos servirían para confirmar esta profunda relación entre el ius como derecho y la equidad. Ulpiano nos propone dos de ellos en formula de reglas: “Iuris praecepta sunt haec: honeste vivire, alterum non laedere, suum cuique tribuere” (preceptos del derecho: vivir honestamente, no dañar a nadie y dar a cada uno lo suyo). Y Iuris prudentia est divinarum atque humanarum rerum notitia, iusti ataque iniusti scientia (la jurisprudencia es el arte o la ciencia de las cosas divinas y humanas, de lo justo y de lo injusto) D. 1.1.10.I. Inst. 1.1. pr. 1.3.101 Estas ideas reflejan una continuidad en el pensamiento que desde la República se consideraban como ciertas.102 Las mismas fuentes romanistas dan cuenta de la vinculación planteada. Así, por ejemplo, en el Digesto se exige, para quienes quieran dedicarse al derecho, saber de dónde deriva el término ius y así se dice que es llamado así por derivar de «justicia», pues como elegantemente lo define Celso, el derecho es la técnica de lo bueno y de lo justo. En razón de lo cual se nos puede llamar sacerdotes; en efecto, rendimos culto a la justicia y profesamos el saber de lo bueno y de lo justo, separando lo justo de lo injusto, discerniendo lo lícito de lo ilícito, anhelando hacer buenos a los hombres, no sólo por el temor del castigo, sino también por el estímulo de los premios, dedicados, si no yerro a una verdadera y no simulada filosofía.103
En el propio Digesto 1.1.3 (Flor. 1. inst.) podemos encontrar también lo siguiente: “que rechazamos la violencia y la injusticia, pues sucede que, en virtud de ese derecho, lo que cualquiera hubiere hecho en salvaguardia de su cuerpo se estime que lo hizo con derecho, y como la natu-
99 Cfr. Catalano, P.,“Religione, morae e diritto nella prospettiva dello ius romanum”, Roma e América, Diritto Romano Comune. Rivista de diritto del´integrazione e unificazione del diritto in Europa e in América Larina, 1, Roma, 1996, pp. 3 y ss. 100 Pugliese, G., Istituzioni di diritto romano, cit., nota 90, p. 188. 101 Cfr. Ibidem, p. 189. 102 Para este punto puede verse el resumen que presenta Schulz de las obras de Cicerón y Stobeo en el que resalta la idea que existía desde Grecia entre la vinculación entre derecho y ética. Cfr. op. cit., p. 242. 103 D.1.1.1. (Ulp. 1. inst).
REGLAS Y PRINCIPIOS
657
raleza estableció entre nosotros un cierto parentesco, se sigue que es ilícito atentar un hombre contra otro”.104 Refiriéndose a la condición de los hombres, la obra de compilación llevada a efecto por Justiniano con base en el derecho antiguo ha reconocido igualmente con toda claridad que la libertad es un derecho con el que todos los hombres nacen, y que la “esclavitud es una institución de derecho de gentes, por la cual uno está sometido, contra la naturaleza, al dominio ajeno”.105 Al hilo discursivo de lo que venimos mencionando, pero ahora sobre el tema del matrimonio se puede leer igualmente que “el matrimonio es la unión de hombre y mujer en pleno consorcio de su vida y comunicación del derecho divino y humano”.106 Estos ejemplos de carácter enunciativo sirven para mostrarnos una idea básica del derecho romano, ser éste una jurisprudencia eminentemente justa y moralmente humanista, la que en el fondo explicaba un ideal de hombre que permeaba la concepción del derecho romano. Sandro Schipani ha sido especialmente insistente en esta noción al escribir que: Para el derecho romano, la noción de hombre y persona coincidían y se referían a todos los hombres. Piénsese en la sistemática de las Instituciones de Gayo (Gai. 1, 8 ss.) y de Justiniano (J.1,3), del Digesto (D.1.5-6), que incluye dentro de tal categoría a los “libres y esclavos, ciudadanos y extranjeros, personas que son de su propio derecho, y personas sujetas a ajeno derecho, los que están en el útero y los nacidos varones, y hembras” que en el marco de una elaboración del discurso sistemático (generatim), se ponen de manifiesto a través de divisiones, que conducen a reflexionar sobre la importancia de la categoría general. Ya que si suma es la división entre libres y siervos, aún de mayor importancia es la categoría que los une.107
104 105 106 107
D.1.1.3. (Flor. 1. inst.). D.1.5.4. (Flor. 9 inst. = Inst. 1.3). D.23.2.1. (Mod. I reg.). Schipani, S., “El derecho romano en el nuevo mundo”, Ars Iuris 12, México, 1994, p. 203 ss. Es la traducción al castellano de “Il diritto romano nel nuovo mondo” recogido en Materiali I. Derecho romano y unificación del derecho. Experiencia europea y latinoamericana. (Con especial atención a la responsabilidad extracontractual). Università degli Studi Roma «Tor Vergata», Roma, 1999, pp. 7-64.
658
JAVIER SALDAÑA
Se insistirá entonces en la idea de una moral humanista cuyo centro de reflexión y operatividad era fundamentalmente el hombre,108 en el que se reconoce la idea de dignidad, elemento permanente en él y capaz de titularidad de derechos. “Umanesimo è affermazione della propria persona nel rispetto di quella altri: la misura è sua virtù”.109 3. Edicto romano Instrumento importante en la República (véase supra) y en el Principado fue también el “edicto”, el cual era un documento que el pretor urbano publicaba al inicio de su magistratura y en el que se contenía el programa de trabajo para el año laborable. Este documento durante mucho tiempo fue una fuente de renovación constante del derecho,110 hasta llegar a tener una cierta estabilidad.111 Los edictos fueron fuente del derecho pero no del ius civile porque éste se funda en la autoridad de la jurisprudencia y el primero en la potestad de los magistrados.112 108 Vacca, L., La giurisprudenza nel sistema delle fonti del diritto romano, op. cit., nota 34, p. 53. 109 Voci, P., Manuale di diritto romano I. Parte generale, 2a ed., Giuffrè, Milano, 1984, p. 48-49. 110 “El pretor, pues, actuaba asistido por un consilium de juristas, en cuyo seno se preparaba y redactaba el edicto año a año, conforme con criterios técnicos; y aunque informal y de libre y flexible integración, ese consejo en la práctica resultaba muy permaneciente. Todo eso explica que el edicto mismo llegara a ser un instrumento altamente tecnificado y desde luego constante, porque la formal renovación anual implicaba una reiteración de buena parte del contenido del edicto anterior, y así sucesivamente (edictum traslaticium), atendida la permanencia de sus verdaderos artífices. Pero también esa renovación formal cada año, e incluso la posibilidad de modificar en cualquier momento el edicto inicial mediante los llamados «edictos repentinos», fue una razón más de la eficacia de esta fuente: la renovación formal misma daba ocasión para examinar y revisar el contenido del edicto anterior que debía quedar incorporado en el nuevo a la luz de la experiencia y de los avances de la ciencia jurídica, y ello permitía perfeccionar el material recibido; además hacía posible ensayar nuevas soluciones con facilidad, en contraste con las dificultades que ofrecía la tramitación de una ley, y sin el riesgo de tener que soportar por mucho tiempo una solución que después se mostrara mala e ineficaz, que es una de las desventajas de confiar la reforma del derecho a la legislación”. Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 38. 111 Cfr. op. cit., nota 19, p. 227. 112 En este sentido conviene tomar en cuenta la § 36 de D’Ors, A., Derecho privado romano, cit., nota 89, p. 68.
REGLAS Y PRINCIPIOS
659
Su composición era variada, pero en términos generales se integraba primero de una parte introductoria sobre cómo debían tramitarse los litigios. La segunda, que era siempre la más extensa, se componía de diferentes acciones relativas a la propiedad, los negocios crediticios, los contratos, la tutela, el hurto. Una tercera concernía al derecho pretorio de las herencias, y, finalmente, un par de últimas partes: una sobre la ejecución de sentencias judiciales, y otra quinta de interdictos y estipulaciones pretorias.113 La practicidad de este documento lo ha anotado D’Ors al señalar que “es observable en el estilo del Edicto, como también en el de las leyes, un progreso de abstracción que lleva a sustituir la forma explicativa «no se haga...: si alguien hace...» por la implicativa «quien haga...»; en los edictos de la última fase, suele aparecer la forma referida a la alegación de los hechos por el demandante (quod dicetur) más que a los hechos mismos”.114 A pesar de ser el edicto una obra eminentemente de poder, detrás de su elaboración radicaba la figura del jurista romano a quien generalmente acudía el magistrado para consultarle y elaborar su edicto. Formalmente el edicto era presentado por el magistrado pero materialmente era elaborado por el jurista, haciendo de éste una obra eminentemente jurisprudencial como lo fue el derecho que venimos sintetizando.115
113 114
Cfr. D’Ors, A., Derecho privado romano, cit., nota 89, p. 71. Cfr. Ibidem y Guzmán Brito, A., Derecho privado romano, cit., nota 20, pp.
12-15. 115
“En la organización judicial formularia, propia de la época clásica, el control del proceso y la admisibilidad de las reclamaciones procesales de los particulares no corresponde a los jueces sino a los magistrados encargados de la jurisdictio en controversias de derecho privado; tales magistrados solían ser personas ignorantes en cuestiones de derecho y, por ello, tenían que acudir al Consejo de los juristas. El asesoramiento de los magistrados por los jurisconsultos no es, en modo alguno, algo políticamente impuesto, sino una práctica socialmente derivada de la anteriormente aludida posición que en el ámbito de la organización socio-política ocupaban los juristas: el derecho privado pertenece a su indiscutida competencia; la auctoritas prudentium aparece, así, contrapuesta a la potestas de los magistrados con imperium, y, de este modo quien tiene potestad pregunta a quien posee el saber, de suerte que la Jurisprudencia ejerce su actividad informadora de toda la vida jurídica a través de los magistrados con jurisdicción”. fernández Barreiro, A., “El modelo romano de derecho de juristas”, Revista de Estudios Histórico-Jurídicos, I, op. cit., p. 35.
660
JAVIER SALDAÑA
4. Senadoconsulto Herramienta importante para el derecho de este periodo fue el senadoconsulto (senatusconsultum), “que exigía la exposición de la materia por un magistrado, la deliberación del senado, su votación y la redacción de un texto continente de su parecer u opinión”.116 La doctrina también ha considerado que, como en el caso del edicto, el senadoconsulto no fue en un principio y de manera directa fuente del ius civile, pero a partir de la época de Adriano valen ya como fuente de éste. Las disposiciones del senadoconsulto debían “ser cumplimentadas a través de la jurisdicción pretoria, ordinariamente mediante concesión de excepciones procesales que paralizaban las reclamaciones fundadas en actos que el senado había prohibido...117 Así, a partir de siglo I, el senadoconsulto fue la forma en la que se publicaban las leyes que habían sido elaboradas por los emperadores y aprobadas por el senado, en todo caso sujeto siempre a discusión, tal y como Gayo lo dejará establecido en sus Instituciones, no siendo necesariamente taxativo.118 De ser éste un documento estrictamente político, pasó a ocuparse eventualmente de asuntos esencialmente jurídicos, sobre todo de carácter privado durante el siglo I d. C. Dos son las características que la figura del senadoconsulto tiene en siglos I y II d. C. Primero, queda como el instrumento normativo, con eficacia y operatividad diversa, y utilizado para la innovación que se quería sancionar; y en segundo lugar, el senadoconsulto le sirve al emperador para dirigir la actividad judicial y normativa del pretor.119 En ambos, la figura del jurista romano será especialmente importante en la elaboración y discusión de la figura referida.120 116 117 118 119
Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 30. D’Ors, A., Derecho privado romano, cit., nota 89, p. 74. Cfr. Gayo, Inst. 1. 1. 4. Talamanca, M., (dir.), Lineamenti di storia del diritto romano, cit., nota 23, p. 396. Un análisis detallado del desarrollo y operatividad del senadoconsulto en el periodo clásico del derecho romano pude verse en punto 79 de ibidem, pp. 395-399. 120 “Un senadoconsulto contiene la opinión del senado acerca de un cierto asunto, y esa opinión servía para que los magistrados pudieran ejercer autorizadamente sus potestades del modo en que lo estimaran conveniente, con el fin de hacer operativo el consejo senatorial. Cuando el asunto era jurídico, en consecuencia, normalmente tocaba al pretor prever mediante sus instrumentos jurisdiccionales o para jurisdiccionales a dicha operación; por ejemplo, concediendo una nueva acción, denegando las existentes u otorgando excepciones, etcétera”. Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 30.
REGLAS Y PRINCIPIOS
661
5. Lex Figura poco relevante en el principado fueron las leyes, las cuales fueron una “declaración de potestad que vinculaba tanto al que la da como al que la acepta”.121 La expresión lex para el derecho romano del periodo al que nos venimos dedicando indicó, en un sentido genérico, no sólo la lex en sentido propio, sino también se incluyeron en ella las deliberaciones de los comitia, la propuesta del magistrado con imperio, y los plebiscitos. Las leyes se dividían en públicas y privadas.122 Las primeras se ocupaban de diversas materias, lo mismo que de la institución de nuevas magistraturas que de sus competencias; igual que del derecho de ciudadanía, que del derecho al voto y los procedimientos legislativos, etcétera.123 La lex privata, tuvo mucho menos presencia debido a que, como lo hemos anotado, el razonamiento casuístico del derecho fijado en las circunstancias del problema impedía hacer propuestas generales. En este sentido, la lex ocupa un lugar poco relevante en el campo del derecho privado.124 La lex pública no podía modificar al ius.125 6. Jurisprudencia del periodo clásico y responsa Llegados a este punto, sería reiterativo insistir en la significativa presencia que el jurista ejerció en la casi totalidad del derecho romano clásico, lo mismo en su aplicación que en su producción, igual en su consulta que en su interpretación, llegando a constituir, como es por todos cono-
121 122
D’Ors, A., Derecho privado romano, cit., nota 89, p. 63. “La lex privata es aquélla que declara el que dispone de lo suyo en el negocio privado (lex rei suae dicta). La lex pública es la que declara el magistrado (rogatio) y reciben los comicios con su autorización (ius sum)”. Ibidem, pp. 63 y 64. 123 Cfr. Francisci, P. de, Sintesi storica del diritto romano, 3a. ed., Roma, Ateneo, 1965, p. 206. 124 Para un resumen general de las principales leyes en el periodo referido cfr. Ibidem, p. 207. 125 “Entre el ius, creado por la autoridad de los prudentes, y la lex, creada por la potestad del magistrado, hay una clara antítesis. En principio, la lex no modifica el ius, y si se dice que es fuente del ius, esto se debe a que los nuevos datos de la ley pueden ser asimilados por la jurisprudencia; también los pretores procuran aplicar los preceptos legales”. D’Ors, A., Derecho privado romano, cit., nota 89, p. 66.
662
JAVIER SALDAÑA
cido, un derecho eminentemente jurisprudencial.126 Alejandro Guzmán Brito resume la presencia del prudente en el derecho del periodo confirmando los argumentos hasta aquí presentados. Primero es el responsa, es decir, “la manifestación oral o escrita de su opinión jurídica acerca de un caso sometido a su dictamen por cualquier particular o por otro jurista e incluso por el magistrado jurisdiccional o el juez”.127 Aunque con diferencias entre el periodo republicano y el clásico,128 el responsa se basó principalmente en la auctoritas de quien lo profería y de sus maestros, llegando a contener en él las opiniones de los juristas más connotados en cuestiones como interpretación de testamentos y contratos como en la república acontecía;129 en la declaración de derechos y obligaciones de las partes en conflicto; en declaración de una acción o en la aplicación de una ley o la costumbre.130 Los comentarios constituyeron también una forma directa en la que los juristas influyeron en la vida del derecho romano. Éstos eran, como los responsa u otra especie de la literatura jurídica, una serie de opiniones que los juristas emitían sobre cuestiones de derecho civil o sobre derecho pretorio. “También está la literatura de responsa, en que se coleccionaban las respuestas dadas por el autor; de quaestiones, en que se trataban de casos reales, pero la mayor parte de las veces imaginarios, resueltos
126 Guariano resumirá en tres incisos concretos los elementos comunes de esta etapa jurisprudencial: “a) el prudente tradicionalismo, la cautela de sus exponentes en meter de parte los viejos esquemas y las viejas concesiones, por tanto la tendencia a utilizarlos donde fuera posible; b) la selección de sus representantes a obra de principios, hay que entenderlo pero en el sentido limitado que estos buscaban con varios medios de favorecer algunos jurisconsultos, sin embargo, sin tomar algunos otros la posibilidad de explicar libremente su actividad; c) el ordenamiento sistemático de su trabajo esto es, a decir la tendencia de los juristas clásicos y a empeñarse en las actividades creativas mejor en sistemas expositivos y encuadrativos unitarios del derecho vigente que en la directa o indirecta producción de nuevas instituciones”. Pugliese, G., Istituzioni di diritto romano, cit., nota 90, p. 444. 127 Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 36. 128 Estas diferencias se refieren fundamentalmente a la distinción que existía entre lo que es il reponsum y el ius publice respondendi. El segundo se refiere a la reforma que introdujo Agusto por la que delegaba la autoridad de quien podía emitir esta(s) respuesta(s). Para tal punto cfr. op. cit., nota 20, pp. 95-101, y pp. 202-210. 129 Ibidem, p. 95. 130 Cfr. Arangio-Ruiz, V., Historia del derecho romano, 5a. ed., Madrid, Reus, 1994, p. 151.
REGLAS Y PRINCIPIOS
663
por el jurista; y de digesta, en que se combinaban el comentario y la casuística”.131 El edicto, como lo hemos visto fue también fuente del derecho y aunque atribuida formalmente al pretor, la elaboración de éste correspondió a los juristas romanos, particularmente al consilium de éstos. Como en la República, los juristas continuaban siendo consejeros y asesores de los jueces y de los magistrados.132 El trabajo realizado por los juristas al interior del consilium en la preparación del edicto anual será la razón de que éste llegara a ser un instrumento altamente tecnificado donde a veces se recogía mucho del material del anterior. “La renovación formal misma daba ocasión para examinar y revisar el contenido del edicto anterior que debía quedar incorporado al nuevo a la luz de la experiencia y de los avances de la ciencia jurídica, y ello permitía perfeccionar el material recibido; además, hacía posible ensayar nuevas soluciones con facilidad, en contraste con las dificultades que ofrecía la tramitación de una ley”.133 Finalmente, como lo hemos señalado anteriormenete, la labor que mejor representa el espíritu jurisprudencial del derecho romano clásico es sin duda el responsa, la solución de casos concretos con criterios prudenciales y justos. Ésta fue llevada a efecto en toda la actividad jurídica de este periodo, lo mismo en las normas generales que a los edictos o las propias constituciones imperiales. IX. CONCLUSIONES Llegados a este punto convendría reseñar algunas conclusiones importantes. Estas parten de un hecho incontrovertible, tanto a nivel de teoría del derecho como de filosofía del derecho, esto es, que en la búsqueda sobre los antecedentes acerca de lo que los principios jurídicos son, se tiene uno que referir de manera necesaria a lo que en la jurisprudencia romana, particularmente clásica, se conocieron como regulae iuris, o reglas del derecho, las cuales fueron elaboradas y empleadas en el razonamiento jurídico de los más importantes juristas de la época tardo-republicana y clásica. Dichas regulae iuris tuvieron como objetivo principal 131 132 133
Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 37. Cfr. op. cit., nota 130, pp. 210 y 211. Guzmán Brito, A., Derecho privado romano, cit., nota 20, p. 38.
664
JAVIER SALDAÑA
resolver los problemas planteados a los juristas, o en su caso servir de punto de partida en su razonamiento sobre el caso concreto, a partir del contenido moral, justo o equitativo de tales reglas del derecho. En este sentido, el contenido justo de las reglas orientó el razonamiento del jurisprudente romano y sirvió además para exponer sus argumentos o interpretar algún problema jurídico concreto. Habrá que decir, como se establece en la primera de las reglas, en el Libro 50 Título 17 del Digesto, que las reglas no crean derecho pero sí sirvieron como criterios que orientaron y dirigieron el razonamiento jurisprudencial. Desde aquí se entiende mejor que la regla es “la que describe brevemente cómo es una cosa. No que el derecho derive de la regla, si no que ésta se abstrae del derecho existente. Así pues, mediante la regla se transmite una breve descripción de las cosas…” (D.50.17.1.). Por tanto, siendo las regulae iuris uno de los antecedentes de los principios del derecho y, teniendo éstas un contenido justo, los principios jurídicos participan de tal contenido. De allí que desde la posición que se acaba de exponer es fuertemente discutible, cuando no definitivamente abandonable, la afirmación que Hart formuló en su post scriptum acerca de que haya principios jurídicos que sean injustos. Éstos siempre entrañan, como lo dice Dworkin, un contenido justo, equitativo o de cualquier otra dimensión de moralidad. Una segunda conclusión igual de relevante que la anterior vendría establecida al afirmar que en una cultura jurídica caracterizada fundamentalmente por ser obra de autoridad jurídica tan poco apegada a la formalidad, donde además existió un rechazo a la abstracción y generalidad y donde se privilegió la dialéctica en el razonamiento para resolver caso a caso los problemas planteados, como fueron tanto la cultura jurídica republicana como la clásica de Roma, no resulta extraño encontrarse con que la producción del derecho correspondió al jurista, particularmente a la auctoritas de éste y no al poder político. En este sentido, dicha jurisprudencia fue eminentemente casuística y jurisprudencial, teniendo como base de su razonamiento la estrecha vinculación entre lo jurídico y lo moral, haciendo de ella una civilización donde la justicia no fue comprendida nunca como un juicio deóntico, sino como el elemento indispensable de la resolución del caso concreto.
REGLAS Y PRINCIPIOS
665
X. BIBLIOGRAFÍA ARANGIO-RUIZ, V., Historia del derecho romano, 5a ed., Madrid, Reus, 1994. ATIENZA, M. y RUIZ MANERO, J., Las piezas del derecho. Teoría de los enunciados jurídicos, Barcelona, Ariel, 1996. BOBBIO, N., El positivismo jurídico, Madrid, Debate, 1993. BURILLO, J., “The Periods of Roman Law”, Revista de Estudios Histórico-Jurídicos III, Valparaíso, 1978. CATALANO, P., “Religione, morae e diritto nella prospettiva dello ius romanum”, Roma e América, Diritto Romano Comune. Revista de Diritto del’Integrazione e Unificazione del Diritto in Europa e in América Larina, Roma, núm. 1, 1996. CICERÓN, Dell’oratore, 1, versión de A. GAOS SCHMIDT, México, UNAM, 1995. D’ORS, A., Derecho privado romano, 5a. ed. (1983), 9a. ed., Pamplona, Eunsa, 1997. DWORKIN, R., ¿Es el derecho un sistema de reglas?, trad. de Esquivel J. y Rebolledo, J., México, UNAM, 1997, col. Cuadernos de Crítica. ———, Los derechos en serio, trad. de M. Guastavino, Barcelona, Planeta-Agostini, 1993. FERNÁNDEZ BARREIRO, A., “El modelo romano de derecho de juristas”, Revista de Estudios Histórico-Jurídicos I, Valparaíso, 1976. FRANCIOSI, G., Corso istituzionale, di diritto romano, Turín, Giappichelli, 1994. FRANCISCI, P. DE, Sintesi storica del diritto romano, 3a. ed., Roma, Ateneo, 1965. GARCÍA DE ENTERRÍA, E., Reflexiones sobre la ley y los principios generales del derecho, Civitas, 1996. GARCÍA GARRIDO, M. J., Derecho privado romano II. Casos y decisiones jurisprudenciales, 2a. ed., GARCÍA BLANCO, Rufino (ed.), Madrid, 1982. GAUDEMET, J., Institutions de L’Antiquité, París, Sirey, 1967. GUARINO, A., Storia del diritto romano, 8a. ed., Nápoles, Editore Jovene Napoli, 1990. GUZMÁN BRITO, A., “La función del derecho romano en la unificación jurídica de Latinoamérica”, Materiali I. Derecho romano y unifica-
666
JAVIER SALDAÑA
ción del derecho. Experiencia europea y latinoamericana (con especial atención a la responsabilidad extracontractual), Roma, Università degli Studi Roma «Tor Vergata», 1999. ———, Derecho privado romano, Editorial Jurídica de Chile, 1996, t. I. HERVADA, J., Lecciones propedéuticas de filosofía del derecho, Pamplona, Eunsa, 1992. JÖRS, P. Y KUNKEL, W., Derecho privado romano, Barcelona, Labor, 1937. MAGALLÓN IBARRA, J., M., La senda de la jurisprudencia romana, México, UNAM, 2000. MORINEAU IDUARTE, M. e IGLESIAS GONZALEZ, R., Derecho romano, 3a. ed., México, Harla, 1993. PUGLIESE, G., “I principi generali del diritto. L’esperienza romana fino a Diocleziano”, en varios autores, I principi generali del diritto, Roma, Accademia Nazionale dei Licei, 1992. PUGLIESE, G., Istituzioni di diritto romano, 2a. ed., Turín, Giappichelli, 1990. RUIZ MANERO, J., “Principios jurídicos”, El derecho y la justicia, Madrid, Trotta, 1996. SCARANO USSANI, V., L’ars dei giuristi. Considerazioni sullo statuto epistemologico della giurisprudenza romana, Turín, G. Giappichelli, 1997. SCHIAVONE, A., Guiristi e Nobili nella Roma republicana. Il secolo della rivoluzione scientifica nel pensiero giuridico antico, Bari, Laterza, 1987. SCHIPANI, S., “El derecho romano en el nuevo mundo”, Ars Iuris 12, México, 1994. ———, La codificazione del diritto romano comune, Turín, Giappichelli, 1999. SCHULZ, F., Storia della giurisprudenza romana, Florencia, Sansoni, 1968. SERNA, P., “Sobre las respuestas al positivismo jurídico”, Persona y Derecho, Pamplona, núm. 37, 1997. STEIN, P., Regulae iuris. From juristic rules to legal maxims, Edinburgh University Press, 1996.
REGLAS Y PRINCIPIOS
667
———, “Lo svolgimento storico della nozione di «regula iuris» in dititto romano”, Antologia giuridica romanistica ed antiquaria I, Milán, Facoltà di Giurisprudenza di Milano, 1968. TALAMANCA, M. (dir.), Lineamenti di storia del diritto romano, 2a. ed., Milán, Giuffrè, 1989. TAMAYO Y SALMORÁN, R., Razonamiento y argumentación jurídica. El paradigma de la racionalidad y la ciencia del derecho, México, UNAM, 2003. VACCA, L., La giurisprudenza nel sistema delle fonti del diritto romano, Turín, Giappichelli, 1989. VILLEY, M., El derecho romano, México, Publicaciones Cruz O., 1993. VOCI, P., Manuale di diritto romano I. Parte generale, 2a. ed., Milán, Giuffrè, 1984.
!
LA INTERPRETACIÓN DEL DERECHO Augusto SÁNCHEZ SANDOVAL* No sólo existen seres y hechos del mundo de lo concreto, también existen seres y hechos del mundo del lenguaje**
SUMARIO: I. El mundo de lo concreto y el mundo del lenguaje. II. La interpretación de los hechos jurídicos. III. La interpretación relativa a las normas jurídicas. IV. La interpretación de las llamadas “normas claras”. V. La decisión judicial. VI. Propuesta de un nuevo modelo de interpretación en el derecho penal mexicano.
I. EL MUNDO DE LO CONCRETO Y EL MUNDO DEL LENGUAJE En la vida social existen dos mundos, el mundo de lo concreto y el mundo del lenguaje: 1. El mundo de lo concreto es el que es y está ahí, pero que los hombres no lo conocen por ser dinámico y cambiante. La ciencia al referirse a él, sólo nos da partes posibles de realidad, cuando no, mentiras completas, ya que por siglos ha funcionado como ciencia y verdad, el dogmatismo ideológico. De ello se deriva que del mundo de lo concreto no pueden argumentarse “verdades”, ni “absolutos” y que no puede hablarse de ciencia, sino de hipótesis científicas que se van construyendo mediante la contradicción, corrección y superación de las hipótesis científicas previas. Si la ciencia robusta que puede controlar en el laboratorio una numerosa cantidad de variables, no puede dar respuestas absolutas, entonces * Facultad de Estudios Superiores Acatlán, UNAM, México. ** Ferris, Mauricio, La hermenéutica, trad. de José Luis Bernal, México, Taurus, 1988, p. 43, paráfrasis. 669
670
AUGUSTO SÁNCHEZ SANDOVAL
tampoco puede ser considerada como la productora de una totalidad explicativa acabada, sino como proceso de un posible conocimiento que es cambio permanente. Las ciencias sociales como la política, la psicología, la economía, la criminología o el derecho, son todavía más inciertas, pues sus variables no son controlables y son impredecibles en sus efectos. En ellas la relación causa-efecto, tan socorrida en las ciencias naturales, sucumbe, porque las causas en las ciencias sociales no son claramente identificables, por lo tanto no son plenamente medibles y en cuanto se llegara, en parte, a conocerlas, sus efectos pueden darse o no, ante las mismas causas. En consecuencia, hablar de la causa-efecto en los fenómenos sociales no tiene consistencia teórica ni empírica. 2. El mundo del lenguaje, que es el que se inventa por los hombres en la comunicación, para construir la conciencia de lo real, la cual se reproduce a través de la norma-ideología. Así, la sociedad vive el mundo intelectual del lenguaje y de la cultura, y no el mundo de lo concreto que existe afuera de las construcciones ideológicas. Por tanto, los sistemas sociales no se edifican sobre el mundo de lo concreto, sino sobre un universo simbólico, cuya repetición en el tiempo, lo sustantiviza y objetiviza como “realidad”. A ese respecto, la concepción de ideología de Marx y Engels parece adaptarse plenamente, cuando la definen como “una labor sobre ideas concebidas con propia sustantividad, con un desarrollo independiente y que sólo obedecen a sus propias reglas”1 (de construcción discursiva). De esta manera, en el mundo del lenguaje, el sistema de las ideas expresadas con palabras adquieren la fuerza de “realidades objetivas”, que viven y evolucionan por sí mismas, a partir de sus propias normas de construcción. En consecuencia, el sistema ideológico-social se auto-reproduce, en virtud de la “racionalidad ideológica” en que se fundamenta y, por lo tanto, no tiene referencias en el mundo de lo concreto que está afuera de él. Otro tanto puede afirmarse en el campo del conocimiento individual, pues basta con decir que la totalidad del ser en sí no puede conocerse por sí mismo; por tanto, menos puede conocer a otro ajeno. “Freud propuso el ‘inconsciente” y a la vez planteó la paradoja: lo que de él se enuncie, por el hecho mismo de enunciarlo, ya no corresponde a él; siendo in1 Marx, C. y Engels, F., La ideología alemana, La Habana, Pueblo y Educación, 1982, p. 26, el paréntesis es nuestro.
LA INTERPRETACIÓN DEL DERECHO
671
consciente es inefable”.2 Lo que se diga de sí mismo o del prójimo será siempre una ilusión, propia de la artificialidad de los enunciados discursivos, contenida en el marco teórico de la disciplina de conocimiento que se utilice. El sujeto mismo es una construcción artificial del lenguaje que adquiere objetividad en cuanto es sujetado por la ideología al atribuírsele un nombre, una condición social y una función. “Sujeto es la ficción que pretende hacernos creer que muchos estados similares son en nosotros el efecto de un mismo substratum, pero somos nosotros los que hemos creado la analogía entre estos diferentes estados”.3 Por ello: el “sujeto” no es un viviente organismo humano, sino en la medida en que le corresponde un nombre, que el sujeto llama “propio” como si ignorara que le fue impuesto; de una imagen de sí, que el sujeto llama “y” y que le permite reconocerse del otro lado del espejo o en una fotografía, y de un “cuerpo” que también es considerado como “propio mío”, en la medida en que acepte las exigencias de ese organismo y la responsabilidad de conducir tal cuerpo, según una normatividad variable, que procede de los usos, costumbres y leyes del entorno… El soporte de lo que llamamos sujeto es el encadenamiento de cuerpo, palabra e imagen en una supuesta unidad, que no existe sino como ficción, pero es una ficción salvadora. El sujeto se considera y se cuenta como uno; pretende tener una cierta sustancialidad, una permanencia de esa sustancia a través del tiempo y de los desplazamientos en el espacio. Sólo hay un nombre propio para permitirle esa fantasía, esa ilusión que se llama “sí mismo”, self.4
Esa construcción del mundo de lo artificial, a través de la ideología, lo simplifica y lo hace fácil para los individuos, de manera que se mueven en un limitado espacio de experiencias conocidas, reduciendo el campo del pensamiento y de la acción a repeticiones y habituaciones que satisfacen la curiosidad y llenan la vida de todos aquellos que interactúan dentro de ese sistema social, sin temor al riesgo de lo desconocido. 2 Braunstein, N., citando a Freud afirma además que el conocimiento imposible de sí mismo lo han planteado Fichte, Schelling, Nietzsche, Dilthey, Wittgestein y Heidegger, La ficción del sujeto, México, 2001, p. 3, inédito. 3 Nietzsche, F., “La voluntad de poder”, parágrafo 480 citado por Braunstein, N., La ficción del sujeto, México, 2001, p. 6, inédito. 4 Ibidem, p. 4.
672
AUGUSTO SÁNCHEZ SANDOVAL
3. Con lo visto, queda claro que existen por una parte, seres y hechos del mundo de lo concreto y por otra, seres y hechos del mundo del lenguaje, y que esos mundos, al pertenecer a esferas ontológicas diversas, corren líneas paralelas que no se juntan, pues cuando lo hacen, producen seres y hechos híbridos que no son lógicos sino ideológicos. La construcción de la verdad jurídica mediante el procedimiento judicial constituye un ser híbrido ideológico, que siendo una especulación del lenguaje de todos los actores que en él intervienen, se presenta falsamente como mundo de lo concreto, cuando es sólo una artificialidad del lenguaje como se verá enseguida. II. LA INTERPRETACIÓN DE LOS HECHOS JURÍDICOS La interpretación de los hechos jurídicos puede verse desde dos ángulos que pueden ser excluyentes o complementarios: a) Para quienes interpretar es sinónimo de conocer o de dar un cierto sentido a los hechos, el juez como resultado de su conocimiento de los mismos y de la información recibida, declara la “verdad” sobre el caso. Para estas orientaciones la ley y las normas son hipótesis dogmáticamente propuestas, de tal forma que estableciéndose los hechos, la aplicación de ésta o aquella norma, puede inclusive cumplirse mecánicamente.5 b) Para quienes interpretar implica el problema de la comprensión de los hechos por parte del juez, imponen a éste la sabiduría de entender y sentir los hechos jurídicos y las motivaciones humanas, que no pueden captarse objetivamente y por lo cual no pueden verificarse. De ahí que cualquier decisión que tome será siempre subjetiva y parcial. Por ello, el proceso de conocer o de comprender subjetivamente los hechos, lleva al intérprete a conformar el hecho,6 seleccionando aquellos aspectos que se acomodan a la comprensión de su propio mundo de lenguaje y al molde constituido por la norma jurídica. Por eso, los hechos no aparecerán como fueron, sino como una nueva realidad construida de acuerdo al interés y al lenguaje de los actores involucrados en ellos, que podrá ser amplio o reducido, y a los márgenes rígidos de las leyes. Esto 5 6
Vernengo, R. J., Interpretación jurídica, México, UNAM, 1977. Soler, S., citado por Vernengo, R., op. cit., nota anterior; véase también a Maurizio Ferraris, La hermenéutica, México, Taurus, 2001. “Interpretar suele significar-para nosotros hoy- entender el sentido y no solo expresarlo”, p. 17.
LA INTERPRETACIÓN DEL DERECHO
673
es, para los sujetos existen interpretaciones de los hechos, nuevas construcciones de los mismos, pero no es posible que lo que ellos dicen del hecho, sea el hecho. Es así como los hechos se motivan y ocurren de una forma; las informaciones otorgadas por las partes los presentan con sus determinadas intenciones y deformaciones; los escribientes los transcriben con un analfabetismo funcional, que no cuida las formas ni los símbolos gramaticales y de redacción; y finalmente, el juez o el ministerio público no los reconstruyen, sino que los construyen, como subjetivamente los conozcan o los comprendan, seleccionando los datos y los sujetos que le sirvan, para integrar los elementos que la norma jurídica les exige cumplir. c) Pa ra quie nes la in ter pretación es un trabajo de desenmascaramien to, 7 deben partir del principio que du dar per mi te co no cer y pa ra ello se requiere negar la con cien cia de rea li dad que es tá pre cons truida por otros y que aparece como verdad, porque ha sido impuesta por quien ha te ni do po der pa ra ins titu cio nali zar la co mo ver dad y to ta lidad pa ra to dos. Si se parte del concepto hegeliano de conciencia o certeza sensible, entendida como la creencia ingenua según la cual lo real se da como inmediatez,8 es posible definir aquí a la conciencia de lo real como la relación determinada del yo con un objeto9 o con otro sujeto, que comienza con el conocimiento superficial y aparente de los entes que constituyen el universo, y que da al individuo la visión de una realidad con criterio de verdad y de totalidad. La conciencia de lo real se construye a través de las percepciones e intuiciones personales, por lo cual es subjetiva y constituye una especie de cámara obscura que impide a los individuos ver más allá de sus paredes. Cuando en una sociedad civil vertical y jerarquizada quien tiene el poder impone su propia conciencia de realidad a todos los demás como única razón, se habla de una construcción particular de la realidad. Por el contrario, cuando en una sociedad horizontal se respetan las diversas conciencias de lo real de los asociados y todos participan en la construcción de la realidad como una síntesis de las mismas, se habla de una construcción social de la realidad. 7
Ferraris, Mauricio, La hermenéutica, México, Taurus, 2001:citando a Marx, Nietzsche y Freud, p. 24. 8 Ibidem, p. 132. 9 Cfr. Hegel, G. W. F., Propedeutique Philosophique, Gonthier, 1963, p. 74
674
AUGUSTO SÁNCHEZ SANDOVAL
La conciencia de lo real debe de ser superada en busca de la conciencia posible, esto es, al buscar las rendijas que haya en las paredes de la cámara obscura o romperlas, se puede ver hacia afuera y encontrar otras razones y otras realidades diferentes. Las ideologías fundamentan su ser esencial en las conciencias de lo real institucionalizadas, es decir, hechas obligatorias y que se desean perpetuar, apropiándose de ellas como única realidad-verdad e imponiéndolas como dogmas al grupo social. En consecuencia, se puede considerar a la ideología como “el conjunto de contenidos de una particular conciencia de realidad, objetivados durante un determinado tiempo, espacio o circunstancias históricas, que han sido institucionalizados por quien ha tenido poder para hacerlo y que se mantienen a través de las generaciones mediante controles sociales formales e informales, derivados de mecanismos de sumisión y obediencia jerárquicas”.10 Así como se inventa y se impone la conciencia de la realidad respecto al mundo de lo concreto, igualmente se inventa e impone la conciencia de lo real respecto del mundo del lenguaje jurídico. Por lo tanto, para interpretarlo, se deben buscar no sólo las funciones declaradas de la norma, sino también es preciso desenmascarar las funciones latentes, que ocultan los intereses del poder, que la ha construido. III. LA INTERPRETACIÓN RELATIVA A LAS NORMAS JURÍDICAS El concepto de interpretar también tiene el sentido referido al análisis del origen de la norma, de su ubicación dentro del ordenamiento jurídico y del significado de los enunciados normativos. Por tanto, el abanico se abre a los campos del poder, del conocimiento y de la comprensión del lenguaje con todas sus implicaciones, entre otros. Para la interpretación judicial de las normas jurídicas se pueden abrir tres grandes cauces: a) Aquel que toman los que consideran que la conciencia que se tiene sobre el mundo y sobre sí mismos ha sido construida con base en ciertos parámetros ideológicos, por lo que el conocimiento institucionalizado ha dependido de los intereses y de las decisiones del poder, con el cual no 10 Cfr. González V. A. et al., Control social en México, México, UNAM, FES Acatlán, Unidad de Servicios Editoriales, 1998, p. 27.
LA INTERPRETACIÓN DEL DERECHO
675
se está de acuerdo. Desde este ángulo de observación, la interpretación del ministerio público o del juez dependerá de su integración al aparato judicial y de su necesidad de permanecer dentro del mismo, para sobrevivir económicamente. Es decir, aquí el intérprete sabe de la mala conciencia que existe en la estructura del Estado y que se pretende legitimar como buenas intenciones a través de las normas jurídicas. Sin embargo, ellos juegan las cartas que tienen. b) Otro cauce es aquel que toman los intérpretes de las normas, cuando comprendiendo o no, que viven en una realidad construida, se conforman con el estado de cosas y aplican las normas, considerando que tienen todo el derecho a juzgar a otros. Entonces para justificarse buscarán la presunta voluntad del legislador al hacer la norma, el contexto social o político en que se encuentre o argumentando la salida que sea de su interés, ya sea respecto de normas claras u obscuras. c) Por último, están los intérpretes del desenmascaramiento que también aquí aparecen al develar la mala fe que pueda existir detrás de las presuntas buenas intenciones que plantea la norma. En las sociedades de estructura vertical y jerárquica, la norma no es un producto del consenso, sino de la imposición del más fuerte, así sea bajo la etiqueta de una mayoría. Entonces el hermeneuta tendrá que afrontar su trabajo partiendo del presupuesto que todo acto de poder es arbitrario y por lo tanto, lo beneficia y lo protege a él. En consecuencia, el intérprete debe tener intuición y saber leer entre las líneas blancas de la norma, el sentido subrepticio que se busca con su aplicación y que será el fin real que desea alcanzar el do minante que la promulgó. Todo acto humano y más si es de poder, contiene funciones declaradas que construyen una aparien cia, por ello es necesario intuir las fun ciones latentes, es decir, to das aquellas que en la realidad se alcanzan. Para ello es preciso poseer pensamiento abstracto y un ánimo libertario que permita ponderar la voluntad de poder, con el interés del dominado a quien va dirigida la norma, ya que ésta es un puñal que rara vez hiere a quien la empuña.
676
AUGUSTO SÁNCHEZ SANDOVAL
IV. LA INTERPRETACIÓN DE LAS LLAMADAS “NORMAS CLARAS” Si la norma es clara, esto es, cuando todas las interpretaciones razonables que pueda recibir conduzcan a la misma solución, requiere ser verificada y para ello Perelman, Ch.11 ofrece el siguiente modelo: Interpretación 1 Interpretación 2 Norma clara:
Interpretación 3
Solución normativa
...Interpretación “n” 1
2
3
Esto implica postular : — Que de toda norma y a fortiori de la norma clara, hay múltiples interpretaciones razonables, entendiendo por razonable, un enunciado equivalente a la norma de origen y que conduce a la misma norma de salida; — Que las múltiples interpretaciones razonables son finitas y enumerables. — Que el conjunto de todas las interpretaciones conducen a una norma única como solución, sea porque lógicamente la impliquen, o porque no tenga, frente a ese conjunto de posibilidades, otra alternativa de procedimiento. La definición e interpretación de las normas claras entonces, como se ha podido observar, muestra tales dificultades que lo menos que puede afirmarse es que nada tienen de claras. “Estamos ante problemas de la semántica de las norma, de la relación que un enunciado normativo, por claro y evidente que sea, tenga con alguna otra entidad que corresponderá entrever: hechos sociales, sentidos o valores”.12 En consecuencia, si la interpretación más seria y metódica de la norma clara, se encuentra con esa problemática, es aún más confusa e inaccesible la situación cuando se trata de normas obscuras, que nos llevan a 11 12
Perelman, Ch., citado por Vernengo, R. J., op. cit., nota 5. Idem.
LA INTERPRETACIÓN DEL DERECHO
677
múltiples salidas, como las normas abiertas o en blanco, en que caben todo tipo de interpretaciones. V. LA DECISIÓN JUDICIAL De acuerdo a los tipos genéricos de interpretación vistos, se llega al momento de las decisiones judiciales, las cuales pueden verse desde las siguientes perspectivas: a) La primera consideraría que en el límite el proceso decisorio de salida no consiste sino en la obtención —si se quiere mecánica— de ciertas conclusiones deductivas, a partir de premisas aceptadas. Se trataría de un proceso lógico y puramente intelectual.13 b) La segunda se caracterizaría porque hace del acto interpretativo, un momento puramente irracional en que juega un papel predominante el querer o el arbitrio del órgano que juzga: su instinto axiológico, su olfato jurídico o una serie de otras supuestas capacidades que escapan al control racional.14 Vistas ambas posiciones puede preguntarse y explicarse el porqué todos los días los juzgadores emiten sentencias múltiples, interpretando hechos y normas claros y obscuros. La respuesta consiste en que los juzgadores no tienen que “demostrar” en su análisis, para justificar ante las partes o las instancias superiores su interpretación. “Sólo presentan el planteamiento de una razón instrumental y utilitaria ausente de toda consideración moral”.15 Para hacer eso, no importa el problema filosófico de que la realidad o la verdad sean hipotéticas e inalcanzables, basta entonces con adquirir sólo un grado subjetivo de convencimiento o interés sobre los hechos y sobre las normas para declararlos reales y verdaderos, mediante argumentos que sean creíbles. “En la ‘argumentación’ no se trata de probar la verdad de una conclusión a partir de la verdad de las premisas, sino de transmitir a la conclusión, la adhesión acordada a las premisas”.16 13 14 15
Vernengo, R. J., op. cit., nota 5. Idem. Horkhaimer, M., Crítica de la razón instrumental, Sur, Buenos Aires, 1969, pp. 15 y ss. 16 Giménez, G., Discusión actual sobre la Argumentación, México, UNAM, 1989, pp. 2; y Vernengo, R. J., op. cit., nota 5.
678
AUGUSTO SÁNCHEZ SANDOVAL
De igual manera procede un ministerio público o un juzgador que se ve impelido por su interés o por un mandato del poder a decidir según una cierta línea, pues la argumentación le sirve de tal manera, que encontrará adeptos a cualquiera que sea su interpretación o decisión. Hay que recordar aquí, la alegoría de Bollack17 entendida como: “El arte de pensar otra cosa bajo las mismas palabras, de decir otras cosas con las mismas palabras o expresar de otra manera, las mismas cosas”. VI. PROPUESTA DE UN NUEVO MODELO DE INTERPRETACIÓN EN EL DERECHO PENAL MEXICANO
El nuevo intérprete podría encarar su trabajo desde la perspectiva de que el Estado de poder de estructura vertical, como producto de una sola razón, se encuentra en la esfera de lo arbitrario y por lo tanto sus acciones no pueden ser racionales. En consecuencia, la creación de las normas jurídicas, su interpretación y su aplicación, obedecen a la voluntad e interés de ese poder, de acuerdo al sistema de organización y de subordinación de los órganos del Estado y de la administración pública, especialmente a los que atañe la creación interpretación y aplicación de las mismas. El rompimiento de la estructura judicial en México es evidente ante la interferencia de otros poderes o servidores públicos en la función judicial como la del Poder Ejecutivo en la administración del derecho desahogando pruebas y decidiendo antes que el juez, qué delitos y qué personas serán de conocimiento de éste; así como la potestad del Ministerio Público de liberar bajo caución administrativa a presuntos responsables, antes de cualquier conocimiento judicial; la ignorancia del derecho, de los unos y de los otros, y el apresuramiento sin técnica de las diligencias y la obtención de información; la falta de conocimiento y el mercadeo de los peritos y de los peritajes científicos, hechos al gusto del cliente, hacen que deba haber un peritaje oficial “tercero en discordia”, que fuerza la decisión y que le da la razón a uno de los dos contendientes. No obstante, el juzgador no está obligado a tener en cuenta el dicho de los peritos, pues están tan desacreditados, que son parte en la litis y no auxiliares del juez. Si se previera un cuarto peritaje, quizás equilibraría las fuerzas 17 Bollack citado por Bourdieu, P., “Génesis y estructura del campo religioso”, Revue Francaiese de Sociologie, núm. 12, 1971, p. 304.
LA INTERPRETACIÓN DEL DERECHO
679
y quedaría claro que ninguno es científico, porque en lugar de converger hacia un dato hipotético de certeza, se polarizan en el interés de la total negación del otro. La reacción social, el manejo del discurso y la utilización del lenguaje, ya no son un mero vehículo destinado a transmitir informaciones, sino se pueden considerar como un dispositivo que permite construir y modificar las relaciones entre los interlocutores, sean éstos individuos o grupos sociales bien definidos; ya no son un sistema de signos destinados a representar el mundo, sino también pueden observarse como una forma de acción, como arma de combate e instrumento de intervención sobre el mundo.18
Por lo anterior, los tantos factores convergentes en la interpretación impiden hacer un modelo mecánico y se requiere más bien, construir caminos que se inscriban en la totalidad fenoménica, en que se da la interpretación. Esta propuesta de interpretación obedecería a un proceso deductivo, dirigido a descubrir las intenciones reales que busca el sistema de poder, que no están declaradas al construir la norma; seleccionar los intereses que quiere proteger y construir a los chivos expiatorios que desea castigar. El sistema de control no puede sancionar a todos los trasgresores, por ello escoge a una mínima parte de personas para aplicarle las penas, ya sean éstas responsables o no, pues lo que busca es demostrar a todos los habitantes, que él es el que manda y monopoliza el ius puniendi. Se tendría entonces que analizar la norma a partir de: — — — —
El poder El lenguaje La realidad como construcción del poderoso La legitimación a través de la ideología-derecho, que justifica su dominio, y descubrir, — Las intenciones reales, no declaradas en la norma
Luego, el proceso deductivo encararía el conocimiento del área del derecho en que se halla ubicada la litis, las normas aplicables, los poderes que intervienen y sus intereses específicos en la decisión judicial o administrativa: 18
Giménez, G., op. cit., nota 18, p. 6.
680
AUGUSTO SÁNCHEZ SANDOVAL
Área :
Poderes que intervienen:
Penal
Ejecutivo y Judicial
Fiscal
Ejecutivo y Judicial
Laboral
Ejecutivo y Judicial
Civil
Judicial y Ejecutivo
Menores
Ejecutivo y excepcionalmente Judicial, vía amparo
Seguiría la interpretación de los hechos jurídicos, partiendo de la certeza de que si el presente no puede ser conocido en su totalidad, el pasado menos, pues ocurrió como ocurrió; no regresa y no puede rehacerse, aunque el derecho diga que hay “reconstrucción de hechos”. Aquí se está ante construcción de un hecho nuevo, a partir de la información recibida por los escribientes de las partes, los testigos, los abogados, los policías y los peritos, que serán, sin saberlo quizás, factores de distorsión del hecho. Ellos, aún diciendo su verdad, no dirán otra que la subjetividad de su percepción y la expresión, amplia o limitada, de su lenguaje; que al referirse al mundo concreto de afuera, no será el mundo de afuera, sino la interpretación que ellos hagan de ese mundo. Esto es, su hecho narrado no será el hecho ocurrido. Este nuevo hecho pasa a ser interpretado y rearmado por el ministerio público en sus conclusiones y al final llegará al juez, que a su vez lo interpretará y lo rearmará, para tener su definición de caso. Pero al estar intervenida por tantas variables, la definición de caso será arbitraria y subjetiva. Después debe venir la interpretación de la norma aplicable al caso definido. Al igual que el hecho jurídico sufre un variado número de distorsiones, la norma jurídica también, pues generalmente no permanece en los términos legales, ya que su reglamentación por el ejecutivo o su interpretación por el jurisprudente extralimita los alcances de la norma original o queda corta respecto de ella. Esas actividades reglamentarias o jurisprudenciales se convierten en factores de distorsión de la norma jurídica, por lo cual no son interpretadas y aplicadas por el Ministerio Público o por los jueces en su forma inicial, sino modificada, aumentando la inseguridad jurídica para los ciudadanos, que se convierten en víctimas del aparato administrativo y judicial.
LA INTERPRETACIÓN DEL DERECHO
681
Las circulares que emiten los servidores públicos respecto de la forma de utilizar la norma jurídica o de interpretar los hechos, son un factor más de distorsión de la norma y de los hechos originales. Por tanto, al juez no le llega el hecho ni el derecho como fueron y sin embargo, a ese resultante se le llama la verdad jurídica, con base en la cual deberá decidir la absolución o la condena de una persona. Ante tales circunstancias, el juez tendrá en sus manos una definición de caso arbitraria, que constituirá un dato respecto del cual se podrá argumentar todo lo que se quiera, pues él argumenta, no prueba ni contra-prueba. La argumentación puede ser totalmente irracional, basta con que se exprese justificándose en una norma pura o espuria. Ante la oposición a la decisión, el juzgador dirá: Apele o ampárese. Y en efecto, la irracionalidad o la ilegalidad de la interpretación jurídica no tiene ninguna consecuencia para el intérprete a quo, ni para el intérprete ad quem, porque aunque el juez en la segunda instancia contradiga al de primera, tampoco importa, pues al final la decisión que vale y que dota de sentido a toda esa realidad construida es la que emita el poder máximo del “ministro” en la tercera instancia. En definitiva, todo depende del poder que tenga el que interpreta y emite la decisión final, con razón o sin razón, con derecho o sin derecho. Aquí se ha dejado claro que a la incertidumbre de las definiciones legales, de los intereses de las autoridades y de las partes en conflicto, se suma la construcción de una verdad jurídica que no tiene nada que ver con el mundo de lo concreto, pero que sirve y es funcional a los intereses del sujeto particular o colectivo con poder, para justificar lo que él considera la verdad y la realidad jurídica para todos.
!
EL POSITIVISMO INCLUYENTE EN LA ENCRUCIJADA Pedro SERNA* SUMARIO: I. Introducción. II. La posición del ILP sobre el positivismo, su reformulación y sus variantes. III. Algunas inconsistencias en el planteamiento expuesto.
I. INTRODUCCIÓN En los últimos años ha surgido dentro del positivismo jurídico una controversia, que ha hecho correr ríos de tinta sobre la posibilidad de una particular conexión entre derecho y moral. Ésta ha surgido desde el momento en que algunos positivistas han admitido que la atribución de validez jurídica a las normas, la determinación de su contenido y su concreta influencia sobre la decisión judicial de un caso concreto, pueden depender de criterios morales.1 Desde este punto de vista, que se conoce * Universidad de Coruña, España. 1 Cfr. Waluchow, W., Inclusive Legal Positivism, Oxford, Clarendon Press, 1994, pp. 2, 81 y 82, 178; Coleman, J., “Authority, and Reason”, en George, R. P. (ed.), The Autonomy of Law. Essays on Legal Positivism, Oxford, Clarendon Press, 1996, pp. 287 y 288; del mismo autor, “Negative and Positive Positivism”, Journal of Legal Studies 11, 1982, pp. 139-164; también incluido en Cohen, M. (ed.), Ronald Dworkin and Contemporary Jurisprudence, Londres, Duckworth, 1983, pp. 28-48; Lyons, D., “Principles, Positivism and Legal Theory”, Yale Law Journal, 87, 1977, pp. 415-435; del mismo autor, “Derivability, Defensibility and the Justification of Judicial Decisions”, The Monist, 68, 1985/3, pp. 325 y ss.; J. Mackie, “The Third Theory of Law”, Philosophy and Public Affairs 7, 1977/1, pp. 3 y ss., también incluido en Cohen, M. (ed.), Ronald Dworkin and Contemporary Jurisprudence, op. cit., supra, pp. 161-170; Soper, E. P., “Legal Theory and the Obligation of a Judge: The Hart-Dworkin Dispute”, Michigan Law Review, 75, 1977, pp. 473-519, también incluido en Cohen, M. (ed.), Ronald Dworkin and Contemporary Jurisprudence, op. cit., supra, pp. 3-27; C. L. Ten, “The Soundest Theory of Law”, Mind 88, 1979, pp. 532 y ss.; F. Schauer, “Positivism Through Thick and Thin”, en Bix, B., Analysing Law. New Essays in Legal Theory, Oxford, Clarendon Press, 1998, p. 69; Postema, G., “Coordination and Conventions at the Foundations of Law”, Journal 683
684
PEDRO SERNA
como Inclusive Legal Positivism2 o positivismo jurídico incluyente (en adelante, ILP), los principios y valores morales figuran entre los posibles fundamentos que un sistema jurídico acepta para determinar la existencia y contenido de las normas jurídicas. En este sentido, es característico de esta tendencia la admisión de la posibilidad de que la regla de reconocimiento de un sistema jurídico contenga explícitamente criterios morales de los que dependa la validez normativa. Es obvio que, si es posible que la regla de reconocimiento contenga estos criterios, entonces la validez jurídica de las normas puede venir determinada a veces no sólo por su origen, es decir, por el hecho de su promulgación y por la forma en que ésta ha tenido lugar.3 A pesar de la notable tendencia en las filas positivistas a aceptar esta conexión entre derecho y moral que sugiere el ILP, hay autores que la rechazan. Desde su posición, conocida como Exclusive Legal Positivism4 (ELP), se considera que la validez de una norma jurídica depende sólo de su procedencia de una fuente adecuada (legislador, decisión judicial o costumbre); es decir, de una pura cuestión de hecho (el origen o pedigree). Además, estos autores consideran que el contenido de las normas jurídicas válidas puede ser determinado a partir de la constatación de ciertos hechos (acciones o intenciones humanas) que pueden ser conocidos sin necesidad de recurrir a consideraciones morales. En definitiva, el ELP se caracteriza por mantenerse fiel a una de las tesis tradicionales del positivismo jurídico: la llamada “tesis social fuerte”.5 of Legal Studies, XI, 1982, pp. 168 y 169. Todos estos autores se consideran seguidores de Hart, cuyas ideas más relevantes sobre este tema se encuentran en su “Postscript”, The Concept of Law, 2a. ed., Oxford, Oxford U. P., 1994, aunque ya hay esbozos de las mismas en la 1a. ed., Cfr. El concepto de derecho, trad. de G. R. Carrió, Buenos Aires, Abeledo-Perrot, 1961, p. 252. 2 Expresión acuñada por Waluchow, W., op. cit., nota 1, pp. 1-3, 81 y 82. Otros autores hablan de incorporacionismo o de “positivismo blando” (soft positivism), expresión esta adoptada por el mismo Hart. Cfr. Coleman, J., “Authority and Reason”, op. cit., nota 1, pp. 287 y 288; Hart, H. L. A., op. cit., nota 1, p. 250. 3 Idea ésta que ya fue admitida por Hart. Cfr. El concepto de derecho, cit., nota 1, p. 252; “Postscript”, op. cit., nota 1, pp. 250-254. 4 Denominación empleada también por Waluchow, W. (op. cit., nota 1, p. 82) refiriéndose a la versión del positivismo defendida por Raz. 5 Cfr. Raz, J., The Authority of Law. Essays on Law and Morality, Oxford, Clarendon Press, 1979, pp. 37-52; del mismo autor, “Authority, Law and Morality”, The Monist 68, 1985, pp. 311-320. Una formulación similar se encuentra en H. Mitrophanous, “Soft Positivism”, Oxford Journal of Legal Studies, 17, 1997, p. 624.
EL POSITIVISMO INCLUYENTE
685
Básicamente, el ILP pretende ser una teoría jurídica capaz de explicar los modernos sistemas constitucionales que dan entrada a criterios sustantivos (incluidos los de índole ética) en la identificación (existencia y contenido) de las normas jurídicas; en esta capacidad suya residiría una de sus principales ventajas frente al ELP.6 Ello supone, por una parte, mantener la fidelidad a los postulados teóricos del positivismo jurídico y, por otra, tomar distancia del positivismo tradicional, fielmente reflejado en el ELP. A tal efecto, se propone un concepto de positivismo que pueda dar cabida tanto al ELP como al ILP, que en el fondo no es otra cosa que una corrección del anterior destinada a hacer viable la continuidad de la doctrina positivista. Todo ello produce un notable cambio de escenario en la polémica con el iusnaturalismo, sobre todo si se atiende a algunas de sus versiones como la representada por el pensamiento de John Finnis, hasta el punto de que, si bien debe admitirse que perviven importantes diferencias de orden ontológico y epistemológico, ambas posiciones pueden dialogar y cooperar en una tarea científica que tenga como objeto el análisis de los modernos sistemas constitucionales. El objetivo de estas reflexiones es mostrar lo que considero puntos oscuros, contradictorios o débiles en el planteamiento del ILP. Acometeré esta tarea desde la perspectiva del observador de un debate que no se siente identificado con ninguna de las dos posiciones en diálogo, es decir, ni con el positivismo incluyente ni con el tradicional. Para la exposición de las tesis fundamentales del ILP tomaré como referencia principal la presentación recientemente realizada por el profesor Vittorio Villa,7 que retrata con notoria claridad expositiva a esta corriente positivista. II. LA POSICIÓN DEL ILP SOBRE EL POSITIVISMO, SU REFORMULACIÓN Y SUS VARIANTES
Según Villa, es posible construir una definición conceptual de positivismo jurídico que ayude a ver a ambas doctrinas (ILP y ELP) como dos concepciones diferentes de un mismo concepto, y muestre la unidad sustancial de todo el pensamiento positivista, haciendo aparecer las diver-
6 7
Cfr. Waluchow, W., op. cit., nota 1, p. 102. Cfr. Villa, V., “Inclusive Legal Positivism e neo-giusnaturalismo: lineamenti di una analisi comparativa”, Persona y Derecho, 43, 2000/2, pp. 33-97.
686
PEDRO SERNA
gencias entre ellos como cuestiones de detalle.8 Esa definición conceptual se compondría de los siguientes elementos: a) Una tesis ontológica, que vincula al derecho con un fenómeno normativo, positivo, contingente y convencional... (Convencional se opone a natural, aunque según Villa es compatible con el positivismo admitir un enraizamiento natural y unos contenidos necesarios si éstos son muy genéricos).9 b)Una tesis epistemológica, que sostiene que una cosa es describir y otra tomar partido. No se identifica con la tesis de la descripción avalorativa, y por ello ahí no puede situarse la diferencia entre positivismo y iusnaturalismo, sino más bien en la índole de las valoraciones. O sea, que el positivismo puede convivir con la índole necesariamente valorativa de la descripción jurídica.10 c) Las dos tesis no están conceptualmente conectadas.11 d) No es, en cambio, esencial al positivismo la tesis de la separabilidad (no necesidad de que el derecho acoja ciertos contenidos morales). Ésta sería un corolario, y de la tesis ontológica, no de la epistemológica, como piensan algunos. Además, esta tesis alude a separabilidad, compatible con la no-separación de hecho, que es lo que sucede ordinariamente.12 Por tanto, dentro del positivismo, ILP y ELP son dos concepciones posibles y discutibles.13 Su único elemento de diferenciación estable14 es la diferente interpretación que hacen de la tesis de la separabilidad. Concretamente, el ILP admite que los criterios para identificar las normas (existencia y contenido) pueden ser morales, dentro de los límites permitidos por la norma de reconocimiento. Y pueden ser directos o indirec-
8 Cfr. ibidem, pp. 39 y 40. En un sentido similar (aunque con cierta variación en cuanto a las tesis que se consideran características del positivismo) cfr. Coleman, J. y Leiter, B., “Legal Positivism”, en Patterson, D. (ed.), A Companion to Philosophy of Law and Legal Theory, Oxford, Blackwell, 2000, p. 241. 9 Cfr. Villa, V., op. cit., nota 7, pp. 42 y 43; Coleman, J. y Leiter, B., “Legal Positivism”, op. cit., nota 8, p. 241. 10 Cfr. Villa, ibidem, p. 44. 11 Ibidem, pp. 49 y 50. 12 Ibidem, pp. 48 y 49. 13 Ibidem, p. 54; Coleman, J. y Leiter, B., “Legal Positivism”, op. cit., nota 8, p. 241. 14 Ya que la divergencia entre ellos no afecta, según Villa, a un supuesto tratamiento diverso del tema de la discrecionalidad, como opinan algunos autores. Cfr. Villa, V., op. cit., nota 7, p. 55.
EL POSITIVISMO INCLUYENTE
687
tos.15 Por su parte, el ELP sólo admite criterios fácticos para determinar la validez; para él, la alusión a la moral encierra una auténtica creación del derecho por el juez, no una identificación del derecho existente.16 A esto se añade que para el ILP es posible una regla de reconocimiento que no admita criterios éticos para determinar la validez, pero si los admite, eso no afecta a la separabilidad17. Ello se vincula con el reconocimiento de que la conexión entre los criterios para determinar la existencia de una norma y aquellos para determinar su contenido da lugar una noción más amplia de validez, que se establece de hecho en los modernos estados constitucionales, pero no es necesaria. Las razones por las que los seguidores del ILP lo consideran preferible al ELP son dos: su mayor potencial explicativo y su mayor atractivo teórico. El mayor potencial explicativo se refiere a la capacidad para integrar en su panorama teórico, sin renunciar al positivismo, la ampliación de la noción de validez que tiene lugar en los estados constitucionales contemporáneos.18 Cierto que el ELP también puede ofrecer una explicación de esto, pero según el ILP, esta explicación no resulta satisfactoria en relación con un aspecto concreto: la extrema fluidez de las relaciones entre lo jurídico-formal y los contenidos sustantivos que ingresan en el derecho durante el proceso interpretativo-aplicativo, que hace difícil determinar de modo fijo y preciso qué es lo interno y qué lo externo al sistema jurídico.19 Esta fluidez extrema se explicaría por el carácter abierto de los textos constitucionales, que impide establecer una interpretación correcta y definitiva de los mismos como si existiera un ámbito de objetividad textual preexistente.20 La tarea que en este marco desarrolla el intérprete (doctrina o jurisprudencia) no es ni pura creación discrecional ni mera descripción de un derecho preexistente, sostiene el ILP siguiendo en este 15 Cfr. Waluchow, W., op. cit., nota 1, pp. 81 y 82, 102; Coleman, J., “Authority, and Reason”, op. cit., nota 1, pp. 287 y 288; del mismo autor, “Negative and Positive Positivism”, op. cit., nota 1, p. 31; Soper, E. P., “Legal Theory and the Obligation of a Judge: The Hart/Dworkin Dispute”, op. cit., nota 1, pp. 16-23; Schauer, F., “Positivism Through Thick and Thin”, op. cit., nota 1, p. 69; Postema, G., “Coordination and Conventions at the Foundations of Law”, op. cit., nota 1, pp. 168 y 169. 16 Cfr. Raz, J., The Authority of Law, op. cit., nota 5, pp. 39 y 40, 48-50. 17 Cfr. Villa, V., op. cit., nota 7, p. 56. 18 Ibidem, p. 62. En sentido similar, cfr. Waluchow, W., op. cit., nota 1, pp. 102 y 103. Sobre esta cuestión cfr., Zagrebelski, G., El derecho dúctil. Ley, derechos, justicia, trad. de Marina Gascón, Madrid, Trotta, 1995, pp. 33 y ss. 19 Cfr. Villa, V., op. cit., nota 7, pp. 63-68. 20 Ibidem, pp. 65 y 66.
688
PEDRO SERNA
punto a Hart (Postcript).21 Esta idea vale también para los casos en que se manejan contenidos éticos, derivándose de ello la imposibilidad de determinar disyuntivamente qué es interno y qué es externo en tales contenidos.22 De todo lo anterior se deriva que no es razonable trazar una distinción neta entre teoría del derecho y teoría de la aplicación, como sugiere el ELP tradicional.23 Es importante destacar que, a pesar de sus diferencias, el ILP comparte con el ELP algunas de sus deficiencias más básicas, concretamente la posición objetualista u objetivista. En ambos, la posibilidad de distinguir netamente entre teoría del derecho y teoría de la aplicación se funda en pensar el derecho como una realidad objetiva que existe autónomamente de las prácticas cognoscitivas, aplicativas e interpretativas.24 Esto se basa a su vez en una confusión semántica y, más radicalmente, en otra epistemológica. La primera consiste en considerar el lenguaje descriptivo como categoría semántica central,25 y la segunda en pensar que los datos objeto de este lenguaje pertenecen a un ámbito de la realidad independiente del modo de descripción empleado y de la descripción misma.26 De ahí que se piense en la descripción como un acercamiento neutral a la realidad existente. Para evitar estos defectos, se ha propuesto una corrección del ILP que pasa por su combinación con una propuesta constructivista. Ésta implicaría, por una parte, abandonar el objetivismo, es decir, la idea de que el lenguaje en que se expresa el conocimiento es reconducible al modelo de la descripción pura como si fuese posible formular afirmaciones que respeten fielmente particulares porciones de realidad. En su lugar, habría de admitir que el lenguaje cognoscitivo tiene siempre una función constitutiva respecto del campo de experiencia con el que trata, en el sentido de que estructura y organiza dicho campo reconstruyéndolo y “recortándolo” según las coordenadas (lingüísticas) dictadas por las categorías y los criterios de clasificación incorporados al esquema conceptual dentro del que se mueve.27 Por otra parte, el ILP debería desechar como radicalmente incoherente la idea de una realidad en sí (tal y como la concibe el 21 22 23 24 25 26 27
Ibidem, pp. 66-68. Ibidem, pp. 67 y 68. Ibidem, pp. 69 y 70. Ibidem, p. 71. Ibidem, pp. 71 y 72. Ibidem, p. 72. Ibidem, pp. 73 y 74.
EL POSITIVISMO INCLUYENTE
689
realismo metafísico) en el sentido de una realidad que se ofrece a nuestros intentos de conocerla como una realidad ya dada, independiente de nuestra intervención cognoscitiva, de su estructuración y etiquetado en objetos, géneros, clases, etc.28 Desde el punto de vista cognoscitivo, en cambio, la única realidad con la que nos encontramos es una realidad para nosotros, en el sentido de una realidad que constituye el resultado, siempre revisable, de nuestros intentos de reconstruirla a partir de los esquemas conceptuales (potencialmente plurales) disponibles dentro de un determinado contexto cultural.29 La adscripción a esta posición constructivista tiene consecuencias inmediatas, según sus defensores. En primer lugar, provoca un cambio en la noción de positividad del derecho. Al rechazarse radicalmente la aproximación objetivista, la positividad deja de considerarse un dato, para verse como el resultado de un proceso, esto es, como una propiedad que el derecho no adquiere de una vez, mediante un solo comportamiento o una sola decisión, sino como resultado de una práctica compleja, en la que el derecho es colectivamente usado, de modos diversos, por los diversos tipos de participantes en la comunidad jurídica. Ello no implica negar la importancia del momento inicial de creación del derecho, pero éste ya no puede considerarse lo único decisivo. La existencia del derecho positivo es, pues, el fruto colectivo de una práctica social, no sólo de concretas decisiones adoptadas por algunos sujetos.30 En segundo lugar, el constructivismo aboca a una flexibilización de la frontera entre teoría del derecho y teoría de la aplicación. Desde el momento en que se concibe el derecho como una práctica social, la teoría de la interpretación/aplicación no puede ser separada de la teoría del derecho, por la simple razón de que los procesos interpretativos y aplicativos son elementos constitutivos de la existencia del derecho positivo y, por tanto, entran plenamente en el ámbito de la teoría del derecho.31 Lo mismo puede afirmarse respecto de la incorporación de contenidos morales, ya sea formando parte de una norma explícita, ya de modo implícito, pues dicha entrada no se realiza tampoco “de una sola vez”, mediante actos o decisiones concretos, sino mediante un flujo continuo de complejas prácticas de carácter productivo, interpretativo y aplicativo que van 28 29 30 31
Ibidem, p. 74. Ibidem, pp. 74 y 75. Ibidem, pp. 75 y 76. Ibidem, p. 76.
690
PEDRO SERNA
especificando progresivamente tales contenidos.32 En este sentido, la teoría de la interpretación debe ayudar a distinguir los casos en que tales contenidos morales se introducen en el derecho como resultado de procesos cognoscitivos, de carácter objetivo (en un sentido procedimental de objetividad)… mediante los cuales los jueces y estudiosos se esfuerzan por dar cuenta de —y explicitar e integrar— el derecho preexistente bajo el perfil ético, sin por ello producir fracturas en la “cadena del derecho” (parafraseando a Dworkin); y los casos en que, por el contrario, los contenidos morales penetran en el derecho como fruto de estrategias creativas fuertes adoptadas por juristas y estudiosos, estrategias que implican la entrada en el derecho positivo de elementos que no son ni coherentes ni congruentes con el derecho preexistente (siempre en su mejor interpretación, obviamente). En esta última serie de casos el positivismo jurídico, también en la versión representada por el ILP revisado en clave constructivista, tiene toda la razón para mantener firme su postulado conceptual relativo a la distinción entre “derecho que es” y “derecho como debería ser”, y por tanto para considerar este último tipo de relaciones entre “derecho” y “moral” como fruto de una —ésta sí perniciosa— confusión entre elementos que deben ser separados.33
En tercer lugar, la posición constructivista permitiría también superar la alternativa entre realismo fuerte y relativismo fuerte, es decir, la trampa tendida por Dworkin a Hart.34 Según la presentación del ILP efectuada por Villa, la tesis incorporacionista, según la cual la norma de reconocimiento puede asumir criterios de naturaleza ética, no aboca a un objetivismo moral fuerte, como afirma Dworkin y parece aceptar resignadamente Hart.35 Y ello porque, a su juicio, cabe una objetividad más débil que nos salva a la vez del relativismo y de los hechos morales, cuya ontología subyacente resulta, cuando menos, misteriosa. La propuesta constructivista cree ofrecer, en este sentido, el punto medio, al pasar de una objetividad metafísica a una objetividad epistémica, que no es ya el resultado positivo de la confrontación entre el discurso y ciertos hechos, sino la consecuencia de haber adoptado técnicas y procedimien32 33 34 35
Ibidem, pp. 76 y 77. Ibidem, p. 77. Ibidem, pp. 81-85. Ibidem, p. 85. Cfr., asimismo, Dworkin, R., Taking Rights Seriously, Cambridge, Harvard University Press, pp. 349 y ss.; Hart, H. L. A., “Postscript”, op. cit., nota 1, pp. 253 y 254.
EL POSITIVISMO INCLUYENTE
691
tos argumentativos correctos y apropiados.36 De nuevo desempeña aquí un papel decisivo la teoría de la interpretación jurídica, papel que consiste en aclarar a través de qué modalidades de tipo “objetivo” es posible introducir (mediante las variadas actividades conectadas con la individualización de la validez y la determinación del significado de las normas jurídicas) contenidos morales en un sistema jurídico, sin por ello entrar en una comparación con “un mundo de hechos morales” y sin considerar tampoco que tal actividad comporte una creación ex novo de principios ético-jurídicos, fruto de la conciencia moral de los operadores y de quienes elaboran la dogmática.37 Ahora bien, ha de tratarse de una teoría de la interpretación internamente articulada con la teoría del derecho, no totalmente independiente de ella.38 Por último, el constructivismo posibilita también la superación de la identidad entre lenguaje descriptivo y análisis avalorativo. La base epistemológica sobre la cual se construye esa especie de identificación entre “discursos descriptivos” y “discursos avalorativos” viene dada por la concepción semántica descriptivista del lenguaje informativo, y por sus presupuestos epistemológicos de tipo realista. Sólo desde tales presupuestos cabe sostener que los discursos informativos implican necesariamente la abstención de cualquier tipo de juicios de valor. Sin embargo, si se abandonan estos presupuestos en favor de una concepción constructivista, “la conexión entre “informativo” y “avalorativo” se revela como lo que verdaderamente es: no como una ligazón conceptual necesaria, sino como una posible concepción del lenguaje informativo —por otro lado, radicalmente inadecuada— a la que se pueden oponer otras, de las cuales algunas —como la constructivista— pueden perfectamente admitir la presencia de compromisos valorativos en el interior de tal tipo de lenguaje”.39 El ILP, revisado en perspectiva constructivista, “debe abandonar la concepción descriptivista del lenguaje jurídico informativo, y reconocer la presencia, en ciertas condiciones que habrá que especificar, de juicios de valor en el interior de ese tipo de discurso”.40 En este sentido, un científico del derecho positivista podría mantenerse legítimamente en un punto de vista externo moderado y encontrarse aún en condiciones 36 37 38 39 40
Cfr. Villa, V., op. cit., nota 7, pp. 87 y 88. Ibidem, pp. 88 y 89. Ibidem, p. 89. Ibidem, p. 94. Idem.
692
PEDRO SERNA
de explicar los juicios de valor. Esto se funda en dos presupuestos, uno epistemológico general, y otro relativo al ámbito particular del lenguaje valorativo. El primero apunta a abandonar el principio de neutralidad valorativa como principio-guía del conocimiento, lo cual remueve la prohibición de introducir juicios de valor en el interior del conocimiento.41 El segundo es la necesidad inevitable de formular juicios de valor si nos situamos en la perspectiva de los discursos acerca de contenidos valorativos, pues “la exigencia, para el estudioso, de interpretar esos contenidos valorativos, de elaborar una determinada concepción (entre las varias disponibles), de enlazarlos con otros contenidos valorativos presentes en el sistema, de establecer prioridad y jerarquía entre ellos (una vez interpretados), etcétera, exige la intervención de apreciaciones valorativas ulteriores (de segundo orden)”.42 III. ALGUNAS INCONSISTENCIAS EN EL PLANTEAMIENTO EXPUESTO Hasta aquí la exposición de las principales ideas del ILP, que he efectuado de la mano del profesor Villa. Corresponde ahora formular, en apretada síntesis, algunas referencias a lo que considero tesis inconsistentes en esta doctrina. Ante todo, conviene llamar la atención sobre un punto importante, a saber, que en gran medida, la propuesta del ILP está guiada por el propósito de hacer compatible el positivismo jurídico con el constitucionalismo contemporáneo.43 Y que tal propósito se alcanza redefiniendo primero el positivismo jurídico para dar cabida en él al ILP, lo cual supone en buena medida una concesión a los críticos del positivismo; y volviendo a redefinir después el ILP, para ponerlo a salvo de las objeciones que todavía pueden formularse contra él. El pensamiento jurídico de corte positivista ha sido objeto de múltiples críticas a lo largo del siglo XX, frente a las cuales ha reaccionado generalmente siguiendo una estrategia de repliegue o descarga de lastre, consistente en excluir del catálogo de las 41 42 43
Ibidem, p. 95. Idem. Análogamente, cfr. Prieto Sanchís, L., Constitucionalismo y positivismo, México, Fontamara, 1997; García Figueroa, A., Principios y positivismo jurídico. El no positivismo principialista de Ronald Dworkin y Robert Alexy, Madrid, Centro de Estudios Políticos y Constitucionales, 1998; y Sastre Ariza, S., Ciencia jurídica positivista y neoconstitucionalismo, Madrid, McGraw-Hill, 1999.
EL POSITIVISMO INCLUYENTE
693
opiniones teóricas positivistas a aquellas que no resulta posible defender ya —como la tesis de la obediencia o positivismo ideológico, la jurisprudencia mecánica, las tesis clásicas sobre la plenitud y coherencia del ordenamiento jurídico, la tesis legalista (ley como fuente única o primaria de calificación jurídica), la teoría imperativista de la norma jurídica, etcétera—, para reafirmar simultáneamente las que se entendía no quedaban afectadas o invalidadas por la crítica.44 Ello se ha hecho, a su vez, siguiendo dos caminos diferentes: el primero pasa por apelar a un núcleo duro o esencial del positivismo jurídico, al cual no pertenecerían estas opiniones, sostenidas de hecho por autores positivistas por mera coincidencia; mientras que el segundo evita hablar de esencia del positivismo, sosteniendo que son positivistas aquellos autores que así se consideran o son considerados tales por los restantes autores positivistas.45 El primero de los caminos comporta una aproximación conceptual al positivismo jurídico. Ahora bien, en mi opinión, definir la esencia del positivismo asignándole unas afirmaciones centrales sin conceder importancia alguna a lo que de hecho han defendido los autores considerados habitualmente positivistas, es decir, adoptar la definición conceptual o esencial excluyendo la perspectiva de la tradición, no deja de ser un ejercicio de arbitrariedad difícilmente justificable, pues el positivismo es una teoría o conjunto de teorías, no un objeto dado de suerte que su definición sea susceptible de corroboración empírica. La única posibilidad de corroboración estaría aquí representada por el recurso a lo sostenido por los autores positivistas, pero eso es lo que precisamente rechaza este modo de aproximarse al problema, para excluir así del positivismo las ideas no susceptibles hoy de ser defendidas. Por otra parte, considerar el positivismo como un conjunto de doctrinas heterogéneas que así se autodesignan o son designadas por otros, renunciando por completo a cualquier definición esencial, que es lo sugerido por Hart, aunque en otros momentos matiza esa postura con la referencia a las constantes históricas,46 conduce 44 Cfr. Orrego Sánchez, C., H. L. A. Hart, abogado del positivismo jurídico, Pamplona, Eunsa, 1997, pp. 385-403, 424 y 425. 45 Más detalles sobre esto, en mi trabajo “Sobre las respuestas al positivismo jurídico”, Persona y Derecho, 37, 1997, pp. 280 y ss. 46 En efecto, para este autor son diversas las doctrinas que se atribuyen o han recibido el calificativo de positivistas. Tres de ellas, a saber, la teoría imperativa, la teoría de la separación conceptual entre el derecho y la moral, y la teoría analítica descriptiva (a-valorativa) de la ciencia jurídica, constituyen la “tradición utilitarista en la jurisprudencia”.
694
PEDRO SERNA
al nominalismo y a una importante confusión originada por la equivocidad absoluta del término: serían positivistas todos los que así son considerados; pero... ¿por quién? y... ¿por qué? En definitiva, ser positivista no significaría en sentido estricto nada. Cabe al menos un tercer enfoque del problema, que resulta de combinar ambas perspectivas. Este tercer enfoque parte de las doctrinas y autores considerados positivistas, buscando la génesis y desarrollo histórico de tales doctrinas, y tratando de delinear la relación entre ellas, de suerte que se pongan de relieve los elementos comunes, los factores que explican la evolución de unas doctrinas a otras (que pueden ser exigencias internas del propio planteamiento positivista, o la necesidad de salir al paso de críticas, corrigiendo en parte la propia posición o explicitando alguno de sus extremos), y se distingan de lo que son particularidades de un autor en concreto, las cuales pueden, en consecuencia, ser descartadas para la elaboración de un concepto de positivismo jurídico. Este tercer enfoque pasaría, pues, de la multiplicidad de las doctrinas a la elaboración de un concepto no arbitrario del positivismo jurídico, el cual se presentaría en esta perspectiva como una tradición (es decir, como una corriente de pensamiento dotada de cierta unidad orgánica en cuanto a su propósito, al punto de vista, o a ciertas opiniones) poseedora a la vez de señas ciertas de identidad y de existencia dinámica y viva, albergando en su seno posiciones diferentes, en ocasiones encontradas, entre sus seguidores. Esta aproximación me parece más correcta y más completa que las otras, en la medida en que permite referirse al positivismo respetando la variedad de las diferentes posiciones que cabe identificar en él, dando cuenta simultáneamente de los factores que condicionan la aparición de tales variantes, sin caer en la pura equivocidad, pero sin apelar a una Ahora bien, a su juicio se trata de tesis distintas y también independientes lógicamente entre sí, y mucho más con respecto a otras de las tesis que pasan por ser positivistas, como el no-cognitivismo ético y la teoría de la aplicación lógico-mecánica de las normas, vinculada a la teoría de la plenitud lógica del ordenamiento jurídico. Ello impide hablar de una “esencia” del positivismo jurídico; lo que hay es una tradición, en la cual el elemento central es la separación conceptual entre el derecho que es y el derecho que debería ser, el análisis conceptual no valorativo y la doctrina de las fuentes sociales. Cfr. Hart, H. L. A., El concepto de derecho, trad. de G. Carrió, México, Editora Nacional, 1961, p. 321; del mismo autor, “Legal Positivism”, en Edwards, P. (ed.), The Encyclopaedia of Philosophy, vol. 4, Nueva York-Londres, MacMillan, 1967, pp. 419 y ss; y del mismo autor, “El nuevo desafío al positivismo jurídico”, Sistema, 36, 1980, pp. 4 y ss.
EL POSITIVISMO INCLUYENTE
695
esencia conceptual del positivismo que no tiene sustentación alguna. El análisis de Bobbio sobre el positivismo se acerca a esta posición;47 cuestión distinta es que lo haga de forma enteramente satisfactoria.48 La definición propuesta por el ILP es portadora, a mi juicio, de elementos analíticos que no condicen con su pretensión de eliminar la rigidez en el tratamiento de los conceptos básicos de la teoría jurídica positivista, como el de positividad. En efecto, su estrategia consiste en fijar desde el comienzo el terreno de juego, acotando con absoluta claridad los perfiles de lo que “debe” entenderse por positivismo jurídico, lo cual no puede ser más contrario a la recepción de la perspectiva hermenéutica que trata de aceptar —no lográndolo a mi juicio de manera completa— que es precisamente la que postula la superación del objetivismo, de la visión estrecha de la positividad, de las fronteras rígidas entre teoría jurídica y teoría de la aplicación, y de las dicotomías insalvables entre descubrimiento y justificación, descripción y valoración, validez o existencia jurídica y contenido material del derecho. Por razones análogas, cuando no idénticas, a las que conducen a admitir que el lenguaje informativo contiene valoraciones, o que la positividad del derecho no es un dato, sino el resultado de un proceso, parece que debe admitirse el carácter dinámico, circunstanciado e histórico del pensamiento y, con él, la insalvable dificultad de ofrecer una definición conceptual de una teoría al margen de lo sostenido por quienes han sido sus principales exponentes. En este sentido, tanto una perspectiva hermenéutica de corte germánico, por ejemplo gadameriano, como el giro hermenéutico apreciable en el análisis filosófico a partir del llamado segundo Wittgenstein, que identifica significado y uso, suponen una introducción del elemento histórico-pragmático en el conocimiento que, cuando menos, choca con la pretensión de establecer una definición “conceptual” de una teoría sobre el derecho en los términos en que se hace desde el ILP, cuyo intento de definir el positivismo jurídico incurre, a mi juicio, en un error idéntico al cometido por el positivismo cuando propone su definición de “derecho”: partir de una definición en lugar de intentar llegar a ella. Por tal motivo, 47 Cfr. Bobbio, N., Il positivismo giuridico, Turín, Giappichelli, 1979, trad. de R. de Asís y A. Greppi, El positivismo jurídico. Lecciones de filosofía del derecho reunidas por el doctor Nello Morra, Madrid, Debate, 1993. 48 Mi posición sobre esto en Serna, P., “Sobre las respuestas...”, op. cit., nota 45, pp. 291-306.
696
PEDRO SERNA
ambas definiciones exhiben una fuerte carga de artificiosidad y, correlativamente, de arbitrariedad.49 Desde la perspectiva aportada por la evolución histórica del positivismo jurídico aparece inexacto, o insuficiente, afirmar que ILP y ELP son meramente dos concepciones diferentes de un mismo concepto, porque soslaya que una de tales concepciones (el ILP) se construye en diálogo con la otra, como un intento de salvar el positivismo eludiendo los elementos que motivan la crítica dirigida contra el ELP. Ello no puede destacarse con suficiente claridad si no es adoptando el punto de vista del análisis histórico y pragmático del conocimiento, es decir, la perspectiva de la historia interna y externa del positivismo, y no el punto de vista conceptual, que presenta una imagen plana, sin relieve. Además, ese modo de construir el concepto produce un efecto falsificador del diálogo científico y filosófico, buscado o no, pues sustrae del análisis algunos elementos relevantes para la evaluación global de una doctrina y de sus “redefiniciones”, como sería el caso de lo ya apuntado: el ILP no es una propuesta nacida de la propia evolución del pensamiento positivista, ni en el debate interno entre diferentes posiciones positivistas, sino que más bien es consecuencia de la necesidad de adaptar las teorías positivistas a las contundentes críticas dirigidas desde fuera que pretenden mediante ellas estar impugnando no el “positivismo excluyente”, sino el positivismo en cuanto tal. En el caso que nos ocupa, esto resulta sumamente relevante porque permite captar el auténtico valor epistemológico de la definición “conceptual” aportada. En mi opinión, ésta no sería otra cosa que una construcción elaborada con el exclusivo fin de intentar una compatibilidad sumamente problemática entre el positivismo jurídico y algunos elementos del derecho constitucional contemporáneo, contemplado tanto desde las normas en sí mismas como desde la perspectiva dinámica, desde la perspectiva de la aplicación.50 Si tal objetivo compatibilizador se alcanza, será a fuerza de acabar llamando positivismo a algo diferente de lo que era considerado tal antes de la redefinición. Pareciera, entonces, que lo decisivo no es tanto adherirse a una teoría que se estima verdadera, sino preservar una tradición y un nombre, un apelativo que se valora por otras razones.51 Ello constituye 49 50
Para un desarrollo mayor sobre este punto, cfr. ibidem, pp. 296 y 297. Sobre la relación entre el moderno constitucionalismo y la crisis del positivismo jurídico, cfr., por ejemplo, Zagrebelski, G., El derecho dúctil, cit., nota 18, pp. 116-119. 51 Cfr. Orrego, C., op. cit., nota 44.
EL POSITIVISMO INCLUYENTE
697
un punto de reflexión significativo, pero no el más relevante. En mi opinión lo decisivo es que, precisamente porque esa redefinición del positivismo es artificiosa, no logra su objetivo. La definición de positivismo jurídico propuesta por el ILP merece, además de la observación general que se acaba de exponer, las siguientes críticas. En primer lugar, pretende ser conceptual, pero no se hace referencia a cómo se forma dicho concepto, que queda en consecuencia desprovisto de justificación. Se trata, pues, de una definición meramente estipulativa, que no es el resultado o punto de llegada de análisis o investigación alguna, sino de una decisión puramente discrecional y, al ser tal, se puede situar en el inicio del discurso. En segundo lugar, pretende ser conceptual integrando dos elementos, las denominadas tesis ontológica y epistemológica, cuya relación se afirma que no es de índole conceptual. En ese caso, ¿por qué integran ambos una misma definición conceptual? ¿Qué es lo que une en un concepto único dos posiciones que no guardan entre sí relación conceptual alguna? La única respuesta posible es la que mira a los hechos, a las coordenadas constantes de la tradición positivista, pero entonces habría que aceptar dos conclusiones. Primera, habríamos abandonado ya el plano de la definición conceptual. Segunda, quedaría fuertemente cuestionada la rectificación que la versión del ILP antes expuesta introduce sobre algunas tesis, en particular sobre la tesis epistemológica. En efecto, acerca de la tesis epistemológica del positivismo realiza tal versión dos afirmaciones. En primer lugar, que dicha tesis sostiene que describir y valorar un orden jurídico son dos operaciones diferentes. En segundo lugar, puntualiza que dicha tesis no debe ser identificada con la doctrina de la descripción avalorativa, sostenida por algunos autores positivistas. Pero ello no puede afirmarse desde las coordenadas de la tradición positivista, que en este punto es sencillamente unánime desde Bentham. Más aún, desde el pensamiento de este último autor el sentido que tiene distinguir entre descripción y valoración es precisamente asignar a la ciencia del derecho una tarea de descripción. Si la descripción puede legítimamente contener valoraciones, como acaba sosteniendo la versión del ILP analizada, ¿cuál podría ser el sentido de la distinción? En Bentham la tesis metodológica consiste precisamente en la distinción entre un derecho que es y un derecho que debería ser, para propugnar como tarea de la ciencia jurídica la descripción del derecho que es, reservando las valoraciones para la cien-
698
PEDRO SERNA
cia de la legislación.52 Omitir este dato aportado por la perspectiva histórica conduce al sinsentido de afirmar que una cosa es describir y otra valorar, pero que las descripciones pueden contener valoraciones y, por tanto, el análisis a-valorativo debe separarse cuidadosamente de la primera afirmación, que sería la verdaderamente integrante del positivismo jurídico. La posición del positivismo jurídico clásico, llamado ELP en este contexto, que distingue netamente entre descripción y valoración, y propugna una ciencia jurídica a-valorativa, puede o no ser compartida, pero tiene sentido; más difícil me parece encontrar sentido en la afirmación de la diferencia entre describir y valorar, para acabar admitiendo un discurso informativo sobre el derecho que contenga y sea fruto de valoraciones. Y para deshacer el sinsentido pienso que no basta el recurso a juegos de palabras, como el consistente en sustituir “descripción” o “lenguaje descriptivo” por “información” o “discurso informativo”, como hace Villa. En último extremo, si el positivismo afirma que una cosa es describir y otra valorar o tomar partido, y ésa es una de las opiniones que integran su definición conceptual, ¿cómo puede reconocerse como positivista una doctrina como el ILP reformulado en clave constructivista, que acaba propugnando “abandonar la concepción descriptivista del lenguaje jurídico informativo, y reconocer la presencia, en ciertas condiciones que habrá que especificar, de juicios de valor en el interior de ese tipo de discurso”? En este planteamiento, quien acepta el ILP afirma, en tanto que positivista, que describir y valorar son cosas distintas, y en tanto que seguidor del ILP, que debe abandonarse la concepción descriptivista y avalorativa del lenguaje. ¿Qué alcance real posee en tal discurso la primera de las afirmaciones? A mi juicio, casi ninguno, porque se reduce a distinguir la descripción del rechazo, aprobación o crítica del ordenamiento, pero admitiendo a la vez la posibilidad de en el interior del discurso acerca de un orden jurídico se emitan juicios valorativos. Limitarse a decir que describir un orden jurídico es tarea diferente a tomar parti52 Cfr. Bentham, J., “A Fragment on Government”, A Comment on the Commentaries and A Fragment on Government, Hart, H. L. A y Burns, J. (eds.), Londres, Athlone Press, 1977., 397-416; An Introduction to the Principles of Morals and Legislation, Hart, H. L. A; Burns, J. y Rosen, F. (eds.), Oxford, Oxford University Press, 1996, pp. 293-300. Cuestión distinta es que esa separación está a su vez guiada por un propósito práctico, lejos de ser una propuesta consistente en la descripción por la descripción. Cfr. Cruz, L. M., Derecho y expectativa. Una interpretación de la teoría jurídica de J. Bentham, Pamplona, Eunsa, 2000, capítulo 6.
EL POSITIVISMO INCLUYENTE
699
do respecto de él, pero que la ciencia jurídica puede ser valorativa, es efectuar una afirmación tan leve que no sirve para identificar ninguna posición teórica, ya que puede ser sostenido por cualquiera, excepto, paradójicamente, por el positivismo más ortodoxo o, si se prefiere, más coherente. Quien se adhiere a la segunda de las tesis sólo puede seguir siendo positivista en sentido metodológico si esto no tiene ninguna consecuencia metodológica, pues la propuesta metodológica del ILP es precisamente rechazar la concepción descriptivista del lenguaje. La redefinición del positivismo no alcanza, pues, el objetivo pretendido porque sigue siendo incompatible con el ILP, es decir, con lo que el ILP se ve forzado a aceptar. Algo semejante podría decirse respecto de algunos de los elementos de la tesis ontológica, que afirma la positividad como rasgo identificador del derecho. Frente a la visión del positivismo clásico, el ILP acepta (en rigor, debe decirse así, mejor que “propone”) que el derecho no puede pensarse actualmente como algo dado de una vez a partir del acto creador de la norma, y que tampoco tiene mucho sentido trazar una frontera completamente nítida entre creación y aplicación-interpretación, pues el derecho acaba siendo el resultado de un proceso interpretativo múltiple, en el cual se razona tomando en cuenta criterios éticos y valorativos de diversa índole, sin que resulte posible hablar aquí ni de deducción pura ni de discrecionalidad pura, es decir, sin que se pueda considerar esa tarea como una actividad puramente lógico-deductiva, pero sin dejar simultáneamente de reconocerle un estatuto cognoscitivo, no irracional. A partir de ahí se propone la necesidad de comprender de forma distinta la positividad y de superar el objetivismo sin tener que adoptar necesariamente una posición relativista. Pero, ¿qué puede significar exactamente la positividad si se la deforma hasta hacerla compatible con los elementos que se acaban de mencionar? Nuevamente, la referencia histórica ayuda a poner un poco de orden. En Hobbes, como en Kelsen, la referencia a la justicia es expulsada de la definición del derecho no porque estos autores desconozcan el dato de que los ordenamientos jurídicos universalmente se presentan como justos, y exhiben una pretensión de corrección,53 sino porque al no ser la justicia objeto de un conocimiento seguro
53 La expresión es de Alexy, R.,“Zur Kritik des Rechtspositivismus”, ARSP Beiheft, 37 1990, pp. 9-26.
700
PEDRO SERNA
(Hobbes),54 o de un verdadero conocimiento (Kelsen),55 resulta imposible identificar el derecho (en orden a obedecerlo, en el planteamiento de Hobbes; en orden a desarrollar una disciplina científica sobre él, en el de Kelsen) si no se prescinde del elemento moral. Por ello proponen ambos autores una definición del derecho que permita identificarlo con base en elementos fácticos. Ésa y no otra es la razón de la identificación del derecho como derecho positivo: la necesidad de excluir la referencia a la justicia, al elemento moral, ya sea con el objetivo de alcanzar un grado de obediencia suficiente para garantizar la paz social, ya para construir una ciencia jurídica pura y rigurosa. En el caso de Hobbes, la positividad del derecho se presenta como el rasgo identificador de un concepto de derecho que se propone como corolario de una filosofía política, no como un elemento tomado a partir de la observación del derecho real. En Kelsen es diferente, hay una referencia al derecho tal y como aparece en los órdenes jurídicos históricamente existentes, aunque tal referencia muestra algunos elementos, como la pretensión de justicia o de corrección, que Kelsen excluye conscientemente de su análisis por considerarlos inmanejables en términos racionales.56 La positividad aparece, pues, como indisolublemente ligada a los problemas de orden epistemológico que plantea la referencia a instancias éticas. A diferencia de esta tradición, se afirma por el ILP que el derecho contemporáneo no puede ser identificado completamente con base en esos elementos de orden fáctico, sino que la tarea de identificación (examen de validez) es en algunos casos inseparable de la tarea de determinación del contenido, y que ésta última se lleva a cabo razonando desde el interior de valores morales, y que dicho razonamiento posee un valor cognoscitivo, y puede considerarse un conocimiento objetivo, si bien reformulando de nuevo la noción de objetividad. Adviértase, además, que pensar desde los valores o principios no es una tarea principalmente de deducción lógica, sino más bien un proceso de comprensión, en el sentido de la hermenéutica contemporánea, el cual no puede pensarse acabadamente desde el esquema suje54 Cfr. Hobbes, T., “A Dialogue between a Philosopher and a Student of the Common Laws of England”, The English Works of Thomas Hobbes, vol. VI, Aalen, Scientia, 1966, pp. 4 y 25. 55 Cfr. Kelsen, H., Teoría pura del derecho, 2a. ed., trad. de alemana de R. J. Vernengo, México, Porrúa, 1993, § 6, c), pp. 61-63. 56 Más indicaciones sobre la posición de ambos autores, en mi estudio “Sobre las respuestas...”, op. cit., nota 45, pp. 299-303.
EL POSITIVISMO INCLUYENTE
701
to-objeto de la teoría del conocimiento clásica.57 La pregunta, entonces, en lo que respecta a nuestro tema, es ¿qué puede significar entonces esa nueva positividad? Más aún, ¿qué sentido tiene mantenerla como rasgo identificador del derecho, si los valores y criterios éticos ya no parecen ser obstáculo ni para la objetividad del conocimiento ni para la identificación de un derecho a obedecer? La admisión de que el derecho no es algo dado de una sola vez, sino el resultado de un proceso complejo de determinaciones, más que a redefinir la positividad, invita a descartarla como nota o rasgo identificador suyo, sustituyéndola por otros elementos, como la cualidad de ser un fenómeno institucional y dinámico en cuyo interior lo ético desempeña un papel. De lo anterior se desprenden dos conclusiones: en primer lugar, que también en lo que respecta a la tesis ontológica, la redefinición propuesta por el ILP resulta difícilmente compatible en el fondo con la definición reformulada de positivismo, que sigue considerando la positividad como la cualidad central del derecho; y, en segundo lugar, que la redefinición del positivismo propuesta desdibuja la conexión entre el elemento epistemológico y la tesis ontológica, aunque esa conexión está presente en la tradición positivista.
57 Cfr. Kaufmann, A., Filosofía del derecho, 2a. ed., trad. de L. Villar Borda y A. M. Montoya, Bogotá, Universidad del Externado, 1999, pp. 469 y 470; “Gedanken zu einer ontologischen Grundlegung der juristischen Hermeneutik”, en varios autores, Europäisches Rechtsdenken in Geschichte und Gegenwart. Festschrift für Helmut Coing zum. 70. Geburtstag, vol. I, Munich, Beck, 1982, p. 542; “Sobre la argumentación circular en la determinación del derecho”, trad. de R. Rabbi-Baldi y M. E. González Dorta, Persona y Derecho, 29 1993/2, p. 28; “Concepción hermenéutica del método jurídico”, trad. de J. Zafra, Persona y Derecho, 35, 1996/2, p. 14; y A. Ollero, ¿Tiene razón el derecho? Entre método científico y voluntad política, Madrid, Congreso de los Diputados, 1996, pp. 239-252. Más referencias a este punto, en mi estudio “Hermenéutica jurídica y relativismo. Una aproximación desde el pensamiento de Arthur Kaufmann”, Estudios en homenaje al profesor Luis García San Miguel, Madrid, Universidad de Alcalá de Henares, 2001.
!
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA: LOS LÍMITES DEL POSITIVISMO JURÍDICO María Emma SILVA ROMANO* El tema de la argumentación ocupa un lugar de preeminencia en las discusiones actuales acerca de la moral y el derecho. Apel, Habermas y Rawls1 han indagado en la naturaleza, presuposiciones y consecuencias de situaciones de diálogo de tipo argumentativo. En el campo del derecho, Alexy2 y MacCormick,3 por una parte, Dworkin4 y Raz,5 por otro lado, han planteado problemas similares, con especial atención al razonamiento y su relación con los motivos y razones para actuar. El positivismo del siglo XIX evolucionó hacia la filosofía analítica; y en particular de la escuela analítico-lógica. Entendemos por esta última, a los fines de este artículo, un conjunto de corrientes que tienen en común defender un criterio verificacionista de significado; acercándose a la filosofía del lenguaje y a la lingüística. La mencionada escuela, en el análisis de la interpretación del derecho, se limita a observar el lenguaje de la norma sin tener en cuenta la selección de los hechos relevantes que se hace al momento de adecuarlos a la * Universidad Anáhuac, México. 1 Cfr. Apel, Otto, La transformación de la filosofía, Madrid, 1985; Apel, Otto et al., Razón, ética y política, España, Anthropos, 1989; id., Etica comunicativa y democracia, Crítica, Barcelona, 1991; Habermas, Jürgen, Conocimiento e interés, Madrid, Taurus, 1986; Habermas, Jürgen, Teoría de la acción comunicativa, Buenos Aires, Taurus, 1987; Rawls, John, Teoría de la justicia, México, Fondo de Cultura Económica, 1979. 2 Cfr. Alexy, Robert, Teoría de la argumentación jurídica, Madrid, Centro de Estudios Constitucionales, 1989; Alexy, Robert, El concepto y la validez del derecho, Barcelona, Gedisa, 1990; Alexy, Robert, Derecho y razón práctica, México, Fontamara, 1993. 3 Cfr. Maccormick, Neil, Legal Reasaning And Legal Theory, Oxford, Oxford University Press, 1978. 4 Cfr. Dworkin, Ronald, Los derechos en serio, Barcelona, Ariel, 1985. 5 Cfr. Raz, Joseph, Practical Reasons and Norms, Londres, 1975. 703
704
MARÍA EMMA SILVA ROMANO
condición de aplicación de la misma. Desde esta teoría, el tema de interpretación se ha limitado a examinar las distintas interpretaciones posibles del enunciado de la norma jurídica y las reglas de inferencia lógica para llegar a la conclusión. El cuestionamiento central de este trabajo consiste en plantear el criterio reduccionista de la aplicación de la lógica formal y ampliar la perspectiva teórica atendiendo a la conducta real. Sostendré que al buscar una visión integradora de las distintas corrientes filosóficas es posible llegar a una mejor comprensión del fenómeno de la interpretación y de la argumentación jurídica. En una de sus primeras versiones, la teoría de la argumentación jurídica, que se encuentra dentro de esta escuela de pensamiento, se limita a las reglas silogísticas. La premisa mayor de este silogismo consiste en el enunciado contenido en la norma jurídica formal que tiene carácter general y abstracto, la premisa menor, que es el enunciado que relata los hechos del caso, y la conclusión, se obtiene casi automáticamente con la aplicación de las reglas lógicas de inferencia. Esta visión lleva consigo un concepto formalista del derecho, que entiende al legislador como racional y convierte al juez en un mero “aplicador” de las normas a los casos. La nueva corriente de argumentación jurídica parte de la idea de que la lógica formal deductiva resulta poco apropiada e insuficiente para sistematizar y conceptualizar las cuestiones jurídicas. Sin embargo, a pesar de esta afirmación, el análisis medular de la cuestión sigue siendo la forma de los argumentos. La teoría de la argumentación jurídica de Robert Alexy6 analiza los distintos tipos de argumentos posibles de acuerdo a la fuente de derecho utilizada. El silogismo implica ver la actividad de los tribunales como una actividad puramente mecánica, sin esclarecer los razonamientos previos al individualizar la norma. En los casos donde la cuestión a resolver es preponderantemente de derecho, la metodología lógico-analítica es la utilizada incluso cuando la cuestión versa sobre la validez de determinada norma frente al sistema de normas en su conjunto. El análisis de este tipo de caso se refiere al enunciado formal de la norma. Es un caso de coherencia sistemática del discurso. 6
Alexy, Robert, Teoría..., cit., nota 2, pp. 203-283.
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA
705
En los casos en los que la discusión se centra en una mera cuestión de prueba de estos hechos, lo que no genera un problema de interpretación del discurso de la expresión normativa. En general, la mayoría de los casos son de los que podemos llamar de tipo mixto. En ellos la discusión central gira en torno a la adecuación de los hechos a la norma o, lo que es lo mismo, en determinar cuáles son los hechos o elementos de estos hechos que tienen relevancia para la solución de la controversia. En este mismo sentido, varios autores coincide en que esta conversión de hechos reales en observables, a los que se le aplica la norma, es una cuestión que ha sido dejada de lado en las investigaciones de la escuela objeto de crítica.7 Determinar cuáles son los hechos relevantes en un caso u otros no viene fácilmente indicado en la condición de aplicación de las normas jurídicas. Además, en todo sistema jurídico existe más de una norma que se refiere al mismo conjunto de hechos y distintas normas consideran relevantes a distintos elementos, conductas o circunstancias. Éste es un amplio ámbito de discrecionalidad de los jueces. En esta selección debe ser puesto el acento de nuevas investigaciones. La escuela a la que hacemos referencia entiende al derecho como: un conjunto de normas orientadas a conocer y a regular las relaciones sociales por medio de mensajes simbólicos...8 y a la interpretación jurídica, entendida como interpretación lingüística, es decir, como actividad de reelaboración semántica del lenguaje normativo.9 El objetivo de la escuela analítica ha sido, en palabras de los autores integrantes de ella, “reemplazar ese montón irracional de leyes diferentes entre sí, e incluso contradictorias en sus formas, propósitos y términos, por la “racionalidad” de un conjunto coherente de normas jurídicas; sustituir la arbitrariedad del legislador por la garantía segura de leyes precisas y estables”.10 7 Latorre, Ángel, Introducción al derecho, Barcelona, Ariel, 1998. Sostiene al respecto que “el problema [de la interpretación] está en determinar exactamente en qué consiste este hecho y en buscar luego la norma aplicable”, p. 85; “...Un suceso de la vida real... no es exactamente un hecho sino un conjunto de hechos antes los cuales lo primero que ha de preguntar el jurista es cuáles son los que tienen «relevancia» desde el punto de vista jurídico”, p. 86. 8 Frosini, Vittorio, Teoría de la interpretación jurídica, trad. de Jaime Restrepo, Santa Fe de Bogotá, Temis, 1991, p. 3. 9 Ibidem, p. 7. 10 Ibidem, p. 19.
706
MARÍA EMMA SILVA ROMANO
En la relación entre realidad y lenguaje hay dos soluciones posibles. Una es la teoría convencionalista y otra que sostiene que hay ciertas propiedades no empíricas que debe reflejarse en el significado de la palabra con la que se nombra, que hacen que las cosas sean lo que son: su esencia.11 En la doctrina jurídica numerosos autores son esencialistas del lenguaje, sin declararlo explícitamente, claro está, lo son al buscar el verdadero sentido de la norma, del derecho, de la justicia; etcétera.12 La postura de la filosofía analítica ligada a filosofía del lenguaje aborda el problema de las proposiciones o expresiones que utiliza un emisor en el proceso comunicativo para lograr que los receptores realicen un determinado comportamiento o para influir en la voluntad de éste. Y a diferencia de la postura esencialista encubierta, afirma que no tiene sentido predicar la verdad o falsedad de una directiva pues esta no tiene relación con los valores de verdad. Por ejemplo, los conceptos de derecho, norma, justicia, están teñidos de fuerte emotividad por lo que ha resultado sumamente difícil precisar su significado; en particular si se busca su verdadera naturaleza desde el punto de vista esencialista. La naturaleza jurídica, que por la mayoría de la autores es presentada como una esencia, es vista por esta escuela como una lógica clasificadora.13 Siguiendo la idea del derecho como discurso, Atienza sostiene que: “el derecho visto como lengua o conjunto de reglas de uso del lenguaje jurídico...”.14 Incluso Angel Sánchez de la Torre, autor de una 11 Para ejemplificar esta postura Carlos Nino cita un verso de Jorge L. Borges: “Si el nombre es el reflejo de la cosa/(como dice el griego en el Cratílo)/en las letras de «rosa» está la rosa/y todo eI Nilo en la palabra «Nilo»” Nino, Carlos, Introducción al análisis del derecho, Astrea, 1984, p. 249. 12 A modo de ejemplo “Bien, si nos preguntáramos qué es una norma, desde luego que no nos interesaría saber qué es una norma en el sentido tautológico que nada define, traído por el diccionario, cuando dice que una norma es una regla de conducta. La cuestión nos interesa en el sentido de captación de la esencia. Es decir, querríamos saber y aclarar el problema de qué es lo que a una norma la hace ser una norma, en qué consiste su normatividad”. Cossio, Carlos, El derecho en el derecho judicial, Buenos Aires, Abeledo Perrot, 1959, p. 45. En el mismo sentido, uno de los más prestigiosos civilistas argentinos “Noción verdadera de derecho. El derecho es el orden social justo... será justo y por lo tanto verdadero derecho...”. Llambías, Jorge, Tratado de derecho civil, parte general, Buenos Aires, Depalma, pp. 18-20, t. I. 13 Cfr. Guibourg, Ricardo et al., Introducción al conocimiento jurídico, Buenos Aires, Astrea, 1984, pp. 110 y 111. 14 Atienza, Manuel y Ruiz Manero, Juan, Las piezas del derecho, Barcelona, Ariel, 1996, pp. XIII y XIV.
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA
707
completamente distinta perspectiva teórica —iusnaturalismo kantia— no ha afirmado que: “...la «expresión normativa» es un problema lingüístico…15 el derecho, con su aparato verbal de derecho, deberes, delitos, etcétera. Es simplemente una aplicación especializada del lenguaje como medio de control social16 [el lenguaje jurídico]... nos explica las propiedades universales de todo el ordenamiento jurídico como tal se puede concretar mediante expresiones referidas a situaciones jurídicamente relevantes”.17 Para acentuar la confusión existente y los saltos de un plano lógico discursivo a un empírico, observemos que la posición Kelsen sobre la posibilidad de construir silogismos normativos se puede encuadrar dentro de la dimensión fáctica. Una norma es sólo válida si existe, y para que exista debe haber sido producida por un acto de voluntad. Las normas se definen como sentidos de actos de voluntad, su validez, entendida como existencia.18 Respecto del tema de la interpretación, actividad en la que deseo centrar mi ejemplificación de la confusión de perspectivas de análisis en la ciencia jurídica. Interpretar es una palabra ambigua del tipo proceso-producto,19 que se da cuando se refiere tanto a la actividad de interpretar como al resultado. Interpretar es desentrañar el verdadero sentido de un texto, en el caso de la interpretación jurídica; el verdadero sentido de la norma. Esta actividad de interpretar es entender el significado del objeto interpretado.20 Toda norma es susceptible de interpretación, aun la más simple y la más clara. En este plano lingüístico que entiende al discurso jurídico como una especie del discurso en general, la interpretación se reduce al punto de 15 Sanchez de la Torre, Ángel, El horizonte del científico del derecho, “Prólogo. Acerca de la relevancia jurídica, apunte de la clase de metodología, doctorado en derecho”, México, noviembre de 2001, p. 96. 16 Citando a Willians, G., Language an Law, “The Law Quarterly Review”, 1964, p. 71, en Sanchez de la Torre, Ángel, op. cit., nota 15, p. 86. 17 Ibidem, p. 105. 18 Cfr. Alarcón Cabrera, Carlos, “Validità semantica e sillogismo normativo”, Materiali per una Storia della Cultura Giuridica, núm. 25, 1995, pp. 209-221. 19 La misma afirmación puede verse en Nino, Carlos, Introducción…, cit., nota 11, p. 261; y Canosa Usera, Raúl, Interpretación constitucional y fórmula política, Madrid, CEC, 1988, pp. 7 y 8. 20 Cfr. Guastini, Ricardo, en Vazquez, Rodolfo, (comp.), Interpretación jurídica y decisión judicial, México, Fontamara, 1998, pp. 49 y 50.
708
MARÍA EMMA SILVA ROMANO
vista semántico; olvidando que éste no es el único plano que debe tenerse en cuenta a la hora del análisis. La escuela analítica limita su análisis a la interpretación textual, que consiste en atribuir un sentido, decodificar el discurso, asignar significación al mensaje. El juez, al realizar la actividad de interpretación, se limita a extraer de la disposición general una norma individual que resuelva el conflicto planteado en el caso concreto.21 Esta posición formalista acerca de la aplicación estricta de la ley se desarrolló con la Escuela de la Exégesis, que nace en torno a la creación del Código de Napoleón, al sostener que los jueces, se limitan a aplicar la letra de la ley escrita, única fuente de decisiones concretas.22 Por supuesto que la lógica es un medio, una herramienta; las reglas de inferencia lógica nos permiten llegar a resultados formalmente correctos.23 Esto es así por que la lógica simplemente busca formular y sistematizar las relaciones admisibles entre las proposiciones o enunciados. La lógica está vacía de contenido empírico, es un lenguaje puramente formal. Una herramienta útil para el pensamiento abstracto; ella nos permite sistematizar, ordenar, controlar y reformular proposiciones. Es un sistema de relaciones abstractas entre proposiciones a partir de reglas de inferencia que determinan un razonamiento válido. Entonces, desde esta escuela, el desarrollo de este discurso jurídico es misión de la ciencia jurídica precisar un lenguaje formal, riguroso, para que pueda ser considerado auténtica investigación científica. La herramienta utilizada es la lógica deóntica, un sistema deductivo formal que suma la lógica de predicados a los operadores deonticos de permitido, prohibido y obligatorio.24 Es dentro del mismo positivismo donde ubicamos a la escuela analítica desde su perspectiva lógica. La visión acerca de la actividad de la in21 Canosa Usera, Raúl, op. cit., nota 19, p. 13. Siguiendo la misma idea, cfr. Legaz y Lacambra, Filosofía del derecho, Barcelona, Bosch, 1979, p. 541. 22 Cfr. Álvarez Ledesma, Mario, Introducción al derecho, México, McGraw-Hill, 1995, p. 252. 23 En el mismo sentido Echave y Guibourg han sostenido: “Una deducción válida... [es] la que necesariamente lleva a un resultado verdadero siempre que las premisas también lo sean… Si partimos de premisas falsa, ninguna seguridad tendremos de llegar a conclusiones verdaderas”, en Echave, Teresa, et al., Lógica, proposición y norma, Buenos Aires, Astrea, 1986, pp. 21 y 23. 24 En este sentido Bobbio, Norberto, Teoria della scienza giuridica, 1950, pp. 218 y ss., entre tantos otros.
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA
709
terpretación se ha ampliado. Así, la escuela de la libre investigación concentra su atención en la voluntad del legislador.25 En esta libre investigación, para tomar una decisión, deben valorarse elementos fundamentales y acudir a fuentes supletorias como la costumbre, la jurisprudencia de los tribunales, la doctrina y, en última instancia, a la libre investigación científica. Aun detrás de aplicación del aparentemente más simple soligismo jurídico el intérprete siempre está haciendo una valoración, ya sea moral, política o acerca de la relevancia de los hechos.26 El hecho de que se utilice la lógica formal como herramienta no quiere decir que no se haga una labor creativa, siempre y cuando la lógica no se convierta en el punto medular del análisis de la actividad judicial. Ésta debe ser enfocada también, desde, la dimensión fáctica y la dimensión valorativa.27 Desde esta última, el valor de la lógica consiste en que obliga a precisar las premisas y observar la necesidad de fundamentarlas en otros tipos de razones, como veremos más adelante.28 Desde la dimensión fáctica podemos afirmar que el sistema jurídico pierde su finalidad
25 Francois Gény pensaba que la aplicación judicial del derecho era una labor creativa dirigida a desentrañar la verdadera voluntad del legislador. Álvarez Ledesma, op. cit., nota 22, pp. 253. 26 Raúl Canosa, sin alejarse mucho de la interpretación textual, afirma la existencia de un criterio político en la interpretación constitucional. Sostiene que la interpretación de la voluntad del legislador es en realidad una voluntad actualizada, el fin racional de la norma que incluye el conjunto de todas las derivaciones lógicas. Afirma que hay dos elementos a considerar: la norma a interpretar y los criterios de interpretación. Al respecto adopta una postura ecléctica en la medida que ambos revisten categoría de datos. El sujeto intérprete no tiene la obligación de emplear exhaustivamente todos los criterios y, en definitiva, hay un fin político en la interpretación buscando la solución más correcta desde el punto de vista constitucional. Cfr. Canosa Usera, Raúl, op. cit., nota 19, pp. 16 y 17. 27 Carlos Santiago Nino ha escrito que: “En verdad no hay nada de malo en considerar el razonamiento judicial como un silogismo. Lo incorrecto es pensar que las premisas del razonamiento judicial —las normas jurídicas relevantes y la descripción de los hechos decisivos— se obtengan por procedimientos mecánicos. Efectivamente, la función judicial antes de arribar a la aplicación de la norma o normas concretas lleva a cabo una labor lógico-jurídica y valorativa sumamente compleja”. Cfr. Nino, Carlos, Introducción..., cit., nota 11, pp. 5 y 6. 28 En el mismo sentido, Juan Pablo Alonso dice que: “El valor de lógica consiste precisamente en que obliga a explicitar las premisas tácitas de los argumentos, entonces, el valor de la argumentación jurídica consiste en que permite justificar la corrección de tales premisas tácitas”. Cfr. Alonso, Juan Pablo, “Un caso difícil en el Código Civil español”, Doxa, Alicante, núms. 17 y 18, 1995, pp. 403-431.
710
MARÍA EMMA SILVA ROMANO
si resulta ineficaz.29 Además, el juez debe tener criterios reales, esto es, relacionar la norma con la moral social, las instituciones de la sociedad y las concepciones que en cada momento histórico se tienen.30 Este punto de vista fáctico, como ya mencionamos, ha sido estudiado por el empirismo, y de alguna manera observado en la ética sociológica y defendido como paradigma por el relativismo moral. Un análisis que combine estas dos afirmaciones da como resultado una concepción del derecho que sostiene que éste es el reflejo de la comunidad en la cual rige, de las ideologías, valores dominantes, de sus diferentes circunstancias sociales y económicas. Una visión aún más reduccionista es la que sostiene el subjetivismo del órgano decidor, donde las creencias o moral individual de cada juez constituyen su fundamento. En esta postura, el juez debe tener criterios reales, esto es, relacionar la norma con la moral social, las instituciones de la sociedad y las concepciones que en cada momento histórico se tienen. Dentro de esta corriente empirista y del realismo jurídico, se hace referencia a la mencionada dimensión fáctica, pero también de manera discursiva, ya que el objeto de su análisis no consiste en las conductas reales, ni el enunciado de la norma jurídica sino las reglas de derecho expresadas por los jueces en decisiones anteriores. El acento ha sido puesto en el resultado de la actividad de los jueces.La idea central es que el derecho consiste en hacer predicciones acerca de las decisiones que los jueces tomarán en los tribunales. La actividad jurídica principal es la interpretación y la predicción de las aplicaciones concretas.31 29 Así lo ha manifestado Sebastián Soler, “No está destinada a predecir lo que los jueces deben hacer sino lo que efectivamente harán”. Soler, Sebastián, Las palabras de la Ley, México, Fondo de Cultura Económica, 1969, p. 95. 30 Cfr. Cardosa, Benjamín, “The Nature of The Judicial Process”, Law, Justice and the Common Good, Estados Unidos, University Press of America, 1988, pp. 330 y 331. 31 Los más importantes exponentes de esta corriente han sido: Wendell Holmes, juez norteamericano, cuyos precedentes sentaron la base del commom law durante años, Jerome Frank, quien sostiene que la personalidad del juez está influida por múltiples elementos, como son convicciones personales, creencias, prejuicios, socialización, educación formal, etcétera (cfr. Holmes, Wendell, La senda del derecho, Buenos Aires, Abeledo Perrot, 1985). El juez es quien crea derecho efectivo, adopta la decisión que considera justa y la fundamenta de acuerdo con la norma vigente (cfr. Frank, Jerome, Law and The Modern Mind, Bretano’s, Estados Unidos, 1931, pp. 100-102). Kart Leweillyn sostiene que se presentan dos tipos de reglas al momento de aplicar el derecho, las llamadas reglas de papel (leyes y reglamentos) y las reglas efectivas que son las reglas de derecho y los principios, motivos, razones que fundamentan la decisión del juez (cfr. Leweillyn,
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA
711
La labor del juez, según coinciden la mayoría de las posiciones doctrinales expuestas desde sus respectivas argumentaciones, es compleja y creadora; se ayuda de la lógica pero no puede descuidar la valoración ni deslindarse de la realidad social. 32 En las decisiones judiciales los fundamentos principales suelen, en la mayor parte de estas, estar basadas en argumentos morales. Juzgar implica decidir y en consecuencia explicar y justificar. Se deben distinguir las causas, y razones que llevan a una decisión, y las razones justificativas que fundamentan la decisión. La razón explicativa o subjetiva se identifica con los motivos, está constituida por los antecedentes causales de ciertas acciones y en ocasiones por los motivos en combinación de creencias y deseos. Tener un motivo implica creer que un cierto fin va a ser obtenido a través de una acción determinada no intencional. Su función es entender por qué se realizó tal acción o para predecir la ejecución de una acción. La razón justificativa u objetiva sirve para valorar una acción. En mi opinión las razones últimas son exclusivamente morales. Una razón para actuar tiene que tener necesariamente relevancia práctica, debe ser capaz de determinar acciones. En el discurso moral se utilizan las razones justificatorias. Desde esta concepción lo más importante para entender el concepto de razón justificativa es el concepto de razonamiento, práctico. Entiendo por razonamiento práctico tanto el proceso psicológico que conduce casualmente a la formación de una intención, sumado a los argumentos que permiten explicar o predecir una acción a partir de leyes y proposiciones fácticas, y los argumentos que permiten evaluar, fundamentar o guiar una acción;33 estos últimos normalmente expresados en una premisa adicional.
Karl, “Karl K Leweillyn on the Function of Precedent”, Law, Justice and the Common Good, Estados Unidos, University Press of America, 1988, pp. 230-270). Para esta corriente los motivos que apoyan una decisión en una sentencia son la mayoría de las veces una visión subjetiva, la moral individual del juez, ante la ausencia de normas precisas en el derecho consuetudinario. 32 La interpretación jurídica se “produce en ambos casos, el legislativo y judicial, los mismo momentos de creación y aplicación del derecho. En las dos situaciones se hace imprescindible, en el primer caso recibe el nombre de interpretación auténtica y en el segundo la de interpretación judicial”. Canosa Usera, Raúl, Interpretación... cit., nota 19, p. 12. El sujeto intérprete decide entre las soluciones posibles, p. 13. 33 Cfr. Nino, Carlos S., La validez del derecho, Buenos Aires, Astrea, pp. 109 y ss.
712
MARÍA EMMA SILVA ROMANO
Este punto de vista resulta novedoso en cuanto los criterios y reglas de interpretación considerados como premisa adicional en el razonamiento del sujeto intérprete. Partiendo de las mismas premisas se puede llegar a diferentes conclusiones dependiendo de cuál sea la premisa adicional seleccionada. La pluralidad de interpretación frente a la aplicación de una norma a un caso concreto resulta, entonces deducida depende de la premisa adicional. El juzgador realiza varios razonamientos previos no explícitos antes del llamado silogismo jurídico. Si bien el derecho determina a los órganos encargados de aplicar la norma muchos de los criterios no sé encuentran de manera explícita o implicita en el sistema jurídico. La búsqueda de la solución constituye una elección de la premisa adicional que sustentarán los argumentos. El juez al aplicar el derecho conoce y valora cuáles son los principios, reglas y diferentes alternativas para la solucción, buscando alcanzar el ideal de justicia.34 34 Atienza ha sostenido que “las reglas interpretativas necesitan a su vez ser interpretadas, pero los criterios últimos de interpretación no pueden encontrarse ya en el ordenamientos jurídico.” Atienza, Manuel, Tras la justicia, Barcelona, Ariel, 1993, p. 30. En este sentido para De Asís este proceso de decisión es eminentemente valorativo. De Asís Roig, Rafael, “Jueces y normas”, La decisión judicial desde el ordenamiento, Madrid, Marcial Pons, 1995, pp. 200-306. Coincidiendo, Schmill afirma que “Los órganos del Estado conocen qué norma aplicar en cada situación y el sentido que deben darle, en tanto conocen los principios subyacentes al propio derecho”. Schmill, Ulises, en Vazquez, Rodolfo (comp.), Interpretación jurídica y decisión judicial, México, Fontamara, 1998, p. 64; y, en el mismo sentido, cfr. Dworkin, R., Los derechos en serio, Barcelona, Ariel, 1984, pp. 25-40. Atienza sostiene de manera muy significativa que “la justicia no es un ideal irracional. Es simplemente un ideal... es posible alcanzar la justicia por medio del derecho”. Atienza, Manuel, Tras... cit. supra, pp. IX y X. Atienza, siguiendo las ideas de Dworkin, distingue entre normas o reglas y los principios que tienen la característica de ser generales y que sirven de base para la interpretación de las reglas. A su vez sostiene que existen principios de caracter abstracto que son guías morales para la fundamentación. En palabras de Atienza: “Las normas de que se compone un ordenamiento jurídico pueden clasificarse en reglas y principios... Las reglas son normas que establecen pautas más o menos específicas de comportamiento. Los principios son normas de carácter muy general que señalan la deseabilidad de alcanzar ciertos objetivos o fines de carácter económico, social, político, etcétera... y a las que cabe denominar directrices o bien exigencias de tipo moral, como el principio de igualdad ante la ley, de respeto a la dignidad humana, etcétera. Estos serían los principios en sentido estricto. Alguno de estos principios... están formulados explícitamente en enunciados jurídicos, pero otros están simplemente implícitos, esto es, deben ser extraídos por el intérprete a partir de otros enunciados [de principios y reglas] explícitos…” Atienza, Manuel, Tras… cit., supra, pp. 27 y 28. y continua diciendo “los enunciados jurídicos constituyen, nos parece, las unidades más elementales del derecho, pero esas piezas sólo adquieren plenamente sentido cuando se
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA
713
Siendo así, el juez puede optar por un conjunto mayor o menor de normas, justificando sus decisiones en otro tipo de razones distintas a la voluntad de legislador o puramente semánticas. Estas razones hacen referencia a otro tipo de premisas que pueden ser hechos o argumentos morales. En estos casos la norma no es claramente identificable y la selección de la norma está a cargo del juez. Finalmente, es una decisión al arbitrio que consiste en la determinación dentro de un conjunto finito de hechos y conductas que son significativos. Esta decisión judicial implica una conceptualización de los hechos o conductas.35 Entonces, como el positivismo da respuesta a la pregunta de si existen relaciones necesarias entre el derecho y la moral tiene múltiples consecuencias. Estas consecuencias cubren desde el concepto de derecho y sistema jurídico, hasta la teoría de la argumentación. La vieja polémica entre positivistas e iusnaturalistas gira sobre esta relación. Dentro de estas dos grandes corrientes se ha formulado una amplia gama de tesis ya sea a favor de la separación o de la conexión. Las teorías positivistas argumentan a favor de la separación. El concepto de derecho ha de definirse en el sentido que no incluya ningún elemento de la moral. Aunque no siempre el positivismo conduce al escepticismo ético que niega la existencia de principios morales y de justicia universalmente válidos y cognoscibles por medios racionales y objetivos. La idea de que existe una relación entre la moral y el derecho puede tener muchas variantes. Básicamente se refiere a dos tesis: una de filosofía ética que sostiene que hay principios morales universalmente válidos y asequibles a la razón humana , y otra acerca de la definición del derecho según la cual un sistema normativo o una norma pueden o no ser calificados de jurídicos si contradicen aquellos principios morales.
comprende bien cuál es su contribución a la conformación y el funcionamiento del derecho”. Atienza, Manuel y Ruiz Manero, Juan, Las piezas.., cit., nota 14, pp. XIII y XI. 35 Ángel Sánchez de la Torre sostiene al respecto que para entender lo jurídicamente relevante o irrelevante, primero hay que entender el sentido de la distinción, este sentido está dado por aplicación de las normas a casos. Un acto es relevante cuando convergen en él dos perspectivas: la seguridad y la continuidad de las instituciones por un lado, y la conveniencia e intereses de los sujetos que llevan a cabo alguna relación intersubjetiva. Cfr. Sánchez de la Torre, Ángel, El horizonte del científico del derecho, “Prólogo. Acerca de la relevancia jurídica, apunte de la clase de metodología, doctorado en derecho”, México, noviembre de 2001.
714
MARÍA EMMA SILVA ROMANO
El ius naturalismo puede definirse con dos tesis: La primera de filosofía ética, que sostiene que existen principios de justicia universalmente válidos asequibles a la razón humana. La segunda tesis, llamada de la subordinación, que puede resumirse en la siguiente idea: «los sistemas o normas que no se adecuen a estos principios universales no pueden ser calificados de derecho».36 El positivismo jurídico parte de la negación de la segunda tesis del iusnaturalismo, al afirmar la tesis de la separación que básicamente sostiene que no existe una relación necesaria en entre la moral y el derecho. Dentro del análisis de la teoría de la argumentación jurídica, las respuestas a los interrogantes planteados en torno a las relaciones entre moral y derecho han sido tanto positivistas como iusnaturalisas o incluso relativistas en la versión del realismo jurídico. Para este último el derecho consiste en realizar predicciones acerca de las decisiones que los jueces tomarán en los tribunales. Dentro de esta escuela la corriente norteamericana llamada Critical Legal Sistem afirma que el derecho está vinculado a un conjunto de principios y reglas de moral social. A modo meramente ejemplificativo indicaré cómo otras corrientes entienden al derecho, de manera no reduccionista. Si se tiene una visión gnoseológica del derecho como hecho, discurso prescriptivo y valor, se produce un replanteamiento en el campo conceptual: “Las consecuencias técnicas de la teoría egológica en el campo de la interpretación jurídica son, con todo, las más importantes porque la oportunidad de interpretar se le presenta, irremediablemente, a todo tratadista, a todo juez, a todo abogado con motivo de cualquier asunto que comprometa su responsabilidad profesional”.37 La teoría tridimensional del derecho entiende al mismo como el resultado del cruce de la dimensión fáctica, la dimensión valorativa y la dimensión axiológica. Cada una de estas dimensiones ha sido desarrollada por distintas corrientes iusfilosóficas: la teoría tridimensional de Miguel Reale,38 la teoría de los círculos de García Máynez,39 la teoría egológica 36 Cfr Nino, Carlos Santiago, Introducción al análisis del derecho, Buenos Aires, Astrea, 1984, pp. 15 y ss. 37 Cossío, Carlos, Radiografía de la teoría egológica del derecho, Buenos Aires, Depalma, 1987, p. 211. 38 Cfr. Reale, Miguel, Filosofía do direito, citado en idem. 39 Cfr. García Maynez, Eduardo, Introducción al estudio del derecho, México, Porrúa, 1999, p. 45.
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA
715
de Carlos Cossío,40 fueron intentos de ver en el aparato conceptual del derecho la visión tridimensional. Es en estas corrientes y en una visión integradora donde deben buscarse las respuestas. CONCLUSIONES Primera: El positivismo jurídico cae en una contradicción al afirmar, por un lado, que la ciencia del derecho debe limitarse a la dimensión normativa, y por otro, dedicarse al estudio del poder, la legitimidad de la norma, la efectividad del derecho, que necesariamente se refieren a la dimensión fáctica. Tal es el caso de la norma fundamental en Kelsen. Segunda: La norma fundamental en Kelsen es un enunciado “metanormativo”. Es una adscripción de validez, en el sentido de obligatoriedad (y por lo tanto de legitimidad) al sistema jurídico. Esta hipótesis, o en palabras de Kelsen, presupuesto epistemológico, siendo un enunciado descriptivo (dimensión fáctica), se convierte en una norma extrasistemática que resulta imprescindible para mantener la validez derivada (en el sentido de pertenencia) de todo un orden jurídico (dimensión valorativa). Tercera: Las premisas de las que parte la escuela analítica jurídica, resultan insuficientes frente al tema de la obediencia al derecho, tema que se refiere necesariamente a la dimensión valorativa, ya que se dan de manera explícita las afirmaciones de los autores analizados presuponen alguna premisa moral en su razonamiento (dimensión valorativa o axiológica). Cuarta: La perspectiva de la mencionada escuela constituye una visión reduccionista del derecho. El derecho puede ser estudiado desde el punto de vista del análisis del discurso. Sin embargo no puede ser el único centro de análisis porque el derecho no es sólo discurso prescriptivo. El lenguaje técnico con que el derecho se expresa es una especie del discurso general que es el género. Las reglas de inferencia lógica y la lógica deóntica resultan útiles pero insuficientes a la hora de aplicar el sistema normativo a casos concretos. El silogismo jurídico no permite reconstruir satisfactoriamente el proceso de argumentación jurídica, ésta va más allá de la lógica jurídica. Quinta: No se debe olvidar que la “premisa adicional” es el resultado de razonamientos previos en la resolución de casos jurídicos, y para explicarla
40
Cfr. Cossío, Carlos, Radiografía..., cit., p. 30.
716
MARÍA EMMA SILVA ROMANO
se vuelve imprescindible una visión integral de la interpretación, aplicación y argumentación jurídica. Sexta: La dimensión fáctica de la norma ha sido analizada por la argumentación jurídica de manera superficial. Es necesaria una teoría que contemple la determinanción de los hechos relevantes y principios que hagan posible una jerarquización de los intereses en juego y las circunstancias que pueden presentarse en cada caso. Séptima: La dimensión axiológica debe ser un punto de análisis obligado en el razonamiento judicial con un tipo especial de razonamiento práctico moral. Octava: Entonces, abordar el problema de la interpretación como discurso textual especializado constituye una visión reducionista que no da respuesta a múltiples interrogantes. Es necesaria una teoría integradora que dé cuenta de las tres dimensiones: lógica (discurso prescriptivo), fáctica, y valorativo moral. BIBLIOGRAFÍA ALARCÓN CABRERA, Carlos, “Validità semantica e sillogismo normativo”, Materiali per una storia della cultura giuridica, núm. 25, 1995. ALEXY, Robert, Teoría de la argumentación jurídica, Madrid, Centro de Estudios Constitucionales, 1989. ALONSO, Juan Pablo, “Un caso difícil en el Código civil español”, Revista DOXA, Cuaderno de Filosofía del Derecho, Alicante, núms.17 y 18, 1995. APEL, Otto, La transformación de la filosofía, Madrid.1985. ——— et al., 1989, Razón, ética y política, España, Anthropos, 1989. ——— et al., Ética comunicativa y democracia, Crítica, Barcelona. ÁLVAREZ LEDESMA, Mario, Introducción al derecho, México, Mc Graw-Hill, 1995. ATIENZA, Manuel, Tras la justicia, Barcelona, Ariel, 1993. ———, Las piezas del derecho, Barcelona, Ariel, 1996. ———, “Carta a un joven iusfilósofo”, La Laguna, Laguna, núm. 3, 1995. CANOSA USERA, Raúl, Interpretación constitucional y fórmula política, Madrid, Centro de Estudios Constitucionales, 1988. CARDOSA, Benjamín “The Nature of the Judicial Process”, Law, Justice and the Common Good, Estados Unidos, University Press of America, 1988.
INTERPRETACIÓN Y ARGUMENTACIÓN JURÍDICA
717
COSSÍO, Carlos, El derecho en el derecho judicial, Abeledo Perrot, Buenos Aires, 1959. ASÍS ROIG, Rafael de, Jueces y normas. La decisión judicial desde el ordenamiento, Madrid, Marcial Pons, 1995. DWORKIN, Ronald, Los derechos en serio, Barcelona, Ariel, 1985. ECHAVE, Teresa et al., Lógica, proposición y norma, Buenos Aires, Astrea, 1986. GUIBOURG, Ricardo, Introducción al conocimiento jurídico, Buenos Aires, Astrea, 1984. HABERMAS, Jürgen, Conocimiento e interés, Madrid, Taurus, 1986. ———, Teoría de la acción comunicativa, Buenos Aires, Taurus, 1987. HOLMES, Wendell, La senda del derecho, Buenos Aires, Abeledo Perrot, 1985. FRANK, Jerome, Law and the Modern Mind, EEUU, Bretano’s, 1931. FROSINI, Vittorio, Teoría de la interpretación jurídica, trad. de Jaime Restrepo, Santa Fe de Bogotá, Temis, 1991. LATORRE, Ángel, Introducción al derecho, Barcelona, Ariel, 1998. LEGAZ Y LACAMBRA, Filosofía del derecho, Barcelona, Bosch, 1979. LEWEILLYN, Karl, “Karl K Leweillyn on the Function of Precedent”, Law, Justice and the Common Good, EEUU, University Press of America, 1988. LLAMBÍAS, Jorge, Tratado de derecho civil, parte general, Buenos Aires, Deplama, 1976, t. I. MACCORMICK, Neil, Legal Reasaning and Legal Theory, Oxford, Oxford University Press, 1978. NINO, Carlos, Introducción al análisis del derecho, Buenos Aires, Astrea, 1984. ———, La validez del derecho, Buenos Aires, Astrea, 1985. RAWLS, John, Teoría de la justicia, México, Fondo de Cultura Económica, 1979. RAZ, Joseph, Practical Reasons and Norms, Londres, 1975. SÁNCHEZ DE LA TORRE, Ángel, “Prólogo. Acerca de la relevancia jurídica, apunte de clase, doctorado en derecho”, El horizonte del científico del derecho,México, noviembre de 2001. SOLER, Sebastián, Las palabras de la ley, México, Fondo de Cultura Económica, 1969. VÁZQUEZ, Rodolfo (comp.), Interpretación jurídica y decisión judicial, México, Fontamara, 1998.
!
METASEMANTICS AND OBJECTIVITY Ori SIMCHEN* If Jones is found guilty of negligence, and the verdict is never overturned, does it follow that the judgment that Jones was negligent is objectively true? If it does, then it is presumably a fact that Jones was negligent. What kind of fact is it? On the other hand, if it does not follow that the judgment is objectively true, what might still falsify it? Is there a “way things are” legally speaking that goes beyond actual judicial decisions upheld by the courts? Such questions as these are most often raised regarding specific domains of judgment, such as the domain of legality or of morality or of science. In this paper I propose to examine the issue of objectivity more generally, with the hope of shedding some light on domain-specific concerns. Writers on objectivity typically set things up in the following oppositional way: Here we are with our X-type judgments. In order for such judgments to be true or false, there has to be something over there by virtue of which they are so-call it the “X-facts”.1 Now the question arises as to the nature of these X-facts: Are X-facts really there to be discovered by us, or are they actually here in some sense, constituted by us? Are they judgment-independent or judgment-dependent? (I will not even pretend to do justice to the plethora of alternative ways of framing this type of query). Once we have settled on the metaphysics of X-facts, on the approach being considered, we can then turn to the question of epistemic access to them. By characterizing the relation between the thinker and the X-facts in such a way, we already open up a divide that any account of the bearing * University of British Columbia, USA. 1 The very idea of facts as truth-makers for judgments has been the topic of much heated controversy in contemporary philosophy. It has been called into question by Frege, Gödel, and Davidson, among others. For the most recent round in the debate, see Stephen Neale, Facing Facts, Oxford, Oxford UP, 2001. 719
720
ORI SIMCHEN
of the world on our judgments will be hard-pressed to close satisfactorily. Yes, X-facts are there to be discovered by us to the extent that we can get the facts wrong; but, No, they are not entirely independent of us to the extent that they attest to our conceptual involvement. And so the familiar back-and-forth refinements can continue without apparent end in sight. The history of philosophy has offered ample illustrations of the moral that if the metaphysical and the epistemic are pried apart at the very outset of accounts of the objectivity of our judgments, then putting them back together again will prove to be a formidable task. In this paper I hope to make some headway towards resisting the common temptation to pry them apart at the very outset. The strategy I will employ is best characterized by fastening on an imagistic contrast. As against setting up a yawning gap between the thinker and the facts and then turning to ask the metaphysical question about the nature of those facts, followed by the epistemic question about the thinker’s access to them, I begin by focusing on those aspects of contact between the thinker and the world through which content emerges. My strategy for broaching objectivity will be metasemantic and will follow in the footsteps of the so-called new theory of reference. We begin by considering the thinker in her worldly surroundings. We then ask the metasemantic question: How do the thinker’s terms happen to gain the content that they do? Any plausible answer here will allude to what the worldly surroundings of the thinker actually are and to what the thinker’s overall epistemic situation actually is. But the metasemantic explanatory strategy does not begin by addressing the nature of X-facts independently of the thinker’s epistemic access to them and then proceed, as a separate project as it were, to address (or to set aside, as the case may be) the issue of epistemic access. Rather, the metasemantic strategy takes its point of departure from the basic idea that terms typically have content. This is sometimes referred to as their “intentionality”, or “aboutness”. And it is the possibility of such endowment that can be shown to require objectivity. Or so I will argue. The argument to follow has a distinctly transcendental, and so Kantian, flavor. But a rather more direct route runs back from it to the work of the later Wittgenstein.2 I will try to show that the very possibil2 As in passages peppered throughout Ludwig Wittgenstein, Philosophical Investigations, 3. ed., Oxford, Blackwell, 1953, such as the following: “Let us imagine a table
METASEMANTICS AND OBJECTIVITY
721
ity that terms in a given domain should have content, the very possibility that they should contribute to the truth-conditions of claims in which they partake, depends on there being a distinction between what is relevantly the case and what only seems to be the case. More specifically, content-determination will be claimed to depend on the existence of an objective measure of correctness in extension-determination. For example, that a term such as “negligence” should have content demands that there be an objective measure of relevant similarity to paradigmatic instances of negligence, a measure of similarity that must be capable of transcending what merely seems to be relevantly similar to paradigmatic instances of negligence. If this is correct, then we still face a choice. We can either affirm the requisite measure of objectivity, or else we can deny the possibility that our terms have content after all. But such is an inevitable feature of transcendental arguments. Kant, for example, offers an argument purporting to show that if experience is at all possible, then the objects of experience must conform in certain elaborate ways to our cognition rather than the other way around. Assuming that this argument is successful, it is still open to us either to affirm Kant’s consequent or deny his antecedent and conclude that experience is not possible after all. We may thus think of Kant’s effort in this area as purporting to illustrate the heavy price we incur by denying his consequent, his Copernican revolution. Similarly in this case, if the argument to the effect that the possibility of content depends in certain elaborate ways on the relevant objectivity is successful, then it is still open to us to deny objectivity. But the price of such denial is the denial of the possibility that our terms have content. And that is a heavy price indeed. Our terms have content. How do they gain it?This basic metasemantic question has a prima facie intelligibility. In what follows I will consider (something like a dictionary) that exists only in our imagination. A dictionary can be used to justify the translation of a word X by a word Y. But are we also to call it a justification if such a table is to be looked up only in the imagination? –‘Well, yes; then it is a subjective justification.’ – But justification consists in appealing to something independent. – ‘But surely I can appeal from one memory to another. For example, I don’t know if I have remembered the time of departure of a train right and to check it I call to mind how a page of the time-table looked. Isn’t it the same here?’ – No; for this process has got to produce a memory which is actually correct. If the mental image of the time-table could not itself be tested for correctness, how could it confirm the correctness of the first memory? (As if someone were to buy several copies of the morning paper to assure himself that what it said was true.) (§265).
722
ORI SIMCHEN
the extent to which it can be respected in its own terms. There is a certain philosophical tradition that considers such a question to be misdirected, ill framed, or beg fundamental issues of philosophical methodology. This is a tradition that takes the facts of meaningfulness to derive from the interpretative situation. It is a tradition that takes the basic question in the area to be something along the following lines: What makes it the case that terms have the content that they do? Donald Davidson clearly falls within this camp, as does, albeit in a different way, David Lewis. Both take their most immediate inspiration from the work of W. V. Quine. On Davidson’s view, that expressions should have their content is a matter of being interpretable in this way according to a suitable “interpretative” Tarskian truth-definition for the linguistic corpus to which they belong, given the attitudes that speakers are likely to have in their actual surroundings. On Lewis’s view, that expressions should have their content is a matter of the existence of an eligible mapping that so assigns contents to them, where eligibility is a matter constrained both by the attitudes of speakers, appropriately interpreted in turn, and by what the plurality of possible worlds is really like. For both thinkers, what makes it the case that terms have their content is at bottom a matter of how they are interpreted. Call this way of thinking about meaningfulness “metasemantic interpretivism”. If we situate speakers in their environment and raise the philosophical question of how it is that their terms come to have their content without privileging the interpretative situation, we part company with the above tradition.3 Call the alternative approach “metasemantic productivism”. Unlike the philosophical query after the determinants of the semantic state of meaningfulness (How is it that terms have their content?), the question raised by the rival approach (How is it that terms come to have their content?) targets the determinants of a process– the process of gaining semantic content. To this alternative approach belong first and foremost the efforts of Keith Donnellan, Saul Kripke, and Hilary Putnam. 3 The qualification ‘philosophical’ before ‘question’ is important because neither Davidson nor Lewis would deny the existence of interesting empirical questions in the general area of content-determination. On the other hand, the qualification should not be taken as a tacit endorsement of a contentious analytic-synthetic distinction – as if philosophical questions can be sharply distinguished from empirical ones. These matters are far subtler than first impressions reveal and I cannot deal with them in a satisfactory way in the scope of this paper.
METASEMANTICS AND OBJECTIVITY
723
Various current attempts to naturalize the mind a la Jerry Fodor or Fred Dretske also belong here, where what is sought is a naturalist reduction of the intentional to the non-intentional. But reductive naturalism is not the only option in metasemantics. We can acknowledge that no such reduction of the intentional to the non-intentional is available while making genuine metasemantic explanatory progress within the general framework of metasemantic productivism. To see how this might be so, it is helpful to consider an analogy. The Russell of Knowledge by Acquaintance and Knowledge by Description asks how it is possible for anyone other than Bismarck to grasp a proposition about Bismarck.4 Most of us have never met the man, nor would we recognize him had we encountered him. Worse still, even if we had met him in the past or were perceiving him at the very moment of thinking or talking about him, while knowing full well that the man in front of us is Bismarck, we would not thereby be acquainted with the man himself but only with how he appears. In short, by Russellian lights we have no direct epistemic access to such items as Bismarck. Yet it is precisely such direct epistemic access to each constituent of a proposition that is required, according to Russell, to be in a position to grasp it. So Russell’s answer to the aboutness question regarding Bismarck is roughly this: There is no possibility for anyone other than Bismarck of grasping a proposition that has Bismarck himself as a constituent. One can only grasp a proposition each element of which is an object of one’s acquaintance, and only one’s own sense data, one’s self, and various universals, qualify as objects of one’s acquaintance. However, we can grasp various propositions that describe Bismarck, propositions that Bismarck himself uniquely satisfies and that are composed of elements with which we are acquainted. It is only a proposition of this second type that anyone other than Bismarck can expresses with the words ‘Bismarck was an astute diplomat’. Aboutness regarding Bismarck for anyone other than Bismarck is, on this view, a species of satisfaction. Let us set aside the question of whether or not Russell’s theory is correct. Consider someone who objected to it on the following grounds: Rather than offer a genuine answer to how aboutness regarding Bismarck is possible, the theory merely pushes back the question of 4 Bertrand Russell, “Knowledge by Acquaintance and Knowledge by Description”, Proceedings of the Aristotelian Society, 11, 1910, pp. 108-128.
724
ORI SIMCHEN
aboutness to aboutness regarding one’s own sense data, one’s self, and various universals – in short, to aboutness regarding items with which one is acquainted. But the theory offers us nothing at all when it comes to how we can entertain propositions about objects of acquaintance; how, for example, one can entertain a proposition that has oneself as a constituent. Given this glaring lack, so the complaint concludes, no explanatory progress has been made by Russell’s theory after all. But the complaint is misguided. Explanatory progress would have been made by Russell’s theory – if only it were otherwise plausible. To claim that Russell’s explanation of aboutness regarding the likes of Bismarck is unsuccessful because it has not succeeded in eliminating any trace of aboutness from the explanans is to set the bar of explanation far too high. If Russell’s theory were plausible, it would succeed in explaining how aboutness regarding all things reduces to aboutness regarding items of our acquaintance. That would have been a significant explanatory achievement. As it happens, the theory has little to recommend it on other grounds. But an account of aboutness need not culminate in a reduction of the intentional to the non-intentional in order to make genuine explanatory progress. In order to begin to see how the possibility of endowment with content requires objectivity, we need to enlist the distinction between semantics and metasemantics and focus on the latter. 5 As it is commonly understood, semantics is concerned with specifying semantic contents and their modes of composition, whereas metasemantics is concerned with the general issue of content-determination. An easy illustration of the distinction is afforded by the semantics and metasemantics of proper names. Direct reference theorists claim against descriptivists that the contents of names are simply their bearers. So the content of “Bismarck” in my mouth, say, is the man Bismarck. Such identification belongs to semantics. It specifies the content of the name as the entity named. But now the metasemantic question arises: How does the name “Bismarck” 5 The distinction is discussed (under a slightly different terminology) in Joseph Almog, “Semantical Anthropology”, Midwest Studies in Philosophy, 9, 1984, 479-489; David Kaplan, “Afterthoughts”, in Almog, Joseph; Perry, John and Wettstein, Howard (eds.), Themes from Kaplan, Oxford, Oxford UP, 1989, pp. 565-614, especially at pp. 573-576; Stalnaker, Robert “On Considering a Possible World as Actual”, Proceedings of the Aristotelian Society Supplementary Volume, 75, 2001, pp. 141-156; Coleman, Jules and Simchen, Ori, “Law”’, Legal Theory, 9, 2003, pp. 1-41.
METASEMANTICS AND OBJECTIVITY
725
in my mouth come to have the man Bismarck as its content? And here the prevalent metasemantic view that accompanies the semantic theory of direct reference is the causal-historical chain view. It holds that the name “Bismarck” in my mouth comes to have Bismarck himself as its content by virtue of a causal-historical chain running back from my current employment of the name, via my own cognitive history, via the sources from whom I acquired the name, be they a history teacher or an author of a book I have read, and their cognitive histories in turn, and further back via sources of sources of sources all the way down to some initial act of naming Bismarck “Bismarck”. This causal-historical chain view is a metasemantic thesis, a thesis that must be distinguished from the semantic thesis that the content of the name “Bismarck” is simply the man Bismarck.6 The new theory of reference, which is the general framework of metasemantic productivism that I employ, initiated an externalist revolution in our thinking about the cognitive relations between the mind and the world, specifically the relation between the contents of terms and what they are about, namely, their extensions.7 Traditionally, the relation between contents and extensions was thought to be a species of satisfaction in the formal sense. On this view, the content of a term poses a mere condition that specifies what the term is about by way of satisfaction of the condition.8 Such contents were thought to be immediately accessible to the mind of the agent, whereas the portions of the world that terms are about were thought to be cognitively once removed. In this way, cognition was thought of as inevitably mediated by conditions entertained in the mind. It was a crucial feature of this outlook that contents do not depend for what they are on what the terms are about, or even on whether they are about anything at all, just as a mere condition can be the condition that it is whether or not anything satisfies it.
6 The most influential statement of the metasemantic thesis regarding proper names is found in Kripke, Saul A., Naming and Necessity, Cambridge, Harvard UP, 1980, pp. 90-97. 7 I aim to remain as neutral as possible on how exactly to think about what contents are. This semantic issue, while a crucial ingredient in any overall metasemantic story concerning content-determination, lies outside the scope of my immediate concerns. 8 By “mere condition” I mean to rule out de re conditions, conditions that depend for what they are on the objects that satisfy them, such as the condition expressed by “identical with O” where the name “O” is understood to be contributing its bearer directly.
726
ORI SIMCHEN
On an externalist view of the relation between the mind and the world, aboutness is no longer thought to depend on satisfaction of conditions. The basic idea is that a term is about whatever it is about by virtue of being of it. To get an intuitive handle on what this ofness amounts to, it is useful to consider the aboutness of photographs.9 Consider the case of a photograph taken of one of two identical twins. Suppose further that the twins are so similar (or the photograph so imprecise) that had a photograph been taken of the other twin under suitable conditions, it would have been molecule-for-molecule identical to the actual photograph. Thus, as a mere visual condition, the photograph does not discriminate between the two twins. Yet for all that, it is only about one of them. We simply do not think of the aboutness of photographs as a matter of satisfaction of visual conditions. Rather, we think of this aboutness as having to do with the photograph’s ofness. The photograph is about the twin it happens to be of. It is about whichever of the two twins was the relevant causal-historical antecedent to the photograph’s formation as consequent. One thing suggested by such cases is that we do not in general individuate photographs in abstraction from what they are about. A photograph of the other twin might have been molecule-for-molecule identical to the actual photograph, yet it would still be a different photograph by virtue of being of —and thus about— someone else. Semantic externalism considers the ofness of expressions to be essential to their aboutness. Whatever their content is ultimately held to be, the aboutness of terms is achieved via their ofness. This means, among other things, that we have a reversal of the traditional view of the relation between content and extension. Traditionally, contents were thought to specify extensions as mere conditions that do not depend for what they are on what the terms are about. But on the externalist outlook, content crucially depends for what it is on what the term is about– so much so, in fact, that many versions of semantic externalism simply identify contents with extensions. To summarize the contrast in a word we might say that whereas the traditional view thought of content as determining extension, the new orthodoxy thinks of extension as determining content.
9 Such heuristic appeal to photography is inspired by a similar appeal made in David Kaplan, “Quantifying In”, Synthese, 19, 1968, pp. 178-214.
METASEMANTICS AND OBJECTIVITY
727
With these cursory remarks on the general framework in hand, we can now turn our attention to the metasemantics of general terms such as common nouns and adjectives. How are we to think of content-determination for a typical general term? To the extent that we think that those contents depend for what they are on what the terms are about, i. e. on their extensions, extension-determination is going to play a crucial role in the overall account of content-determination. Take the familiar example of “water”. To the extent that the content of “water” depends for what it is on its extension, an account of how “water” comes to apply to all and only samples of water will occupy a central role in any plausible story about the way in which “water” gains its content. For the remainder of this paper, my earlier antireductionist remarks must be borne in mind. Specifically, the explanatory burden of a metasemantic account of general terms should not be thought of as the reduction of the intentional to the non-intentional.10 Elsewhere Jules Coleman and I have defended an account of extension-determination that takes its main cue from Putnam’s work in The Meaning of “Meaning”.11 As against the traditional view that knowing the content of a typical general term is a matter of knowing an extension-fixing criterion that all and only samples of the relevant kind satisfy, Putnam (and, independently, Kripke) has argued convincingly that there is little reason to think that proficient speakers are in possession of any such criteria. For example, adult speakers of English who are proficient with the noun “gold” seldom know a general criterion that applies to all and only instances of gold. But for all that, “gold” applies to all and only instances of gold. How is this determination achieved? It is achieved in two ways: socially and environmentally.
10 One reason for being pessimistic about the prospects of a naturalistic reduction of aboutness is that for many terms content-determination proceeds by way of linguistic deference to a relevant expertise, as we shall see. Such deference implicates an elaborate authority structure, and there is good reason for being pessimistic about the explanatory prospects of attempting to account for such social phenomena naturalistically, within the vocabulary of cognitive science, say. Such pessimism carries over to a general pessimism about a cognitive-scientific reduction of aboutness. This is an area of heated controversy that obviously demands far more attention than I can devote to it here. 11 See Coleman, Jules and Simchen, Ori, “Law”, Putnam’s classic paper is collected in Putnam, Hilary, Mind, Language and Reality: Philosophical Papers, vol. 2, Cambridge, Cambridge UP, 1975, pp. 215 and 227.
728
ORI SIMCHEN
Socially: Let us grant that proficiency with “gold” does not entail possession of an extension-fixing criterion. Yet I am a proficient speaker who would be quite easily taken in by samples of iron pyrite (“fool’s gold”). Does it not follow that ‘gold’ in my mouth picks out anything that I would be inclined to regard as gold, including samples of fool’s gold? – Not at all. “Gold” in my mouth still applies to all and only samples of gold because what “gold” in my mouth applies to is not just a matter of how things are with me considered in isolation from the rest of my linguistic community. Rather, it is an intricate matter of social exchange that Putnam dubbed “division of linguistic labor” and Gareth Evans likened to the relation between producers and consumers. I will follow received practice and refer to this phenomenon as “linguistic deference”. The basic idea is that ordinary speakers (“novices”) successfully refer to gold and not to fool’s gold by employing “gold” via their tacit reliance on a relevant expertise, in this case metallurgy. By placing their trust in an expert doctrine, speakers can employ general terms to refer determinately to things regarding which they are relatively ignorant. Reference cannot be such a difficult cognitive task so as to require each and every member of the linguistic community to become an expert on what is being talked about. Environmentally: Had speakers’ surroundings been relevantly different, say with some distinct yet superficially indiscernible water-like substance occupying the role of water, or with cat-like demons occupying the role of cats, the extensions of “water” and “cat”, and so their contents, would have been different from what they actually are. Speakers employ such terms to speak about whatever in the world is around them. We employ “cat” to refer to cats and not to cat-like demons. Our counterparts in the cat-like demon world use “cat” to refer to cat-like demons and not to cats. The difference is in what is around. Moreover, if we bear in mind that our cats are not demon-cats and consider our own intuitions regarding whether or not “cat” as spoken by us applies also to demon-cats, assuming such things are possible, the answer is a resounding No, even under the further assumption that we would never be able to tell them apart from cats. “Cat” as spoken by us applies to cats and to nothing else. Similar intuitions can be elicited for other general terms. This strongly suggests that there is an indexical element in extension-determination for a typical general term. To fall under the extension of “cat” is to bear some relation —a relation that demon-cats, for example,
METASEMANTICS AND OBJECTIVITY
729
do not bear— to paradigmatic cats in the environment that are referred to indexically, say by employing ‘this[the furry meowing thing over here]’. In other words, the actual interaction between speakers and their environment determines what ‘cat’ applies to in any possible world.12 As Frank Jackson puts it regarding the example of ‘water’: ”The reference in all worlds is settled by what is watery and the subject of the relevant acquaintance in the actual world” (39).13 Putting the above two points together yields the following schema of an account of extension-determination for general terms. The extension of a typical general term “N” is specified by the following condition: (†) N(x) 1 (x, this).14 “N” applies to all and only those items, in any possible world, that bear a relevant similarity relation ˜ to whatever is indexically referred to by “this” as spoken in the actual world. Take “gold”. It applies to all and only samples of a substance, in any possible world, that bear a certain similarity relation —in this case microstructural similarity— to paradigmatic samples of the substance indexically referred to by “this” as spoken in the actual world. In short, “gold” refers to whatever is microstructurally close enough to paradigmatic samples of gold in speakers’ actual environment. And discerning that the relevant similar12 (For those interested in semantic scruples): When considering whether “cat” applies to occupants of other possible worlds that are relevantly similar to actual cats picked out indexically, or whether instead it applies to occupants of other possible worlds that are relevantly similar to items picked out indexically in those other worlds, the first option seems to be supported by, and the second option to conflict with, a basic semantic fact about indexicals, namely, that indexicals take large scope relative to intensional operators. Thus, (i) is consonant with the logic of indexicals as it is commonly construed, whereas (ii) is not (we let the square brackets indicate scope and “˜” stand for the relevant similarity relation): (i) [this]N(“x)(cat(x) « ˜ (x,this)) (ii) N(“x)(cat(x) « [this] ˜ (x,this)) If this is correct, then the rigidity of ‘cat’ depends on a feature of its metasemantics, a feature that depends, in turn, on a feature of the semantics of indexicals. 13 Frank Jackson, From Metaphysics to Ethics, Oxford, Clarendon Press, 1998. 14 Nothing requires that “this” be the particular indexical expression involved in extension-determination for a typical general term. The choice of a specific indexical is only for heuristic purposes, as should become clear from the discussion to follow of the role of (†) within the overall metasemantic account.
730
ORI SIMCHEN
ity relation (call it “M”, for “metal”) indeed obtains is something that is left to metallurgical expertise to decide. In other words, the social aspect of extension-determination for “gold” enters primarily15 in discerning that M obtains between putative instances of gold and paradigmatic samples, whereas the environmental aspect enters in the employment of the indexical “this” in the actual presence of paradigm instances of gold. Before moving on to consider further wrinkles, I need to say more about the role of (†) itself within the overall account of content-determination on offer. First and foremost, (†) is not meant itself to capture the content of “N”. It is offered as an extension-fixer that speakers are tacitly committed to, given their actual referential intentions. (†) figures in a metasemantic, rather than a semantic, account of extension-determination. The idea is that speakers employ a typical general term “N” as if they are committed to (†) as an extension-fixing stipulation. And the force of this “as if” claim is just that speakers employ “N” with the referential intention to pick out whatever is in fact relevantly similar to paradigmatic instances of the kind in their environment. Now, (†) , all by itself, is completely schematic. Precisely how we are to think of the implicated referential intentions in concrete instances is a subtle matter, but this much is relatively clear. Referential intention attribution is a species of intention attribution more generally, which is, in turn, a species of attitude attribution. It is a commonplace in attributing attitudes to agents that we attribute to them only those attitudes that they can be expected to have given their overall epistemic situation. What is rather surprising and seldom noticed is that this constraint, mild as it may seem, actually renders certain common philosophical attributions of referential intentions highly implausible. One such implausible attribution is the attribution to ordinary speakers of the metaphysical realist intention to employ “water” to refer to anything relevantly similar to paradigmatic instances of water from the standpoint of the world as it is in itself, beyond whatever we might come to believe about the matter. Another implausible attribution, from the other end of the philosophical spectrum, is the attribution to ordinary speakers of the radical subjectiv15 It is sometimes suggested that linguistic deference enters not only in discerning relevant similarity to paradigmatic instances of the kind, but also in identifying the paradigmatic instances themselves. This seems correct for some deferential terms and incorrect for others. The general issue need not concern us here.
METASEMANTICS AND OBJECTIVITY
731
ist intention to employ “water” to refer to whatever the agent herself would regard as relevantly similar to paradigmatic instances of water in a way that is not susceptible to any external check on the matter. (I will come back to radical subjectivist referential intentions below). Neither attribution is plausible in light of speakers’ other attitudes. Referential intention attribution is an exercise in making sense of speakers’ attitudes within an overall metasemantic story about how a given term comes to possess the content that it has. More specifically, it consists in squaring referential intentions with speakers’ other intentions, beliefs, desires, hopes, fears, etcetera. It should thus aspire to remain as true as possible to speakers actual attitudes and should refrain as much as possible from subjugating them to extrinsic philosophical agendas. A related point concerning the role of (†) is that (†) is neutral as to whether “N” is linguistically deferential or not. Certain terms, such as the natural kind term “gold”, are linguistically deferential if any term is. As mentioned above, individual proficiency with “gold” does not require of speakers to be capable of discerning that a given sample of substance is relevantly similar to paradigmatic instances of gold. Rather, speakers are best understood to be implicitly deferential to metallurgy to decide on such matters. But other terms do not exhibit linguistic deference – the non-natural kind term “chair” is one salient example. It is no part of our linguistic practices vis-à-vis “chair” that we are deferential to some chair-expertise to discern relevant similarity to paradigmatic chairs. In ”Law” Jules Coleman and I argue that despite initial appearances to the contrary, the deferential-non-deferential distinction cuts across the natural-non-natural distinction. It is just not the case that the natural kind terms are the deferential ones whereas the non-natural kind terms are the non-deferential ones. Some natural kind terms, such as “puddle”, are not deferential, whereas some non-natural kind terms, such as ‘carburetor’, are.16 This makes the question of what determines whether or not a given term is linguistically deferential more demanding than is often presumed. Much of the discussion in ”Law” is devoted to answering this question and drawing implications from the answer for the recent con16 I use “natural kind term” in a way that purports to remain neutral with respect to further metaphysical commitments regarding natural kinds. Puddles are not non-natural; hence, they are natural. (I realize that there is a lot more that can be said here concerning what in general counts as natural, but it is not required for present purposes).
732
ORI SIMCHEN
tention in the philosophy of law that we are as linguistically deferential to jurisprudential expertise with respect to ‘law’ as we are to metallurgy with respect to “gold”.17 To summarize this all-too-brief metasemantic sketch, extension-determination for a typical general term “N”, which plays a crucial role in its content-determination, is achieved via referential intentions to pick out whatever is relevantly similar to (i. e. bears to) paradigmatic instances of N in speakers’ environment. (The role of “this” in (†) is simply to make the environmental aspect of extension-determination salient). If ‘N’ is linguistically deferential, speakers leave it up to some relevant expertise to discern whether or not obtains. If “N” is not linguistically deferential, speakers are relatively self-reliant in this regard. Either way, “N” gains its extension, and consequently its content, via referential intentions that specify that it is to apply to anything bearing ˜ to paradigmatic instances of N in speakers’ environment. We are now finally in a position to explore the bearing of this metasemantic story on the question of objectivity. If the above sketch is on the right tracks, then content-determination depends on extension-determination. And extension-determination depends, I now claim, on an objective measure of similarity to paradigmatic instances of the relevant kind. In other words, it is built into the possibility that the general term “N” should have whatever content it happens to have that there be an objective measure of similarity to instances of the kind. Extension-determination for a typical general term depends on the existence of some independent standard that can facilitate a genuine difference between cases where instances only seem to be relevantly similar to one another and cases where this is in fact the case. To see this, we turn to consider some examples. In the metasemantic literature it is often presumed that in the case of substance terms such as “water” or “gold”, such a standard is provided by the microstructure of the substance. Take “gold” again. It is thought to apply to all and only samples that are microstructurally close enough to paradigmatic samples of gold. But this is a matter that can and does easily transcend mere seeming similarity to gold. Ordinary proficient speakers are not privy to the procedures whereby experts distinguish samples 17 For a defense of this contention see Nicos Stavropoulos, Objectivity in Law, Oxford, Clarendon Press, 1996.
METASEMANTICS AND OBJECTIVITY
733
of genuine gold from samples that only seem to the unaided mind to be samples of gold. It is precisely here that linguistic deference enters the picture. For it is built into our linguistic practices vis-à-vis these substance terms that in determining whether or not such a term applies in a given case, an ordinary speaker is beholden to a relevant expertise on the matter. This means that distinguishing similarity to paradigm instances in such cases from mere seeming similarity is a matter that novices leave to experts to decide. The case of simple artifact terms such as chair’ or “hammer” is more difficult, but here, too, there are means for distinguishing similarity to paradigm instances of the kind from mere seeming similarity. As mentioned above, a term such as “chair” is not linguistically deferential, so such means are not provided by an expert doctrine. In addition, while as a linguistic community we are obviously successful in classifying things under the label “chair”, how we determine relevant similarity to paradigmatic chairs is not entirely transparent to us. However, there are compelling empirical reasons for thinking that relevant similarity in such cases is heavily informed by the intended function of instances of the kind.18 Let us assume that this is correct: A proficient speaker employs “chair” with the referential intention to pick out anything that is relevantly similar to paradigm instances, where relevant similarity has much to do with being intended to serve the same function as paradigmatic chairs. But whether or not a given item is intended to serve the same function as a paradigmatic chair is a matter that can easily transcend what merely seems to be the case. If it is indeed true, as findings on conceptual development suggest, that relevant similarity to chairs is a matter that is heavily informed by intended function, then in the case of an item that despite appearances to the contrary has no intended function, speakers would stand corrected if they initially classified it as a chair and were then informed that in fact the item has no intended function. Be that as it may, whether we are dealing with linguistically deferential kind terms or with ones that are not, without facilitating a distinction between genuine similarity to instances of the kind and mere seeming similarity, no extension could be secured for the kind term in question, 18 The psychological literature on conceptual development abounds with attempts to identify features of artifacts that are generally considered to be essential to them. See, for example, Keil, F. C., Concepts, Kinds, and Cognitive Development, Cambridge, MIT Press, 1989.
734
ORI SIMCHEN
and, consequently, no content. For without any means of effecting a seems-is distinction in extension-determination, a term would apply to anything seeming to be relevantly similar to (what seem to be) paradigmatic instances of the kind. This means that no possibility of erroneous application of the term would be facilitated. But without the possibility of genuine error in application, there is no possibility of genuine correctness in application either. In this way, the term would not contribute to the truth-conditions of claims in which it partakes; that is to say, it would lack content altogether. This line of reasoning bears repetition in a more orderly and schematic fashion: Let “N” be a putative kind term for some putative kind N. Suppose that (i) there is no objective measure of similarity among instances of N. Then, (ii) there is no objective measure for membership in N. Thus, (iii) there is no possibility of genuine error in the application of “N”. But then, (iv) there is no possibility of genuine correctness in the application of ‘N’ either. Therefore, (v) “N” does not contribute to the truth-conditions of claims in which it partakes. And therefore, (vi) “N” lacks content. A standard subjectivist response to this argument is to claim that nothing in it effectively rules out the possibility of endowment with subjective content. In other words, so the objection presses on, nothing that has been said so far rules out that a general term may have such content that is shaped by the radical subjectivist referential intention alluded to above, the intention to pick out anything that merely seems to be relevantly similar to what merely seem to be paradigm instances of the kind. All that is needed for endowment with subjective content is that the relevant similarity relation itself be subjective. For “N” to be endowed with subjective content, its extension need only be fixed by the subjective inclination to regard things as relevantly similar to whatever one is subjectively inclined to regard as paradigmatic instances of seeming-N. As long as this remains a standing possibility, it is just wrong to claim, as I have, that endowment with content requires an objective measure of similarity in extension-determination. Let us examine what would transpire if we withdrew the requirement that there be an objective measure of similarity in extension-determination, in the way suggested by the objection. Let us assume for the sake of argument that the attribution of the radical subjectivist referential intention is in fact adequate for some substance term that applies to all
METASEMANTICS AND OBJECTIVITY
735
and only instances of seeming water-like. Let this term be “water*”. We are supposing, then, that “water*” applies to whatever is deemed by the speaker to be relevantly similar to (i. e. whatever bears * to) other instances of water*, where being an instance of water* is constituted by merely seeming water-like. Now, in order for any general term “N” to gain a determinate extension, and so to contribute to the truth-conditions of claims in which it partakes, there has to be some way of effecting a seems-is distinction that would allow us to say that something can only seem to be relevantly similar to instances of N without actually being relevantly similar to those instances. We just saw how a seems-is distinction is provided for in the examples considered above of substance terms and simple artifact terms. In the case of a term such as ‘water*’, what would be required is a facility to distinguish cases of merely seeming to bear* to instances of water* from cases of genuinely bearing* to them. But here comes the crucial point: If something seems to bear* to instances of water*, then ipso facto it bears* to them! For to bear* to something is to seem relevantly similar to it. But to seem to bear* to something is to seem to seem relevantly similar to it. But seeming to seem relevantly similar to something is just to seem relevantly similar to it all over again. Seeming does not genuinely iterate. Consider any case of seeming to f. If something seems that it seems to f, then it also thereby seems to f. If something seems that it seems red, then it also seems red; if something seems that it seems sweet, then it also seems sweet; if something seems that it seems painful, then it also seems painful. In other words, there is no place to insert the requisite seems-is wedge when it comes to seeming-to-f. If I believe that something is red then I may be mistaken, for it may only seem to me that it is red while being some other color. But if something only seems red to me – where “seems red” is not just a stylistic variation on “is red” – I cannot be mistaken about that. What this means, in effect, is that extension-determination for “water*”, and so content-determination, cannot take place after all. So the metasemantic question regarding “water*” remains unanswered. If this is correct, then despite initial appearances to the contrary, a term such as “water*” can-
736
ORI SIMCHEN
not gain content. The possibility of endowment with content requires objectivity in extension-determination. 19 I began this paper by briefly considering the oppositional way that writers on objectivity typically set things up, using their strategy as a point of contrast to my alternative metasemantic strategy. Rather than focus on judgments in a particular domain and raise the question of the metaphysical status of the facts that constitute their subject matter, followed perhaps by the question of epistemic access to those facts, I chose to focus on the world-thinker interplay that undergirds endowment with semantic content. Given the framework of metasemantic productivism sketched above, it turned out that the very possibility of such endowment requires that there be some independent measure to facilitate the difference between genuine similarity to instances of a given kind and mere seeming similarity. In this way, objectivity is required for extension-determination, and so required for content-determination more generally. But curious minds still want to know: What kind of objectivity do legal facts, let us say, enjoy, as opposed to the objectivity of the facts of natural science, or of moral facts, or of mathematical facts? Is the objectivity of legal facts not “softer” in some sense than the objectivity of natural-scientific facts? Yet for all that such questions may strike us as gripping and unavoidable, it is far from obvious that anything useful can be said about objectivity as a feature of facts considered as truth-makers for our judgments. We can, however, turn our attention to objectivity as presupposed by the possibility of endowment with content of specific terms and perhaps learn thereby something important about their employment. 19 The transition from the claim that if “water*” seems to apply to something then it does in fact apply to it, to the claim that “water*” has no content, might give rise to the following worry. Suppose that “water*” applies by seeming to apply. Could I not still misapply it, say by intending to misapply it? But in that case, it seems that a genuine contrast between application and misapplication for “water*” can be facilitated, in which case “water*” can gain a determinate extension, and so a determinate content, after all. However, further reflection will reveal this to be gratuitous. Under the conditions specified above, what might it mean to say that we can misapply “water*”? Suppose I resolve to misapply it in a given instance. In what (or against what) might my misapplication of it consist? The only available answer is that “water*” seems to misapply in this given instance. In other words, the term in question applies by seeming to apply and misapplies by seeming to misapply. And this can only mean that there is no talk of genuine application or misapplication here. (Thanks to Mark Greenberg for drawing my attention to this worry).
METASEMANTICS AND OBJECTIVITY
737
By way of conclusion, let us turn again to “negligence”. If the overall argument of this paper is sound, and to the extent that the metasemantic framework sketched above is independently plausible, then in order for “negligence” to gain its content there must be an independent measure to distinguish genuine similarity to paradigmatic instances of negligence from mere seeming similarity. The presumption that ‘negligence’ is endowed with content, that it contributes in relevant ways to the truth-conditions of claims in which it partakes, entails, among other things, that “negligence” can apply wrongly. As long as speakers —and this includes judges— consider the term “negligence” in their mouth to have content, as long as they consider it as contributing in relevant ways to the truth-conditions of claims in which it partakes, they must also consider it to be susceptible to misapplication in specific cases. If the term is not susceptible to misapplication, it cannot have content. And it is, in fact, overwhelmingly likely that speakers, including judges, consider such terms to be susceptible to misapplication. In this, “negligence” is not so different from “water”. As long as speakers —and that includes chemical experts— consider the term “water” in their mouth to have content, as long as they consider it as contributing in relevant ways to the truth-conditions of claims in which it partakes, they must also consider it to be susceptible to misapplication in specific cases. If the term is not thus susceptible, then it cannot have content after all. Where does this all leave us? One thing that can be said about objectivity is that a measure of independence from what we happen to deem relevantly similar to paradigmatic instances of kinds is presupposed by the very possibility that our kind terms are endowed with content. And this includes what we deem relevantly similar to paradigmatic instances of kinds even at some hypothetical end of inquiry, or under ideal epistemic conditions. The epistemic conditions under which the verdict that Jones was negligent was reached may have been ideal. Yet for all that, in order for the term ‘negligence’ in the court’s mouth to have content, that is, to contribute to the truth-conditions of claims in which it partakes, the court must be regarded as susceptible to error in application. This means that despite all the epistemic ideality in the world that may happen to obtain as regarding the court’s employment of “negligence”, it is compulsory to treat it as answerable to some independent standard that can facilitate the distinction between being relevantly similar to paradigmatic instances of negligence and merely seeming to be so.
738
ORI SIMCHEN
Does this conclusion saddle us with some version of untenable Platonism? – Hardly. For the metasemantic strategy for broaching objectivity does not begin with the customary examination of the metaphysical underpinnings of the relevant facts, followed by a treatment of epistemic access to them. The above argument, if indeed successful, illustrates that objectivity is presupposed by the possibility of endowment with content. To my mind, given the attractiveness of the metasemantic picture offered above, such a conclusion is on much firmer ground than are customary defenses of objectivity, defenses that tend to raise far more perplexities than they actually succeed in quelling.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS? Michael S. MOORE* SUMMARY: I. Introduction. II. Simchen’s Transcendental Deduction of Objetivity. III. Simchen’s Semantics. IV. Connecting Simchen’s Semantics to Simchen’s Transcendental Argument for Objectivity.
I. INTRODUCTION There are two topics examined in Professor Simchen’s paper. The first and metaphysical topic is the sense in which our judgments in science, ethics, and law might be objective and how one should argue for objectivity in that sense. The second topic, this one in the philosophy of language, is about the central question for that discipline: what is the meaning of the terms used in a natural language such as English, and how did such terms acquire such meanings?. It seems to be a central organizing principle of the paper that answering the questions in the philosophy of language will help in answering the questions in metaphysics. At the close of these comments I shall return to discuss the connection between the two topics. Before doing that it would be well to discuss the topics separately, which I plan to do, starting with the metaphysical question of objectivity. II. SIMCHEN’S TRANSCENDENTAL DEDUCTION OF OBJECTIVITY Simchen puts aside what he calls the “oppositional approach” to metaphysical questions.1 On this approach —of which I take myself to be an * University of Illinois, USA. 1 Simchen, Ori,“Metasemantics and Objectivity”, this volume, p. 719. 739
740
MICHAEL S. MOORE
exemplar—2 one isolates a class of judgments, seeks the facts that could make such judgments true, asks whether such facts exist and if so, whether their existence is independent of human belief and convention. The existential and mind-independence questions classify one as a realist, a skeptic, or an idealist of some kind about such facts. One separately addresses the epistemological question of how one discovers and grasps facts of this nature and how one justifies belief in them. Simchen’s motives for putting aside this traditional approach to metaphysics appear to be three fold. First, he doubts “that anything useful can be said about objectivity as a feature of facts considered as truth-makers for our judgments.”3 Call this the intelligibility worry. Second, the history of metaphysics carried on in this way is not reassuring to Simchen: “the familiar back-and-forth refinements can continue without apparent end in sight”.4 Call this the non-resolvability worry. Third and most important to Simchen, there is what I shall call “the gap worry”: if we separate questions about the nature of certain facts from questions of how we discover, grasp, and justify our beliefs about such facts (as is done on the “oppositional” approach), then we will have opened up a gap (between what there is and what we can discover/understand/justifiably believe) that we cannot bridge.5 Because of such a gap, we will always be open to the skeptic’s taunt that the evidence we possess is insufficient to justify belief in the things that evidence supposedly evidences. Simchen’s approach, as he himself characterizes it, “has a distinctly transcendental, and so Kantian flavor.”6 Let us first be clear what that flavor is before we probe Simchen’s variety of it. On my understanding, a transcendental deduction has three steps to it.7 First, one does a deep 2 See my “Moral Reality”, Wisconsin Law Review, 1982, pp. 1061-1156; “Moral Reality Revisited,” Michigan Law Review, vol. 90, 1992, pp. 2424-2533; “Legal Reality: A Naturalist Approach to Legal Ontology”, Law and Philosophy, vol. 21, 2003, pp. 619-705. These and like-minded essays are collected in Moore, Objectivity in Ethics and Law: Essays in Moral and Legal Ontology, U. K., Ashgate Press, 2004. 3 Simchen, “Metasemantics”, op. cit., footnote 1. 4 Ibidem, p. 720. 5 Ibidem, p. 719. 6 Ibidem, p. 720. 7 See generally Lewis White Beck, A Commentary on Kant’s Critique of Practical Reason (Chicago: University of Chicago Press, 1960), p. 170: “The process of transcendental deduction is not that of linear inference from a premise to its logical consequence. It is a process of taking some body of alleged fact (e. g., mathematics or science) which
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
741
analysis of some body of alleged fact, seeking its presupposed deep principles. We ask for the conditions of the possibility of those facts being as we believe them to be. At this step we do not ask whether such facts or their presuppositions are true; only if the one indeed presupposes the other. Second, we count the cost of denying such presuppositions, i. e., can we countenance or even imagine a world in which such presuppositions are not true? Third, if we find the cost of abandoning such presuppositions to be too great, we commit to the facts from which they are taken. That is, we affirm such facts to be true. Simchen’s use of this broadly Kantian schema is as follows (using legal judgments as our exemplars). First, Simchen observes that we experience law as a set of statements using terms like “negligence” in a way that endows them with semantic content; such terms, in other words, apply by virtue of their meaning to some things and not to others. In this endowment of our terms with content we presuppose the objectivity of such terms in the sense that we presuppose a distinction between what such terms actually apply to and what they only seem to apply to. Second, we can’t imagine experiencing law in any way that did not endow legal terms with content, that did not make them applicable to the world. Third, we should therefore commit to the objectivity of law in the sense presupposed by our practices, viz, that there is an objective truth about whether such terms apply or not to a given state of affairs, a truth not captured by the subjectively experienced applicability of such terms by certain legal actors. We should commit to judgments of the form, “x is negligent,” as capable of being objectively true in this sense because not to do so would rob “negligence” (and like terms of law) of their content. Putting it this explicitly reveals my first query about Simchen’s argument. Put simply, the analysis in the first step of the deduction doesn’t seem very deep: it ends pretty much where it begins. That is, the presupposition of our experience of law (that at the end of the deduction we are to affirm) is pretty much right on the surface of the experience itself. The idea that legal terms have content —that they apply to the world— seems very close to the idea that we must distinguish actual from merely seeming applicability of such terms. This seems close to saying that we experience law as objective in its character, and (in that trivial sense) our has been challenged and showing (a) what its necessary presuppositions are and (b) what the consequences of denying these presuppositions are”.
742
MICHAEL S. MOORE
experience of law “presupposes” its objectivity. In which case, wouldn’t it be more accurate for Simchen to argue: we experience law as objective in character, and we can’t imagine that it isn’t? To the extent Simchen intends a truly Kantian form of argument here, the closeness of what is presupposed to that from which it is presupposed robs the argument of its force. A transcendental deduction is only persuasive when there exists some differential plausibility between some facts that we experience, on the one hand, and their presuppositions, on the other. It is this difference in plausibility that allows the deduction to endow the one with the greater plausibility of the other. When the presupposition and the facts experienced are one and the same, there can be no such enhancement of plausibility. Supposing that Simchen’s argument can be taken to be an instance of a transcendental deduction, my second query is whether such deductions can ever succeed in establishing what they seek to establish. My general take on such modes of argument is that they either prove too little or they prove too much. Take the “too little” horn of the dilemma first. Such deductions threaten to collapse into an analytic psychology, of the kind Kant in his ethics dubbed a “metaphysical deduction.”8 They so collapse when the costs of giving up some concept is bearable, and so the conclusion sought to be established —the presupposition of the concept— is hardly one we must affirm. As an illustration, consider Ronald Dworkin’s early foray into this kind of analytic psychology. In his famous hard cases argument,9 Dworkin noted that we conceive of law in such a way that litigants never approach judges as supplicants of a favorable exercise of judicial discretion; they always appear as claimants of legal rights even in the hardest of hard cases. A condition for the possibility of there being legal rights in hard cases is that there is law governing such cases; if there is no obvious law governing the case (which there is not because it is a hard 8 In Kant’s ethics a “metaphysical deduction” seeks a kind of pure, a priori knowledge of concepts (such as the concept of duty), without showing us that our concepts give us knowledge of the objects to which such concepts purport to refer. As Beck puts it, “The metaphysical deduction is Kant’s effort to discover what the categories are; the transcendental deduction is his effort to show that they are valid”. Commentary, cit., footnote 7, p. 110. 9 Ronald Dworkin, Taking Rights Seriously, Cambridge, Harvard University Press, 1978, pp. 2-4.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
743
case), then there must be a “seamless web” of unobvious law, consisting of moral principles having some institutional support in other parts of the obvious law. There is nothing in this argument as stated10 that compel us to affirm either our concept of law or its presupposition. For we can easily imagine revising our concept slightly; the rhetoric of lawyers arguing hard cases is seen as just that, rhetoric, not to be taken seriously as requiring beliefs by anyone that there really are legal rights in hard cases. In which case the cost of not affirming the presupposition of these practices – a kind of natural law view of the law governing hard cases – is one we might easily pay. That would leave Dworkin’s “deduction” as only a bit of uncommitted, third person, psychological analysis: we conceive of law and law practice in ways presupposing a seamless web view if it. I take it that Simchen does not think we could imagine that legal terms like “negligence” are not endowed with content in the way that we could imagine that there were no legal rights in hard cases. So let us swing to the other horn of the dilemma. Suppose we find it literally inconceivable that we did not experience sequences of events (for example) in ways that did not divide them up between those orderly ones supporting induction and those variable ones that do not.11 Such inconceivability would mean that we find unintelligible any ways of thinking that fails to draw this distinction. (As Willard Quine put it (in a quite different context): if there were a question to beg, we would be begging it).12 That would mean we cannot self-consciously affirm either this distinction or the presupposition of it (viz causation), not at least as an act of affirmation conditioned on acceptance of the distinction. Because we cannot imagine 10 One can perhaps beef up Dworkin’s counting of the costs of giving up the practice in question. For some suggestions, see Moore, “Legal Principles Revisited”, Iowa Law Review, vol. 82, 1997, pp. 867-891, reprinted in Moore, Educating Oneself in Public: Critical Essays in Jurisprudence, Oxford, Oxford University Press, 2001. 11 Kant’s transcendental deduction against Hume’s causal skepticism. 12 Quine, W. V. O., Word and Object, Cambridge, MIT Press, 1960. Quine was referring to our inability to see others linguistic behavior in a way that did not indicate a distinction (between affirmation and denial) being drawn by those where behavior it was. As another example, consider the way that Simon Blackburn (Ruling Passions, Oxford, Calrendon Press, 1998, pp. 54-59) regards the principle of charity in attributing representational states of belief and desire to another creature: Blackburn transforms the principle from a heuristic into an “a priori principle of interpretation” so that we cannot see a creature that did not conform to the principle as even having beliefs or desires.
744
MICHAEL S. MOORE
not accepting the distinction in question, so we cannot imagine having to proclaim that we must accept the distinction and its presupposition because it is too costly not to. Rather, we simply affirm that causation exists. We affirm, analogously, that the statement, “x is negligent,” is objectively true; we do not affirm that it must be regarded as true because otherwise we must change our ways of thinking in certain ways. When successful, in other words, transcendental deductions seem to prove too much. Such successful deductions are indistinguishable from standard realist arguments framed, not in terms of experiences and conceptualizations it would be costly to give up, but in terms of reasons for believing certain propositions to correspond with how things (objectively) are.13 In addition to these two queries about Simchen’s use of a transcendental deduction-like argument, I also wonder about his motives for wanting to use such a form of argument. About the first too motives mentioned above – the unintelligibility and non-resolvability worries – I shall say little. Partly this is due to the fact that Simchen himself does not say enough to reveal why he is skeptical of the traditional metaphysical enterprise; also, I have elsewhere laid out why I think the enterprise is worthwhile, susceptible of progress, and productive of not only an intelligible answer, but a true one as well.14 Simchen’s gap motivation merits closer attention. I have two questions here. One is whether the gap (between the realist’s truth conditions, on the one hand, and graspability, discoverability, and justification conditions on the other) should force a change in our metaphysical modes of argument. Simchen, like the skeptic and the constructivist in metaphysics, worries about being ship wrecked on the side of metaphysics if ever he admits of a kind of metaphysics that allows a gap to exist between epistemology and metaphysics. I should have thought that the lesson of books like Gil Harman’s Thought15 was that such fears are groundless. They are the product of notions of graspability, discovery, and justification that are too demanding. The lesson we should take from such a gap is a lesson in epistemology, not in metaphysics: we should 13 I am not so naïve as to think that any dedicated Kantian would be convinced by these abbreviated remarks. Simchen himself would weaken the deduction so that it displays impossibility but not inconceivability; this, so that we can conceive of what is impossible. 14 See note 2, supra. 15 Gilbert Harman, Thought, Princeton, Princeton University Press, 1971.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
745
relax what we require in order to understand something, discover something, justify belief in something, so as to accommodate the fact that our conclusions (in some sense) always outrun our evidence for them. Given the relative firmness of our belief in induction, physical objects, other minds, and the past, in the face of what we recognize to be less than overwhelming evidence for any of them, a proper understanding of a non-foundationalist epistemology is to relax our epistemological beliefs.16 Second, supposing the worry about the gap to be a genuine worry, I wonder whether Simchen’s response could adequately assuage such a worry. We certainly have the experiences on which Simchen’s transcendental deduction rests, viz, we ascribe content to our concepts. In so doing we do indeed seek those “objective similarity relations” between particulars we call kinds, different from the merely “seeming similarities” that historical persons see (or even epistemically idealized persons would see). Yet in that seeking are we not presupposing just the gap Simchen fears, reappearing now within his own preferred mode of argument? Is there not still a gap between what there is (objective similarities), and what our actual (and even our best) theories can accommodate (actual or hypothetical seeming similarities), that Simchen’s approach does not close? In which event, I fail to see why a fear of gaps would motivate Simchen’s approach (again, even conceding arguendo that the gap fear is a genuine fear). III. SIMCHEN’S SEMANTICS I turn now to Simchen’s semantic project. Professor Simchen has joined myself,17 David Brink,18 Nicos Stavropoulos,19 and others20 in 16 An argument laid out at somewhat greater length in Moore, “The Plain Truth About Legal Truth”, Harvard Journal of Law and Public Policy, vol. 26, 2003, pp. 23-47, reprinted in Moore, Objectivity, cit., footnote 2. 17 Moore, “The Semantics of Judging”, Southern California Law Review, vol. 54, 1981, pp. 151-295, “A Natural Law Theory of Interpretation”, Southern California Law Review, vol. 58, 1985, pp. 277-389; “Do We Have an Unwritten Constitution?”, Southern California Law Review, vol. 63, 1989, pp. 107-139. 18 David Brink, “Legal Theory, Legal Interpretation, and Judicial Review”, Philosophy and Public Affairs, vol. 17, 1988, pp. 105-148; Brink, “Realism, Naturalism, and Moral Semantics”, Social Philosophy and Policy, vol. 18, 2001, pp. 154-176. 19 Stavropoulos, Nicos, Objectivity in Law, Oxford, Clarendon Press, 1996. 20 E. g., Katz, Leo, Bad Acts and Guilty Minds, Chicago, University of Chicago Press, 1987, pp. 82-96.
746
MICHAEL S. MOORE
thinking that “K-P” Semantics (after Kripke-Putnam)21: (1) is the correct semantics for most terms in a natural language like English; and (2) in the correct semantics for legal terms like “negligence”. I shall consider each of these two issues in turn. The Search for the Correct General Semantics Simchen argues that the target of the new, K-P semantics is criterial semantics, according to which the meaning of any term is given by a set of individually necessary and jointly sufficient conditions for its correct usage. Actually the target of K-P semantics is considerably broader than that,22 and since it matters to understanding both K-P semantics and Simchen’s version of it, I shall first portray against what K-P semantics was directed. A. The Target: Conventionalist Semantics On the traditional view of semantics, the meaning of words is a matter of convention. The conventions of our linguistic community have assigned certain properties as fixing the extension of a word like “gold,” or they have assigned the word “gold” to name certain particular hunks of metal (whatever their properties might be). In either case, there are certain analytically necessary truths, statements that are true by convention: “gold is a yellow, ductile metal”, or “the stuff in storage at Ft. Knox is gold,” might be an example of such truths.Conventionalist semantics comes in quite a few varieties. A useful way of organizing those varieties for present purposes is by the resources available to answer the critique of K-P semantics. Let us accordingly group conventionalist semantics into three levels, the levels organized by the degree of reconstruction 21
Kripke, Saul, Naming and Necessity, Oxford, Blackwell, 1970; Putnam, Hilary, “The Meaning of «Meaning» Lenguage, mind and knowladge”, Minnesota Studies in the Philosophy of Science, vol. 7, 1975; pp. 131-193, reprinted in Putnam, Mind, Language, and Reality, Cambridge, Cambridge University Press, 1975. By “K-P semantics”, I mean to include both what Simchen would classify as Kripke’s and Putnam’s semantics and their metasemantic story as to why their semantics is correct. 22 Putnam, for example, quite explicitly directs his argument against criteriological as well as criterial semantic theories. See Putnam, “Is Semantics Possible?”, Mind, Language, and Reality, cit., footnote 21, p. 139.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
747
contemplated for the facts of raw, linguistic usage. At the first and most shallow level, there is what might be called the behavioral semantics of ordinary language philosophy. On this view of semantics, the conventions that give a word its meaning are those conventions accurately generalizing how most native speakers use the word. What it would be odd and not odd to say is used as the touchstone of the meaning of words. Consider the word, “voluntary.” Gilbert Ryle urged that it would be odd to call an action voluntary if it were not up for some kind of appraisal; from this usage fact Ryle concluded that “voluntary” could not mean, a willed bodily movement – for many of such movements are not up for appraisal.23 I call this a behavioral semantics because it does no reconstructive work on the raw data of linguistic usage. (It does not even divide conventions of usage between the semantic conventions related to truth, and the pragmatic conventions related only to appropriate utterance.) The second level of conventionalist semantics does some reconstruction of raw usage facts. It distinguishes semantic conventions from merely pragmatic conventions, regarding the semantic conventions as extension-determiners. (An extension in semantic theory is the class of things of which a predicate is true). At this level one parses usage into one of two kinds of extension-determiners. One is in terms of definitions, which are lists of properties anything within the extension of some predicate analytically must possess. The other is in terms of paradigmatic exemplars, particulars that analytically must be within the extension of the predicate for which they are paradigms.24 I shall describe each briefly in turn. The criterial theory that Simchen mentions is one kind of definitional theory of semantics. It holds that the meaning of a term like “bachelor” is given by a crisp definition: anything that is unmarried, male, and a person is a bachelor. Such a definition gives three properties, possession of each of which is individually necessary and possession of all of which is jointly sufficient for the correct usage of the word, “bachelor.” Another definitional theory is the criteriological theory, according to which 23 24
Ryle, Gilbert, The Concept of Mind, London, Hutcheson, 1949, p. 69. I explore these in greater depth in my “Semantics”, op. cit., footnote 17, pp. 281-292, and “Natural Law Theory”, op. cit., footnote 17, pp. 291 and 292, num. 25, pp. 295-291.
748
MICHAEL S. MOORE
there is a list of properties analytically connected to each meaningful word; only, the properties are not individually necessary, and no subset of the properties is jointly sufficient, for correct application of the word.25 Rather, there is simply an overlapping of properties, some determining the extension on some occasions while other properties determine the extension on other occasions. Still, even on this less crisp definitional theory, the entire list of properties is jointly necessary and jointly sufficiet for correct use of the word. The paradigm version of this second level of conventionalist semantics is known as the Paradigm Case Argument, or PCA semantics.26 Here it is not words but things that are linked by convention to the word whose meaning is in question. On this view, the meaning of a word like “gold” is given by the things (pieces of gold, presumably) early speakers noticed and baptized with the label, “gold.” “Gold” necessarily applies to those things; if one didn’t apply the word to those items, he would be said not to know the meaning of the word – because it is those items that give the word its meaning. The extension of “gold” includes more than these paradigmatic exemplars. It also includes those items that are similar to the paradigm cases of gold. Such similarity is not to be cashed out in terms of certain properties that the similar items share. For if this were possible, then one could frame a definition out of such properties.27 Rather, the analogies between paradigmatic and penumbral instances within the extension of “gold” are based on a primitive similarity relation, a relation not limited to a few properties in respect of which two things might be similar. The third level of conventionalist semantics is what I have called “deep conventionalism.28 Here one iterates the reconstructions of usage 25 A view often attributed to Wittgenstein in his Philosophical Investigations, 3rd. ed., Oxford, Blackwell, 1958, p. 67. See Wellman, Carl, “Wittgenstein’s Conception of the Criterion”, Philosophical Review, vol. 71, 1962, p. 433 and ff.; Lycan, Bill, “Non-Inductive Evidence: Recent Work on Wittgenstein’s «Criteria»”, American Philosophical Quarterly, vol. 8, 1971, pp. 109 and ff.; Rorty, Richard, “Criteria and Necessity”, Nous, vol. 7, 1973, pp. 313 and ff. 26 See the citations in my “Semantics”, op. cit., footnote 17, p. 286. 27 A point much stressed by legal theorists who adopted PCA semantics. See Hart, H. L. A., “Positivism and the Separation of Law and Morality”, Harvard Law Review, vol. 71 1958, pp. 593-629; Borgo, John, “Causal Paradigms in Tort Law”, Journal of Legal Studies, vol. 8, 1979, pp. 419-455, p. 437. 28 See Moore, “Natural Law Theory”, op. cit., footnote 17, pp. 298-300.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
749
done at level two, so that a term’s usage yields two layers of semantic conventions. There are conceptions (or interpretations) of the meaning of some words given either in terms of definitional properties or in terms of paradigmatic exemplars; and there are concepts giving the meaning of words, again conceived either in terms of properties or exemplars.29 The definitions or exemplars giving the meaning of concepts are more general, deeper, more agreed-upon, than are the definitions/exemplars making up the conceptions of such concepts. The idea is to accommodate considerable disagreement between the conventions that constitute distinct conceptions while preserving the idea that there is still a convention-based meaning for every word in terms of that word’s concept.30 B. The K-P Critique of Conventionalist Semantics There are two shoals on which all forms of conventionalist semantics founder. One has to do with when a word should be said to change its meaning. Both disagreements within a culture at a time, and disagreements between cultures over time, are hard to make sense of on conventionalist accounts of meaning. If you (or the ancient Greeks) mean by “whale,” “a big fish,” and I mean something mammalian, how can we disagree? After all, you and the Greeks have fixed the meaning of “whale” one way, and I have fixed it another, so we will just talk past each other even though both sides use the same word, “whale.” Or you (and Norman Malcolm31) mean by “dreaming” the only criterion we had for dreaming prior to 1950, viz, a waking remembrance of occurrences during sleep known not to be real. Certain scientists discover REM and EEG patterns usually accompanying dreaming, and hypothesize that we do not remember all that we dream. If you fixed the meaning of “dreaming” by the criterion of waking remembrance, then the idea of an unremembered (and certainly an unrememberable) dream is literally senseless.32 29 See generally Gallie, W. B., “Essentially Contested Concepts”, Proceedings of the Aristotelean Society, vol. 56, 1956, pp. 167-198; Dworkin, Ronald, A Matter of Principle Cambridge, Harvard University Press, 1985, pp. 128-131. 30 The use to which Dworkin puts such deep conventionalism in Law’s Empire, Cambridge, Harvard University Press, 1986. 31 Norman Malcolm, Dreaming, London, Routledge, 1959. 32 Hilary Putnam, “Dreaming and Depth Grammar”, in Butler, R. J. (ed.), Analytic Philosophy, Oxford, Oxford University Press, 1962, First Series; reprinted in Mind, Language and Reality, cit., footnote 21.
750
MICHAEL S. MOORE
As Kripke and Putnam originally pointed out, this inability to capture our sense that these disagreements are meaningful (because the words in terms of which such disagreements are carried on do not change their meaning when used by the opponents in such disagreements), and that one side of such disagreements is or at least can be right (so that science is capable of progress), is a damning indictment of conventionalist semantics. Equally damning is another implication of conventionalist semantics, this one having to do with the idea, not of changing meaning, but of running out of meaning. Suppose one comes across a piece of metal that is white and ductile; on the criteriological and PCA versions of meaning, there is no answer as to whether or not this piece is or is not gold, for it shares only some of the properties definitive of gold (on the criteriological view) and it is only somewhat analogous to paradigmatic instances of gold (on the PCA view). The word is vague, meaning we have run out of conventions sufficient to place the item definitely in or definitely out of the extension of “gold”. Yet most of us sense that there is an answer as to whether the thing is or is not gold. “Gold”, that is, seems to have a meaning sufficient to determine whether or not these items are within its extension; since we have run out of conventions, meaning must be constituted by something other than these conventions. These two theoretical considerations militate strongly against any form of conventionalist semantics, at least for any discourse where: (1) meaningful, theoretical disagreement about the extension of some predicate exists in the face of there being differing definitions, paradigms, or other supposedly extension-fixing conventions; and (2) meaningful questions about the extensions of some predicate exist in the face of there being no relevant or non-vague definitions, paradigms, or other supposedly extension-fixing conventions. Such considerations point to an alternative semantics, K-P semantics. Simchen helpfully divides this into semantic and metasemantic theses. The semantic thesis is that the meaning of a word is given by (or at least heavily influenced by) its extension. The metasemantic thesis explains how this could be so: speakers discover certain exemplars they provisionally think might be instances of a kind; they baptize the kind with a word (e. g., “gold”); there is a causal chain of usage with each succeeding speaker intending to refer to the kind first baptized with the label, “gold”; expertise develops about what that nature is and what are its exemplars; paradoxically, it may turn out that the
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
751
initial items people took to be exemplars of the kind are in fact not such exemplars, but merely lucky heuristics to the discovery of the kind. The main payoff of such a semantics is its ability to handle the two theoretical concerns that sink all forms of conventionalist semantics. People can meaningfully disagree because the terms they employ have the same meaning, i. e., the same thing to which their words refer. People do not run out of meaning as fast as they run out of conventions because meaning is a function of the world and its nature, which may only be partially known and thus only partially reflected in conventions. C. Three Versions of K-P Semantics in Legal Theory It is an interesting question as to what is required to make the K-P metasemantics story plausible for some realm of discourse. Let me distinguish three possibilities here, roughly corresponding to three generations of K-P semanticists within legal and moral theory. a. The standard model. Those of us who were Hilary Putnam’s students in the early 1970’s when he was writing “The Meaning of «Meaning»” took away the following interpretation, what I shall call the “standard model” of K-P Semantics.33 On this model K-P Semantics is appropriate when but only when two sorts of facts are true. First, there is (what Simchen aptly calls) an environmental fact: the world must contain the item to which apparent reference is being made in the use of the word in question. In the case of singular terms, these items will be particulars; in the case of general predicates, these items will be universals, namely, kinds.34 For such kinds to be apprehended there must in addition be particulars whose similarities inter se suggest that there is a kind of which they are instances. Such kinds, on the standard model, must not be mere aggregation of individuals; rather the kind must have a nature sufficiently robust and unitary that it can be referred to without mention of its instances. Secondly, there must be what I have elsewhere called “facts of
33 See Moore, “Semantics”, op. cit., footnote 17; “A Natural Law Theory”, op. cit., footnote 17. See also Platts, Mark, Ways of Meaning, London, Routledge, 1980. 34 Thus Putnam carefully separates the question of whether speakers intend to refer to a kind, from the question whether there is in fact a kind, using the example of jade. See his “Meaning”, op. cit., footnote 21.
752
MICHAEL S. MOORE
usage”,35 and what Simchen terms, “social facts”.36 On the standard model there are three such usage, or social, facts: a) Speakers must use the predicate in question with indexical intentions, that is, an intention to name whatever local stuff happens to be around them. In Putnam’s famous example, we on Earth use “water” to refer to the local stuff around here (H2O, as it turns out), but the speakers of English on Twin-Earth use “water” to refer to their clear, colorless, life-giving, etcetera, local stuff (XYY, as it turns out).37 “Water” is thus indexical in the same was as “I” (Bar-Hillel’s original example of indexicals38), depending for its reference on whatever is in the environment of the original speakers. b) Speakers must use the predicate in question with referential (versus attributive) intentions.39 The distinction is most easily grasped with singular terms, so to use one of Leo Katz’s examples:40 your wife directs you to meet “the man in the Brooks Brother suit, the Yves St. Laurent tie, and the Gucci shoes”. If her intention is to refer to some one particular person, no matter what he is in fact wearing, then her intention is referential; if her intention is to refer to whoever is wearing these three items, then her intention is attributive. For predicates like “gold” analogously, if we speak intending to name a kind whatever its properties turn out to be, our intentions are referential; if we speak intending to name whatever class of individuals turns out to possess the gold-making properties we take to be definitive of gold, then our intentions are attributive. c) Speakers must be willing to defer to any well-evidenced expertise others may possess about the true nature of the kind to which all refer. Putnam calls this the “division of linguistic labor”,41 while Simchen relabels it “linguistic deference”.42 It is this deference that makes it plau35 Moore, “Hart’s Concluding Scientific Postscript”, Legal Theory, vol. 4, 1998, pp. 301-327, reprinted in Moore, Educating Oneself, cit., footnote 10, pp. 100-102. 36 Simchen, “Metasemantics”, op. cit., footnote 1, passim. 37 Putnam, “Meaning”, op. cit., footnote 21. 38 Bar-Hillel, “Indexicals,” Mind, 39 Keith Donellan’s distinction. See his “Reference and Definite Descriptions”, Journal of Philosophy, vol. 75, 1966, pp. 281-294. 40 Katz, Bad Acts, p. 85. 41 Putnam, “Meaning”, op. cit., footnote 21. 42 Simchen, “Metasemantics”, op. cit., footnote 1, p. 728. Simchen pays greater attention to linguistic deference in Coleman and Simchen, “Law”, Legal Theory, vol. 9, 2003, pp. 1-41.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
753
sible how any individual speaker can “mean more than he knows” because he can rely on and incorporate the knowledge of others in his referential intentions. One might well call the standard model of K-P semantics the realist model for that semantics’ applicability. For the environmental fact required is a realism about kinds, and the social facts required are facts true only of speakers who are themselves some kind of realist in their metaphysics. My own early application of K-P semantics to legal and moral theory,43 together with like applications by David Brink44 and Mark Platts,45 illustrate this realist understanding of K-P semantics. b. The pedestal model. A less robustly metaphysical view of K-P semantics has been developed by Nicos Stavropoulos46 (and perhaps Ronald Dworkin, if one accepts Stavropoulos’ likening of Dworkin’s interpretivism to K-P semantics).47 On this model, the environmental fact needed to ground K-P semantics is quite modest: only that there be certain particulars that can be classed together, and a concept so grouping these particulars together and which is accepted by the speakers who use the word.48 The usage facts are also comparatively modest: speakers need to have indexical intentions, making their words’ reference hostage to the accidents of environment; and speakers must be willing to defer to expertise when it is possessed by those with theories about the concepts that group the particulars in question. (This latter feature is what leads Simchen to accuse Dworkin and Stavropoulos of placing theorists on a pedestal, thus my name for this model).49 On the “pedestal” view, there 43
Moore, “Semantics”, op. cit., footnote 17; “Moral Reality”, footnote 2; “A Natural Law Theory”, op. cit., footnote 17 ; “Unwritten Constitution”; “Moral Reality Revisited”. 44 Brink, “Legal Theory”; Brink, Moral Realism and the Foundations of Ethics, Cambridge, Cambridge University Press, 1989. David is more guarded in the metaphysical commitments of K-P semantics in his “Semantics and Legal Interpretation (Further Thoughts)”, Canadian Journal of Law and Jurisprudence, vol. 2, 1989, pp. 181-191. 45 Platts, Ways of Meaning, cit., footnote 33. 46 Stavropoulos, Objectivity in Law, cit., footnote 19. 47 Id. at pp. 129-136, 160; compare Moore, “Postscript”, p. 102, n. 7 (in Educating Oneself, cit., footnote 10). 48 On Stavropoulos’ version of K-P semantics, “key concept-words are intended to pick out the concepts they stand for, whatever their content may be,” and “the content of the relevant concepts is determined by substantive theory, which is constrained by paradigmatic applications and abstract characterizations of the relevant practice of application.” Objectivity in Law, cit., footnote 19, p. 160. 49 Coleman and Simchen, “Law”, op. cit., footnote 42, pp. 10 and 11.
754
MICHAEL S. MOORE
is no need for speakers to have referential intentions with respect to a kind; it is enough that they are willing to defer to experts about a concept of the kind. c. Simchen’s Version of K-P Semantics. Like Stavropoulos, Simchen dispenses with any metaphysics of kinds as a presupposition of K-P semantics. The only environmental fact needed is that there be some particulars susceptible to grouping into a class by speakers. (There apparently need not even be a shared concept of how such grouping should be defined.) Simchen also dispenses with referential intentions with respect to kinds, again like Stavropoulos. But unlike Stavropoulos, Simchen rids K-P semantics of any need for linguistic deference; speakers need not be willing to defer to anyone, even in principle, because they rightly think themselves to be in possession of the correct classificatory scheme grouping certain particulars together. Such classificatory scheme is “correct” only in the sense that correctness is here a matter of convention: if some scheme is in accord with the classificatory abilities possessed by most native speakers, then it is “correct”.50 D. Queries About Simchen’s Version of K-P Semantics Simchen and I are in agreement in rejecting Stavropoulos’ version of K-P semantics, although our reasons for doing so are somewhat different. We both think that Stavropoulos has failed to justify any deference to theorists by ordinary users of English predicates. I think that, however, because I link the justifiability of such linguistic deference to there being something, a kind, with a deep nature amenable to theoretical 50 Ibidem, p. 20: “Schematically, to be a chair is to be taken by the average speaker as having the same intended function, general appearance, and so on, as paradigmatic chairs. Determining whether or not some item bears the sameness relation to a paradigmatic chair is something which an average speaker can be expected to do… the ‘essence’ of chairs depends on ordinary speakers’ everyday classificatory capacities”. See also ibidem, p. 22 (“the equivalence relation itself was determined by speakers’ ordinary stuff-involving classificatory capacities”); p. 28 (“Whether or not sameness obtains between a given item and a paradigmatic instance of law is determined by the average speaker’s ordinary classificatory capacities”); p. 28 fn. 39 (“whether or not the relevant similarity relation obtains… is determined by the average speaker’s ordinary classificatory capacities”); p. 30 (“Something belongs to the extension of ‘law’ just in case it would be deemed by the average speaker as relevantly similar to paradigm cases”); p. 33 (“the extension... is fixed by the average speaker’s classificatory tendencies”); p. 39.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
755
treatment; Stavropoulos’ requirement that there be a concept justifies only a theory of the nature of that concept, a kind of deep conventionalist semantics at best. Whereas Simchen rejects Stavropoulos’ theorizing on the ground that no such theorizing or deference is required (nor is there any in fact for many words) for K-P semantics to be applicable; all that is needed are the ordinary classificatory abilities of native speakers, which abilities require and in fact generate no deference to experts. Turning to Simchen’s version of K-P semantics, my first query is whether his version can garner for itself the two theoretical advantages that K-P semantics possesses vis-à-vis all forms of conventionalist semantics. Consider first the constancy of meaning that makes possible radical disagreement. Without the environmental fact that reference to a genuine kind has succeeded, and without the usage fact that speakers typically intend to refer to such kinds in their usage of the relevant words, I don’t see how meaning remains constant across very divergent beliefs. All Simchen’s version of K-P semantics has to work with is the environmental fact that there are certain particulars picked out by a term, grouped into the extension of that word by the normal classificatory abilities of native speakers, and the usage fact that speaker’s intentions are indexical, i. e., the word is intended to pick out whatever particulars are in the vicinity of native speakers. These two facts are perhaps sufficient to reject criterial semantics, for the actual and intended indexicality of a term makes the ordinary criteria for use inadequate to determine reference; “water” as used on Earth has the same criteria of use as on Twin-Earth, and yet the reference is different in the two different environments. Yet these two facts are not sufficient to show how there can be the converse situation, namely, where the reference is the same but the criteria are different, as in the “whale” and “dreaming” examples earlier. And it is this latter kind of example that is needed to show constancy of meaning despite very different criteria for use. Even if we and the Greeks both happened to stumble across genuine instances of gold, our differing beliefs about the stuff could generate sufficiently different classificatory schemes by the two groups of speakers that there was little overlap–in which case the extension of “chrysos” and of “gold” would differ and we and the Greeks would be talking past each other when we disagreed about the nature of gold. Now consider the second theoretical advantage of K-P semantics, that of successful reference despite vague, non-existent, or conflicting con-
756
MICHAEL S. MOORE
ventions guiding usage. Only the intent to refer to a kind whose nature outstrips current convention, together with the existence in fact of such a kind, generate the needed implication about successful reference despite indeterminate conventions. The classificatory abilities shared by native speakers is just a convention, and like other conventions it is no more comprehensive than the behavior from which it is constructed. Where ordinary speakers’ classificatory tendencies are confused, fragmented, or conflicted, there will be no answer to the question of whether some item is within the extension of some predicate. K-P semantics in Simchen’s version fares no better here than any other form of conventionalist semantics. Which introduces my second query: isn’t Simchen’s version of K-P semantics just a reversion to some form of conventionalist semantics? Not the definitional form of such semantics, for the reason mentioned earlier (indexicality prevents sameness of definition from guaranteeing sameness of extension). Yet how does Simchen’s semantics differ from either PCA semantics or the shallow, behavioral semantics of ordinary language philosophy? Consider each in turn. Whether Simchen’s semantics collapse back into the old PCA semantics depends on how Simchen regards the paradigms which speakers baptize with the name of a class. Many years ago I distinguished strong from weak paradigms.51 A strong paradigm is a particular that is (analytically) necessarily within the extension of the predicate for which it is a paradigm. Such paradigms are tied by convention to words, so that anything that is a paradigmatic exemplar of blue, or is relevantly similar to such exemplars, is necessarily blue. Weak paradigms, by contrast, are no more than heuristics: they indicate to speakers that they are instances of a kind. But howevermuch such paradigms were the original evidence for the existence of a kind, howevermuch they are the standard learning tools by which a culture teaches the use of the kind-word, weak paradigms may turn out not to be instances of the kind at all. The original exemplar of flat may have been the ocean, the way “flat” is taught may be by pointing at the ocean, yet the ocean is not in fact within the extension of “flat”. It just looks flat. I am unclear how Simchen’s semantics permits any but strong paradigms. After all, if there need be no kind referred to by some predicate, 51
Moore, “Semantics”, op. cit., footnote 17, pp. 287 and 288.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
757
only some particulars sharing whatever properties as happen to be picked out by the ordinary classificatory abilities of native speakers, then what would make any paradigm only provisionally within the extension of some predicate? To what deeper insight is its status hostage, in the absence of any but the most conventional nature? If Simchen’s semantics does rely on there being strong paradigms, similarity to which determines the extension of each predicate, then Simchen’s semantics are indistinguishable from the conventionalist PCA semantics of fifty years ago, a semantics to which K-P semantics was supposed to be the antidote. Perhaps, however, Simchen wishes to regard paradigms as weak, which is to say, provisional and defeasible. Perhaps the linguistic dispositions of native speakers is held to trump the paradigmatic status of any given particular (although it is hard to see how such classificatory dispositions could dispense with all such paradigms, as it should in principle be able to do if the paradigms are truly weak paradigms). Yet then, what distinguishes Simchen’s semantics from the behavioral approach of ordinary language philosophy? Common to both is ultimate reliance on what people are disposed to say, such common, classificatory sayings determining what they are talking about. My third query has to do with why Simchen is attracted to a version of K-P semantics that is stripped of the metaphysics of kinds, stripped of intentions to refer to such kinds in the typical uses of words, and stripped of any deference by ordinary speakers to the expertise others may possess about the nature of such kinds. One temptation for this stripped-down version of K-P semantics could be ontological: one could doubt the realist (i. e., anti-nominalist) metaphysics of kinds, either across the board or at least for many of the predicates making up a language. Simchen’s motives, however, do not seem to stem from ontological parsimony. Rather, his doubts are rooted in the usage facts depended upon by the standard version of K-P semantics. He doubts whether ordinary speakers have the metaphysical views he thinks they would have to have in order to intend to refer to kinds with a nature others may know better than do they. It is worth quoting Simchen here, since he seeks to load the dice a bit. Simchen thinks that any attribution “to ordinary speakers of the metaphysical realist intention to employ ‘water’ to refer to anything relevantly similar to paradigmatic instances of water from the standpoint of
758
MICHAEL S. MOORE
the world as it is in itself, beyond whatever we might come to believe about the matter”,52 is highly implausible. Or again: “such a view attributes to speakers, when using a kind term N, the intention to refer to everything having the same underlying nature as some paradigmatic sample of N quite apart from what any expert doctrine about the nature of N does or would reveal.”53 There are several things to untangle in these rather exaggerated characterizations of the referential intentions needed by the standard version of K-P semantics. To begin with, in this context the distinction between Peircean (or Putnam’s “internal”) realism and metaphysical (or “external”) realism, is a red herring. I doubt (as does Simchen) that ordinary speakers’ referential intentions are sufficiently fine-grained so as to pick out one or the other of these metaphysical views. Fortunately, however, this does not matter to the issues at hand, which are (1) whether such speakers presuppose that there is a kind to which they intend to refer and about the nature of which they intend to defer when confronted with a better theory (the usage fact); and (2) whether there is in fact such a kind (the environmental fact). As I have argued elsewhere,54 the internal realist can match the metaphysical realist stride for stride in these commitments, so a presupposition of either form of realism (or the undifferentiated combination of both) is sufficient to support the referential intentions and metaphysical presuppositions I argue are needed to use K-P semantics. The second clarification has to do with the place of paradigmatic examples and similarity functions in ordinary speakers’ referential intentions. We should distinguish the referential intentions of the original baptizers of a kind, from those far down the causal chain of reference. Only the baptizers need have before them puzzlingly similar particulars from which they self-consciously hypothesize a kind; later users need not think about (or even believe in the existence of) any paradigmatic exemplars.55 Their intentions can be simpler: to refer to a kind with their general predicates in the same way they refer to a particular with their singular
52 53 54 55
Simchen, “Metasemantics”, op. cit., footnote 1, p. 730. Coleman and Simchen, “Law”, op. cit., footnote 42, p. 36, n. 43. Moore, “Legal Reality”, p. 694. Other than for the word, “meter,” can one identify plausible paradigms? Surely any original bits of metal, for example, have been lost to us even if they were our initial samples of gold.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
759
terms. Such later users need have in mind no complex function of similarity relations over certain particulars. Notice that both of these points simplify considerably the content of the referential intentions the standard version of K-P semantics would attribute to contemporary language users. The first rids that content of any total independence “from what any expert doctrine about the nature of N does or would revea”. The second rids that content of any isolation of paradigmatic samples and universal quantification over particulars sharing the nature of such samples. The content of the relevant referential intention is easier: it is to refer to a kind that exists independently of whether the speaker or her community thinks it exists (a realism about universals); and such intention is accompanied by the belief that the nature of the kind may only be partially revealed (to either the individual speaker or to her linguistic community). That these simpler psychological states are required on the standard version of K-P semantics makes the latter version more plausible because these states are more easily ascribed to ordinary speakers. Having clarified the content of the requisite referential intentions, it remains to clarify the nature of the claim made when it is claimed that a speaker has the requisite referential intention and accompanying belief. As Simchen recognizes, this is of a piece with one’s general views on what is required to ascribe intentional attitudes to another. One thing that is not required (on this I assume Simchen agrees) is that there be some Joycean phenomenology explicitly containing the content of the intention and the belief. We do not require such conscious recitations to ascribe intentions and beliefs generally, so there is no warrant for requiring such here. What is required to ascribe intentions and belief is that there be certain dispositions, which is to say that certain counterfactuals are true of the individual who mental states they are. In the case of referential intentions, the most pertinent dispositions are verbal dispositions, specifically: what would the speaker think and say on learning certain surprising facts about some subject of his discourse? To enlist an old intuition pump of mine,56 suppose the speaker has pro nounced as dead a per son who has lost consciousness and whose heart and lungs have ceased spontaneous functioning because he has been immersed under very cold 56
Moore, “A Natural Law Theory”, pp. 293 and 294, 297-300, 322-328.
760
MICHAEL S. MOORE
water for thirty minutes. What would such a speaker think if presented with the conclusion that the drowning victim “is not really dead” and if presented with the medical evidence supporting that conclusion (intact brain function, revivability, etcetera)? If the speaker’s intentions had been attributive in using the word “dead” – so that anything that possesses the properties definitive of “death” for the speaker is necessarily dead – then he should refuse the conclusion as senseless. Such a victim may not be smead (a new state defined by brain function), but that victim is necessarily dead? Whereas if the speaker’s intentions were referential, then he would readily accede to the meaningfulness of the conclusion and to the relevance of the evidence for sustaining it; he would thus regard his own conclusions about death as fal lible and recog nize that experts’ views about death might well be better than his, even though theirs too are fallible. These are the beliefs of a realist about the kind, death, even though such a speaker is wholly ignorant of the realism/anti-realism debate in philosophy. My own empirical intuition is that such referential intentions are quite widespread, both as to people holding them and as to words with respect to which they are held. Reverting to the death example, surely few native speakers of English will cut the organs out of a drowning victim who meets the prevailing definition of “death” but who is not really dead. B. The Reach of K-P Semantics: the Search for the Correct Semantics for Terms Used In Law and in Legal Theory. Simchen and I apparently agree that law is an artifactual notion (what I call a functional kind),57 that K-P semantics applies to the terms referring to artifacts, and because of these facts, that K-P semantics applies to the terms used both in propositions of law and propositions about law. Yet because of our disagreement about what is required for K-P semantics to be appropriate, this apparent agreement masks some serious disagreements about the semantics of legal terms. My view about legal terms is the view of the standard version of K-P semantics:
57 Compare Coleman and Simchen, “Law”, op. cit., foot note 42, with Moo re, “A Natural Law Theory”, op. cit., footnote 17, p. 301, num. 44, and Moore, “Law as a Functional Kind”, in George, R. (ed.), Natural Law Theories, Oxford, Clarendon Press, 1992, reprinted in Moore, Educating Oneself, cit., footnote 10.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
761
(a) Environmental facts: kinds such as contracts and law exist in the world irrespective of us thinking that they exist and words like “contract” used in propositions of law, and words like “law” used in legal theory, take their meaning from the nature of these kinds and not from conventional guides to usage; (b) Usage facts: ordinary users of “contract” and “law”: (i) have indexical intentions to refer to the contract-stuff and law-stuff exemplified around here; (ii)have referential intentions to name these kinds whatever their properties turn out to be; and (iii) have the conditional intention to defer to any well developed expertise of lawyers or legal theorists about the nature of these kinds should any such expertise appear. Simchen, by contrast, is agnostic about (a) and denies (b)(ii) and (b)(iii). Although disputes about empirical facts between philosophers firmly planted in their armchairs are doubtlessly to be viewed with some skepticism, my own sense is that ordinary language users are actually deferential to legal professionals about terms like “contract” appearing in propositions of law.58 H. L. A. Hart noticed a facet of this many years ago when he pronounced such legal terms to be “defeasible”.59 My sense also is that ordinary language users and lawyers are potentially deferential to legal theorists about terms of legal theory like “legal right”, “legal duty”, “second-order reasons”, “sovereignty,” “rule of recognition”, “legal system”, and ultimately, “law” itself. Remembering that the relevant question is the counterfactual one – what would such speakers think if they were fully informed about a better theory of law, etcetera? – the question is not actual deference to legal theorists by lawyers and laypersons. Nor is the question whether there is currently any such expertise in jurisprudence, nor even whether there will ever be. It is after all quite possible that the lawyers’ and the laypersons’ current understanding of law (as58 Simchen appears not to disagree about deference to experts on terms of law (Coleman and Simchen, “Law”, op. cit., footnote 42, p. 26), only about deference to experts for terms of legal theory such as “law”. 59 Hart, H. L. A., “Ascription of Responsibility and Rights”, Proceedings of the Aristotelian Society, vol. 49, 1949, pp. 171-194. I reallocate Hart’s defeasibility conclusion towards a K-P semantics basis in “A Natural Law Theory”, op. cit., footnote 17, pp. 337 and 338; and in “Legal Reality”, pp. 666-669.
762
MICHAEL S. MOORE
suming arguendo there is one) just happens to be correct. Then there can be no better theory to which one will or should ever defer. Yet the question is how such language users regard their knowledge of the nature of law. If they regard themselves (collectively) as infallible – because the meaning of “law” is given by conventional criteria and they have grasped those criteria—then they lack the referential intention and deferential attitude I think necessary for K-P semantics. But if they regard their beliefs about law as in principle correctible, then they do not think the meaning of “law” is given by conventional criteria but by the nature of the kind to which reference is made. So clarified, I thus think that even for the terms of legal theory like “law”, the usage facts needed on the standard model of K-P semantics are present. IV. CONNECTING SIMCHEN’S SEMANTICS TO SIMCHEN’S TRANSCENDENTAL ARGUMENT FOR OBJECTIVITY I find Professor Simchen’s version of K-P semantics worth discussing for its own sake. Almost none of the details of those views, however, have much bearing on the larger issue of objectivity. More specifically, one could adopt any of the three versions of K-P semantics above outlined and base Simchen’s objectivity argument on it. For this larger purpose, our differences are thus bootless. Much the same I fear is also true about the difference between all versions of K-P semantics, on the one hand, and almost all versions of conventionalist semantics, on the other.60 For the only mileage Simchen takes out of K-P semantics is the supposition of the latter that the similarities between particulars making up a kind must be objectively existing similarities, mere subjective (or “seeming”) similarities not being acceptable. Yet surely this reality/appearance distinction is available on virtually any of the semantic possibilities we have canvassed. If there are conventional criteria, for example, that give the meaning of “gold”, then presupposed is that it is only when those criteria are actually (objectively) satisfied is the word used correctly and that a mere seeming satisfaction is insufficient. 60 Only the supposed semantics of a private language (against which Wittgenstsein protested) seems ruled out as a possible basis for Simchen’s transcendental argument.
CAN OBJECTIVITY BE GROUNDED IN SEMANTICS?
763
Perhaps Professor Simchen would not wish to deny this, allowing that any semantics even plausibly endowing our terms with content must presuppose objectivity. This includes, but is not limited to, the K-P semantics Simchen favors. If this is Simchen’s belief, then it is only the organization of the paper that seems to make a stronger claim. The organization —moving from objectivity to K-P semantics and back again— might suggest that the justification for the excursion into K-P semantics is that only that form of semantics presupposes objectivity. Whereas in reality perhaps the justification for the excursion is the intrinsic interest of K-P semantics itself.
!
A HYBRID THEORY OF CLAIM-RIGHTS Gopal SREENIVASAN* The language of rights is pervasive. As commonly used, however, it is also indiscriminate and loose, as Wesley Hohfeld complained long ago.1 In a celebrated effort to forestall confusion, Hohfeld distinguished various senses of a right, which he regimented in terms of four jural equivalences or correlatives. Of these, he himself regarded the equivalence in which rights are correlative with duties as regimenting rights in the strictest sense: if X has a right against Y that he shall stay off the former’s land, the correlative (and equivalent) is that Y is under a duty toward X to stay off the place. If, as seems desirable, we should seek a synonym for the term right in this limited and proper meaning, perhaps the word claim would prove best.
Now few dispute that Hohfeld’s claim at least marks a central and important sense of a right.2 Indeed, it is perfectly standard to define claim-rights, as they are more often called, on the model of Hopfield’s equivalence: X has a claim-right against Y that Y j if and only if Y is under a duty toward X to j.3 * Canada Research Chair, University of Toronto, Canada. 1 Hohfeld, W. N., Fundamental Legal Conceptions, Cook, W. W. (ed.), New Haven, Yale University Press, 1919, pp. 36 and 38. 2 Some dispute that rights have a strictest sense. See, e. g., Sumner, L. W., The Moral Foundation of Rights, Oxford, Clarendon Press, 1987, ch. 2. 3 See, e. g., Feinberg, J., Social Philosophy, Englewood Cliffs, Prentice-Hall, 1973, ch. 4; Waldron, J., “Introduction”, Theories of Rights, Oxford, Oxford University Press, 1984, p. 8 [hereafter, TR]; Sumner, op. cit., footnote 2, pp. 25-27; Thomson, J., The Realm of Rights, Cambridge, Harvard University Press, 1990, pp. 41-43; Kramer, M.; Simmonds, N. and Steiner, H., A Debate Over Rights, Oxford, Clarendon Press, 1998. 765
766
GOPAL SREENIVASAN
So defined, one person’s possession of a claim-right is equivalent to someone else’s possession of a duty—a duty, moreover, with the same content.4 But neither this fact nor anything else Hohfeld says, for that matter, tells us how we are to identify the relevant pair of persons. If I have a claim-right to some land, then someone else has a duty to stay off the land. But who has this duty exactly? Similarly, if I have a duty to pay my taxes, it may be asked who, if anyone, holds the correlative claim-right. In certain cases, we may think this is easy to say. As far as my claim-right to land goes, for example, we may think the bearer of the correlative duty is everyone. But other cases will not be so easy. How, in general, are we to iden tify the bearer of the duty that cor re lates with a given claim-right? Or the holder of the claim-right that correlates with a given duty? If a correlation between the right-holder and the duty-bearer belongs to the nature of claim-rights, as the standard definition suggests, an adequate understanding of claim-rights requires an understanding of the basis of this correlation. Rival accounts of the correlation are offered by two well-established theories of rights, the Will theory and the In terest theory. 5 Yet nei ther theory, it seems to me, is ultimately satisfactory. To begin with, I shall present each theory, together with the main problems it faces. In my view, the best objection that each theory wields against the other is unanswerable. More constructively, I shall then suggest a hybrid of the two theories. I shall argue that it solves the main problems confronting the Will and Interest theories. We should therefore prefer the hybrid theory.
4
In Hopfield’s example, the claim-right and the duty share the content that Y stay off X’s land. To preserve idiom, we could also say, alternatively, that they share a content that is satisfied by Y’s staying off X’s land. 5 In presenting the debate between these theories in terms of their account of the correlation between claim-right holder and duty-bearer, I follow Waldron, op. cit., footnote 3, pp. 8 and 9, and Sumner, op. cit., footnote 2, pp. 24 and 39-45. While there are other ways to frame the debate, I do not think the choice of frame affects the argument at any point. My choice is based on independent grounds, which I discuss in a companion paper, “Duties and their direction”.
A HYBRID THEORY OF CLAIM-RIGTHS
767
I 1. Let me begin with the Will theory.6 The following rough statement will serve our purposes: (WT) Suppose X has a duty to j. Y has a claim-right against X that X j just in case Y has some measure of control over X’s duty”. To explain what is meant by a measure of control over a duty, we should turn to H. L. A. Hart, one of the foremost proponents of the Will theory. According to Hart, the full measure of control over X’s duty comprises three powers: (i) the power to waive X’s duty or not; (ii) the power to enforce X’s duty or not, given that X has breached it; (iii) the power to waive X’s duty to compensate, which is consequent upon his original breach.7
Note that the power to enforce X’s duty in (ii) includes both the power to sue X for compensation and the power to sue for an injunction against X. I think it is fair to say that our clearest paradigms of a claim-right are the claim-rights recognized in property and contract law. The Will theory bases itself closely on these paradigms. Indeed, it holds, in effect, that they present the necessary and sufficient conditions for claim-right holding. It therefore stands to reason that, in property and contracts, the duties that correlate with claim-rights are duties over which the claim-holder typically has the full measure of control encompassed by the powers (i)-(iii). It is the signal advantage of (WT) that Y’s having the full measure of control over X’s duty to j gives a readily comprehensible sense to the statement that X’s duty is owed to Y, and so to the statement that it is Y who holds the correlative claim-right against X. Lesser measures of control can be accommodated as approximations to the case of full control. 6 Throughout the discussion, I shall ignore the distinction between moral rights and legal rights. That is, I shall not pay special attention to it. While this will sometimes involve me in (minor) infelicities, it conveniently enables me to concentrate on the core features of a claim-right, which hold in common between law and morals. 7 Hart, H. L. A., “Legal Rights” in his Essays on Bentham, Oxford, Clarendon Press, 1982, pp. 183 and 184.
768
GOPAL SREENIVASAN
Thus, as Hart says, duties with correlative rights are a species of normative property belonging to the right holder, and this figure becomes intelligible by reference to the special form of control over a correlative duty which a person with such a right is given by the law.8 But (WT) confronts two serious objections. One concerns inalienable rights.9 Sometimes a claim-right holder is disabled from waiving the duties that correlate with his claim-right. Typically this is done for the right-holder’s own good and protection. Moreover, as Neil MacCormick observes, the protective disability is typically also seen as strengthening the claim-right. A dramatic example is the claim-right not to be enslaved. Less dramatic examples include the claim-right not to be operated upon without informed consent;10 and the claim-right not to be employed in unsafe working conditions. (In some ways, the less dramatic examples are actually more important, since they exhibit the fact that inalienable claim-rights need not be correlated with extremely weighty duties. Hence, the strength added by a protective disability is distinct from the weight, in that sense, of the original claim-right).11 In any case, we likely do not wish to deny either that Y has a claim-right against X that X not enslave Y or that Y has a claim-right against X that X not employ Y in unsafe working conditions. It is worth emphasizing that the crucial question here concerns the possibility, rather than the fact, of inalienable claim-rights (WT) makes inalienable claim-rights incoherent in principle. A second criticism concerns incompetent adults.12 Say Y is incompetent to exercise any of —and therefore lacks, in the relevant sense— the 8 9
Hart, cit., supra, p. 185. See MacCormick, D. N., “Rights in Legislation”, in Hacker, D. N. and Raz, J. (eds.), Law, Morality, and Society, Oxford, Clarendon Press, 1977, pp. 195-199. 10 The inalienable claim-right here, to be precise, is the claim-right to receive a standard disclosure prior to consenting (to an operation or other medical treatment). In U. S. law, this claim-right may not be inalienable, since it seems that a physician’s duty to disclose can actually be waived. See Berg, J. W.; Appelbaum, P. S.; Lidz, C. W and Parker, L. S., Informed Consent: Legal Theory and Clinical Practice, 2nd. ed., New York, Oxford University Press, 2001, ch. 4. But given the standard analysis of the requirements of informed consent —on which they include understanding the standard disclosure— a patient’s having the power to waive the physician’s duty to disclose is incoherent. On the standard analysis, therefore, the claim-right is inalienable. 11 The second of the less dramatic examples also makes it clear that what the protective disability protects need not be the autonomy, specifically, of the claim-right holder. 12 A better known variant of this objection concerns children. But I think this variant is liable, with reason, to greater controversy.
A HYBRID THEORY OF CLAIM-RIGTHS
769
powers (i)-(iii) because, for example, Y is in a coma. Do we wish to say that Y no longer has a claim-right against X that X not assault Y or steal from Y? Or that X no longer owes Y duties not to assault or steal from Y? Presumably not. But (WT) implies that someone with no measure of control over a duty lacks the correlative claim-right. In the paradigm cases of a claim-right, the interests of the right-holder are advanced, on balance, by the fact that he or she is empowered to waive the correlative duty. One way to regard these objections is this: they present cases in which the interests of the person in question are not advanced, on balance, by being so empowered. Indeed, they present cases in which the person’s interests are advanced, on balance, either by not having the power to waive the rel e vant duty (first objection) or by someone else’s having that power (second objection). Yet it seems intuitive to regard the person disabled from waiving the relevant duties as still holding the correlative claim-right. The fundamental difficulty with (WT), then, is that it prevents us from generalizing the notion of a claim-right from the paradigm cases to cases of inalienability and incompetence, cases to which we clearly should be able to generalize it. It seems to me that this difficulty cannot be overcome. 2. By way of illustration, let us consider Nigel Simmonds recent response to the inalienability objection.13 Simmonds discusses partial and complete inalienability separately. In the partial case, the agent lacks (i) the power to waive a duty, but retains (ii) the power to sue for enforcement and (iii) the power to waive compensation. In the complete case, the agent has no control over the duty whatever. Here Simmonds’ discussion concerns criminal law prohibitions against murder and assault. Simmonds argues that the Will theory does, in fact, vest agents in the partial case with a correlative claim-right, since they retain a residual measure of control over the duty, of precisely the kind Hart describes. Furthermore, he denies that this reduction from the full measure of control is inconsistent with strengthening the claim-right, on the ground that it is over-simple to identify the strength of someone’s claim-right with the measure of her control over the correlative duty. To handle the case of complete inalienability, Simmonds invokes the distinction between legal rights and moral rights. On the legal side, he is content to affirm (WT)’s implication that the criminal law confers no claim-right against 13
Simmonds, N., “Rights at the Cutting Edge”, op. cit., footnote 3, pp. 225-232.
770
GOPAL SREENIVASAN
murder or assault. On the moral side, he is content to insist that the duties not to murder and not to assault really can be waived. Neither of these replies withstands scrutiny. It is true that (WT) vests agents who have even a residual measure of control over a duty with a correlative claim-right. But it cannot seriously be maintained that reducing the right-holder’s measure of control is consistent with strengthening her claim-right, at least not on the Will theory’s conception of a claim-right. Someone with only a residual measure of control over my duty to j lacks the ability to exert her will in certain ways notably, to make it the case that my failure to j does not count as a breach of my duty. How can this not weaken her ability to exert her will, and so not weaken her claim-right on (WT)? Simmonds’ second reply is beside the point. In either law or morals, one might debate whether or not a certain claim-right is completely inalienable. Let the example be one’s favorite. For present purposes, it is simply irrelevant to insist that one position or the other in the resultant debate is correct. The question is whether the debate itself is coherent; and the very fact that Simmonds can engage in the debate shows that it is. But this contradicts (WT), which excludes the coherence of asserting that any claim-right is completely inalienable. II 1. Let me now introduce the Interest theory. The following rough statement will serve our purposes to begin with: “(IT) Suppose X has a duty to j. Y has a claim-right against X that X j just in case Y stands in a sanctioned relation to benefiting from X’s j-ing”. This formulation is slightly odd. But it allows (IT) to cover a number of subtle variations in the basic structure of the Interest theory. For now, we can think of standing to benefit from X’s j-ing’ and being intended to benefit from X’s j-ing’ as the sanctioned relations. (IT) also gives a comprehensible sense to the statement that X’s duty is owed to Y, and so to the statement that it is Y who holds the correlative claim-right against X: namely, the duty is for Y’s benefit. (IT) is more general than (WT) in two important respects. First, it extends the notion of a claim-right to a wider range of cases than (WT)
A HYBRID THEORY OF CLAIM-RIGTHS
771
does. In particular, (IT) extends the notion to the cases of inalienability and incompetence that motivated the objections to (WT). On the plausible assumption that X’s enslaving Y or employing Y in unsafe working conditions or assaulting a comatose Y sets Y’s interests back, (IT) yields the verdict that X’s duties not to perform any of these actions are still owed to Y, and so that Y still holds the correlative claim-right. Second, (IT) is associated with a more general account of the justification of claim-rights. On the account associated with (WT), the justification for empowering Y to waive the duty correlative to her claim-right, and so for vesting her with the claim-right, lies in the fact that so doing serves Y’s interest in autonomous choice.14 In the paradigm cases, empowering Y to waive this duty also advances her interests on balance. By contrast, on the account associated with (IT), the justification for the structure of Y’s normative standing, as we might put it, lies in the more general fact of what advances Y’s interests on balance. It is not tied to the more specific fact of what advances Y’s interest in autonomous choice.15 When these facts coincide, as they do in the paradigm cases, (IT) yields the same results as (WT).16 But when they diverge, as they do in the cases motivating the objections (IT) classifies duties that advance Y’s interests as owed to Y, even if Y has no measure of control over them, as long as Y’s disability with respect to these duties advances her interests on balance.
14 Hart, op. cit., footnote 7, pp. 188 and 189. On some versions of the Will theory, it would be objectionable to characterize the justification of Y’s power to waive in terms of her interest in autonomous choice. But nothing turns on this formulation, at least not for my purposes. I could as well describe the justification associated with (WT) as appealing in some fashion’ to the value of (individual) autonomy. The formulation in the text makes the greater generality of the justification associated with (IT) explicit on the surface of the two accounts. However, the facts about which account is more general hold independently of this formulation (see the following note). 15 The justification of claim-rights associated with (IT) can let whatever it is about the value of (individual) autonomy that grounds the justification associated with (WT) weigh in favour of empowering Y to waive X’s duty to j. Its greater generality consists in the fact that it also allows other factorsCto wit, aspects of Y’s well-being that are independent of her autonomy to weigh against empowering Y to waive this duty. It is irrelevant to this claim whether advocates of (WT) would assign justificatory weight to these other factors, so long as you and I do. 16 Cfr. MacCormick, op. cit., footnote 9, pp. 207 and 208.
772
GOPAL SREENIVASAN
At least one serious objection can be raised against (IT). This concerns the problem of third party beneficiaries.17 In simple form, the problem is as follows. Suppose you promise your brother to pay your sister $100. Ordinarily, we would say that your brother now has a claim-right against you or that you now owe a duty to your brother to pay your sister $100. Hart questions whether (IT) yields this verdict.18 However that may be, (IT) certainly yields the verdict that your duty to pay your sister is (also) owed to your sister, and so that your sister (also) has a claim-right against you, since she benefits from the $100. Hart also maintains that this verdict is incorrect.19 However that may be, it would certainly be the wrong verdict if your duty to pay your sister were also owed to your sister’s child, on whom —let us say— she will spend the $100, so that her child had a claim-right against you. But (IT) clearly appears to yield that verdict as well. More generally, the ob jection is that, intuitively, there is a limit to the number of people to whom duties are owed, and so to the number of claim-rights that arise, under a third party promise or contract. Indeed, for many duties, there is an intu itive limit to the number of people to whom the duty is owed. It is therefore a condition of adequacy on (IT) that its generalization of the no tion of a claim-right suitably limit the number of people it classifies as correlative claim-hold ers. For the most part, however, this condition of adequacy has not been met.20
17
See, notably, Hart, H. L. A., “Are there Any Natural Rights?”[1955] in Waldron, op. cit., footnote 3, pp. 81 and 82; and Hart, op. cit., footnote 7, pp. 187 and 188. 18 See previous note. Some interest theorists reply by affirming that your brother has an interest in your fulfilling your promise to him, in which case (IT) will vest him with a claim-right against you. See, e. g., Lyons, D., “Rights, Claimants, and Beneficiaries” [1969] reprinted in his Rights, Welfare, and Mill’s Moral Theory, New York, Oxford University Press, 1994, pp. 42-44; and Kramer, M., “Rights Without Trimmings”, footnote 3, pp. 79 and 80. 19 See note 15; cfr. Steiner, H., An Essay on Rights, Oxford, Blackwell, 1994, pp. 61 and 62. Kramer protests that it begs the question to deny that your sister has a claim-right against you, op. cit., footnote 3, pp. 66-68. Cfr. Lyons, pp. 37-41. 20 MacCormick replies that the third party objection can also be re-modelled to tell against the Will theory, and thus proves too much (op. cit., footnote 8, pp. 208 and 209). As it happens, his re-modelling is not effective. But even if it were, it would still not show that (IT) had itself satisfied the condition of adequacy.
A HYBRID THEORY OF CLAIM-RIGTHS
773
2. By way of illustration, let us consider a promising defense of the Interest theory recently offered by Matthew Kramer.21 To his credit, Kramer confronts the central problem head on, explicitly acknowledging that we have to distinguish the relevant beneficiary from other people whose well-being may be advanced by the execution of the contract... [Must the Interest theory] ascribe a right to anyone who might benefit from the carrying out of the contract? If the answer here were yes, then the Interest Theory would merit no further consideration as a serious theory of rights.
The theory Kramer defends is somewhat different from (IT). In particular, it offers different sufficient conditions for holding a claim-right. Kramer adapts his preferred sufficient conditions from Bentham’s test for the assignment of rights under a law, as glossed by Hart.22 According to Hart, Bentham’s test identifies holders of a claim-right correlative to a given duty by asking what findings are necessary to establish a breach of that duty by the duty-bearer. In particular, it asks whether detriment to the candidate right-holder is necessary to establish a breach. Kramer adapts the test by substituting sufficient for necessary.23 Thus, on Kramer’s test, if detriment to X is sufficient to establish a breach by the duty-bearer, then X holds a correlative claim-right and otherwise not.24 In terms of our example, we are to ask what findings are sufficient to establish that you have breached your duty to pay your sister $100. Since proof that your sister suffered the detriment of not having been paid $100 by you suffices to establish that you breached this duty, it follows on Kramer’s test that she holds a claim-right correlative to your duty. By contrast, proof that her child suffered the detriment of not having been given a $100 present does not suffice to establish a breach of your duty. Hence, the child does not hold a correlative claim-right. So Kramer’s test certainly rules some beneficiaries out as claim-right holders; and may even seem to draw the line in the right place. Appearances, however, can be deceiving. To begin with, we should ask how, on Kramer’s test, your brother —the promisee— qualifies as a 21 Kramer, M., “Rights Without Trimmings”, in Kramer, N. et al., op. cit., footnote 3, pp. 66, 68 and 79-84; 80 and 81. 22 Op. cit., footnote 7, pp. 179. 23 Kramer et al., op. cit., footnote 3, pp. 81 and 82. 24 op. cit., footnote 3, p. 81.
774
GOPAL SREENIVASAN
claim-right holder. Presumably, it is because of his interest in seeing his wishes fulfilled.25 The idea is that proof of your brother’s detriment of not seeing his sister get her $100 will suffice to establish a breach of your duty. But it is not clear that this will do the trick. Imagine that your grandmother has an interest in seeing her grandchildren behave themselves, get benefits, and so on. Will proof of the detriment to her-of not seeing her granddaughter get her $100-suffice to establish a breach of your duty? If so, your grandmother will also hold a correlative claim-right. An adequate test of claim-right holding should draw the line between your grandmother and your brother. Yet it is not clear how Kramer’s test can exclude the former without also excluding the latter. I can make out three options, none of them satisfactory. First, your grandmother may be excluded because she is not a party to the promise. But this fails to distinguish her from your sister, who is said to hold a correlative claim-right. Second, your grandmother may be excluded because her interest is parasitic-it smuggles in reference to your sister’s detriment. But this fails to distinguish her from your brother, who would otherwise fail to hold a correlative claim-right.26 Third, your grandmother may be excluded because her interest is not important enough. But the one clear way of interpreting this option is not available to Kramer. One might require the detriment to be so important that proof of it is necessary to establish a breach of the relevant duty. However, this would be to adopt precisely the structure of Hart’s gloss on Bentham’s test, which Kramer explicitly rejects. Furthermore, if we examine the notion of what suffices to establish a breach a little more closely, a different sort of trouble soon emerges. Consider the special case where your brother waives your duty to pay your sister.27 In this case, your sister’s detriment is not sufficient to establish’a breach of your duty. Having once seen this, we should then recognize that her detriment does not suffice even when your brother 25 26
Cfr. op. cit., footnote 3, pp. 79 and 80 Changes in the description of your brother’s interest can be mirrored by changes in your grandmother’s interest. In principle, the description of his interest should not explicitly refer to the breach or fulfillment of your promise, since this would make Kramer’s test vacuous (cfr. note 23). For that matter, however, your grandmother may also have an interest in promises to her grandchildren being kept. 27 This case is also discussed by Hillel Steiner, who makes somewhat different use of it. Steiner, H., “Working Rights”, in Kramer et al., op. cit., footnote 3, pp. 285 and 286.
A HYBRID THEORY OF CLAIM-RIGTHS
775
does not waive your duty, since he might have done.28 In fact, even your brother’s parasitic detriment does not really suffice to establish your breach, since detriment on his part does not, strictly speaking, entail that he did not waive your duty. Kramer’s test therefore fails to vest the one uncontroversial claim-right holder —the promisee— with a claim-right against you.29 III One version of the Interest theory is plausibly regarded as exempt from the third party beneficiary objection. I think Joseph Raz’s version may be seen as having solved the problem, which is somewhat ironic, since as far as I know he does not discuss it.30 Still, let me briefly adapt his definition of rights to this end:31 (RZ) Y has a claim-right against X that X j just in case, other things being equal, an aspect of Y’s well-being (his interest) is a sufficient reason for holding X under a duty to j.
The threshold requirement that Y’s interest must itself suffice, other things equal, to justify X’s duty may be regarded as formidable enough to set a suitable limit on the number holding a claim-right correlative to X’s duty to j. Is your nephew’s or niece’s interest in the $100, for example, itself sufficient to ground a duty on your part, other things equal, to pay your sister? Probably not. So far, so good. However, Raz’s account faces another problem, as he himself concedes.32 I believe Raz’s solution to this other problem is objectionable. Moreover, it is arguable that he is forced into the objection28 Kramer later mentions, but does not resolve, a related issue about when a given proof is sufficient (op. cit., footnote 3, pp. 90 and 91). 29 Kramer does sometimes slip in the qualification unexcused detriment´ (e. g., op. cit., pp. 82 and 83), which might be exploited to cover cases where the duty is waived. But this makes his test vacuous. Compare the equivalent notion of a detriment in breach, which explicitly drains the test of content. 30 Raz, J., The Morality of Freedom, Oxford, Clarendon Press, 1986. 31 Raz, op. cit., footnote 24, p. 166. 32 See Raz, J., “Rights and Individual Well-being”, Ethics in the Public Domain, Oxford, Clarendon Press, 1994, p. 45 (cfr. Raz, op. cit., footnote 24, p. 187). My discussion in the remainder of this section refers to this article.
776
GOPAL SREENIVASAN
able aspect of that solution by the structure of his solution to the third party beneficiary problem. Thus, while (RZ) avoids the objection against (IT), the price it ultimately pays for its solution is unacceptably high. The problem Raz admits he faces is that of explaining the apparent mismatch between the weight of many rights and the weight of the right-holder’s corresponding interest. The weight of the claim-right —that is, the weight of its correlative duties— is often, so it seems, much greater than the weight of the right-holder’s interest. Consider, for example, a journalist’s claim-right to withhold the names of her sources.33 We may suppose that the duties that correlate with this claim-rightCduties that protect the freedom of the pressChave great weight. By contrast, the interest an individual journalist has in protecting her sources is often, if not always, comparatively slight. But it is unclear how this can be, given that on (RZ) the journalist’s interest is meant to be sufficient to justify the correlative duty (not to require journalists to disclose their sources). Raz’s solution may be described, in a nutshell, as a piggy-backing solution: He allows that, sometimes, the importance of an individual’s interest can, for the purposes of assessing its contribution to the justification of someone else’s duty, be augmented by taking the interests of third parties into account. Specifically, it can be thus augmented just in case the interests of the third parties are served precisely by serving the relevant interest of the individual in question. That is, the importance of the individual’s interest can be augmented just in case the third parties’ interests can piggy-back on it; and then its importance is augmented by crediting it with the weight of the piggy on its back. Applied to the case of the journalist, Razes solution is to allow the general public’s interest in a free press —including its interest in living in the kind of society made possible by freedom of the press— to weigh in favour of the journalist’s claim-right; and to do so just because the public’s interest is served precisely by securing the journalist’s own interest in protecting her sources. More generally, Raz argues, the great weight of many fundamental civil and political rights is to be explained by the fact that the distinctive common goods of a liberal culture are riding piggy-back on the individual interests that correspond to these rights.
33
Cfr. Raz, op. cit., footnote 24, pp. 247 and 248.
A HYBRID THEORY OF CLAIM-RIGTHS
777
My objection to this solution is that it instrumentalizes the individual’s status as right-holder.34 By using the individual to enable others to grace their cause with the banner of right-holding, Raz’s solution fails to take the status of right-holder seriously enough. Assignments of this statusCthat is, the vesting of an individual with a given claim-rightCshould reflect nothing apart from the intrinsic standing of the individual who is to possess it.35 Consequently, if claim-rights are vested on the basis of the weight of an individual’s interest, as they are on (RZ), then the individual’s interest has, for these purposes, to be weighed simply on its own. In the case of the journalist, that is to say: if her claim-right to protect her sources is to prevail in the social calculus, and prevail on account of the journalist’s status as a right-holder, that must be because the journalist’s own interest has sufficient weight to defeat the interests others have in learning the identity of her sources.36 If the journalist’s interest lacks this weight, then either she has to reveal her sources or, more plausibly, freedom of the press will have to be regarded as (at least, largely) a matter of net social utility, rather than as a matter of individual rights. Notice that insisting that the status of right-holder reflect only the intrinsic standing of the relevant individual leaves it entirely open what 34 Compare Simmonds, op. cit., footnote 3, pp. 195-200; and Thomson, op. cit., footnote 3, p. 152. 35 At a minimum, this requirement is a desideratum for a theory of claim-rights, one that derives from the aim of preserving the connection between the language of rights and liberal individualism. In its weakest version, my argument against (RZ) is that it fails this desideratum, whereas (as we shall see) my hybrid alternative satisfies it. I actually believe, more strongly, that the requirement stated in the text is a condition of adequacy on a theory of claim-rights. But I shall not argue for this here. 36 The interest of the journalist that must have sufficient weight here is her interest as an individual person (albeit, one who is a journalist). As an anonymous referee has observed, the individual journalist might also be thought to have interests as the occupant of a certain office (i. e., that of journalist), interests that are independent of her interests as a person and that reflect —by definition (of the office), rather than by instrumental alignment— the interests third parties have in a free press. We need not decide whether this alternative analysis provides a better account of the freedom of the press. Even if it does, the account it provides either makes no appeal to the journalist’s status as a right-holder (as distinct from her status as an office-holder) or else it, too, makes assignments of that status reflect something in addition to the journalist’s intrinsic standing as an individual. In the first (more likely) case, the account on offer is not enough like Raz’s account to help him; and, in the second case, too much like it to satisfy our desideratum.
778
GOPAL SREENIVASAN
significance that standing actually has. In particular, it remains open whether an individual’s own interest (always) has sufficient weight to prevail against the onslaught of the social calculus. Perhaps no individual’s interest can be worth that much. I do not knowCthat is another matter. But if it is not worth that much, we should not pretend that individual claim-rights have as much weight as we ordinarily suppose they do.37 Moreover, a theory of rights should not vindicate that pretence on the underside of a piggy. (RZ) avoids the objection confounding (IT) because of its requirement that Y’s interest suffice, other things equal, to justify X’s duty in order for Y to hold the correlative claim-right. However, given the mismatch between the great weight ordinarily attached to the duties that correlate with certain claim-rights and the limited weight that can be justifiably accorded to any one individual’s interests, an account with (RZ)’s structure faces a dilemma. Either Y’s interest is weighed strictly on its own or it is not. If it is, then X’s duty must itself have limited weight, which contradicts our ordinary assumption in certain important cases. If it is not, then the correlation of X’s duty with Y’s claim-right is due to an instrumental —albeit non-fortuitous— alignment between an individual’s interests and those of certain third parties. Raz appears to embrace the second horn of this dilemma. But neither strikes me as very comfortable. IV It seems to me, then, that we lack a satisfactory solution to the debate between the Will theory and the Interest theory. We therefore lack a satisfactory understanding of the correlation between the right-holder and the duty-bearer that is constitutive of claim-rights. I should like to propose a new understanding. The account I propose is a hybrid of the Will theory and the Interest theory. I shall first present a rather crude hybrid, which is nevertheless adequate to meet the objections faced by (WT) and (IT). Then I shall refine my proposal, and explain how it avoids the objection I made to (RZ). 1. Consider a Simple Hybrid model of claim-rights. 37 Either that or we should reject (RZ) we should deny, that is, that claim-rights are vested on the basis of the sufficiency of an individual’s interest to justify the correlative duty. But this option is not open to Raz.
A HYBRID THEORY OF CLAIM-RIGTHS
779
(SH) Suppose X has a duty to j. Y has a claim-right against X that X j just in case: either Y has the power to waive X’s duty to j or Y has no power to waive X’s duty to j,but (that is because) Y’s disability advances Y’s interests on balance. This model has various advantages over (WT). First, (SH) can handle classical inalienable rights, for example, a claim-right not to be enslaved or a claim-right not to be subject to unsafe working conditions. In these cases, Y’s disability is imposed to secure Y’s own position on balance and is standardly taken to strengthen Y’s claim-right. Second, (SH) can handle various forms of incompetence to waive a duty without having to dissolve the correlative claim-right. Here, again, the disability to waive the relevant duties secures the person’s own position on balance. In both cases, Y qualifies as a claim-right holder under the second disjunct. The Simple Hybrid model also has an important advantage over (IT). (SH)’s advantage is that it solves the infamous third party beneficiary problem. Say that B promises A to do something that explicitly favours C and implicitly favours D (whom C will favour, as it happens, if B performs). On (SH), A qualifies as a claim-right holder under the first disjunct, since we may assume that A has the power to waive B’s duty. D does not qualify as a claim-right holder since he fails both disjuncts. Ordinarily, the same holds of C. It is natural to see the merit of the Interest theory as being that it is more general than the Will theory. At the same time, however, it is possible to see its demerit as being precisely that it over-generalizes from the Will theory. The correct theory clearly has to be more general than the Will the ory be cause there are im por tant cases of claim-rights that the Will theory mishandles. One way of approaching the problem of a theory of claim-rights, then, is to look for a way of generalizing from the Will theory’s treatment of the paradigm cases of contractual and property rights that manages not to over do it. The Interest theory fails at this because it awards too many claim-rights. I contend that (SH) succeeds, by generalizing the Will theory but only within clear limits.
780
GOPAL SREENIVASAN
There is also a generic advantage to (SH), that is, an advantage with respect to both the Will and the Interest theories. (SH) gives us some independent purchase on the question of whether there are individual claim-rights under the criminal law. This question is standardly treated as a matter of bare judgement. Those who think there obviously are claim-rights under the criminal law treat their judgement as a basis for criticizing the Will theory,38 whereas those who think there plainly are not claim-rights under the criminal law, at least not for the most part, treat their judgement as a basis for criticizing the Interest theory.39 On (SH), the answer turns on the reasons for vesting control over criminal law duties in the public prosecution service. If the public prosecutor has this control because that is what best secures the interest of individual members of the public, then criminal law duties do correlate with individual claim-rights. But if the justification for vesting control with a public prosecutor is, for example, to secure consistency in the administration of justice, then criminal law duties do not correlate with individual claim-rights. What if both justifications apply? Then we should consider whether a given justification would itself be sufficient to overturn an opposite verdict from the other. Say, for example, that individuals’ interests in security are best advanced by vesting individuals with the power to waive criminal law duties, but the administration of justice is best advanced by vesting that power in the public prosecutor instead. In this case, which justification would prevail? If the latter would prevail, then even if individuals’ security and the administration of justice are both advanced by vesting control in the prosecution service, the latter justification is what settles the question. According to (SH), therefore, criminal law duties do not correlate with individual claim-rights, since individuals are not disabled from waiving those duties because it advances their interests on balance. Notice that, on this view, the weight of the relevant duties is irrelevant to the question of whether they correlate with claim-rights (at least, it is not a sufficient condition). There is no incongruity, it seems to me, in saying that weighty duties that are not owed to individuals do not correlate with individual claim-rights. 38 For example, MacCormick, op. cit., footnote 8, and Kramer, in “Rights Without Trimmings”. 39 For example, Hart, op. cit., footnote 7.
A HYBRID THEORY OF CLAIM-RIGTHS
781
2. Let us now consider a series of pair-wise comparisons between (SH) and var i ous compli ca tions on it that serve to iden tify de fects in (SH) upon which we can improve. The variations from (SH) appear in bold face. Variant A. Suppose X is duty-bound to j. Y has a claim-right against X that X j just in case: either Y has the power to waive a duty of X’s to j or Y has no power to waive a duty of X’s to j, but (that is because) Y’s disability advances Y´s interests on balance.
(SH) may suggest or imply either that X can only have one duty with a given content —for example, to j— or that, in order for X to owe Y a duty to j, Y must have the power to bring it about that X has no duty to j at all. By contrast, we ordinarily suppose that someone can owe duties with identical content seven identical non-indexical contents to different people. For example, I can owe both my fiancée and my mother a duty to make it to the church on time. Variant A makes clear that X’s owing Y a duty to j does not exclude X’s also owing Z a duty to j. Likewise, Y’s waiving X’s duty to j need not bring it about that X has no duty to j. It may well be, for example, that X still owes Z a duty to j. This limit’on Y’s power to waive a duty of X’s to j does not prevent Y’s power from making it the case that at least one of X’s duties to j is owed to Y; and so does not prevent Y from holding a correlative claim-right. Variant B. Suppose X has a duty to j. Y has a claim-right against X that X j just in case: either Y has some measure of control over X’s duty to j or Y has no control over X’s duty to j, but (that is because) Y’s disability advances Y’s interests on balance.
Recall that Hart distinguishes three levels of control in the full measure of control over a duty recognized by the Will theory. (SH) fixes narrowly on the first level of control, whereas variant B ranges more widely. On (SHB), the primary non-contractual beneficiary of a contract in my earlier exampleCmay also qualify as a right-holder if he or she has
782
GOPAL SREENIVASAN
the power to enforce the duty, even if he or she lacks the power to waive the duty itself.40 Variant C. Suppose X has a duty to j. Y has a claim-right against X that X j just in case: either Y has the power to waive X’s duty to j or Z has the power to waive X’s duty to j, but (that is because) so empowering Z advances Y’s interests on balance. When Y is competent to waive X’s duty, but nevertheless disabled from doing so (SH) allows Y to qualify as a right-holder under its second disjunct as long as Y’s disability secures her own position on balance. In these cases, Y’s position is secured, on balance, by preventing her from exercising this power to her own detriment. When Y is incompetent, there is no need to prevent her from exercising any such power. (SH)’s second disjunct is trivially satisfied, and so functions simply to preserve Y’s correlative claim-right. But (SH) thereby appears to assimilate cases of incompetence to those of inalienability, by making no provision for X’s duty ever to be waived. This leaves open the case in which Y is incompetent to waive X’s duty, but where Y’s interests are advanced on balance by vesting some third party, Z, with a power to waive X’s duty. (SHC) makes it explicit that powers of waiver can be exercised in trust and that those on whose behalf they are placed in trust can still qualify as claim-right holders.41 Variant E. Suppose X has a duty to j. Y has a claim-right against X that X j just in case: Y’s power (or disability) to waive X’s duty to j matches (by design) the outcome (having the power or not) that advances Y’s interests on balance. This has two advantages over (SH). First, it tidies up the disjunctive formulation. The parenthetical reference to design is meant to preserve (SH)’s sensitivity to the justification underlying Y’s position. Second, the one small change in content effected by the tidying is actually an improvement. On (SH), possession of the power to waive X’s duty to j suffices to qualify Y as a claim-right holder, regardless of whether hav40 41
Cfr. Hart, op. cit., footnote 7, p. 187. We might also consider a variant D: the same as (SHC), except that Z is interpreted to cover both third parties and the null party, i. e. no one (SHD) would extend the rationale in (SHC) to cover the case in which Y’s interests are advanced on balance when no one at all has the power to waive X’s duty to j.
A HYBRID THEORY OF CLAIM-RIGTHS
783
ing that power advances Y’s own interests on balance. By contrast, on (SHE), having the power to waive X’s duty qualifies Y as a claim-right holder only if having it advances Y’s own interests on balance (and that is what justifies Y’s power). Thus, someone who exercises a power of waiver in trust for someone elsefor example, either a surro gate decision-maker in clinical care or a parent will thereby count as a claim-right holder on (SH), but not on (SHE). In preferring (SHE), I assume that the surrogate or parent is vested with a power of waiver in order to advance someone else’s interests on balance namely, those of the incompetent patient or minor. (SHE) has a further advantage over (WT), which will agree with (SH) here. Although the change in content introduced by variant E is no doubt an improvement, it also mildly complicates the hybrid theory’s solution to the third party beneficiary problem. I shall explain the point simply in relation to the status of the promisee (i. e., the second party). In discussing (SH), I said we could assume that the promisee has the power to waive the promisor’s duty to fulfill the promise. Since the warrant for this assumption is that it reflects a standard feature of promising as ordinarily understood, I shall continue to regard it as an assumption we are entitled to make. As previously explained, the assumption suffices, on (SH), to qualify the promisee as a claim-right holder. However, it does not suffice on (SHE). On (SHE), as we have just seen, the promisee (like anyone else) qualifies as a claim-right holder only if her power to waive the promisor’s duty advances her own interests on balance (and is justified on that basis). The mild complication, then, is that the adequacy of variant E’s solution to the third party beneficiary problem depends on the justification for empowering the promisee to waive the promisor’s duty; and this, in turn, will depend upon our preferred theory of promising. To avoid having to enter into that subject here, let me re-state the complication as follows: Variant E constrains the theory of promising (or contracts) to empower the promisee to waive the promisor’s duty because the promisee’s own interests are advanced on balance by having that power. I describe it as a mild complication because it seems to me that any plausible theory of promising will plainly satisfy this constraint.42 42 Or, more precisely, either the correct theory of promising will satisfy this constraint or it will license us to abandon the ordinary assumption that the promisee has a
784
GOPAL SREENIVASAN
3. We can now roll the Simple Hybrid model and its variants (SHA)-(SHE) into an omnibus formulation, or Complex Hybrid model: (CH) Suppose X is duty-bound to j. Y has a claim-right against X that X j just in case: Y’s measure (and, if Y has a surrogate Z, Z’s measure) of control over a duty of X’s to j matches (by design) the measure of control that advances Y’s interests on balance.
I maintain that (CH) avoids Raz’s problem of instrumentalizing the status of claim-right holder. To see this, we should first notice that (CH) treats the question of whether a given duty correlates with an individual’s claim-right as strictly independent of the question of what justifies the given duty.43 In particular, the question of correlation —and hence, assignment of the status of right-holder— is independent of what justifies either the existence or the weight of the given duty. Having disconnected these questions, (CH) then confines the trade-offs affecting whether an individual is empowered to waive a given duty to the sphere of that same person’s interests. The balance of interests that settles this question is nothing but a balance of the individual’s own interests. Thus, the trade-offs that affect an individual’s status as a claim-right holder, as someone to whom a particular duty is owed, do not have to be aligned with the interests of third parties. Nor need they be aligned with any other aspect of the larger trade-offs inherent in the social calculus. The perils of instrumentalization are thereby avoided. Of course, the nature of a particular duty’s justification will inevitably constrain whether a given individual can justifiably be empowered to waive the duty in question. Thus, Y will be justifiably empowered to waive X’s duty to j only if two further conditions are both satisfied: (i) the justification of X’s duty to j is consistent with X’s not j-ing; and claim-right against the promisor. Notice that the constraint says nothing about how the promisor’s duty has to be justified. In relation to the central burden of a theory of promising, then, it is no constraint at all. 43 Indeed, all the versions of my hybrid begin with some such formulation as Suppose X is duty-bound to j. This is meant to signal that the justification for the duty to ö is taken as given.
A HYBRID THEORY OF CLAIM-RIGTHS
785
(ii) Y is a good judge of whether condition (i) holds in any given case.
(If we want Y to be uniquely empowered to waive X’s duty, then we have to add: (iii) Y is the only person who is a good [enough] judge of whether condition (i) holds in any given case).
Now there are various cases in which these further conditions may be satisfied. The most familiar case is where the decisive consideration in the justification of X’s duty to j simply is what advances Y’s interests on balance. Given the traditional liberal dogma that an individual is the best judge of what advances his or her own interests, Y will easily satisfy condition (ii). Indeed, Y will also satisfy the additional condition (iii), and hence be uniquely empowered to waive X’s duty. A second case in which conditions (i) and (ii) may be satisfied is where third party interests play a significant role in the justification of X’s duty to j (for example, in explaining its great weight), but where these third party interests are served precisely by advancing Y’s interests on balance. We might call this the constrained piggy-back scenario because it describes a sub-set of Raz’s piggy-back cases namely, those which also satisfy constraints (i) and (ii). Strictly speaking, this is simply a subtle instance of the previous case.44 It therefore avoids concerns about instrumentalizing the individual’s status as right-holder, since the decisive balancing of interests for vesting Y with control over X´s duty remains a balancing of Y’s own interests. Notice that, here, the weight of X’s duty to j depends on the interests of third parties, but Y’s status as a claim-right holder according to (CH) does not. Y’s status is independent of any alignment with the interests of third parties. Finally, there may be cases where the justification of X’s duty to ö has nothing to do with Y’s interests, but where conditions (i) and (ii) nevertheless hold on account of Y’s excellence in judgement. Y may be a superb judge of social utility, for example. These cases may well raise con44 In this case, the decisive considerations justifying X’s duty are the third party interests. Ex hypothesi, however, these decisive interests are served precisely by serving the balance of Y’s own interests. That makes the balance of Y’s interests decisive for justifying X’s duty, which is why this is actually an instance of the previous case. See also the discussion below of the artist’s right of integrity.
786
GOPAL SREENIVASAN
cerns about instrumentalizing Y in some fashion. However, we need not worry about them, since they are not cases in which (CH) vests Y with a correlative claim-right. It may be useful to consider an example of the constrained piggy-back scenario. For technical reasons,45 the journalist’s case discussed earlier is not really suitable to examine in this context. So let us consider a structurally similar case instead say, the claim-right of artists to the integrity of their work.46 The right of integrity correlates with a duty not to distort, dismember, or misrepresent a work of art. It was violated, for example, by the owner of a refrigerator, bought at a Paris charity auction, on six panels of which Bernard Buffet had painted a composition. Although Buffet considered the six panels to be a single work (and had signed only one of them), the owner offered one of the panels for sale at another auction half a year later (buffet sued to prevent the separate sale of the panel and won). There are various interests served by the right of integrity. Clearly, these include the interests of individual artists, such as their interests in communication and in reputation. But the right of integrity also serves significant third party interests. In addition to audience interests, these third party interests importantly include collective social interests for example, the interest in preserving a culture’s artistic heritage.47 Together, 45 The journalist’s right to withhold the names of her sources is actually a cluster-right: a combination, that is, of a liberty-right to withhold (or to disclose) these names and of a claim-right not to be required to disclose them. This is a familiar arrangement, in which the claim-right serves to protect the liberty-right. However, it makes the relation between a power to waive the correlative duty (not to require disclosure) and the journalist’s primary interest here (i. e., the liberty to withhold or disclose the relevant names) unnecessarily complicated for our purposes. This is less of an issue for Raz, for whom the specific notion of a claim-right, as distinct from a liberty-right, is not at the forefront of attention. 46 For discussion of this right, see (e. g.) Merryman, J. H., “The Refrigerator of Bernard Buffet”, Hastings Law Journal, 27, 1976, pp. 1023-1049. The details of the case that follow in the text appear on p. 1023. I owe the example and the reference to Charles Beitz. 47 Compare Merryman, op. cit., footnote 37, p. 1041: The machinery of the state is available to protect “private” rights in part because there is thought to be some general benefit in doing so. Thus the interests of individual artists and viewers are only a part of the story. Art is an aspect of our present culture and our history; it helps tell us who we are and where we came from. To revise, censor, or improve the work of art is to falsify a piece of the culture.
A HYBRID THEORY OF CLAIM-RIGTHS
787
the common good of an artistic heritage and the audience interests ride piggy-back on the individual artist’s interest, since they are served precisely by protecting that individual’s (e. g., Buffet’s) own interest in communication and reputation.48 Does the right of integrity illustrate the constrained piggy-back scenario, more specifically? It depends, in the first instance, on whether the common good of an artistic heritage or the audience interests are consistent with individual artists waiving the duty protecting the integrity of their own works when they see fit. Suppose the third party interests were not consistent with this outcome. In that case, we would have to give up the idea that artists have a claim-right to the integrity of their work. For artists should then be disabled from waiving the relevant duty and their disability would not be designed to advance the balance of their own interests. Rather, it would simply be required by the superior weight of third party in terests inconsistent with artists having the power to waive this duty. Hence, on (CH), individual artists would have no claim-right. But now suppose, not implausibly, that the common good and the audience interests are (at least, on balance) actually consistent with individual artists’ being empowered to waive the duty not to distort, dismember, or misrepresent their work. From the standpoint of the social calculus, there would no longer be an impediment to artists having this power. However, while it may then be justifiable to empower artists to waive this duty, that does not suffice to vest them with a claim-right: On (CH), it still matters whether this power of waiver advances their own interests on balance. For simplicity, let us say that artists have the power to waive the relevant duty and that (is because) it advances their interests on balance.49 Then (CH) will assign them a claim-right to the integrity of their work; and this claim-right will illustrate the constrained piggy-back scenario.
48
To tighten the parallel with the journalist’s claim-right, we can assume, plausibly, that these third party interests have a greater weight in the social calculus than the interests of individual artists. 49 In some jurisdictions (e. g., France), the right of integrity is actually partially inalienable. The artist lacks the power to waive the duty not to distort her work, but retains the power to enforce the duty (as Buffet did) or not. This arrangement remains in the spirit of (CH), since it reflects the same concern for the balance of the artist’s interests (cfr. Merryman, op. cit., footnote 37, p. 1044). (We need not enquire here what measure of control over this duty best satisfies that concern).
788
GOPAL SREENIVASAN
The complications here highlight an important point. When the status of claim-right holder is not treated instrumentally, piggy-back riding is a fairly precarious enterprise. To stick with the right of integrity, the third party interests must be aligned with more than an artist’s interest in actually protecting the integrity of her work. They must be aligned, more precisely, with the sub-alignment of the artist’s own balance of interests on having the choice to protect that integrity or not. The artist’s freedom of choice must serve both the balance of her own interests and (the balance of) the common good and audience interests. Without the first alignment, the artist will not qualify as the correlative claim-right holder on (CH); and without the second alignment, it will not be justifiable to empower her to waive a duty of such great weight. On the other hand, if this elaborate alignment of interests does hold, then the duties protecting the artist’s interest can have a greater weight than the artist’s interests themselves justify, and this without instrumentalizing her status as the correlative claim-right holder.50
50 This paper originated in a graduate seminar on rights I gave at Georgetown University during the Spring semester of 2001. Successive versions were delivered at a conference on rights at the Hebrew University in Jerusalem; as a philosophy colloquium at York University in Toronto; and at a conference on contemporary problems in the philosophy of law at the Universidad Nacional Autónoma de México in Mexico City. I am grateful to the audiences on all these occasions for helpful discussion. For comments on previous versions, I should also like to thank Brian Kierland, Robert Myers, Hanoch Sheinman, Martin Stone, Wayne Sumner, Judith Thomson, and Leif Wenar. I am especially grateful to Alon Harel and Horacio Spector, my commentators in Jerusalem and Mexico City respectively.
COMMENT ON PROFESSOR GOPAL SREENIVASAN’S “A HYBRID THEORY OF CLAIM-RIGHTS” Horacio SPECTOR* I In this interesting paper, professor Sreenivasan provides an account of rights that seeks to avoid the main difficulties that affect the Will Theory and the Interest Theory. Drawing on Hohfeld’s classical analysis, professor Sreenivasan identifies rights with claim-rights. He says “the best objection that each theory wields against the other is unanswerable”.1 Gopal formulates the Will Theory in this way: (WT) Suppose X has a duty to F. Y has a claim-right against X that X F just in case: Y has some measure of control over X’s duty. Citing Hart, he takes the full measure of control over X’s duty to comprise the power to waive X’s duty, to enforce it or not, given that X has breached it, and the power to waive X’s duty to compensate. As Gosal recognizes, the paradigms of the Will Theory are the claim-rights recognized in property and contract law, where right holders have typically the full measure of control.
Gopal argues that the Will theory is too restrictive because it cannot accommodate inalienable rights and the rights of incompetent adults. Thus he says: “The Will Theory makes inalienable claim-rights incoherent in principle”.2 While the holders of inalienable rights lack the power to waive the correlative duties, incompetent rights holders cannot exer* Universidad Torcuato Di Tella, Argentina. 1 Sreenivasan, Gopal, this volume, p. 776. 2 Ibidem, p. 768. 789
790
HORACIO SPECTOR
cise the powers of control on which the Will Theory relies. This objection is not compelling, however. As Gopal himself concedes, “lesser measures of control” can be accommodated as approximations to the case of full control. In fact, though holders of inalienable rights do not have the full measure of control over the correlative duties, they typically retain the power to enforce correlative duties and the power to waive compensation duties. Since the inalienability objection is not compelling, Gopal must complement it with what I will call the strength difficulty. According to the Will Theory, inalienability must weaken rights, because inalienable rights do not include the power to waive correlative duties. Yet the disability associated with inalienable rights —says Gopal— is typically seen as strengthening those rights. Replying Simmonds, Gopal sets out the strength difficulty as follows: …it cannot seriously be maintained that reducing the right-holder’s measure of control is consistent with strenghening her claim-right, at least not on the Will theory’s conception of a claim-right. Someone with only a residual measure of control over my duty to Æ lacks the ability to exert her will in certain ways – notably, to make it the case that my failure to Æ does not count as a breach of my duty. How can this not weaken her ability to exert her will, and so not weaken her claim-right on WT?3
Gopal formulates the Interest Theory in these terms: (IT) Suppose X has a duty to F. Y has a claim-right against X that X F just in case: Y stands in a sanctioned relation to benefiting from X’s F-ing. The Interest Theory covers easily the cases of inalienability and incompetence, but is subject to the well-known third-party beneficiary objection. As is well known, Raz’s formulation of the Interest Theory is meant to overcome this objection: (RZ) Y has a claim-right against X that X F just in case: other things being equal, an aspect of Y’s well-being (his interest) is a sufficient reason for holding X under a duty to F. As Raz himself acknowledges, this formulation must confront a new difficulty, which I will call the weight difficulty. Gopal expounds it in these terms: 3
Ibidem, p. 770.
COMMENT TO “A HYBRID THEORY OF CLAIM-RIGHTS”
791
“The weight of the claim-right —that is, the weight of its correlative duties— is often, so it seems, much greater than the weight of the right-holder’s interest. But it is unclear how this can be, given that the right-holder’s interest is meant to be sufficient to justify the correlative duty”.4 To deal with the weight difficulty, Raz proposes a “piggy-back solution”: the weight of an individual’s interest may be sometimes augmented by taking the interest of third parties into account. An example is a journalist’s claim-right to keep her sources secret. Against this solution, Gopal says: My objection… is that it instrumentalizes the individual right-holder. If fails to take his or her status as a right holder seriously enough. If an individual’s claim-right is to prevail against the onslaught of the social calculus, it must do so of its own accord – or, at least, substantially of its own accord.5
Gopal proposes a Simple Hybrid Model that is supposedly resistant to the objections against the Will Theory and the Interest Theory: (SH) Suppose X has a duty to F. Y has a claim-right against X that X F just in case: either Y has the power to waive X’s duty to F or the justification of Y’s disability to waive X’s duty is settled by considering whether vesting Y with a power to waive X’s duty would, on balance, advance Y’s interests.
To solve a number of technical problems —which I will not consider here— Gopal turns the Simple Model into the Complex Model: (CH) Suppose X is duty-bound to F. Y has a claim-right against X that X F just in case:
the question of whether Y (or his surrogate Z) is vested with some measure of control over a duty of X’s to F (and if so, of which one is and with what measure ) is settled by the consideration of what would, on balance, advance Y’s interests.
4 5
Ibidem, p. 776. Ibidem, p.777.
792
HORACIO SPECTOR
II I take Gopal’s paper as seeking to provide an analysis of both moral and legal rights. On the one hand, he adopts the Hohfeldian notion of a claim-right, applicable centrally to legal rights, and takes many examples of claim-rights from the law. On the other hand, he adopts the well-established usage in moral philosophy of rights as trumps or constraints on the utilitarian calculus. In the absence of this usage, it would be difficult to make sense of the instrumentalization problem. Therefore, Gopal’s project should be assessed in terms of its ability to account for both moral and legal rights. It is not clear to me that any conceptual analysis of rights can meet the above standard of success at the present stage of legal evolution. In the seventeenth and eighteenth centuries, the situation was probably different. At those times moral and legal rights were essentially associated with the value of personal autonomy. According to the Kantian doctrine of right, for instance, legal rights were public and institutional ways of recognizing the status of persons as ends-in-themselves. Rights were intelligible concepts against the background of a fundamentally non-consequentialist moral outlook. In turn, legal rights recognized individual autonomy by vesting in individuals the powers that Will Theory picks out. It is no surprise that Hart mentions rights in property and contract law as the cen tral ex amples of claim-rights. Those legal rights constituted the basic legal machinery of the Kantian conception of law. The Will Theory is an incomplete and fragmentary way of articulating the classical conception of rights. In fact, the theory focuses on the powers of right holders, but ignores the underlying autonomy-based justification. Gopal cites Hart’s suggestion that the justification of claim-rights associated with the Will Theory is “the interest in autonomous choice”.6 On the Kantian view, however, rights cannot be grounded on any interest —not even an interest in autonomous choice— because that would amount to disregarding the value of autonomy. Rights should be based on the status of individuals as autonomous agents. A formulation of the Will Theory faithful to the moral and legal tradition from which it takes its cue should refer both to the powers pres6
Ibidem, p. 771.
COMMENT TO “A HYBRID THEORY OF CLAIM-RIGHTS”
793
ent in classical legal rights and to its associated justification on basis of the value of individual autonomy. Toward the end of the nineteenth century, the harmonious picture of legal rights and underlying autonomy-based moral rights broke down. In a well-known process that spanned over decades, the individualistic paradigm of legal rights was gradually replaced by a paradigm centered on interests and social goals. Legal rights were no longer a way of recognizing the status of autonomous agents but instruments for enhancing the interests of individuals —particularly the worst-off— and for implementing social goals. Jhering’s famous theory of rights as legally protected interests exemplifies this new approach to the law. The Interest Theory is, of course, an attempt to account for this new conception of legal rights, which disconnects them from the value of individual autonomy. Though the Interest Theory is sensitive to the greater variety of legal rights in modern legal systems, like the right to a minimum wage or the right to education, it is at odds with those features of moral and legal rights that answer to the classical paradigm. These features are emphasized in the contemporary notion of rights as trumps or constraints. Given the historical linkage between rights and non-consequentialism, it is natural that the Interest Theory cannot provide a satisfactory account of rights. The instrumentalization problem is just an instance of this general truth. Even if we leave aside Raz’s “piggy-back solution”, the Interest Theory cannot accommodate the anti-consequetialist overtones of the concept of rights. As Eric Mack has recently shown, the Interest Theory is in tension with two central features of rights-based theories: the impermissibility to trading off rights against aggregative goals and the principled rejection of paternalism.7 The Interest Theory —particularly in Raz’s version— is incompatible with those features because it understands the value of rights as based on the interests of rights holders. These interests can have either agent-neutral (impersonal) or agent-relative value. If they have agent-neutral value, rights fall prey to the utilitarian calculus. In effect, given that the normative force of rights is grounded on the right holders’ interests, there is always the possibility that those interests be outweighed by other people’s interests. Alterna7 Erick Mack, “In Defense of the Jurisdiction Theory of Rights”, The Journal of Ethics, 4, 2000, nums. 1 and 2; reprinted in Pincione, G. and Spector, H. (eds.), Rigths, Equality and liberty, Dordecht, Kluwer, 2000.
794
HORACIO SPECTOR
tively, if the rights holders’ interests only have agent-relative value (i. e., they only provide reasons for the right holder), the theory cannot explain how those benefits or interests can justify holding someone else under a duty. In both variants (agent-neutral or agent-relative value), rights could not block (in a principled way) interferences intended to advance more successfully the right holder’s interests. For instance, if the right to reject medical treatment were based on the patients’ interests, it might be possible to justify the imposition of a blood transfusion on a Jehovah’s Witness. I believe that an illuminating theory of rights should take into consideration the changing paradigms in which the notion of rights is embedded. It seems obvious that while the Will Theory tries to capture the classical features of rights, the Interest Theory seeks to accommodate the widely different kinds of rights that modern legal systems recognize and their different underlying justifications. Therefore, it may be impossible to provide an analysis of rights that does full justice to the various and changing ideas with which the concept of rights was associated at different points of its historical evolution. A partial success may be the most we can aspire to. Conceptual analysis is very often criticized by its lack of historical awareness. Though I am not in general sympathetic to this kind of criticisms, usually linked to an anti-intellectual bent, I do believe that the analysis of rights can enrich itself by paying more attention to the facts that I have outlined. III If we are confronted with the need to opt for one theory, I think that the Will Theory carries the day. Consciously or unconsciously, Hart dropped from the explicit formulation of the theory any reference to its underlying autonomy-based justification. We should celebrate this because, as I suggested, legal rigths are embedded in different normative paradigms. For instance, we cannot assume that the justification of modern welfare rights matches the justification of classical rights in private law. Unlike the Interest Theory, the Will Theory is neutral with respect to justificatory matters and, therefore, is in a better position to account for different kinds of legal rights. So what are the obstacles that stand in the way of embracing the Will Theory? As I said above, Gopal tries to rebut the Will Theory by means
COMMENT TO “A HYBRID THEORY OF CLAIM-RIGHTS”
795
of the strength difficulty. He claims that typical inalienable rights, like the right not to be enslaved, are stronger than alienable rights because of the disability such rights incorporate. This conclusion seems to contradict the Will Theory. Since this theory equates rights with powers, a right comprising fewer powers —so the argument goes— must be weaker than a right including all the relevant powers. In my opinion, the argument from the strength difficulty relies on a controversial assumption. It is true that inalienable rights are typically stronger than alienable rights. However, the explanation of this fact need not lie in the disability, as the argument assumes. Classical inalienable rights, like the right to freedom, are “stronger” than alienable rights not because of the disability, but because of the weight of the duties that correlate with them and the importance of the value that such duties secure. Even if the holder of an inalienable right has lesser power to control the correlative duty than the holder of an alienable right, the greater weight of the former right might simply mirror the greater weight of the correlative duty. This is clear in the case of the right not be enslaved. In effect, enslaving a person destroys her status as an autonomous agent, regardless of whether she voluntarily consented to become a slave. On the classical Kantian view of rights, the inalienability of the right to freedom is in accord with the autonomy of the will. Thus, the second formulation of the Categorical Imperative forbids us to treat not only the humanity in others but also the humanity in ourselves as only a means. Consenting to become a slave is a direct violation of this prohibition. Classical inalienable rights are stronger than ordinary rights not because but despite of the disability they include. As soon as we dismiss the strength difficulty, inalienability poses no serious problem to the Will Theory. It can handle inalienability because holders of inalienable rights have residual control of the correlative duties. We can reinforce this conclusion by noticing that Hart’s enumeration of the powers associated with rights leaves aside an essential ingredient illuminated by Feinberg. When we say that Y has a claim-right against X that X F we imply that Y is in a position to make a valid claim that X should F and to make a complaint if his claim is not satisfied.
796
HORACIO SPECTOR
IV Even if my treatment of the strength difficulty were unsuccessful, Gopal should still prove that the Hybrid models can handle this difficulty more successfully than the Will Theory. This is far from obvious. Gopal says that the disability of inalienable rights is typically seen as strengthening those rights. The hybrid models fail to explain this fact (if it is fact). Why should rights become stronger when the second disjunct of the Simple Hybrid model is true (and weaker when the first disjunct applies)? I can see no reason for this asymmetry. Nor does the Complex Hybrid model explains why inalienable rights are stronger than alienable rights (notice that Gopal could not explain the difference in terms of the importance of the interests or values that the rights protect. This would bring us back to my analysis of strength as weight, which solves the strength difficulty). To show that the Hybrid models are superior to the Will Theory, Gopal should also prove that such models are immune to the difficulty that threatens the Interest Theory (and to which the Will Theory is not subject). Thus, he argues that the Hybrid models avoid disregarding the status of individuals as rights holders (i. e., the problem of instrumentalization). This is not clear to me. On the one hand, according to the Complex Model, the question of whether the right holder is vested with a measure of control of the correlative duty must be settled by considering the balance of his interests. Therefore, the attribution of rights under that model is compatible with illiberal paternalistic interferences. For instance, if the State of Sonora passed a law abrogating the powers of citizens to protect their liberty to smoke, it could well claim that the law respects citizens’ rights because it is justified on the balance of each citizen’s interests. Gopal could reply that the duty to respect citizens’ liberty to smoke is justified on independent grounds. But the paradox remains that the Complex Hybrid model does not allow citizens to invoke the most natural defense they have in this case, namely, that the law violates their right to smoke. On the other hand, individual autonomy is the most natural justification of the legal powers on which the Will Interest focuses. The Complex Hybrid model excludes a Kantian justification of those powers and, therefore, fails to do justice to their traditional anchorage in the value of individual autonomy. Accordingly, the instrumentalization problem could reappear under a different shape. The balance of interests that justifies
COMMENT TO “A HYBRID THEORY OF CLAIM-RIGHTS”
797
powers might be traded off against the interests of other people, or of society at large. It is true that the model restricts trades offs to the right holder’s balance of interests, but this restriction seems arbitrary. The Complex Hybrid model suggests that the attribution of legal powers to individuals must be grounded on their interests. Once this is admitted, it is difficult to stop the sliding into the utilitarian calculus. For example, the arrest of certain individuals (e. g., Arabs) could be justified if it is needed to preserve public tranquility. (Notice that constitutional guarantees are best conceived as Hohfeldian powers). V Gopal also suggests that admitting claim-rights under the criminal law runs afoul of the Will Theory. I disagree. In fact, right holders do have the full measure of control under the criminal law because they can waive criminal prohibitions, just as they can waive private law prohibitions. For instance, if Alice waives her ownership right over her piano (and no one else claims it), Martin’s taking control of it cannot constitute robbery. What rights holders cannot typically do under the criminal law is to cancel the offender’s liability to punishment, because criminal prosecution is a public matter. In contrast, rights holders can waive the obligation to compensate under private law. But this difference does not affect the Will Theory, for it does not pick out the power to cancel criminal liability once the offence has been performed. True, in some cases, like murder and assault, rights holders cannot even waive criminal prohibitions. This is probably the thrust of the claim that there are no claim rights under the criminal law. However, the inalienability of those rights is not necessarily connected to their criminal law protection. Individuals lack the power to waive their rights against murder and assault even under private law. These are unlawful acts even though the victims (or their heirs) have the power to waive the duty to compensate. I concede, however, that the holders of inalienable rights have narrower residual powers under criminal law. This is not a serious difficulty for the Will Theory. The Hybrid models also imply that there are fewer rights in the criminal law, because the standard argument for denying victims the power to cancel the offender’s liability to punishment relies on the public interest, rather than on the victim’s balance of interests.
!
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION: THE BASICS Martin STONE* SUMMARY: I. Introductory. II. The Skeptical Argument. III. “Theory”. IV. “Interpretive Communities”. V. Spectators and Agents, Theory and Practice. VI. Practice, or the View from Straight-on.
I. INTRODUCTORY Throughout his work, whatever the topic, Stanley Fish is preoccupied with a question concerning the basis of our entitlement, in various domains of discourse, to the notions of correctness and objectivity in judgment. Literary criticism and legal analysis supply his main examples. In virtue of what, he often asks, is one reading of a literary text or one application of a legal rule correct, and not another? This question is already present (though outside the main focus) in Surprised by Sin, with its perception of Milton as a writer concerned with severe disagreements: cases where someone’s access to how things are, or to what is a reason for what, appears to depend on their acceptance of a premise which is un-demonstrable (since the compellingness of any demonstration seems to depend on it).1 Next, Self-Consuming Artifacts argues for the role the reader in determining the meaning of a literary text–and this in something more than the trivial sense that insofar as there are works of literature there must be readers of them. (The idea, rather, is that something about the reader or her situation explains why a literary text means what it does). This view gets articulated in Is There a * Cardozo Law School, Yeshiva University, USA. 1 See also Fish, The Trouble with Principle, Cambridge, Harvard University Press, 1999, pp. 243-248, 263-270. 799
800
MARTIN STONE
Text in this Class as a kind of “conventionalism”, according to which communal accreditation determines what counts as correct in judgments about literary texts. And this thesis is extended to other subjects (especially law) in Doing what Comes Naturally, where Fish portrays a number of otherwise diverse theorists (Unger, Dworkin, Hart, Posner) as seeking —often against their own declared intentions— an Archimedean standpoint for judgment. Doubting the availability of such a standpoint, Fish proposes s a “pragmatic” alternative in which the notions of interpretation and community again help to secure the notion that a text sometimes means one thing rather than another.2 In this essay, I sketch the main argument running through these works, address a few misunderstandings, and indicate, somewhat programmatically, how the argument deserves to be criticized.3 The grounds for my criticism are not exactly foreign to Fish’s work. In fact, my main premise might be described as “the priority of the practical point of view”, something Fish himself seems to favor in his criticism of the theorists mentioned above. Thus, my hope is that Fish will be able to see my criticism as a friendly one: as clarifying and extending a valuable line of his thought, notwithstanding that the theory to be exorcized, in this case, is his own. Otherwise put, my criticism finds a conflict within Fish’s work; and the part of a friend, in such a case, is naturally to be an ally —giving reinforcement or resolution— to the better side.
2 More recent work by Fish extends these themes by proposing that we see “Liberalism” (as he writes it) as presenting a political analogy to the suspect forms of theory depicted earlier. See, e. g., The Trouble with Principle. This proposal is off the main line of my discussion. 3 The following remarks stem from seminar I taught in Spring 1998 in Duke’s Program in Literature; they retain here the style and sound of their pedagogical origin. My focus is only on the main nerve of Fish’s argument. A broader treatment can be found in my contribution to John Gibson and Wolfgang Huemer, Literature after Wittgenstein (forthcoming, Routledge). Related issues are also touched on in my “Wittgenstein on Deconstruction”, in Crary, Alice and Read, Rupert (eds.), The New Wittgenstein, London, Routledge Press, 2000; and my “Focusing the Law: What Legal Interpretation is Not”, in Marmor, Andrei (ed.), Law and Interpretation: Essays in Legal Philosophy, Oxford, Oxford University Press, 1995.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
801
II. THE SKEPTICAL ARGUMENT To start things off, we might remember that Milton writes in an historical moment of crises having the form of a perceived gap between the desire for a just order of society and historical experience, or between moral value and social fact–a gap figured by Milton as the relation between God and man.4 The project of Paradise Lost —“to justifie the ways of God to men”— is motivated by a sense of the apparent failure of God, and hence implies the need for human speech and judgment to bring moral intelligibility to historical experience. Thus, what attracts Fish to Milton is that Milton treats poetry’s religious theme as a secular, not a religious poet. That is, unlike his predecessors in this theme, Milton’s focus is not the difficulties man encounters in keeping to the demands of God, but the potentially false surmise–the idolatry, as it were–involved in talk of the specific content of divine imperatives.5 Two ideas may be extracted from this general picture of Milton—ideas, which structure a great deal of Fish’s subsequent work: (1) the idea of correct judgment or right social order as that judgment or order which is in accord with God’s will; and (2) the idea that what makes a particular judgment one that accords with (keeps faith with) God’s will is itself a question which calls for human judgment. The first of these ideas expresses what a “judgment” is for the human being laboring in history, a creature capable of departing–through responsible exercises of his conceptual capacities—from the divine will. The second idea might be thought of as a form of “antinomianism.” Putting these together, we have the thought: Although correct judgment is 4 See Allen Grossman, “Milton’s Sonnet, “On the Late Massacre in Piemont’: The Vulnerability of Persons in a Revolutionary Situation”, The Long Schoolroom: Lessons in the Bitter Logic of the Poetic Principle, Ann Arbor, University of Michigan Press, 1997. On the general connection between Fish’s reading of Paradise Lost and his later interest in “interpretation”, see the Preface to the second edition of his Surprised by Sin, Cambridge, Harvard University Press, 1997. 5 The idea of idolatry —the false representation of divinity— provides the point of intimacy, which Fish later explores, between Milton and the politics of Roberto Unger. See “Unger and Milton”, in Fish, Doing What Comes Naturally: Change, Rhetoric, and the Practice of Theory in Literary and Legal Studies, Durham, Duke University Press, 1989, esp. pp. 403-412.
802
MARTIN STONE
judgment in accord with God’s will, there is no means of externally validating (i. e., from a point external to our judgments) whether one has got things right. In Fish’s words: “The doctrine of the inner light marks out the area of interpretive labour; the doctrine of the single Truth names the goal of that labour, but withholds explicit directions for attaining it”.6 In saying that a thought along these lines structures Fish’s work, what is meant is that Fish is concerned to respond to a certain felt difficulty with this thought. The difficulty is characteristic of modern philosophy. People are apt to feel that, in the absence of “directions” for certifying disputed judgments as correct, the very idea of correctness in judgment —of their being something to “get right”— must come under threat. The difficulty arises on the assumption that our entitlement to regard one of two conflicting judgments as “objectively correct” requires that there be some means of demonstrating its correctness through premises which do not presuppose either of the positions in question. It appears questionable, to say the least, whether this requirement can be satisfied in such contest-laden domains as law or literary criticism, where judgment nonetheless has objective purport. So someone working in these domains might come to feel the pinch of the present difficulty. And they might then naturally move in one of two opposing intellectual directions: (a) They might attempt to vindicate the objectivizing view of discursive participants by supplying a theory of what makes judgments in the relevant domain correct. That is, they might construct a theory of validity for the discourse in question (or, if we call different judgments —e. g., about literature or law— different “interpretations”, then we may speak here of a theory of validity in interpretation). (b) Alternatively, they might come to deny that talk of correctness has the substance which discursive participants are inclined to credit it with. In its extreme versions, this view says that we are not really entitled to talk about “getting things right”, only about what people take to be right. This means that engaged participants are prone to an illusion of some kind. For they take their judgments to be not merely their way of “taking” things, they take them–this defines the participant perspective–to be true; whereas according to the theorist, such claims need to be accounted for
6
Fish, Surprised by Sin, cit., p. XLIV.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
803
in other terms, e. g., as ideology or the rhetorical camouflage of power, and so on. Since (b) evidently expresses a form of skepticism, it is tempting to think of those embracing (a) as anti-skeptics. This is right in one way, but misleading in another. It accurately records the way (a) and (b) are interlocked voices in a single argument, as well as the intellectual derivativeness of (a): proponents of (a) are often defending certain commonplaces of the practice against the threat of skepticism. However, in a somewhat broader sense, one might regard both positions as “skeptical” ones. That is, “skepticism” might be taken to refer not just to arguments which deny that correctness in judgment is possible, but also to attempts to refute those arguments. Why speak this way? The point is to mark an alternative point of view from which (a) and (b) look intellectually intimate with each another; from which it appears that what these views share in common is larger than the point over which they disagree. What these views share in common is the premise: (P) Our entitlement to see one of two conflicting judgments as objectively correct requires some means, independent of those judgements, for validating one or another of them as correct. The intimacy between positions (a) and (b) is that neither so much as sees a question to be asked about (P). That is, for each of them (P) is invisible as a premise. Thus, each position takes itself to be the only alternative to the other. Where in this landscape does Fish belong? The answer is: Fish wishes to reject both (a) and (b). So he is essentially an anti-skeptic in the broad sense of the term. “Various characterizations of me as a skeptic–as someone who disbelieves in truth or relatives value... or is unconfident in his judgments, follow from the confusion between a very limited denial of a universal mechanism of validation and the denial, which I do not and never would make, of just about everything”7–of just about everything (I take this to say) about which people judge and, often enough, agree. As this makes clear, Fish’s intended target is not the possibility of true or confident judgment just as such, but only what he regards as one mistaken defense of this possibility–one which seeks a “universal mechanis”. Fish sometimes calls the mistaken defense a “foundationalist” 7
p. 65.
Fish, “A Reply to My Critics”, The Responsive Community, vol. 12, 2002, núm. 3,
804
MARTIN STONE
one. His continuous theme is that the options described by (a) and (b) —the Scylla of foundationalism and the Charybdis of skepticism, as it were— are not exhaustive; and that we can locate another possibility if we allow ourselves to question (P), the premise which the skeptic and her traditional opponent share in common. Now it should be noted that “questioning (P)” evidently means for Fish: constructing an alternative explanation of the basis of our entitlement to the notion of correctness in judgment. (This means giving an alternative account, as we shall see, of how there could sometimes be “plain meanings”–obvious cases which no one disputes).8 But I shall suggest below that this misses a more radical possibility (§§5 and 6). One doesn’t need to read Milton, of course, in order to feel that (P) is not an innocuous premise. Indeed, one might see (Fish’s) Milton’s central thought–that we endeavor to judge the “single Truth” without anything standing surety for our judgments–as a variation on a point of Aristotle’s: namely, that the practically wise person doesn’t have a recipe (or a set of deductively applicable instructions) for living well, but rather is able to see the significance of the details of practical situations in light of a correct grasp of the relevant ethical concepts. Aristotle’s remarks trace a circle that never leaves the domain of ethical thinking. For if we ask, “what makes a grasp of the relevant ethical concepts a correct one”, Aristotle is apt merely to refer us to the judgments of the practically wise person, just where a more modern (and in the broad sense, skeptical) line of thought would expect to find an attempt at external validation.9 At this point, someone might wish to object, however: Surely Fish is a skeptic. Doesn’t he everywhere say that every judgment is contestable and that there may be no means, independent of the dispute, for settling the matter; that what will count as evidence in favor or one or another judgment, for example, may itself be a function of the position one holds? What is this if not a skeptical challenge to our notion that some judgments are objectively correct?
This is a misunderstanding of Fish’s aim, though it may not be one —I’m inclined to think— of his achievement. As I will later explain, 8 9
Cfr. Fish, “Force”, Doing What Comes Naturally, cit., footnote 5, esp. p. 513. See McDowell, John, “Some Issues in Aristotle’s Moral Psychology”, Mind, Value, and Reality, Cambridge, Harvard University Press, 1998.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
805
there are genuine difficulties in Fish’s argument, difficulties which understandably lead his readers to take him for a skeptic (§5). (Thus disclaimers like the one quoted above need to be continuously re-issued.) This recurrent mistake on the part of Fish’s readers needs a more careful account, however. For the present objection merely records the fact that Fish does indeed set his face against attempts to defend “objective correctness” along the lines of (a). The objection thus testifies to the tenacious hold of premise (P). For if one unquestioningly accepts (P), then one is bound to hear Fish’s opposition to (a) as incurring a commitment to the skepticism of (b). This misses the general alternative Fish has in mind: The failure of foundationalism, rather than affording a reason for embracing skepticism, should, given the practical intolerability of the skeptic’s position, provide a reason for questioning (P), the premise which makes it appear as if these were the only options. III. “THEORY” Fish sometimes calls (a) “theory hope” and (b) “theory fear”. (What I call (P) therefore exhibits the common genus). These labels imply that someone questioning (P) is seeking freedom from a way of thinking which makes having a “theory” a prerequisite to our entitlement to take up the participant or objectivizing point of view. That of course is how Fish often presents himself: as being against “theory” in some sense of the word.10 This way of talking won’t do any harm if one bears in mind what “theory” stands for–the requirement expressed by (P). Yet it is not especially perspicuous either, if only because the word “theory” is so beloved by academics today as to be almost devoid of significant contrast: it comes to appear that to think or reason about anything at all is to “theorize.”11 (The causes of this emptiness are, I think, significant: it expresses difficulties we have with the thought that certain forms of reasoning are distinctively “practical”: see below). Here the following points ought to be kept in view. First, “theory/practice” is not to be construed as a contrast between what we should ordinarily call “doing something” on the one hand, and 10 See, e. g., “Consequences” and “Dennis Martinez and the Uses of Theory”, both in Doing What Comes Naturally, cit., footnote 5. 11 Cfr. “Dennis Martinez”, Doing What Comes Naturally, cit., footnote 5, p. 378.
806
MARTIN STONE
reasoning or reflecting, even very abstractly, on the other. Fish’s anti-theoreticism is not the view —which might describe certain spiritual exercises like Zen or Pyrrhonism12— that it is useless to reason or ponder. It is true that in some activities–playing basketball, for example–one’s performance is apt to be hindered if one reflects on what one is doing while doing it. This shows up in forms of training: one learns basketball by playing it, not (as one first learns, say, law) by studying it. Nonetheless, this is simply a special feature of certain activities, related to the kinds of performances and skills they require. (For this reason, Fish’s use of the game of baseball as an analogy for legal “practice” is as obscuring as it is clarifying).13 In the case of other activities —legal argumentation, for example— to perform successfully to is to reason at a high level of abstraction; it is to advance, as lawyers say, a “legal theory.” Being a plumber is perhaps an intermediate case, somewhere between basketball and law. Much of what a competent plumber does he could do “in his sleep”. Yet a competent plumber ought also to be capable, when the occasion demands, of posing alternative hypotheses about the source of a problem and considering different ways of proceeding. (The best course may not be the one that “comes naturally” or prior to deliberation.) The general point here is two-fold: first, it does not make sense to contrast doing something and reasoning or reflecting in general; second, where such a contrast can be drawn (e. g., in describing two aspects of the plumber’s job), the contrast will clearly be seen to be beside Fish’s point. Why should premise (P) be associated with a kind of “theoreticism”? The idea calls for a contrast, as I have hinted, not between doing something (“practice”) and reasoning about it (“theory”), but between two forms of reasoning–namely, theoretical and practical. Consider a judge who endeavors to apply a legal rule, say one requiring good faith in one’s dealings with others. The judge must think about what this concept requires; he must determine what, in particular cases, 12 Or perhaps the experience of clinical depression–though it seems more accurate to say that depression is more often the feeling that it is useless to act (Hamlet). 13 See “Dennis Martinez”, Doing What Comes Naturally, cit., footnote 5, Part of what makes sports both important and pleasurable is that the meaning (and other effects) of action are completely tractable within the game. Related to this is the fact that the point or goal of action is in general completely perspicuous–to win. Most everyday activities are not like this, and the law is a far cry away.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
807
would be in accord with the rule. Now we might wish to call this movement from the abstract to the concrete “practical” reasoning because it involves capacities of thought which are distinct from drawing logical inferences and from thinking about what will lead to what.14 This will be true if, as here, the rule in question cannot be expected to function as part of a premise from which, given the facts, one could simply deduce the desired conclusion. Of course, there may be room for explanations of “good faith dealing”—explanations which might even be called (in an anodyne sense) a “theory” of it. But it may also be that correctly to grasp the concept of “good faith”— or some concept used to explain it—just is, in part, to be able to see that this and not that is required in circumstances like these. Applications of theoretical rationality cannot in general tell one what it is to get things right in such applicative judgments, or how to recognize particular acts or circumstances as instances of general classifications. Nor can correct judgment be generally explained by means of rules for making those judgments, for then we should need rules for correctly applying those rules, and so on, in a hopeless regress.15 Now suppose that a dispute breaks out about what the rule requires. Premise P says we are not entitled to think of either view as being genuinely “correct” unless we have a validating argument from the outside. Applied quite generally (i. e., not just to “good faith” but to every concept which can be used to explain it), this can only be a demand that “correct” judgment be made deductively accessible: the correct resolution of the issue would be expressible as the conclusion of an argument which would be compelling to anyone who can draw logical inferences and recognize what the facts are.16 (If someone still persisted in not “get14 Reasoning about what will lead to what often comes into reasoning about what to do in a particular situation. But it is not distinctly practical in the present sense. 15 This was noticed by Kant. See Critique of Pure Reason, trans. Norman Kemp Smith, New York, St. Martin’s Press, 1929, A133/B172; and Kant, “On the Common Saying: ‘This May be True in Theory, but it does not Apply in Practice’” in Kant, Political Writings, Reiss, Han (ed.), Cambridge, Cambridge University Press, 1970. The point also arises in Wittgenstein’s discussion of “accord with a rule” in Wittgenstein, L., Philosophical Investigations, trans. Anscombe, G. E. M., Oxford, Blackwell, 1958, §§138-202. 16 I develop this idea in the context of debates in legal theory in my “Legal Formalism: The Task of Judgment,” in Coleman, Jules and Shapiro, Scott (eds.), Oxford Handbook of Jurisprudence and Legal Philosophy, Oxford, Oxford University Press, 2002.
808
MARTIN STONE
ting it,” they could be convicted of irrationality by established standards of theoretic rationality; so this would comprise a “universal mechanism”). To be “against theory”, in this context, is to allow that there may be useful explanations of “good faith”; but it is to reject the thought that no applicative judgment can be regarded as “objectively correct” without an explanation of this sort: one which makes judgment available in a way that, in principle, obviates the need for practical discernment.17 IV. “INTERPRETIVE COMMUNITIES” The example of applying a legal rule brings out the fact that any account of how correct judgment is possible (and that is Fish’s general question) must explain also how it is that certain actions or events can be “in accord” with a rule, or indeed with any bit of intentionality. Meaning has a normative aspect: we could not speak about texts (or correct judgments about them) if we couldn’t make use of such notions as “accord”. Difficulties we get into over such normative notions are thus at the core of Fish’s argument. To illustrate, consider a simple statement describing how things are in the world, for example “There is a vehicle parked on Elm Street”. This sorts the world into states of affairs which are in accord with it and those which are not; it makes a demand, one may say, on how the world must be if the judgment is to be correct. A similar point applies to any item–e. g., a rule, judgment, wish, order, thought, expectation, belief, etcetera.–which carries meaning: generally speaking, meanings sort things out. 17
For purposes of simplicity, I am not questioning the thought that explanations which make judgment deductively available would obviate the need, in principle, for “practical discernment”. But the better view is that all judgments-even deductive ones-rely on something like the kind of discernment which is out in the open in cases of practical conflict. As John McDowell has argued, this may be taken as one of the lessons of Wittgenstein’s remarks on “accord with a rule”. (There is a similar point in Cavell, Stanley, The Claim of Reason, 2nd. ed., Cambridge, Harvard University Press, 1999. As McDowell suggests, this lesson should allay the temptation to think that judgment in hard cases (where the need for discernment is conspicuous) must suffer in its credentials of objectivity by comparison with a deductive case, conceived as a paradigm of objective judgment. For the lesson is that even the deductive case does not live up to the notional ideal of a discernment-free path to judgment which structures the invidious comparison. See McDowell, “Virtue and Reason”, Mind, Value and Reality, Cambridge, Harvard University Press, 1998.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
809
One important bit of the world which meanings sort-out is of course human linguistic behavior itself. For example, if someone grasps the meaning of the word “vehicle” then she is required, if she is to act “in accord” with what she has grasped, to reach certain determinate verdicts when the world presents her with circumstances which bring this concept into play. Naturally, there may be borderline cases–Is it still a “vehicle” even though it lacks a motor? Is it “on Elm” when it is abutting the corner–but insofar as these words can be used to communicate anything at all, there must also be plain cases, cases in which no classificatory hesitation arises. This commonplace idea–viz., that meaning has a normative bearing on linguistic performances–is related to other commonplaces concerning truth and objectivity, for example, that the world can be such as to make it correct or incorrect to say certain things about it. The very idea of “something which can correctly be said about the world” presupposes that there is a normative pattern in our use of words, a pattern that a particular use can (or can fail) to keep faith with. If that weren’t the case, then anything could be said about anything—so nothing could be said at all. The upshot is that should we begin to loose our grip on normative notions like “accord,” then our notions of meaning, objectivity and truth will come under threat as well. And this is just what is happening in the skeptical currents in which Fish is swimming. Keeping a grip on the notion of “accord” (or related normative notions: “misuse”, “misunderstanding”, “misapplication”, etcetera) turns out to be a difficult thing to do. For there is a tempting line of thought which seems precisely to unhinge us here. And this line of thought provides the right context in which to understand the general work which Fish sees “interpretive communities” as doing. The unhinging line of thought begins with the notion of a “sign” or a “text”. A sign or a text is anything which carries linguistic meaning.18 Thus, the first line of Milton’s Paradise Lost–“Of Mans First Disobedience...”—comprises a sign or text, as does also a road sign pointing out the direction in which one is to go (———>). It will be useful to take 18 “Non-natural meaning” would be more precise. See Paul Grice, “Meaning”, The Philosophical Review, num. 64, 1957, pp. 377-388. The idea, at any rate, is just to focus on the concept of meaning at stake when one says, e. g., “That is not what the text means”, as opposed to e. g., “These tracks mean that a lion was here”.
810
MARTIN STONE
the latter as our example because it makes immediately perspicuous that a sign carrying meaning sorts behavior into that which accords with it and that which does not. (This, in fact, is the chief difference between signs carrying meaning and mere doodles or noises: signs are “alive” in that they have such normative reach. But this is also the thought on which we seem, under theoretical pressure, to loose our grip). Before proceeding, two comments may help to set things up more clearly. First, concerning exemplification. Fish initially introduced the notion of “interpretive community” to address a set of questions arising within literary studies: e. g., the relevance of authorial intentions, the distinctive “literariness” (if there be any) of literary texts, the semantic multiplicity or univocity of such texts, the reasons for interpretive disagreement, the status of appeals to the “text itself” in resolving disagreement, the possible innovativeness of literary interpretation, and so on. Our board (———>) would be a poor example for discussing such issues.19 But it becomes clear, in the evolution of Fish’s work (§1), that insofar as literary texts always require interpretation, they are to be regarded as merely exemplary of how it is with discourse in general: “Communications of every kind are characterized by exactly the same conditions–the necessity of interpretive work... and the construction by acts of interpretation”.20 I find this development disappointing because, for reasons which will appear, I think the necessity of interpretation could only have been plausible as a restricted thesis about the meaning of literary texts. (In this role–as opposed to the perfectly general role Fish gives it–the necessity of interpretation might also have told us something genuinely informative about “literature”, or about the nature of our interest in it).21 In any case, given the generality of Fish’s thesis, a basic example (———>) is just what is wanted for discussing it; the more basic the better. 19 20
At least without some further details. Fish, “With the Compliments of the Author: Reflections on Austin and Derrida”, Doing What Comes Naturally, cit., footnote 5, pp. 43 and 44. 21 The implications of the idea that the interpretability of literary works is a function of the kind of interest we take in (what we call) “literature” are developed in my contribution to Wittgenstein after Literature, note 3 above. The idea is not completely foreign to Fish–see e. g., “Fish vs. Fiss,”, Doing What Comes Naturally, footnote 5, p. 137 (contrasting literature and law) —but it never leads him to question the generality of the interpretivist thesis. To the contrary, such differences as may appear between literature and law are, for him–given that thesis— to be considered as effects of interpretive activity.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
811
Second, concerning skepticism. The line of thought to be considered may be called “skeptical”, though it doesn’t aim towards a skeptical conclusion. It does not aim to deny, for example, that it is sometimes perfectly plain what road signs or other texts mean. The question is merely how such “plainness” is possible. What Fish (and others today) wish to deny is not that there are perfectly plain meanings (that would make them not just skeptical but mad),22 but only a purportedly suspect conception–naive or metaphysical–of such phenomena or of their conditions of possibility. Provisionally, we may say that on the suspect conception, a case of plain meaning is apt to be considered “inherently plain, plain in and of itself” or plain as a simple fact-of-the-matter.23 Briefly, then, the “skeptical” line of thought unfolds like this:24 1. Considered just “in and of itself” (say, as an inscribed piece of wood), the sign (——>) does not determine what is in accord with it and what is not; it does not determine, say, whether one is to go in the direction of the arrow or in the opposite one. (This is true of any text: just in itself, it is dead matter, powerless to determine its own meaning or how we are to understand it; powerless, as Fish sometimes likes to say, to “execute” its own meaning). 2. To animate the sign into meaning something —i. e., to get the normative notion of “accord,” and hence of “meaning” into play— we need to consider the sign not “in itself” but under some interpretation that has been put on it. That is: we need to interpret it–e.g., as a road sign saying that one is to go in a certain direction. Signs mean what they do only by way of some interpretation. 3. This seems clear enough. But is it? If a sign or text cannot “in itself” determine what accords with it, how does it manage to do so when 22 See e. g., “Force”, Doing What Comes Naturally, cit., footnote 5, p. 513: “The question is not whether there are in fact plain cases–there surely are–but, rather, of what is their plainness a condition and a property”; see also “Working on the Chain Gang”, Doing What Comes Naturally, cit., footnote 5, p. 101. 23 Fish, “Force”, Doing What Comes Naturally, cit., footnote 5, p. 513. I say that Fish’s formula is “provisional” (for us) because its sense is part of what needs to be investigated here. In the end, I think there should be no problem saying that some cases are “inherently plain”; that could strike us as just a bit of practical commonsense. See §§5 and 6 below. 24 The dialectic sketched here retraces a few passages in my “Wittgenstein on Deconstruction,” in The New Wittgenstein, cit., footnote 3. It is under investigation in Wittgenstein’s discussion of the concepts of meaning and understanding.
812
MARTIN STONE
considered under an interpretation? In fact, it looks like there’s a problem here. 4. Suppose that an “interpretation” involves some further sign or text. For example, one might “interpret” the sign (———>) by using the spoken words “this way,” accompanied by a pointing gesture. Surely, the original sign is now alive with meaning, no? Well, no. For according to step (1), this new text cannot “in itself” determine how it is to be followed. It too seems dead–a bit of sound and fury. It seems that if the interpretation (“this way”) is really to animate our original sign into meaning something, we shall first need an interpretation of this interpretation, and so on. A hopeless regress–not to mention an hysteria of gesticulation (“this way, I mean THIS way”)—looms before us. 5. We had better back-up. Why did we think–in step (2)–that an interpretation could help bring “meaning” into the picture? The answer seems clear. There was a doubt about how the sign was to followed, and we know that “interpretations” do sometimes successfully function to remove or avert such doubts. “Interpretations” in a familiar, sense are a kind of explanation: they come into play when the meaning of a text isn’t fully clear.25 Thus, it was hoped that we could get “meaning” into our picture by making a quite general use of this familiar function of interpretation. But it appears now that the notion of “interpretation” is unsuited for this general role. Rather than animating our original sign, the requirement of interpretation seems only to redouble the problem of its impotence. 6. But wait, someone will say. When we put someone pointing and saying “this way” into the picture, we didn’t just introduce another inert block of wood, or even (comically) any number of inert items, each one standing behind the next; nor did we just introduce some noises, such as a person might make. Instead, we put a person into the picture, a living being. One wants to say: surely that makes a difference; surely meaning, in all its splendid animation, is somewhere at hand! The thought which is apt to occur now is that a person makes a difference, not as a potential source of sound and other commotion (many things are that), but as the locus of a mind. Thus, the demonstrative utterance “this way” introduces meaning 25 This seems to be true even of “performing interpretations” (e. g., Gould’s interpretation of the Goldberg Variations) which don’t at first look like explanations. Even here, however, the sense is that a performance helps to elucidate aspects of a work of art which would not otherwise be fully perspicuous.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
813
into the situation because it introduces someone who thinks or intends the sign in a certain way. Indeed, it seems that thought is really the essential thing here, for it might have occurred—and meaning might come into the picture—even without the giving of any further signs. The motive here is understandable enough: since further signs (texts or linguistic items) merely re-double the problem of the sign’s impotence, it becomes tempting to think that “interpretation” must refer to some essentially mental act of thinking the sign one way or another. What we need, the thought goes, is not another inert bit of nature, but a mind; not essentially interpretations (qua signs) but an interpreter, alive and present. 7. Alas, this solution can make us happy only for a moment. Suppose it is asked, “What does his thinking or intending the sign this way rather than that way consist in?” After all, if we can doubt what the original sign requires, it should be possible to raise a question about what he intends or what accords with his intention. There seem to be only two general possibilities. A) We might say that his intending the sign this way consists in his meaning that, or meaning that. Clearly, this answer goes nowhere: it merely re-uses the very notion–“meaning”–which “interpretation” was supposed to explain.26 B) We might try to identify something which went on “in his mind,” considered as a region of goings-on that is left over once we abstract from the world and all the (“in themselves” meaningless) items to be found in it. However, this option looks no less hopeless. For one thing, if someone always follows the sign in the direction of the arrow (or points out the mistake when other people don’t), then we shall say that he grasps its meaning no matter what actually goes on “in his mind.” In fact, the search for a meaning-creating item in his mind only returns our original problem. Lots of things might have occurred to him, some of which (like the pang of hunger or impatience he felt) seem irrelevant. 26 The point here is not that we can’t give analytic explanations of what “intending” or “meaning” something consists in; Grice and others do that. The point is that, given the dialectical set-up (one suggesting that meaning is in fact impossible), the kind of explanation we need here must be one that does not make use of any normative notions closely related meaning. Gricean and other analyses of “meaning” do not meet this requirement. This is the answer to a question that George Wilson asked me at a talk I gave at Johns Hopkins several years ago. I regret that I was only able to give a confusing answer at the time.
814
MARTIN STONE
But if anything occurs to him which does seem relevant (perhaps he thought “to the right” or perhaps he saw a picture of the traveler turning right in his mind’s eye), it is bound to disappoint us. For it is just one more discrete item which, like our original sign, can always be projected and applied in different ways. So it too stands in need of an interpretation. This result shouldn’t surprise us. For it amounts to what much 20th century philosophy has told us anyway: viz., that we can’t really make intelligible to ourselves how a thought occurring in someone’s mind–e. g. ”turn right”–can be such as to be any more determinate, or less in need of interpretation, than a text representing that thought. For we can’t really understand what it would be for there to be an item in the mind that had the requisite normative properties of meaning but that was not, from the get-go, subject to the conditions or requirements of representability (or communicability) in signs.27 Actually, there is a third possibility for attempting to answer the question “what does his thinking or intending the sign... Consist in?” We might try to identify something that goes on “in his mind,” considered not as a region apart the world, but as something that includes a lot of happenings there, for example what other people say and do. Fish’s idea of an “interpretive community”—or of a subject whose mental life is what it is only “by virtue of his membership in a community of interpretation”28— is a version of this idea. I shall postpone commenting on it because my endeavor is first to get into a position to describe its appeal more fully. 8. Someone might throw up their hands at this point and say something like this: “Clearly, an interpretation is needed to get meaning into this picture. But the idea of “interpretation” needed is just that of a very unique and remarkable spiritual power to make signs mean this rather than that–somewhat like the power to give life to dead matter. ‘The Mind’ is that unique kind of thing which has such remarkable powers. “To interpret” is mentally to present oneself with a Meaning. And Meanings sort things out in a way that is —we know (today) not how— immune to any further interpretation”.
27 Of course, there is more to say on this point. It must suffice here to note that it is common ground between both Wittgenstein and Derrida, different as they are. 28 “Why No One’s Afraid of Iser”, Doing What Comes Naturally, cit. footnote 5, p. 83.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
815
This response is not just a re-use of the term “meaning” a la (6A). When it is seriously entertained, it purports to explain the meaning of signs through the mind’s grasp of entities called “Meanings”. Such a proposal–often dubbed “platonism” by its detractors–is sometimes thought to arise as a kind of self-standing conception at the beginning of philosophical inquiry into meaning; it is what the skeptic, in pointing to the indeterminacy of texts “in themselves” is supposed to be reacting against. But it should be clear at this point that “platonism” can just as well, or better, be given a different pedigree. It can be understood as a late (and des perate) product of a way of thinking which be gins with a skeptical thought, a thought which then creates a felt need to explain the general possibility of meaning because it latently suggests, contrary to everyday experience, that meaning is in fact impossible.29 9. A metaphysically occult idea of meaning does indeed seem to be forced upon us here. This is so because we are eventually led to see that in order for “interpretation” to function as a general condition of the possibility of meaning, there has got to be some last or final interpretation–i. e., an interpretation not in need of any further interpretation–which is what we call “the meaning”. In other words, our starting point commits us, after whatever twists and turns, to looking for some item which a meaning-endowing interpretation can consist in, but which, unlike ordinary linguistic signs, will function as a regress-stopper. It comes to seem that only a unique act of mind can do that. Of course, there still remains another bold option: bite the skeptical bullet and accept “the endless movement from sign to sign”.30 But the choice, within the present set-up, seems clear: either (1) indulge a platonistic mythology, allowing that there just are Meanings, remarkable normative entities channeled through a mind; or (2) accept rampant interpretivism, admitting that anything can be made to accord with any interpretation of a text (on some interpretation of that interpretation). 29 “Latently”: The point here is that this pedigree can be historically accurate even if the implications of the originating skeptical thought are not recognized until later on–even after the “platonistic” moment. John McDowell develops a similar idea in Mind and World, Cambridge, Harvard University Press, 1994; to which I’m indebted here. 30 This phrase is meant to echo Derrida in the context of a similar dialectic. e. See, g., Speech and Phenomena, David B. Allison, trans., Evanston, Northwestern University Press, 1973, pp. 103, 149; “Sign, Structure and Play”, Writing and Difference, Alan Bass, trans, Chicago, University of Chicago Press, p. 292.
816
MARTIN STONE
Which is to say, for some people today, the choice is clear: We should avoid mythology, and accept the ubiquity of interpretation. So much for the skeptical recital. It presents ubiquitous interpretation as the realistic or demystifying alternative to a suspect metaphysics of meaning. But doesn’t demystification here look unnervingly like decapitation? Hasn’t this line of thought in fact destroyed the very possibility (i. e., of plain meanings) which it was supposed merely to account for? If anything can be made to accord with a text (on some interpretation), it looks like we simply can’t talk about accord or conflict, and therefore can’t talk about meaning.31 Are we really to accept that on a clear-headed view of things, nothing really means anything; and that, could we but see to the bottom of things, we should see that our most everyday concourse with meaning (“Please come next weekend”) is unreal? It is just at this point that Fish wishes to make use of the notion of an “interpretive community.” That notion comes into play as an attempt to hang onto the idea that “to understand is to interpret” while avoiding the skeptical consequences that seem to come in the wake of this idea.32 According to Fish, the impression of skeptical consequences–the decapitating “denial of just about everything”33–arises only because we have not really disabused ourselves of a longing for a metaphysical ideal, by comparison with which the available notions of meaning and truth seem disappointing. To purge immodest hope, however, can be at once to allay unfounded fear. We can purge the longing by recognizing that there are no “interpretation-free” facts about meaning. But we can allay our fear by noting that in place of such facts, there is always something coming, for all practical purposes, close enough: a story to be told about our membership in communities of mutual recognition, about how we achieve good standing and credit in such communities, about the sanctions which attach to deviance, and so on. Essentially, Fish’s thought is that is that the source of norms relevant to meaning is the community itself: someone who does not behave (e. g., follow the sign) as the community does is in violation of one of its norms and may justifiably be said to “misunderstand” the relevant text. And given the mutu31 Cfr. Wittgenstein, Ludwig, Philosophical Investigations, trans. G. E. M. Anscombe, Oxford, Blackwell, §202. 32 The general possibility of such a move was indicated at the end of step (7) above. 33 Fish, “A Reply to My Critics”, The Responsive Community, vol. 12, num. 3, 2002, p. 65; quoted in §2 above.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
817
ally sustained communal framework, any dues-paying member will find the meaning of “——>” and many other signs to be plain as day: they will go right, naturally. So, in the end, the attack on “theory-hope” is not a destructive one—or it is destructive only of bits of philosophy (“texts which are clear in and of themselves”)34 which we have no need for anyway. Thus, we can come to love interpretation, not fear it. For it suffices to account for all the plainness and stability we could intelligibly ask for to see how meanings are–by a kind of groundless self-enactment of the community–socially constructed and maintained. V. SPECTATORS AND AGENTS, THEORY AND PRACTICE The foregoing dialectic elaborates two paradigmatic moments which appear in a typical Fish essay. The first moment invokes a notion of possibility: “it is always possible” for a text to mean something else, no matter what —or how richly specified— the context; every text (and context) is surrounded by a space of interpretive possibilities;35 it does not just by itself determine, etcetera...36 Anemic as the notion of possibility invoked here is–that a doubt is possible doesn’t mean anyone does doubt–this may seem alarming. At the second moment, however, we learn that we needn’t worry about the first moment. For after the interpreter is located within a community, we are supposed to have the materials we need to reconstruct such normative notions as are indispensable to our everyday talk of texts and their meanings. Indeed, it turns out that we not only needn’t worry, but needn’t even be interested, unless we are interested in theoretical questions. For, according to Fish, the reconstruction of “plain meaning” (as an effect of interpretation) would leave everything, practically speaking, as it was: “When you come to the end of the antiformalist road, what you will find waiting for you is formalism”.37 (“Anti-formalism,” as several Fish essays make clear, is another term for “rampant interpretivism”).38 34 35 36
“Force”, Doing What Comes Naturally, cit., footnote 5, p. 513. See, e. g., “With the Compliments of the Author”, Doing What Comes Naturally, p. 51. For examples of the appeal to notional “possibility”—or its cousin, the “absence of necessity”— see Doing What Comes Naturally, cit., footnote 5, pp. 296, 512; The Trouble with Principle, footnote 1, p. 271. 37 Trouble with Principle, p. 294 and 295. 38 See e. g., “Introduction: Going Down the Anti-Formalist Road”, Doing What Comes Naturally, cit., footnote 5, esp. pp. 4-6.
818
MARTIN STONE
Remarks like the preceding one–archetypal in their structure (they tell of a journey and a return, of something lost and regained)–deserve special comment. At such moments, Fish goes so far as to invite us to regard rampant interpretivism as just a transitional step–a self-consuming artifact, if you like–the effect of which is merely to remove some mistaken bits of philosophy, but without consequences for practice.39 On the other hand, Fish doesn’t think that his interpretivism is completely self-consuming; for he clearly thinks that it is to be endorsed, at the journey’s end, as the right view in place of the wrong one. This is evident from the way the foregoing passage continues: “...what you will find waiting for you is formalism; that is, you will find the meanings that are perspicuous for you, given your membership in what I have called an interpretive community” [my emphasis]. To anticipate what I will have to say about Fish’s view, it is worth noting an ambiguity here. Is “your interpretive community membership” within the intensional scope of “what you will find” at the end of the road, or is it merely the general pre-condition—itself unfound or unrecognized—of everything else you will find? The ambiguity isn’t surprising, ultimately, because neither option should sit well with Fish. If communal interpretivism is part of what you will find, in what sense have you come back to “formalism”? If, on the other hand, communal interpretivism is only the (unthought) pre-condition of what you will find, why should anyone accept it as true? How could they? The significance of these questions will become more apparent in a moment. For now it may be remarked simply that, at the last stop (or what he regards as the
39 Martha Nussbaum notices this structure in Fish and finds an analogy in the notions of “epoche”–suspension of commitment” and ataraxia–“freedom from disturbance” from Pyrrhonian skepticism. See “Skepticism about Practical Reason in Literature and the Law”, 107, Harvard Law Review, 714, 1994. This somewhat obscures the philosophical register in which Fish is operating. What Fish seeks to gain freedom from is not, as Nussbaum says, “all normative judgment” (Nussbaum, p. 726), but rather certain philosophical accounts of its possibility. A better analogy for Fish’s gesture of self-consumption would be the use of a similar self-conscious literary strategy in, e. g., the early Wittgenstein: “My propositions serve as elucidations in the following way: anyone who understands me eventually recognizes them as nonsensical... (He must, so to speak, throw away the ladder after he has climbed up it.)”. Tractatus Logico-Philosophicus, §6.54. On eludicatory nonsense, see James Conant, “The Method of the Tractatus”, From Frege to Wittgenstein: Perspectives on Early Analytic Philosophy, Reck, Erich (ed.), Oxford, Oxford University Press; Diamond, Cora, “Throwing Away the Ladder”, Realism and The Realistic Spirit, Cambridge, MIT Press, 1991.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
819
last), Fish is prepared to find not just practice unchanged, but practice regained through the right bit of theory. This is not place to examine every stop on this road. I limit myself to three observations. These observations will lead to the following conclusion. Fish’s interpretivism would be more satisfying if it were utterly self-consuming: something to be recognized, at the last stop (if not before), as complete nonsense. In this role–as a piece of transitional nonsense–the interest of interpretivism obviously could not be, as Fish thinks, that it shows us the truth about texts and their meaning: nonsense is nonsense. Rather, its interest would be that it shows us something about ourselves, namely (1) that we are sometimes prone to imagine that we are making sense when we aren’t, and (2) that this illusion is connected to our wish to say something philosophical, our wish, that is, for there to be a philosophical perspective on things. The recognition of ourselves as harboring this wish–hence as calling on words like “interpretation” outside the practical settings in which they have their significance–is the last stop. From such a recognition (of our wish to speak philosophically as one that would not be satisfied insofar as what we said made sense), there follows a loss of attraction to philosophical investigation–or not. In any case, my remarks here amount to friendly encouragement to Fish to take another step along the road and not chicken out. My reasons for so encouraging him will shortly become apparent. 1. To begin with, we need to see why the interpretive community story cannot provide a satisfactory account of meaning. Such a story is clearly aspiring to be a kind of down-to-earth pragmatism, as against metaphysically suspect conceptions of meaning. But it is really lacking in the perspicuity it would need to be that. Some of Fish’s commentators have drawn attention to problems in the definition of “community”–what constitutes the relevant community? can there be different but equally “right” answers for different communities?40 if so, can we really not intelligibly aspire to any more full-blooded objectivity than this?–but the problems I have mind here are much more basic: they arise no matter how the community is spliced. Notice how things appear from the first-person point of view, that of the agent engaged in hands-on transactions with meaning. The question 40 Cfr. Trouble with Principle, p. 295: “Of course, members of other communities will not see what you point to or will see something else, but that’s life”.
820
MARTIN STONE
is what the text means, not what other people think it means. For a judge, the question is what the rule requires not what other people (or other judges) think it requires. Of course, it is possible for a judge to ask himself what other judges think, but this is only because someone is asking the hands-on question—someone is having thoughts about what the rule requires. The hands-on question is a critical question, as we may call it, not a sociological one.41 Of course, all of us are, everyday, such hands-on agents. For, as indicated, there would be no sociological questions to ask about texts if there weren’t, in the first place, agent’s whose relation to them is the engaged or critical one. (The sociology of meaning, if there is one, concerns the thoughts of such agents.) In this sense, the agent perspective on meaning is primary: It is possible to think of a world in which people only ask the critical questions, but not a world in which the only questions about texts are sociological ones. Now this is not, just by itself, likely to be perceived as an objection by Fish. He is apt to say that the competent agent has internalized the community’s way of seeing things, and so has no need to consult anything but the “rule itself” as it appears within the relevant communal-interpretive framework. So the perspective of practical agency, Fish will say, is preserved in his story. But things are not that simple. We might ask: How does such a picture manage to be a picture of meaning (with its normativity intact) at all? For that a certain decision is required by a rule consists, according to this picture, in nothing more than the community agreeing that it is required. How does this differ from the picture of a community merely pretending to agree–or collectively sustaining the myth—that something is required by the rule?42 How, this is to ask, can an agent so much as “agree” that something —anything at all— is genuinely required by the rule, if he is not entitled to the view that the rule re41 This could be refined to accommodate the fact that in many legal systems, judicially correct judgment involves following precedent, even when prior decisions are “wrong” on the merits. In such cases, the critical question isn’t abandoned in favor of a question about what other judges think. Rather a higher-order norm is applied, namely the norm that precedent is binding; and the critical question is what precedent requires, not what other judges think it requires. Conventional rules–like “drive on the right” are also not an exception to the present point. It is true that the reasons for following such a rule depends on whether other people follow them. But this is different from saying that what the rule means depends on what other people think it means. 42 See McDowell, John, “Wittgenstein on Following a Rule”, Synthese, 1984 vol. 58, pp. 325-363 for a helpful exploration of these questions.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
821
quires this no matter what others might think? The most he can say, it would seem, is something about what the community thinks. But no one in the community is any better position. They, likewise, are not entitled to the view that the rule imposes a determinate requirement regardless of what anyone else might think. And since no one in the community is in a position to say anything stronger than something about what the community thinks, the perspective of agency vanishes here. (And of course, when this vanishes, there can also be no “communal way of seeing things,” internalized or not).43 Thinking about the primacy of the agent-perspective is instructive here. It means that what communal agents are being asked to agree to–the subject of their possible agreement–is, in the first place, what the rule requires, not what the community thinks it requires. The later is a possible question only because there are agents in the community who are not asking it, who have other things on their mind. But the problem, for Fish’s story, is to see what entitles any of community’s agents to represent (to themselves or to others) that the rule (e. g.) “no vehicles in the park” genuinely prohibits such-and-such events, once it is understood that whether one has gotten things right must ultimately be a question of what the community agrees the rule prohibits. All of this points to the same general conclusion. The ersatz notion of “correctness in judgment” provided by the interpretive community story can’t really sustain the notion of their being meaning (i. e., of there being agents subject to genuine normative requirements) once it is seen, that at the basic level, underneath talk of “what a rule requires,” there is nothing but mere convergent behavior—or (one might again say: §4) mere soundings-off. Fish’s account of meaning, someone might feel, is really 43 To put this another way, if talk about a “community framework” makes sense here, it records the fact that insofar as it is possible to speak at all, it must be possible to speak for others (“this is what we call a vehicle”) without having to consult them or do a bit of socio-linguistic research first. But talk of “internalizing” the community’s perspective doesn’t itself put us in a position to see how such “speaking for” is possible once we are obliged to suppose that whether, e. g., something really is a vehicle is just a matter of whether the community agrees it is one. To the contrary, it now looks positively irresponsible to speak for other community members without checking with them first. On the idea of “speaking-for” as inherent in speaking, and on the centrality of this idea to the procedures of “ordinary language philosophy” see Cavell, Stanley, The Claim of Reason, cit., footnote 17, ch. 1; and “Must We Mean What We Say”, Must We Mean What We Say, 2nd. ed., Cambridge, Cambridge University Press, 2002.
822
MARTIN STONE
no less skeptical than the skeptic’s account it is meant to combat. (As will become clear in a moment, it is also no less “theoretical” than the theoreticism it is meant to combat: §6). The objection advanced here is essentially that the interpretive community story does not make room for the attitudes towards meaning which agents must have if there is to so much as be an interpretive community—a community agreeing in its critical judgments–at all. For the story tells agents that in making such judgments–viz., that the rule requires such-and-such no matter what others might think–they are engaging a philosophical illusion. Given this structure, an understandable way of trying to defuse the objection would be to acoustically separate the judgments of practical agency from the deliverances of “theory”. Thus, it might be said that theory (i. e., the right story about the possibility of plain meanings and correctness in judgment) is one thing, and practice (i. e., the engaged concourse with texts and their meanings) is quite another. According to this rejoinder, an agent can judge (and represent to all the world) that the “no vehicle in the park” rule genuinely prohibits such-and-such events because, in making this judgment, she is acting (and seeing the world) in her capacity as agent, not as a detached theorist of meaning. She is playing the legal game, as Fish is apt to say, not the theory game. The motive here is obvious: Those who judge that such-and-such is required by a rule–required as a plain fact–had better not be those who also see, by means of the right theory, to the deeper level of things, at which it becomes apparent that such notional “requirements” and “facts” are only such by courtesy of interpretation. The theoretical truth about meaning, in other words, had better not get around. For it hardly seems clear how the attitudes agents must have in their practical concourse with meanings could be psychologically stable ones once it does. But is this separation plausible? What is supposed to stop the theoretical truth from getting around? One way of trying to stave off the possibility of reflective conflict would be simply cleaving everyone in two. Thus, it might be said: “Let the truth get around as it will. Still, at any moment, we are either having transactions with meaning qua practical agents or theorizing about it qua knowing-spectators; but these two parts of ourselves can never shake hands, for they may never be present at once.” Of course this looks desperate. Why can’t they be present at once? Simply because agents would be psychologically unstable in their atti-
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
823
tudes if they were? That is our point: It argues against a theoretical view which puts agents in the way of such conflict, not against the evident possibility of conflict on the grounds that practices and their agents are, after all, reflectively stable ones. However these problems are to be developed, we might note that it is surprising to see Fish appealing to the split-agent picture as much as he does. For this is precisely a picture of a self-standing realm of “theory”, laying bare the grounds of possibility of practice, yet somehow separated or detached from the judgments of practice. Isn’t this ground-giving just what Fish everywhere says is “impossible”, a hopeless attempt to look at oneself (qua agent) from sideways-on? (Evidently, Fish doesn’t see this, so I will address this question—and not just ask it rhetorically—in a moment). 2. The inadequacy of the interpretive community story about meaning would explain the matter I mentioned earlier: why Fish’s work is liable to give some readers the impression that it intends a kind of skepticism (§2). Fish’s argument depends on following a skeptical (interpretivist) progression of thought up to a certain point, and then heading off its apparent unacceptable consequences by appeal to the notion of “community” as a source of (“always-already”)44 interpretive stability. The trouble is that although Fish’s intention is a non-skeptical one, the solution remains too much in league with the skeptic, follows him too far down the road. Fish might ask himself whether such an account of “correct judgment” (as that view which the community realizes from among the interpretive possibilities) really squares with the Miltonic notion of correctness as judgment in accord with God’s will (§2).45 It would seem that 44 Fish often finds his critics to be mistakenly positing a moment of interpretive freedom which then needs to be constrained, whether by texts, rules, conventions, communities and so on. See e. g., “Working on the Chain Gang: Interpretation in Law and Literature” and “Critical Self-Consciousness” (esp. pp. 458 and 459), Doing What Comes Naturally, cit., footnote 5, I insert the parenthesis —“always-already— to make clear that nothing in my criticism incurs a commitment to this allegedly suspect conception of freedom/constraint. That is, I’m happy to follow Fish in saying that a community’s interpretive framework is always-already internalized by its agents, or that subjects are always already “inscribed” within an interpretive framework. My question is how, on Fish’s story, there could so as much as be an interpretive framework to be inscribed in. 45 Fish cites Richard Rorty, who in response to Alasdair MacIntyre having said “In your view, the worst thing someone can say about the Soviet Union is that it is un-American”, shrugged and replied, “What could be worse?” Fish approvingly glosses Rorty’s response as follows: “I would be hearing in [Rorty’s]... line a thicker statement and a serious question.
824
MARTIN STONE
a notion of correctness as “community agreement” must remain a second-best notion, something falling short of some ideal.46 To my ears, Fish is ambivalent on this point: sometimes he presents the interpretive conditions of judgment as requiring that we understand every judgment as falling short of some ideal; at other times, he presents the interpretive conditions of judgment as requiring us to abandon the notion of such an ideal as illusory (and not just unattainable). 3. How far down the road should one follow the skeptical progression of thought? A satisfactory response to it requires questioning, sooner or later, its very first step, the step at which the notion of a sign or text “considered in itself” is introduced. If one accepts that step unquestioningly, then it will be natural to accept the thesis that to grasp a meaning is to interpret; and if one accepts this thesis, it will be natural to feel obliged to choose between “platonism” and some social-pragmatic story about meaning. But there is another option. We might come to see that we have no use for such notions as signs or texts “in themselves” unless we are trying to give a philosophical account of the meaning of a sign or text. And (taking a hint from the proverbial man suffering from carrying around a heavy rock who found an astonishing solution: drop it) we could simply stop trying to give such an account. What is meant by this can be indicated by thinking about what happens when we give everyday explanations of meaning– i. e., explanations in situations where questions about the “conditions of possibility” of meaning are not in play. Generally, we rely on the responses and uptake of others: we count on them, for example, to follow in the direction of the pointed finger, not the opposite one. Everyday explanations are (thus) directed towards removing or averting such doubts as, under the circumstances, actually arise—not every “possible” doubt, whatever that The statement would be a rehearsal of the interlocking values, investments, and social commitments... we implicitly refer to when we say «America». The serious question would be, «What could be worse than a state and an ideology opposed in every way to everything we cherish and believe in?»”,“A Reply to My Critics”, The Responsive Community, cit., footnote 33, p. 63. The question seems easily answered: Worse than a state opposed to everything we believe in is a state that conforms to everything we believe in when our beliefs are evil. Clearly, there is something better than being guided by our most cherished beliefs, something most of us would want more: being guided by just and correct beliefs, or at least by not unjust or incorrect ones. Even Hitler (or Satan) was guided by his most cherished beliefs; there’s nothing especially good about that just as such. 46 See, e. g., the quotation from the Preface of Surprised by Sin, cit., footnote 4, in §2 above.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
825
might mean. In contrast, a philosophical account seeks to explain how the meaning of a sign gets fixed from among all the possibilities. (Remember, what justifies talk of ubiquitous interpretation, for Fish, is not that there are always real doubts—some cases are plain ones—but that doubts are “always possible”). The burden of a philosophical account, to put this another way, is not simply to rule out such doubts as might, under the circumstances, arise, but to specify the meaning of a sign absolutely.47 Now the notion of a sign or text “in itself” is a natural starting point for such an endeavor. Why? Because this notion is formed by abstracting the sign from our practical concourse with it– i. e., the natural (circumstantial) responses and uptake on which everyday explanations rely. By means of this abstraction, we, in effect, represent doubts which are merely notionally possible (they might arise in some circumstances) as somehow already present to an agent considering the sign. Such a representation is clearly the mirror image of the “platonistic” notion that grasping a sign’s “Meaning” determines (in the present moment) its application in all possible circumstances, excluding all possible doubt. What the platonist and the interpretivist have in common, then, is the endeavor to give an account of the fixity of meaning, as it were, in light of all the possibilities. (Both express what someone might call “the metaphysics of presence”). What happens if, in contrast to both, we were to free ourselves of the felt need for such an explanatory endeavor? We should have no use for speaking of signs “in themselves”–save perhaps in the practically useful way that (e. g.) lawyers sometimes do, namely to distinguish between a text (“the rule itself”) and someone’s gloss on it. And if we had no use for such an abstraction, we should also have no use for the thought that there must always be an interpretation that fixes a sign’s meaning. “What gives life to signs,” we will be inclined to say (if we must say something about this), “is that they are part of the weave of our lives. It is we who are the life of signs”. This is to be heard not as a further bit of rock-carrying theory, but simply as expressing that one no longer feels compelled to try to account for the normative aspect of signs by means of whatever materials remain in view after one abstracts from the sort of practical activities and attention which comprise our sign-filled lives. 47 I owe a debt to Cora Diamond for this formulation. See her Realism and the Realistic Spirit, cit., footnote 39, pp. 68 and 69.
826
MARTIN STONE
Given this possibility (of rejecting the argument’s first-step), it seems clear that we are not compelled to embrace the interpretive community story in order to head-off the argument’s nihilistic consequences. We might instead come to recognize, in light of those consequences, that the thought “to understand is always to interpret” is–just as it intuitively seemed to be—an absurdity. The ubiquity of interpretation, communalized or not, is not intrinsically plausible. At best, it comes to look plausible as the result of a philosophical set-up which makes it look as if “platonism” and “nihilism”–“theory hope” and “theory fear”—were the only other options. In such cases, the solution is always to figure out what we need to do to scrap the set-up. Here, this would mean asking what has happened–what doubts have arisen—to make an account of the very possibility of meaning seem like something we need. (That there must or could be such an account—a substantially correct one—is of course not something that Fish, for all of his good cautionary advice about “the unavailability of cosmic doubts”,48 ever questions).49 Why doesn’t Fish recognize that his “interpretivism” is cut from the same philosophical cloth as the “platonism” it would oppose? Recognizing this would require that he see more clearly what is wrong with the platonistic or “foundationalist” idea of “absolutely fixed meaning.” Fish tends to speak as if the trouble with this were just a suspect wish to find a “universal mechanism”–to give assurance to judgment from the outsi48 See Fish, “Theory Minimalism”, p. 772: “Schlag’s mistake can be seen by considering the nature of the ‘doubts’ he considers ‘requisite’... They are cosmic doubts, not doubts about this or that, but doubts about the entire cognitive structure within which ‘this’ or ‘that’ emerge as objects of inquiry. That form of doubt is not available to situated beings...” Fish ought to have seen this his own interpretivism falls by this axe. My argument here may be expressed, in the terms of this passage, by saying that: (1) rampant interpretivism presupposes the intelligibility of doubt not about this or that text (there are plain cases), but about the possibility of textual meaning as such; and (2) such a form of doubt does not appear intelligible from the point of view of “situated beings”–it requires a notional God’s-eye point of view. 49 “What was required,” Fish writes, “was an explanation that could account for both agreement and disagreement, and that explanation was found in the idea of an interpretive community”, “Change,”, Doing What Comes Naturally, cit., footnote 5, p. 141. Fish is speaking here about introducing the notion of “interpretive community” to address certain issues in literary theory. But at the time this was written, this was also the central notion, for him, in an account of the possibility of the determinate meaning of any text. See, e. g., “With the Compliments of the Author”, Doing What Comes Naturally, cit., footnote 5, p. 43.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
827
de. But a more fundamental question is whether we can so much as make out what is being said here—“fixed in light of all the possibilities”? If intelligibility (rather than substantial truth or falsity) is the trouble, no satisfaction is to be gained from denying that meaning could be so fixed by asserting that, on the contrary, all meaning is subject to interpretive conditions. To assert the later (i. e., that it is always possible for the text to mean something else) is to join ranks with what one means to be opposing: it is to suppose that one has managed to make sense of the idea of an absolute space of meaning-possibilities, the space of what a text could mean (It is to entertain “cosmic doubts”). An example of Fish’s might help to make this clearer: “As yet two plus two equals four has not become...a flash point of disagreement, but it could... Until two plus two equals four crosses someone’s ambition, it is a fact agreed on by all the parties, but this doesn’t mean that there are truths above ideology but that there are (at least by current convention) truths below ideology”.50 The passage is virtuostic, as so much else in Fish, in purporting to exhibit how virtually anything, including the supposedly hard facts of mathematics, can be reconstructed as effects of interpretation. (No facts, to put this somewhat less benignly, are capable of getting in the way of Fish’s interpretivism). But to pursue further the intuition of “possibility” invoked here (“it could...”), we might ask: From what point of view does this possibility— that “two plus two equals four” could (intelligibly) cross someone’s ambition—appear? From what point of view does it appear, for that matter, that a case which is perfectly plain under a rule could (tomorrow) come in for doubt?51 Certainly not our point of view as practical agents, at least if “could” means that we can make sense of these possibilities. (And it if doesn’t mean that, what does it mean?) After all, some cases are so clear that to “doubt” —or to try to doubt— merely announces to others that you are not someone with whom it is going to be possible to speak; and if there is no speaking with you, there is no disagreeing, or feeling crossed by you, either. God’s point of view then? A deeper diagnosis of what is wrong with foundationalism–its reliance on such a notional point of view–should have led Fish to see that his own interpretivism falls by the same axe. Interpretivism is the negative image of foundationalism. And a 50 51
Trouble with Principle, 271 (emphasis on “could” is mine). Cfr. “Force”, Doing What Comes Naturally, p. 512.
828
MARTIN STONE
general moral to be grasped here is that one does not get rid of philosophical foundations by denying that there are any. That is merely a way of preserving the structure of the question–i. e., the demand for an explanation of how plain meaning is possible–which foundational views take themselves to be answering. VI. PRACTICE, OR THE VIEW FROM STRAIGHT-ON To conclude, it is worth recalling a point mentioned earlier (§4), namely that the everyday idea of interpretation is at home in cases of real doubt or uncertainty–cases which occur against a background of “plain cases” in which there is no call for interpretation. I have been arguing that to assert (in contrast to this) that an interpretation is always required because no text is immune to possible doubts, is essentially to entertain, in league with one’s philosophical opponent, the idea of a “philosophical perspective” on meaning–an account of how meaning is fixed from among “all the possibilities”. When we give up this idea, we can return the word “interpretation” to its ordinary use, whereby interpretation is sometimes needed and sometimes not (it is no longer a general requirement). By the same token, we can return the expression “text itself” to its ordinary use, which marks a distinction between a text and an interpretation or gloss someone has put on it. For all of his pragmatic aspiration, Fish misses this possibility, the possibility, you might say, of trusting in how things ordinarily appear. At the last stop, it seems he wants there to be a philosophical perspective on meaning, an account for him to be “right” about; that idea–philosophy’s traditional idea of itself, never ceases to attract him. His attraction to it, and his blindness to the intellectual possibilities it occludes, are ironic, of course, because the rejection of philosophical dogmas–including the dogma that there must always be room for good answers to philosophy’s “how possible” question—is one of his big themes. The conflict I’m describing comes directly into view in remarks like this: “Theory’s project–the attempt to get above practice and lay bare the grounds of its possibility–is an impossible one”.52 How, we will want to know, is the general account Fish seeks to be described if not as an attempt to give grounds of the possibility of our concourse with meaning? 52
“Change”, Doing What Comes Naturally, cit., footnote 5, p. 156.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
829
Isn’t that just what is in the offing when a question like “What makes it the case that this action is in accord with the utterance «a diet Coke please»” meets with answers like “some community-informed interpretation,” as opposed to the sort of answers that actually figure in our practical activity, answers which merely direct attention to features of the text in question or to the situation in which it was uttered? In contrast to what I have called the everyday use of interpretation, “interpretation” as an ubiquitous requirement begins to look like another name for–an occupant of the same explanatory place as–divinity: it is it the terminus of all other explanations of meaning. So this looks like “theory’s project” more or less as Fish describes it: not a “universal mechanism”, to be sure, but still an attempt to get above practice and exhibit its grounds of possibility; an attempt, in Fish’s words, to look “sideways at oneself”.53 (Looking from straight-on —to continue the metaphor— it will appear that an interpretation is needed only when there is some actual doubt, not the mere notional possibility of doubt, to be cleared-up or averted). Fish’s mistaken sense of his own philosophical radicalism comes out again when he quotes a remark of Hilary Putnam’s which is a modern variation on Plato’s myth of the cave: “What if all the philosophers are wrong,” Putnam asks, “and the way it seems to be is the way it is?” Fish approvingly glosses the question like this: “What if the answers philosophers come up with are answers only in the highly artificial circumstances of the philosophy seminar, where ordinary reasons for action are systematically distrusted and introduced only to be dismissed as naive?”54 But now it should be plain that, with respect to the refusal of philosophical tradition gestured toward in this question, Fish’s interpretivism is on the wrong side. For that an interpretation is required in every case is not how things appear from the (naive) point of view of practical activity. (Imagine the server, with no special (circumstantial) prompting, replying, “I interpret that to mean you’d like a certain beverage now”. Is she mad? Or just doing a bit of literary theory?) In fact, it is only in the caves of the seminar room that the term “interpretation” shows up as part of an account of how it so much as possible for certain signs to be meaningful and hence to afford agents with reasons for action. Thank God, wise is He, for that. 53 “Theory Minimalism”, p. 772; see also Trouble with Principle, cit., footnote 1, pp. 305 and 306. 54 The Trouble with Principle, cit., footnote 1, p. 294.
830
MARTIN STONE
From the straight-on perspective, the answer to a question (should it arise) like “What makes it a fact that he ordered a diet Coke?” must surely be: not a communal interpretation, but rather (perhaps after reminding the questioner of the richly-woven world of restaurants, menus, orders, servers, meals, preferences, beverages, and so on) “look, you can that’s what happened yourself”.55 A final point to be dealt with involves being clear about the status of the material I have put in parentheses here. The parenthetical material reminds of us the practical situation or setting. But the point is not to say that it is really, in the end, practice which determines a text’s meaning, or which mediates between a text and what accords with it. That would be another bit of theory; and we should then have to ask (a la §4), whether we really have a notion of “practice” as behavior which is describable without attributing “meanings” to anyone, and also (a la §5) whether behavior, so described, is really sufficient to give us the notion of “accord”, and hence of meaning with its normativity intact. After everything I have said, it must be clear that I don’t mean the parenthesis in this way, as finally the best theory of all—the “practice theory”! The parenthesis is there rather to remind us that from the practical (engaged, straight-on) perspective, no general gap between an order and what accords with it appears. (It only looks like there is a general gap when we consider the order “in itself”). Since there is no general gap, there is no general need for the explanatory (gap-filling) work of “interpretation”, “practice” or anything else. Speaking as practical agents, what we shall say is simply this: sometimes there is a gap (and an interpretation is useful in bridging it) and other times there isn’t (and then there is no call for interpretation). Of course, this is not a philosophical remark. It is merely something that practical agents can see and (often enough) agree on, in just the way that they (often enough) agree about such things as his having ordered a diet Coke. No explanation of the possibility of such agreement in judgments, or the possibility of “plain meaning” is on offer here, no attempt to go deeper than the fact that we do (often enough) agree. Is an explanation therefore missing here? A certain traditional philosopher is apt to be certain it is. Of course. But Fish? He ought to have said that it isn’t com55 I’m indebted to David Finkelstein’s voicing of a similarly flat-footed response in “Wittgenstein on Rules and Platonism”, The New Wittgenstein, cit., footnote 3.
THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION
831
pulsory to think so. For from the primary standpoint of practical engagement, an explanation is not merely not needed–it isn’t even wanted. Despite his anti-theoreticism, Fish never really gets this intellectual possibility fully into view. Yet, from much of what he says, I think it is what he was after.
!
LAW AS A REFLECTIVE PRACTICE: A COMMENT ON STONE’S “THEORY, PRACTICE AND UBIQUITOUS INTERPRETATION” Scott HERSHOVITZ* SUMMARY: I. Preliminaries II. Interpretive Communities and Normativity. III. Fish and Wittgenstein.
In Theory, Practice and Ubiquitous Interpretation: The Basics, professor Martin Stone accomplishes something rare for an analytic legal philosopher. He takes Stanley Fish seriously. This is not an easy thing to do, as Fish’s caustic style and literary flair often obscure the depth of his argument. Not only has Stone taken Fish seriously, he has managed to say something deeply illuminating about Fish’s project. Stone advances two criticism of Fish’s work, one small, one big. The small criticism is only small by comparison, because it is nothing less than a challenge to Fish’s central claim—that interpretive communities are the source of the standards by which interpretations are properly judged. While the small criticism addresses Fish’s solution to the task he sets himself, the bigger criticism calls the task into question. According to Stone, if Fish understood the full implications of his own arguments, he would never ask the question which leads him to the interpretive community view in the first place. This comment explores Stone’s criticisms of Fish’s work. I shall suggest that both criticisms fall short of their marks, that Fish’s project can withstand them. However, this should not obscure the importance of the contribution that Stone’s essay makes. It deeply illuminates the nature of Fish’s project and its weak points. * Yale University, USA.
833
834
SCOTT HERSHOVITZ
I. PRELIMINARIES Before we can assess Stone’s criticisms of Fish, we need first to understand the views that are under attack. I shall present only a short summary here due to the thorough job that Stone does in his essay. As Stone tells us, Fish rejects both foundationalism and skepticism. Foundationalism here is the idea that it is possible to supply or construct a theory of what makes judgments in a given domain correct that is independent of those judgments. In this essay, we will be most concerned with judgments about meaning. The skepticism Fish is concerned with denies that it is possible to speak of getting things correct and counsels instead focusing on what people take to be correct. All this is quite arid, so an illustration is in order. Suppose Aaron has an interpretation of Hamlet on which the protagonist is paralyzed by indecision (originality is not Aaron’s forte). How do we know whether Aaron’s interpretation is correct? Well we might think that we should compare Aaron’s interpretation to the text of Hamlet to see if he has got things right. But for a variety of reasons we do not have the space to explore here, Fish says we cannot do this. We cannot consult the text to see if an interpretation is correct, because our only access to the text is through interpreting it (at least according to Fish). If the text of Hamlet cannot be consulted to determine the validity of an interpretation of Hamlet, it might seem that there is nothing to be consulted which could provide assurance that an interpretation of the play is a good one. Indeed, this is just what the skeptic concludes. The skeptic concludes that no interpretations of Hamlet are really correct or incorrect; some are just taken to be correct. But Fish rejects this skeptical view of things as well. One of the important contributions of Stone’s paper is to clarify just what it is that foundationalism and skepticism share in common, and hence just what it is that Fish is rejecting. Stone identifies the following premise lurking behind foundationalism and skepticism: (P): Our entitlement to see one of two conflicting judgments as objectively correct requires some means, independent of those judgments, for validating one or another of them as correct. Foundationalists think that judgment-independent means of verification are available; skeptics, while agreeing that such means are necessary to validate judgments as correct, deny that that they are available.
LAW AS A REFLECTIVE PRACTICE
835
Fish thinks that he can provide an alternative account of the correctness of our judgments. Although he rejects foundationalism, he aims to avoid skepticism. His solution is that interpretive communities determine whether an interpretation is correct or incorrect, successful or unsuccessful. So in order to know whether Aaron’s interpretation of Hamlet is correct, in Fish’s view, we do not ask whether it matches the text of Hamlet, we ask instead whether Aaron’s interpretation is accepted by the community as correct. Now notice that this method of determining the correctness of judgments is not judgment-independent. Whether a judgment is correct depends on whether the community accepts the judgment as correct. This, of course, depends on what judgments the community makes. Thus, the interpretive community view allows us to speak of correctness and incorrectness where someone who accepted (P) would not. The view is neither foundationalist (because it does not posit a judgment-independent test of correctness), nor skeptical (because it preserves a notion of correctness). This is the view that Stone’s small criticism is targeted at. II. INTERPRETIVE COMMUNITIES AND NORMATIVITY Stone’s small criticism consists of three objections to the interpretive community view. Stone’s first objection to the interpretive community view is that from the perspective of an agent engaged with a text, the primary question always has to be what the text means and not what people think the text means. In Stone’s view, it simply does not make sense to wonder about what people think a text means unless someone out there is wondering about what the text means. Now as Stone notes, Fish is not apt to consider this an objection, because he will say that people simply internalize the community’s perspective. They will of course speak as if they are addressing the hands-on question of what the text means, even though the standard for correctness is what the community thinks it means. I think that Stone is right that Fish will not count this as an objection, and I want to sharpen just why he will not. According to Fish, interpreters share strategies for writing not reading texts.1 Now this is an odd metaphysical view, but 1 “Interpretive communities are made up of those who share interpretive strategies not for reading but for writing texts, for constituting their properties.” Stanley Fish, is there a text in this class: The Authority of Interpretive Communities, p. 327, 1980.
836
SCOTT HERSHOVITZ
it is Fish’s. Because of it, he is likely to say that people address the hands-on question of what a text means only after the text has been constituted by communal interpretation. Stone’s second objection is much deeper. Stone argues that in Fish’s picture there is no normativity for communities. There is no such thing as the community getting Hamlet right or wrong. Whatever the community accepts as a correct interpretation of Hamlet just is correct on Fish’s view. As Stone points out, this makes it impossible to distinguish a community which agrees on the meaning of a text from one which is, perhaps, merely pretending to agree. Stone is correct to suggest that there is no normativity at the community-level on Fish’s view, but once again Fish is unlikely to see this as an objection. After all, what Fish is concerned with is normativity for individuals. That is, he wants to explain how individuals can get things right or wrong, and he may see no need to tarry over the fact that his answer obviates any sense in which an entire community could be right or wrong. After all, Fish might fairly ask why it is important to maintain an ability to distinguish between a community which accepts that Hamlet is paralyzed by indecision and a community which merely pretends to accept it. Such a distinction seems quite foreign to our literary practice. Stone’s most serious objection is that there is no normativity at the level of individuals in Fish’s picture either. If Stone is right about this, then Fish will be defeated, after all it is just this sort of normativity that Fish aims to account for. Stone’s argument is simple. He says one will not be entitled to say, “this text means X”, once one understands that whether this claim is true does not depend on facts about the text, but rather on whether the claim is regarded by the community as true. That is, Aaron cannot maintain that his interpretation that shows Hamlet as paralyzed by indecision is correct, once he understands that to be correct in this case is merely to be regarded by the community as correct. While Stone’s final objection would be decisive if successful, I think it fails. Consider the following analogous case. Imagine a group of people who believe that any rule requires whatever God regards it as requiring (which should not be too much of a stretch). On this picture, there is no normativity for God; God cannot be wrong about what a rule requires, because it requires whatever God believes that it does. But for individuals within the group, there can be normativity. They can be right
LAW AS A REFLECTIVE PRACTICE
837
or wrong about what a rule requires (the test of whether they are right or wrong is simply whether their belief about what the rule requires matches God’s). Now if we substitute “the community” for “God” in this story, we end up with Fish’s picture of how interpretive communities provide normativity for their members. I see no reason to accept Stone’s assertion that normativity disappears as soon as people learn that the test for correctness is conformance to the community’s view. As long as it makes sense to talk of correctness and incorrectness, there is genuine normativity in the picture. I am inclined to agree with Stone, however, that Fish’s interpretive community view fails, but on different grounds than Stone suggests. I think the real flaw is that the view fails to provide a plausible account of disagreement within communities. I have developed this argument elsewhere,2 but it is unnecessary to explore it here. Doing so would merely delay getting to Stone’s bigger, more important criticism of Fish’s project. III. FISH AND WITTGENSTEIN According to Stone, the deepest problem with Fish’s project is that that the interpretive community view is offered as a “philosophical account” of meaning. A philosophical account of meaning, in Stone’s terminology, is one that “seeks to explain how the meaning of a sign gets fixed from among all the possibilities”. Stone does not believe that we can have such an account, and indeed, the most provocative part of his essay is his suggestion that should stop seeking philosophical accounts. In Stone’s view, everyday explanations of meaning are “directed towards removing or averting such doubts as, under the circumstances, actually arise”. Fish’s interpretive community view, on the other hand, purports to be a general explanation of how meaning is fixed. It purports to secure meaning against all possible doubts, not just the ones we actually have. In Stone’s view, Fish would have been better off if he had simply rested on his rejection of (P), his denial that judgment-independent means of verification are required in order to be entitled to claims of correctness of judgment. Fish’s view fails, according to Stone, because like foundationalism before it, it seeks to do too much. 2 Hershovitz, Scott, Judging Interpretations, pp. 54-58, 2001 (unpublished D.Phil. thesis, University of Oxford) (on file with author).
838
SCOTT HERSHOVITZ
Stone’s critique of Fish draws heavily on the work of the later Wittgenstein. Space does not permit a full exploration of Wittgenstein’s views, but we need a cursory examination in order to place in context the worry that I shall raise about Stone’s invitation to stop seeking philosophical accounts of meaning.3 The relevant portions of Wittgenstein’s writings appear mostly in the Philosophical Investigations;4 they are sometimes known as the rule-following remarks. Wittgenstein is investigating, among other things, how we know what actions accord with rules, and he focuses on rules of mathematics and language. He is concerned to show that one does not always need to interpret language in order to understand it. By “interpretation”, Wittgenstein means something a bit idiosyncratic: replacing one expression of a rule with another.5 Sometimes interpretation of this sort is called for, Wittgenstein admits, but it cannot be the case that we always need to interpret to understand, because interpretations themselves are just further bits of language. If we could not at some point understand language without interpreting it, we could never understand language at all; we would be stuck in a endless regress, needing to interpret our interpretations. Clearly we can understand language, and so it must be possible to understand without interpretation. As Stone explains, Fish’s rampant interpretivism (to use Stone’s phrase) is in part a consequence of his view that one can always raise doubts about the meaning of a text.6 The interpretive community view is meant to explain how meaning gets fixed from among all the possibilities. But Wittgenstein rejects the idea that “secure understanding is only 3
For a detailed account of Wittgenstein’s rule-following remarks and their relevance to law, see Hershovitz, Scott, “Wittgenstein on Rules: The Phantom Menace”, Oxford J. Legal Stud., 22, 619, 2002. 4 Wittgenstein, Ludwig, Philosophical Investigations, 3rd. ed., G. E. M. Anscombe trans., Blackwell, 1998. 5 Wittgenstein, Ludwig, op. cit., footnote 4, p. 201. This is not what we mean by “interpretation” generally. When we interpret a painting, we do not replace one expression of the painting with another. Similarly, interpreting a law need not involve replacing on expression of the law with another, though it may. The idiosyncratic use of “interpretation” is another cause for concern in extending Wittgenstein’s arguments about interpretation and language beyond their intended scope. 6 And in this way, Fish shares a lot in common with the skeptic Saul Kripke sees in Wittgenstein’s writings. Kripke’s skeptic also exploits that fact that, on some interpretation of a rule, any action can be made out to accord with it. See Kripke, Saul, Wittgenstein on Rules and Private Language: an Elementary Exposition, 1982.
LAW AS A REFLECTIVE PRACTICE
839
possible if we first doubt everything that can be doubted, and then remove all those doubts”.7 Explanations of meaning, he says, “remove or avert a misunderstanding... that would occur but for the explanation; not every one that I can imagine”.8 In the normal case, we understand without an explanation of meaning. Importantly, we may not be able to give an explanation of meaning if called upon to do so. According to Wittgenstein, we often follow rules or use language without being able to provide reasons to justify what we do. We might say that, in this way, our use of the rules of language is unreflective. I shall not take issue with the Wittgensteinian picture of language that Stone draws upon. Rather I want to grant that it is true of language in general, but question whether it teaches us anything about law or literature, the two areas Fish is most interested in. I shall argue that it does not, and moreover, that we cannot take up Stone’s invitation to stop seeking philosophical accounts of meaning within literature and law, even if we might be able to do so for language in general. Even if Wittgenstein’s picture of rule-following within language and mathematics is correct, it is not necessarily true of all rules, not even all rules within language or mathematics. Colin McGinn, in outlining Wittgenstein’s position, writes ...where the bringing to bear of reasons is appropriate the possibility of doubt is correspondingly real. For when reasons are appropriately brought to bear we are dealing with beliefs and actions which are reflective, with respect to which reasons may be weighed and evaluated; and where the question of the goodness of a reason is appropriately raised it will be appropriate to entertain doubts about the quality of the reasons one has. But when an activity is as undeliberative as using language is it lies outside the sphere of the reason based and doubt ridden.9
Our question is what do Wittgenstein’s remarks about rules tell us about law and literature? If McGinn is right, and I think he is, they tell us almost nothing about law and literature. Both are among our most reflective activities.
7 8 9
Wittgenstein, Ludwig, op. cit., footnote 4, p. 87. Idem. McGinn, Colin, Wittgenstein on Meaning, pp. 22 and 23, 1984.
840
SCOTT HERSHOVITZ
Consider the lawyerly activity of distinguishing one case from another. Faced with a rule in a prior case adverse to one’s client, a lawyer seeks to distinguish the prior case from the one at hand. In a case I recently worked on, the following question arose: is an admission made in the course of a summary judgment proceeding binding on a litigant? Multiple authorities stated clearly that such admissions were binding in the jurisdiction. However, the inquiry could not stop there. I had to anticipate how opposing counsel might distinguish the prior cases so as not to be bound. One difference jumped out—the previous decisions were all made during summary judgment proceedings; none of the cases addressed whether or not the admissions were binding in subsequent phases of litigation. But then, none indicated that admissions would not be binding in subsequent phases either. To convince a judge, we would have to be prepared to offer arguments for applying the rule so as to bind litigants in all proceedings, rather than only in summary judgment proceedings. The practice of distinguishing cases demands that lawyers offer reasons for applying a rule one way rather than another. This sets law apart from our normal use of language. To see this, think of the skeptic Saul Kripke sees Wittgenstein’s writings. Kripke’s skeptic is engaged in a practice of distinguishing much like the lawyer’s practice. Faced with the problem 68+57, the skeptic tries to distinguish the instant case of addition from all previous cases in order to convince us that the answer is 5 rather than 125. He tells us that these numbers are larger than we have faced before, and that with such large numbers, the correct answer is always 5. He challenges us to give a reason for thinking that the answer is 125, and the force of the skeptic’s argument is our inability to do so. Our short patience with Kripke’s skeptic comes, I think, from his attempt to distinguish one case from another when doing so does not make sense because it has no place in the practice. The Wittgensteinian reply to the skeptic is that we do not need reasons; it is enough that we apply rules in the way we find natural given our training. In law, however, distinguishing one case from another and giving reasons for going on in a particular way are central parts of the practice. Our inability to give reasons for the way we apply rules in language or mathematics need not trouble us, but a lawyer who cannot give reasons for the way she recommends applying a legal rule is inviting trouble. Law is, to use McGinn’s words, reason based and doubt ridden.
LAW AS A REFLECTIVE PRACTICE
841
One last thought experiment will help us to see that the wittgenstenian picture of language has limited applicability to law. Wittgenstein explains that underlying our ability to use language is the fortunate fact that we all find it natural to go on in the same way despite our inability to justify how we go on. He writes: Disputes do not break out (among mathematicians, say) over the question whether a rule has been obeyed or not. People don’t come to blows over it, for example. This is part of the framework on which the working of our language is based ...10
As an experiment, let’s rework this passage. Disputes do not break out (among lawyers, say) over the question whether a rule has been obeyed or not. People don’t come to blows over it, for example. This is part of the framework on which the working of our law is based ...
The rewritten passage is absurd. Not only do disputes break out among lawyers over whether rules have been obeyed or not, these disputes are central to the working of law. The point of this long digression into the applicability of Wittgenstein’s picture of language to law is to suggest that the strategy Stone adopts to critique Fish’s project has limited appeal. Even if Stone is right that we cannot and need not seek philosophical accounts of meaning in general, he may not be right about law. When it comes to language, we may not need an account which explains how meaning gets fixed from among all the possibilities; such a thing may not even be possible. But Fish’s search for a means of verifying judgments may make sense for law, given law’s status as a reflective practice, as a practice in which reason-giving and doubt have a central role. Fish intends his interpretive community view to apply generally, to be an account of meaning not just within law and literature, but everywhere. But given a more modest scope, Fish’s project can survive the objection Stone offers. In the end, Stone’s major contribution is demonstrating that Fish has overextended himself, that he has strayed too far from his roots in law and literature. 10
Wittgenstein, Ludwig, op. cit., footnote 4, p. 240.
!
INTERPRETACIÓN JURÍDICA (DOS LECTURAS DEL DERECHO)* Rolando TAMAYO Y SALMORÁN** SUMARIO: I. Introducción. II. El orden jurídico. III. Autopoyetika iuris. IV. Interpretación e indeterminación. V. ¿Perplejidad? VI. Las variaciones jurídicas. VII. Final. VIII. Bibliografía.
I. INTRODUCCIÓN El presente ensayo trata de la aplicación del derecho, de lo que hacen los jueces.1 Se inscribe dentro de un análisis de las creencias que subyacen detrás de la aplicación del derecho; creencias que rodean la función judicial, creencias en las que los jueces creen, aunque no las expliciten.2 Algunas de estas creencias son, si no contradictorias (no es de la naturaleza de las creencias ser consistentes), al menos se oponen entre sí y su descripción arroja fuertes paradojas. Una idea ampliamente aceptada es que una teoría3 tiene que ser descriptiva. Ahora bien, una teoría que pretenda describir el derecho as it is tiene que determinar su objeto. Sobre este particular voy a explicitar la * Para propósitos diversos, algunas ideas aquí expuestas las he considerado en otro trabajo. Cfr.: “Indeterminación del derecho. Las paradojas de la interpretación jurídica”, en Malen, J.; Orozco, J. y Vázquez, R. (eds.), La función judicial. Ética y democracia, Barcelona, Gedisa, 2003, pp. 57-83. ** Facultad de Derecho, UNAM, México. 1 Ciertamente, existen otras instancias que aplican el derecho, sin embargo, me refiero a los jueces como instancias profesionales, conocedoras de las técnicas de la aplicación de normas jurídicas. 2 Mi tesis incluye las decisiones administrativas y cualquier acto de aplicación del derecho. Sin embargo, retengo como ejemplo a los jueces porque la aplicación judicial del derecho es la más elaborada. 3 ‘Teoría” entendida como conjunto de enunciados (definiciones, axiomas e hipótesis) que dan cuenta de un sector del mundo. (véase Guibourg, Ricardo, Derecho, sistema y realidad, Buenos Aires, Astrea, 1986, Filosofía y Derecho, 13, p. 10. 843
844
ROLANDO TAMAYO Y SALMORÁN
siguiente tesis que informa todo este trabajo: lo que los jueces hacen,4 quæ iudices, es parte de lo que el derecho es. De ahí que una apropiada descripción del derecho tiene que dar cuenta de lo que los jueces hacen. El derecho —lo he señalado varias veces5— tiene como condición de existencia su formulación en un lenguaje.6 Pero, ¿cómo se conoce un lenguaje? La respuesta es sencilla: conoce un lenguaje quien sabe qué dice. Quien sabe qué dice puede hacer una «lectura» de sus textos. Así, v. g.: una persona sabe griego si dice lo que está dicho en griego; sabe árabe quien entiende lo que se dice en árabe; sabe tártaro, quien entiende tártaro y… sabe derecho quien nos dice lo que el derecho dice.7 Los jueces dicen lo que el derecho dice y, con ello, determinan lo que el derecho es. II. EL ORDEN JURÍDICO 8 Pannomion9 La profesión jurídica concibe el derecho como un conjunto, (“orden”) a cuyas entidades llama “normas” (cualquier cosa que éstas fueran).10 4 Incluyendo, mutatis mutandi, a cualquier órgano aplicador del derecho actuando como tal. 5 Véase: mi artículo: “Indeterminación del derecho. Las paradojas de la interpretación”, en Malen, Jorge; Orozco, J. de Jesús y Vázquez, Rodolfo, op. cit., supra, 2003. 6 Véase: Capella, José Ramón, El derecho como lenguaje, Barcelona, Ariel, 1968, p. 28. 7 Sobre el problema de la «lectura» jurídica, véase mi libro: Razonamiento y argumentación jurídica (El paradigma de la racionalidad y la ciencia del derecho), México, UNAM, Instituto de Investigaciones Jurídicas, 2002, serie Doctrina Jurídica, núm. 121, pp. 95 y ss. 8 En esta sección reformulo algunas tesis expuestas en mi artículo “Rechtsordnung und Verfassung. Eine Kurze Beschreibung des Prozesses des Rechtserzeugung”, en Olivé, León y Salmerón, Fernando, Philosophie und Recthstheorie in Mexiko, Berlín, Duncker und Humblot, 1989, pp. 121-133. Algunas de ellas están incluidas en el capítulo X: “El concepto de constitución” de mi libro Introducción al estudio de la Constitución, México, Distribuciones Fontamara, 2002, Doctrina Jurídica Contemporánea, 3; y en mi ensayo: “La interpretación constitucional. (La falacia de la interpretación cualitativa)”, en Vázquez, Rodolfo (ed.), Interpretación jurídica y decisión judicial, México, Fontamara, 1998, Doctrina Jurídica Contemporánea, 4, pp. 89-133. 9 Palabra inventada por Bentham. Cfr.: Introduction to the Principle of Morals and Legislation, capítulo XVII, nota final, sección VI, Darien, Connecticut, Hafner Publishing Co., 1970, The Hafner Library of Classics, 6, p. 333. 10 En la tradición de habla inglesa el uso de norms es menos frecuente; se usa laws (con ‘l’ minúscula) o rules. Pero lo que los juristas dicen sobre norms se aplica tanto a laws como a rules.
INTERPRETACIÓN JURÍDICA
845
Para la profesión jurídica, el derecho no es una cosa singular, sino un conjunto, una «clase de cosas» (aunque habitualmente no lo expliciten).Ahora bien, para penetrar la «naturaleza» del derecho (i. e. de cualquier orden jurídico histórico) es necesario tener en cuenta que los órdenes jurídicos son conjuntos más bien complejos. Esta complejidad resulta de la interdependencia recíproca de sus entidades (i .e. normas) que los juristas conciben como las «partículas elementales» de los órdenes jurídicos positivos). “Es imposible penetrar la naturaleza del derecho [dice Hans Kelsen] si limitamos nuestra atención a una norma aislada... Únicamente sobre la base de una clara comprensión de estas relaciones que constituyen el orden jurídico puede entenderse completamente la naturaleza del derecho”.11 El profesor H. L. A. Hart, sostiene que una descripción completa de una norma particular supone una descripción de todas las condiciones comunes a ella y a las otras normas; por tanto, supone una descripción del funcionamiento de la totalidad del sistema.12 Antes de Kelsen y de Hart, Jeremy Bentham (1748-1832), para quien el derecho es un pannomion, observaba: “Un cuerpo de normas es una vasta y complicada pieza de mecanismo de la cual ninguna de las partes puede ser completamente explicada sin el resto. Para entender las funciones de un péndulo [balance-wheel] se debe deshacer todo el reloj: para entender la naturaleza del derecho se debe deshacerlo todo”… 13 El derecho no es un mero abarrotamiento de cosas; sino, más bien, una “intrincada urdimbre de normas”.14 El derecho es un conjunto15 (de nomas).
11 General Theory of Law and State, trad. de Anders Wedberg, Nueva York, Russell and Russell, 1973, p. 3. (Reimpresión de la edición de Harvard University Press, 1945). Los corchetes son míos. Existe versión española de García Máynez, Eduardo, Teoría general del derecho y del Estado, México, UNAM, 1979, p. XXXV. 12 Cfr: “Introduction” en Bentham, Jeremy, Of Laws in General, Hart, H. L. A. (ed.), Londres, Athlone Press, 1970. 13 An introduction to the Principles of Morals and Legislation, Londres, University of London, The Athlon Press, 1959. (The Collected Works of Jeremy Bentham), capítulo XVII, § 29 n. b2, p. 299. 14 El derecho no es una yuxtaposición de entidades. Estas entidades están de tal manera relacionadas que no hay espacio para entidades aisladas o separadas. Las entidades que forman el derecho se encuentran relacionadas en una secuencia (véase infra: La estructura básica del orden jurídico). 15 Un conjunto que no puede ser vacío.
846
ROLANDO TAMAYO Y SALMORÁN
Éste es un dato básico para la profesión jurídica, un presupuesto de su oficio. Así: D= {n, n, n, n …} Donde D cubre cualquier derecho positivo y donde ‘n’ nombra “cualquier cosa” hecha norma jurídica. Ahora bien, x se convierte en n si ciertas condiciones son satisfechas. (Si x satisface la “regla de formación del conjunto”). A esta compartida concepción estática, la profesión jurídica añade otro dato: El derecho no es sólo un conjunto atemporal de normas, sino es un “continuum de actos humanos que crean y aplican normas jurídicas”.16 El derecho —valga la paráfrasis benthamita— es un pannomion dynamikon. Aunque esta concepción dinámica no siempre es hecha explícita; ésta no es tampoco “el lado oscuro de la luna”. El aspecto cinético del orden jurídico es siempre presupuesto en el trabajo cotidiano de jueces y abogados y corresponde ampliamente a los usos profesionales de “derecho”. La tesis que subyace detrás de este ensayo es que el derecho es la “unión de actos de creación y actos de aplicación del derecho”. 17 En lo que sigue me moveré dentro de esta concepción dinámica. III. AUTOPOYETIKA IURIS 1. Nomodinámica Los actos que crean el derecho ocurren en diferentes momentos y en gran variedad de cadencias. No obstante, sus entidades, i. e. normas (y los actos que las crean y aplican), son interdependientes unos con respecto de los otros. Las entidades de un orden jurídico se encuentran relacionadas de tal forma que para que el orden jurídico opere es necesario que los actos que crean y aplican las normas se realicen en una secuencia que va de los actos jurídicos condicionantes (acta anteriora) a los actos condicionados (acta posteriora), conexión sin la cual la creación jurídica “escalonada” no es posible.18 16 Los actos jurídicos son bifásicos (sit venia verba); prácticamente todos ellos son, al mismo tiempo, actos de creación y actos de aplicación. 17 En cuanto a esto véase Atria, Fernando, On Law and Legal Reasoning, Oxford and Portland, Oregon, Hart Publishing, 2001, The European Academy of Legal Theory Series. 18 Cfr. Kelsen, Hans, Reine Rechtslehre, Viena, Verlag Franz Deuticke, 1960, pp. 228 y ss; véase, Teoría pura del derecho, trad. de Roberto J. Vernengo, México, Po-
INTERPRETACIÓN JURÍDICA
847
Es fácil percibir que el concepto clave en esta secuencia es el de facultad. “Facultad” nombra una función fundamental que, inter alia, permite identificar (i. e. determinar) las actos y normas subsecuentes. Ahora bien, si los acta posteriora están condicionados por otros los acta anteriora, entonces estos actos pueden ser representados como una secuencia en la cual se faculta la creación de actos jurídicos.19 Figura 1
Donde los actos a1 son la condición de los actos a2; y éstos la condición de a3, et sit cetera. Es difícil percatarse de que a5 no condiciona ningún acto ulterior y, por tanto, es considerado las consecuencias de esta secuencia. A su vez, a1 es la condición más mediata de las consecuencias y tiene la particularidad de no estar condicionada por ningún acto. Como dije, los actos jurídicos crean y aplican normas. Aunque las normas no son sino el contenido de los actos jurídicos (que los crean), es posible representar el aspecto fáctico del derecho conjuntamente con su aspecto normativo. Normas y actos están íntimamente unidos. Esto me obliga a introducir más elementos en el diagrama:
Figura 2
rrúa-UNAM, Instituto de Investigaciones Jurídicas, 1997 (reimpresión de la edición de la UNAM, Instituto de Investigaciones Jurídicas de1979, pp. 232 y ss.) En gran medida ésta es una reformulación de la tesis de Kelsen. Sobre la creación escalonada del orden jurídico, véase: Ohlinger, Theo, Der Stufenbau der Rechtsordnung. Rechtstheoriestiche und ideologische Aspekte, Viena, Manzsche Verlag und Universitätsbuchhandlung, 1975. 19 Joseph Raz llama a estas secuencias de actos que facultan: ‘cadenas de validez’. En la construcción de estas secuencias de facultades he tomado varias ideas de The Concept of a Legal System (véase: pp. 97-99).
848
ROLANDO TAMAYO Y SALMORÁN
Cada línea de unión representa una norma20 que faculta (autoriza) el acto que la aplica y la cual, a su vez, crea las normas que siguen en la secuencia. Así, n1 autoriza los actos a2, cuya realización aplica n1 y crea n2. Ésta es precisamente la función de facultar. Esta función puede ser representada por la fórmula siguiente: ($n) n[O F f ] y se lee: “existe una norma n que faculta a un determinado un órgano (O) a realizar f”, en el caso, crear a2. Lo que se en cuentra entre corchetes es lo que n prescribe. En el diagrama de la secuencia es claro que los actos que forman (que pertenecen) la secuencia tienen que satisfacer las condiciones impuestas por los actos que les preceden. Siguiendo las prácticas de la profesión jurídica, voy a denominar “conformidad” a la satisfacción de estas condiciones. 2. Validez sistemática Teniendo en cuenta lo que acabo de decir, voy a introducir un concepto de validez que ayuda a describir el funcionamiento de esta secuencia de facultades sucesivas (léase: ‘secuencia ƒ’) que corresponde perfectamente con las prácticas judiciales. Este concepto puede ser resumido en los siguientes dos enunciados: (1) x es n si, y sólo si, x Î S (donde “S” represen ta una secuencia ƒ y “n” una norma de la misma), y (2) x es a si, y sólo si, x Î S (donde “S” representa una secuencia ƒ y “a” un acto de la misma) i. e., algo es una norma o un acto jurídicamente válido si, y sólo si, pertenece a una secuencia ƒ de un cierto orden jurídico. Las entidades de una secuencia ƒ (sean normas o actos) son jurídicamente válidos si satisfacen las “reglas de formación” del conjunto (i. e. de la secuencia), establecidas (sucesivamente) por los actos que le preceden. Estas “reglas de formación” son las condiciones fijadas por las normas que confieren facultades, las cuales autorizan la realización de ciertos actos jurídicos. 20 “Norma” en el sentido de norma unselbständige Rechtsnormen (‘normas no independientes” (Véase Kelsen, Hans, Reine Rechtslehre, cit., nota 18, pp. 55 y ss. (véase Teoría pura del derecho, cit., nota 18, pp. 68-70). Para Kelsen las normas propiamente hablando se componen de toda la secuencia (cfr. idem).
INTERPRETACIÓN JURÍDICA
849
La validez jurídica es el resultado de la conformidad a las “reglas de formación” de la secuencia y, en este sentido, no tiene nada que ver con “valores” (no obstante su semejanza gráfica) ni con ninguna consideración metafísica. Validez es sólo una cuestión de pertenencia. Así, n2 es una norma válida si n1 faculta a O a crear n2 y O efectivamente lo hace (y O lo hace si su acto se conforma a n2). En cuanto a esto último es importante agregar que en la secuencia ƒ las normas posteriores (i. e.: n3 o n4) no son deducidas de las normas anteriores (i. e.: n1 o n2). El proceso de creación jurídica no opera por inferencia.21 Para que n3 exista no es suficiente que n1 y n2 existan, es necesario que a3 ocurra (exista), un acto empírico del órgano facultado que tiene que ser efectivamente realizado, acto de voluntad a través del cual el órgano establece n3. 3. La función de facultar Los actos en la secuencia ƒ adquieren un significado específico al determinar los actos que los aplican y al conformarse a las normas que los condicionan. Una norma faculta a O (al órgano) confiriéndole cierto poder (competencia, capacidad) para que sus actos tengan el efecto que pretenden tener. Los actos de O son actos jurídicamente válidos si, y sólo si, existe una norma que faculte a O a realizarlos y que sus actos efectivamente se conformen a las condiciones establecidas por la norma facultativa.22 Si para que un acto (o una norma) sea válido es necesario que exista una norma que confiera facultades y que un acto se conforme a las condiciones impuestas por ella, entonces el enunciado que describe este proceso de creación (o modificación) jurídica es verdadero si, y sólo si, existe una norma que faculte a O a crear (o modificar) normas y O efec21 La lógica no gobierna la creación del derecho. Véase, capítulo XXII: “La «lectura» jurídica y la creación de inferencias en derecho”, en mi libro: Elementos para una teoría general del derecho, cit. pp. 369-380. Véase Schmill, Ulises, “Derecho y lógica”, Isonomía. Revista de Teoría y Filosofía del Derecho, Instituto Tecnológico Autónomo de México, núm. 1, octubre de 1994, pp. 11-26. 22 Ésta es una operación canónica de investir o facultar. Pero, de hecho, las condiciones que los actos posteriores deben satisfacer pueden estar establecidas en cualquier acto anterior de la secuencia. Más aún, el acto de facultar puede darse en una norma que imponga deberes, que ordene a un órgano realizar un acto determinado.
850
ROLANDO TAMAYO Y SALMORÁN
tivamente lo hace. Consecuentemente, la fórmula para cualquier proceso de creación jurídica debe ser reformulada como sigue: ($n) n [O F f] & O f-s Fórmula que debe leerse: “Para cualquier norma n (excepto n1), n es creada (modificada o derogada) si, y sólo si, existe una n que confiera la facultad f (crear normas) a un órgano del orden jurídico”. Fórmula en la cual “F” nombra el operador modal para facultad (“facultar”, empowering, Ermächtigung), “O” es el órgano facultado y “f”, una (meta)variable que cubre cualquier acto de creación (o derogación) normativa. De ahí se sigue un concepto de validez (sistemática). Un acto (jurídico) es “válido” si, y sólo si, satisface las condiciones establecidas por los actos jurídicos que le preceden.23 Este concepto de validez es, de hecho, la piedra angular de la doctrina de la legalidad. De esta forma los actos jurídicos que se conforman con los actos que le preceden en la secuencia son actos jurídicos válidos; los que no se “conforman” son considerados prima facie nulos (así se expresa la práctica judicial). 4. La función constitutiva La norma que confiere facultades, al señalar las condiciones bajo las cuales y las instancias (órganos) por los cuales un acto jurídico debe ser creado, tiene un carácter constitutivo. Facultar es, así, una función constituyente a través de la cual un acto (o norma) de la secuencia establece condiciones para los subsecuentes “pasos” de la creación jurídica.24 Cualquier norma en la secuencia, con independencia de cualquier otra función que realice, es una norma que confiere facultades y, consecuentemente, tiene carácter constitutivo.25 23 24
Entre las condiciones puede haber actos prohibidos, actos que no deben ser realizados. De esta manera tenemos órganos “constituyentes” (los que establecen las normas que confieren facultades) y tenemos, también, órganos “constituidos” (los que aplican y se conforman a las normas establecidas por los órganos constituyentes). 25 Ciertamente, las normas (n1, n2 o n3) pueden realizar diferentes funciones normativas que corresponden a diferentes operadores modales “Gebieten ist jedoch nicht die einzige Funktion einer Norm. Auch ermächtigen, erlauben, derogieren sind funktionen von Normen” (“ordenar no es, sin embargo, la única función de las normas. Habilitar, permitir y derogar, son también funciones de las normas”. Kelsen, Hans, Allgemeine Theorie der Normen, Viena, Manzsche Verlag- und Universitätsbuchhandlung, 1979, p. 1; véase
INTERPRETACIÓN JURÍDICA
851
Algunas normas pueden ser aplicados por varios actos jurídicos; es suficiente con que éstos se conformen a las condiciones que dichas normas imponen. Estos actos (y las normas que crean) comparten un “paso” (un eslabón) común. Hasta aquí he representado a una secuencia de facultades (en adelante: “secuencias ƒ”) de forma aislada. Pero dos (o más) secuencias ƒ pueden compartir más “pasos” del proceso:
Figura 3 Donde n2 es condición común tanto de varios actos (a3, a4, a5, y a6,) como de las correspondientes normas (n3, n4, n5 y n6) que han creado. Es precisamente este carácter común de n2 el que permite relacionar o unificar los actos y las normas que comparten este “paso” común. En este diagrama (figura 3), como en los que siguen, la aplicación de normas juibidem, pp. 76 y ss. Sobre el concepto de Ermächtigung en Kelsen, véase ibidem, pp. 82-84. El español no tiene palabras que correspondan exactamente al uso jurídico de Ermächtigen o Ermächtigung como la expresión inglesa: to empower (y palabras relacionadas, v. g. empowered o empowering). En español la palabra ‘apoderar’ que parece corresponder a Ermächtigen, no tiene el mismo uso, aunque ciertamente ‘apoderar’ y ‘apoderado’, así como la misma expresión ‘poder’, en derecho privado, aluden al acto por el cual se confiere a alguien el “poder suficiente” para realizar actos válidos. En todo caso ‘facultad’, ‘facultamiento’ y ‘facultado’ son palabras de larga tradición en las lenguas latinas. En la segunda edición de la Teoría pura Kelsen había señalado: “Denn eine Norm kann nicht nur gebieten, sondern auch erlauben und insbesondere ermächtigen” (“puesto que puede no sólo ordenar algo sino, también, permitirlo y especialmente facultarlo”. Cfr. Reine Rechtslehre, cit., nota 18, p. 5; véase Teoría pura del derecho, cit., nota 18, pp. 19). Para un breve análisis del concepto de ‘facultad’, véase el capítulo IV: “La permisión (derecho subjetivo y facultad)” de mi libro: Elementos para una teoría general del derecho (introducción al estudio de la ciencia jurídica), México, Themis, 2001, pp. 45-64. Un detallado examen del concepto de facultad desde el punto de vista dinámico es desarrollado por Ulises Schmill (véase La reconstrucción pragmática de la teoría del derecho, México, Thémis, 1997, pp. 42-50).
852
ROLANDO TAMAYO Y SALMORÁN
rídicas por varios actos de aplicación (v. g. los actos jurídicos que aplican n3) es representada aquí de forma limitada (dos ocurrencias), pero pueden suceder en un sinnúmero de ocasiones.26 Varias secuencias ƒ pueden confluir formando una red de estas secuencias:
Figura 4 El carácter común de ciertas normas (o actos) es la piedra angular que permite la construcción de los órdenes jurídicos. Todos los actos y las normas que compartan al menos una norma (o acto) forman un solo orden jurídico. Mientras más mediatos de las consecuencias, los actos jurídicos son (generalmente) comunes a un mayor número de normas (o actos) del sistema. Los actos más mediatos del sistema unifican más actos (o normas) del sistema y, necesariamente, el acto considerado el más mediato es el que unifica la totalidad de actos y normas del sistema. Consecuentemente, en cualquier orden jurídico (éste es parte del criterio de identidad) existe, al menos, un acto jurídico que es común a todas las secuencias ƒ del sistema. De esta manera las secuencias ƒ que forman todo un orden jurídico pueden representarse como un haz de aplicaciones que se va expandiendo en el tiempo:27 26 27
Véase infra: Las variaciones jurídicas. “Una pluralidad de normas forma una unidad, un sistema, un orden, si la validez de las normas pude ser referida a una norma única como último fundamento de validez”. Kelsen, Hans, Reine Rechtslehre, Einleitung in die rechtswissenschaftliche Problematik, Scientia Verlag, Aalen, con prólogo de Stanley L. Paulson, reimpresión de la 1. Auflage, Franz Deuticke, Leipzig-Vienna, 1934, p. 62. Existe versión en español de Jorge G. Tijerina: La teoría pura del derecho. Introducción a la problemática científica del derecho, Buenos Aires, Lozada, 1946. Existe una excelente versión inglesa de Bonnie Litschewski y Stanley L. Paulson, Introduction to the Problems of Legal Theory, Oxford, Oxford University Press, 1996, véase p. 55.
INTERPRETACIÓN JURÍDICA
853
Figura 5 Como hemos podido observar, en las secuencias de ƒ todas las normas jurídicas realizan la misma función constituyente (creadora). En todos los “pasos” de la secuencia aparece la misma relación genética que permite determinar e identificar los actos y normas posteriores.28 IV. INTERPRETACIÓN E INDETERMINACIÓN 1. Primera «lectura» y sus paradojas El derecho es un complejo de secuencias de normas y actos jurídicos. Las normas o actos que preceden (acta anteriora o normæ anterioræ) funcionan como condición o “fuente” de los actos jurídicos subsecuentes (acta posteriora) y de sus correspondientes normas (normæ posterioræ). De ahí que las normas y los actos jurídicos anteriores en la secuencia determinan (identifican) los actos jurídicos subsecuentes. Siguiendo la «mecánica» de la secuencia, un acto (o una norma) es reconocido (identificado o determinado) si éste se conforma a las condicio28 “La relación entre una grada superior y una inferior en un orden jurídico —como entre una Constitución y una ley o entre una ley y una decisión judicial— es una relación de determinación... [L]a norma superior regula el acto por medio del cual la norma inferior es creada (o simplemente regula la ejecución del acto de coacción… Al regular la creación de la norma inferior, la norma superior determina no sólo el proceso mediante el cual la norma inferior ha de ser creada sino, posiblemente el contenido de la misma”. Kelsen, Hans, Reine Rechtslehre (1. Auflage) pp. 90 y 91; véase id., La teoría pura del derecho. Introducción a la problemática científica del derecho, cit., nota 27, p 127; Introduction to the Problems of Legal Theory, cit., nota 27, pp. 77 y 78; Reine Rechtslehre (2. Auflage), pp. 346-349; véase Teoría pura del derecho, cit., nota 18, pp. 349-351.
854
ROLANDO TAMAYO Y SALMORÁN
nes que le preceden. Así, los rasgos característicos de un acto jurídico (o norma jurídica) son establecidos (determinados) de antemano. En otras palabras: la determinación de las normas o actos de la secuencia se encuentra establecida con anterioridad en los normas o actos precedentes. La determinación, entonces, se “lee” de izquierda a derecha en una «lectura» del tipo que llamaré “latina” La determinación obtenida por esta «lectura» es, sin duda, muy importante; constituye, como señalé anteriormente el patrón básico del concepto de validez sistemática. Esta «lectura» muestra que los actos jurídicos determinan cómo deben ser los actos subsecuentes en la secuencia, puesto que las secuencias normativas no son sólo una sucesión de normas y actos jurídicos, sino, también, una secuencia de condicionamientos. Las normas y actos jurídicos posteriores (como consecuentes) tienen que satisfacer las condiciones establecidas por las normas y actos jurídicos anteriores para ser reconocidos como actos de la secuencia. 2. Creación jurídica. ¿Determinación o profecía? La «lectura latina», sin embargo, genera un primer problema, el cual, en cierto sentido, es subproducto natural de esta «lectura». En efecto, esta «lectura» genera la idea de que la determinación de los rasgos característicos de los actos jurídicos futuros (o normas jurídicas futuras) está completamente establecida con anterioridad, de antemano. Pero la paradoja es que ni los actos jurídicos futuros (ni las normas que éstos podrían crear) se han realizado aún. El derecho aguarda ser creado y sus normas y actos no pueden ser determinados mientras no existan. Esto realmente constituye un problema, porque varios conceptos jurídicos, como los de validez, legalidad y nulidad, entre otros, dependen de esta «lectura». Supongamos (sin conceder) que los las normas y actos jurídicos anteriores efectivamente determinan cómo serán las normas y actos jurídicos futuros que los habrán de aplicar (suposición, ab obvo, contrafáctica). Aunasí, esta determinación nunca sería completa. Para saber cómo es el acto posterior tenemos necesariamente que esperar su realización efectiva, tenemos que esperar a que éste se produzca. Hemos visto que para determinar lo que es el derecho tenemos necesariamente que recurrir a las “fuentes” (acta anteriora y normæ poste-
INTERPRETACIÓN JURÍDICA
855
rioræ), resulta ahora que esta prueba se muestra totalmente insuficiente. Esta prueba no es suficiente para determinar ni la fuente misma ni sus productos. Recurrir a las “fuentes” proporciona sólo un indicio de identidad, una identidad prima facie; en ocasiones una mera pro fecía. Ahora bien, si recurrir a las “fuentes” (acta anteriora y normæ posterioræ) no es suficiente, entonces, enfrentamos un manifiesto problema de indeterminación. Esta situación es harto perpleja. Pareciera que, prima facie, predicar que un acto jurídico es “válido” es resultado de que se conforma a las condiciones establecidas en los actos y normas jurídicos que le preceden. Y la mera idea de “conformidad” presupone que existe algo (previo, anterior) a lo que, precisamente, hay que conformarse. Un acto “conforme” es un acto “bien hecho”, un acto que satisface las condiciones que le han sido impuestas. Dentro de este orden de ideas resulta tentador decir que el acto “conforme” estaba (completamente) determinado por los actos jurídicos (o normas) que le preceden en la secuencia. Pero esto, como mostré, no es necesariamente verdadero. No se puede determinar un acto que no se ha realizado. Un padre expectante no puede saber si su hijo será pianista, boxeador o trapecista, primero hay que esperar que nazca. Existe otro elemento que incrementa la indeterminación. El acto “conforme” es más que un mero acto conforme, mucho más. Este acto suma (adiciona) elementos a la secuencia, elementos que no estaban previstos (predeterminados) en los actos previos de la secuencia. Si un acto adiciona algo, agrega una “porción” jurídica que no había sido determinada por ningún acto anterior (¿cómo podría serlo?). El additum que resulta de la realización de cada acto es, ab obvo, necesariamente indeterminado. De esta manera, a2 adiciona algo; a3, a su vez, también adiciona algo y, así, sucesivamente. Incluso el mismísimo acto último de ejecución podría agregar una porción substancial de innovación. Si los actos sucesivos de la secuencia introducen cierto grado de innovación, “paso a paso”, la «lectura» de n1, por ejemplo, no dice prácticamente nada del derecho que será (if any). La innovación se introduce gradualmente. Si sumamos n2 a n1 la determinación del derecho se incrementa. Sin embargo, aun así, todavía no sabemos prácticamente nada del derecho que será (si llega alguna vez a
856
ROLANDO TAMAYO Y SALMORÁN
ser). Como podemos ver, una secuencia es completa únicamente cuando el último acto de la secuencia (i. e. las consecuencias) se realiza. Entre tanto, la determinación nunca es completa. Si consideramos cualquier derecho positivo el problema se magnifica. En los órdenes jurídicos ocurren innumerables actos jurídicos y todos introducen, al menos, un modicum de innovación. Habiendo subrayado la insuficiencia de la «lectura latina» para proveer la determinación (la identidad) de los órdenes jurídicos, debemos tener cuidado de no cometer un grave error. Pensando que, como esta «lectura» es insuficiente, es fácil subestimar la importancia de las normas que confieren facultades, las cuales, efectivamente, contribuyen (aunque parcialmente) a la identidad de los órdenes jurídicos. La «lectura latina» de la secuencia es, no obstante su insuficiencia en la determinación, una pieza fundamental en la aplicación del derecho. Es sencillo observar que la indeterminación que acompaña al derecho se reduce progresivamente a medida que los actos de aplicación de los individuos facultados (los órganos) efectivamente ocurren. De modo que es a través del ejercicio efectivo de las facultades jurídicas que la indeterminación del derecho es progresivamente reducida. Sin embargo, aquí enfrentamos una nueva paradoja: cuando la determinación del derecho es completa (cuando el último acto de aplicación de la secuencia es realizado) el derecho ya no es; fue. En otras palabras: una vez que el derecho está completamente determinado (si es que podemos decir esto), el derecho ya es historia.29 El derecho que podemos describir es el derecho acabado; pero durante el continuado proceso de creación y aplicación del derecho, el derecho padece de indeterminación.
29 Algunos dirían que, como quiera que sea, sería derecho en forma de precedente. Pero los precedentes, como cualquier parte del derecho, son: (1) un datum de un derecho que fue y (2) un acto jurídico que constituye una mera propuesta para ser seguida, un acto que tiene que ser “aplicado” por los órganos de aplicación (v. g. por los tribunales) en una nueva secuencia por construir.
INTERPRETACIÓN JURÍDICA
857
3. La “otra lectura”30 Il processo interpretativo si esercita su di un enunciato... e perviene alla norma; la norma non precede come dato, bensì segue como prodotto, il processo interpretativo31
La insuficiente determinación de la primera «lectura» me condujo a mirar cuidadosamente en la “mecánica” que opera en las secuencias ƒ de los órdenes jurídicos y en las prácticas de la profesión jurídica. De acuerdo con la «lectura latina» una norma (o acto) es una norma jurídica si es establecida por la “fuente” apropiada. Este hecho la hace una norma jurídica válida. Sin embargo, esta norma jurídica válida tiene que ser aplicada y, por tanto, “reconocida” por los órganos de aplicación, por ejemplo, por los tribunales. Sin duda, los juristas y los profesionales del derecho saben bien que los tribunales, efectivamente, “aplican” las normas jurídicas válidas, pero, saben también que esta aplicación se realiza de conformidad con las prácticas y costumbres de la profesión. Un presupuesto ampliamente aceptado por la profesión jurídica es que el derecho es un conjunto de normas. Pero estas normas sólo son las normas de la secuencia si son reconocidas y aplicadas por los tribunales.32 Los tribunales “reconocen” las normas que aplican mediante el “mágico” artilugio de la “interpretación”. Al inicio de este ensayo señalé que el derecho tiene como condición de existencia su formulación en un lenguaje, i. e. el derecho se presenta lingüísticamente. Las normas se presentan en enunciados. Sin embargo, como también indiqué anteriormente, las normas, en cuanto a lo que a la determinación del derecho se refiere, son incompletas e insuficientes. 30 En la exposición de esta segunda lectura sigo de cerca las ideas de Ricardo Guastini (véase “Interpretative Statements”, en Garzón Valdés, Ernesto; Krawietz, Werner; von Wright, Georg Henrik y Zimmerling, Ruth, Normative Systems in Legal and Moral Theory. Festschrift for Carlos Alchourrón and Eugenio Bulygin, Berlín, Duncker & Humblot, 1997, pp. 279-292. Id. Le fonti del diritto e l’interpretazione, Milán, Guiffrè, 1993). 31 “El proceso interpretativo se aplica a un enunciado y deviene norma. La norma no precede el proceso interpretativo como dato, sino que le sigue como producto”. Tarello, Giovanni, Diritto, enunciati, usi. Studi de teoria e metateoría del diritto, Bolonia, 1974, p. 395. Tuve conocimiento de este excelente libro por la lectura de “Interpretative statements” de Ricardo Guastini (op. cit. nota 32, p. 281). 32 En general todo órgano que tiene que aplicar el derecho.
858
ROLANDO TAMAYO Y SALMORÁN
Más aún, son también vagas y ambiguas. Consecuentemente, las normas tienen que ser interpretadas. Mientras estas normas (y los actos que los crean ) no son interpretados, carecen de significado completo y, por tanto, sufren de indeterminación. La incompletitud, la vaguedad y la ambigüedad de las normas jurídicas anteriores efectivamente se resuelven. Y esto es únicamente posible mediante la interpretación dada a estas normas por los actos de aplicación. Pensemos en la “fuente” apropiada de n2; En realidad, n1 es fuertemente indeterminada. Cuando n1 ocurre no sabemos (hasta entonces) cómo va a ser el derecho. Más aún, no sabemos qué es n1. Para saber qué es n1, necesitamos una interpretación autoritativa de n1. De esta manera a la pregunta “¿cuándo sabremos el significado de n1?” la respuesta es la siguiente: ‘cuando tengamos una interpretación autoritativa de n1.33 En otras palabras: cuando n2 y los actos que lo aplican sean efectivamente realizados por los órganos especialmente determinados para ello (v. g. los tribunales). Si todos los actos en una secuencia ƒ son, al mismo tiempo, actos de creación y actos de aplicación del derecho, entonces toda norma de la secuencia (toda n) es —como señala Ricardo Guastini— “al mismo tiempo un texto y un enunciado interpretativo”.34 De esta forma n2 es un texto que recibe su significado (explícita o implícitamente) de n3, significado establecido, precisamente, por un acto de voluntad (a3) de un órgano específico del orden jurídico. Si n2 es un texto (v. g. una disposición del código civil), n3 es la resolución judicial que actúa como enunciado interpretativo que, inter alia, decide el significado y alcance de n2. ¿No acaso la jurisprudencia de los tribunales de casación, por ejemplo, determina autoritativamente el significado y alcance de las disposiciones de los códigos civiles? El enunciado interpretativo n3, consecuente33 Tomo la expresión ‘autoritativa’ de Hart, H. L. A. (cfr. “Commans and authoritative Legal Reasons”, Essays on Bentham. Jurisprudence and Political Theory, Oxford, Oxford University Press, 1982, pp. 243-268). “He sostenido [dice Hart] que para entender estos rasgos del derecho …una Constitución otorgando facultades legislativas... y las nociones de validez e invalidez… tiene que introducirse la idea de una razón autoritativa: esto es, un argumento (que en sistemas simples puede incluir la emisión de un mandato) que es reconocido, al menos, por los tribunales de un orden jurídico eficaz...”, Ibidem, p. 243. 34 Guastini, Ricardo, “Interpretative Statements”, cit., nota 30, pp. 279-292. Id. Le fonti del diritto e l’interpretazione, Milán, Guiffrè, 1993.
INTERPRETACIÓN JURÍDICA
859
mente, contiene un “operador oracional” que podría ser formulado así: “n2 significa...”. Enfáticamente señala Michel Troper: “...aquello que precede al juicio no es una norma, sino un texto... La norma no es ese texto sino solamente su significado”.35 La segunda «lectura» que podría llamar «lectura arábiga» compromete fuertemente la idea de legalidad que se obtiene de la «lectura latina», la cual presupone la idea de la conformidad. ¿Cómo conciliar métodos de determinación tan tajantemente opuestos? Prima facie la idea de la conformidad de un acto se observa mediante la «lectura latina». En efecto, cuando quiero saber si un acto (o una norma) es un acto válido del sistema, verifico si este acto satisface las condiciones impuestas por los actos (y normas) que le preceden, esto es, verifico si tal acto se conforma a dichos actos y normas. ¿Qué sería de la “conformidad” sin esta «lectura»? ¿Qué pasaría con los conceptos de validez, de legalidad y de nulidad? Para la «lectura arábiga» esto no es problema. Simplemente la determinación de la “conformidad” está incluida en la interpretación del acto de aplicación. De esta manera n3, además de indicar lo que n2 significa (en virtud de ello) determina que n3 efectivamente se conforma a lo dispuesto por n2 (n3, como cualquier otro acto de aplicación del derecho, pretende ser un acto “regular” del sistema. Esta «lectura» interpretativa necesariamente conduce a una determinación ex post facto de los actos jurídicos (la “conformidad” y comprise). La interpretación no necesita ser explícita; n2 es suficiente evidencia para saber qué significa n1; es suficiente la creación de n2 para saber qué significa n1 para a2. Si la «lectura latina» sigue la secuencia de facultades sucesivas, la «lectura arábiga» es una secuencia de sucesivas “interpretaciones”. En el primero de los casos, i. e. «lectura latina», la proposición p, si es verdadera, describe las facultades sucesivas contenidas en la secuencia; i. e. describe las facultades otorgadas por n1 a a2, las otorgadas por n2 a a3, 35 “Fonction jurisdictionnelle ou pouvoir judiciare?”, Pouvoirs, Presses Universitaires de France, 1981, pp. 5-15. (Reimpreso en Troper, Michel. Pour un théorie juridique de l’état, París, Presses Universitaires de France, 1994, pp. 95-105). El conocimiento de este texto se debe a la lectura de “Interpretative statements” de Ricardo Guastini (op. cit., nota 30, p. 280).
860
ROLANDO TAMAYO Y SALMORÁN
las otorgadas por n3 a a4, et sit cetera, así como la “conformidad” de los acta posteriora a las condiciones establecidas por las normæ anterioræ. En el segundo de los casos, i.e. «lectura arábiga», la proposición p, si es verdadera, describe la interpretación sucesiva contenida en la secuencia; da cuenta de la interpretación dada por n2 a n1, la dada por n3 a n2, et sit cetera, incluyendo la determinación de la “conformidad” de los acta posteriora a las condiciones establecidas por las normæ anterioræ. Además del fuerte contraste de estas “lecturas”, el problema se complica frente a la creencia, ampliamente compartida, de que los órganos de aplicación del derecho (v. g. tribunales) tienen el deber de aplicar el derecho preexistente (if any). ¿Pero si los órganos de aplicación son las instancias que “deciden” lo que significa la norma que aplican (además de decidir que es el “derecho aplicable”), cómo puede pensarse en que los órganos de aplicación tengan el deber de aplicar el derecho que interpretan? Lamentablemente no puedo detenerme a examinar esta perplejidad deóntica. 4. “Libertad” de los órganos de aplicación Una atenta observación de los actos de aplicación muestra que los órganos de aplicación “corren el riego” de la aplicación (periculum est applicatores36) al decidir el significado de la norma que aplica. Una vez que una norma que confiere facultades es establecida, surge una alternativa fuerte en lo que a la existencia del derecho ese refiere. Este predicamento toca resolverlo al órgano aplicador.37 Esta disyunción puede representarse como sigue: n [O F f ] Þ (Y) O f Una vez que una norma que confiere facultades (n-F) es creada, se sigue (del mero acto de su creación) que O, el individuo facultado, se encuentra en posición de hacer f o de omitir f.38 36 Sit venia verba. 37 En cuanto a la posición en que se encuentra el órgano de aplicación frente a este predicamento normativo Kelsen señala: “Aquel que ha de ejecutar la norma ha de examinar y decidir también si es una norma regular y, por tanto, ejecutable” (Teoría general del Estado, trad. de Luis Legaz Lacambra, Barcelona, Labor, 1934, p. 84). 38 Existen formas variadas de omitir. Un tribunal, por ejemplo, puede declararse incompetente, declarar la improcedencia, hasta “rehusar” simple y llanamente la aplicación.
INTERPRETACIÓN JURÍDICA
861
Puede ocurrir que la norma que faculta, i. e. n [O P f], nunca sea aplicada, es decir, que O nunca realice f. En este caso la creación jurídica se interrumpe. El derecho anunciado (en esa pretendida norma que confiere facultades) nunca nació. Por el contrario, puede suceder que la norma que faculta sea aplicada, que O efectivamente haga f y que con este acto que O realiza se incremente la determinación del derecho. Sin embargo, una nueva alternativa surge. El acto de O, i. e. f, puede ser considerado “regular” o “irregular”: ($n) [O F f] & O f) Þ (Y) O fR) Una vez que el órgano facultado efectivamente realiza f, este acto (en base a la «lectura latina») puede ser considerado fR “no-regular” mediante un procedimiento ulterior. Este episodio procesal simplemente lo menciono pero no lo abordaré aquí. Como quiera que sea, los procedimientos de control de la regularidad de los actos (control de la legalidad o de la constitucionalidad) se explican como cualquier otro acto de creación y aplicación del derecho. Pues bien, de la aplicación de una norma que confiere facultades (n-F) se sigue (de su mero acto de aplicación) que, además de adicionar una porción de determinación a este proceso de creación, O decide el curso sucesivo de la creación jurídica. V. ¿PERPLEJIDAD? Tenemos dos tipos de «lecturas»: la «lectura latina» (de izquierda a derecha) y la «lectura arábiga» (de derecha a izquierda). Esto produce una situación, si no contradictoria, sí seriamente paradójica. Mientras n2, por ejemplo, pretende determinar lo que es n3 (o lo que va a ser), n3 (o, mejor, a3) pretende determinar (interpretar) lo que n2 efectivamente significa. ¿Perturba esta situación a los jueces y abogados (en el supuesto de que hicieran explícita esta perplejidad)? Da la impresión que la profesión jurídica “diluye” (o ignora) esta situación. Más bien, parece que los juristas piensan que disponen de dos distintos artilugios para «leer» el derecho, aprendidos como cánones del oficio —como todas las (meta)reglas de interpretación—. Cuando se quiere saber si el acto a(?) es un acto jurídico válido, se comienza por “leer” los actos que confieren facultades en un individuo. Después se confronta este acto con el contenido de la norma que le con-
862
ROLANDO TAMAYO Y SALMORÁN
fiere facultades para ver si, efectivamente, a(?) satisface las condiciones establecidas por los actos anteriores de la secuencia. Pero si, por el contrario, lo que se quiere saber es qué significa la norma n(?) (e. g. una disposición constitucional o cualquier disposición legislativa), se comienza por “leer” los actos posteriores, los actos autoritativos que interpretaron n(?), por ejemplo, la jurisprudencia de los tribunales supremos (tribunales de casación, cortes supremas o tribunales constitucionales). ¿Existe acaso un argumento que nos permita privilegiar a cualquiera de las lecturas? ¿Qué hacen los juristas para inclinar la balanza? ¿Tiene la dogmática jurídica algún (meta)criterio para decidir? ¿Son estas “lecturas” representativas del conservadurismo o activismo judicial? Lamentablemente no me puedo detener en estas importantes cuestiones. VI. LAS VARIACIONES JURÍDICAS Siguiendo con la indeterminación del derecho y su incidencia con la aplicación (interpretación) del derecho, permítase añadir otro problema. Como he señalado, la creación jurídica no se produce de una vez y para siempre ni a intermitencias regulares. Por el contrario, la creación (o innovación) jurídica se produce de forma constante. Este carácter constante de la creación jurídica me condujo a considerar que la experiencia jurídica es el marco de las variaciones jurídicas. El orden jurídico (parcial o total) no es sino el cuadro de las transformaciones jurídicas unitariamente consideradas. Los órdenes jurídicos no se encuentran ni acabados ni en reposo: están en proceso continuo.39 Es importante tener presente que las facultades conferidas por una norma jurídica para crear normas subsecuentes pue39 La creación jurídica no se produce necesariamente en in momento fijo o en intermitencia regulares. Por el contrario, la creación o innovación jurídica —con todos los cambios y alteraciones que implica— se produce de forma constante. Ahora bien, si el orden jurídico es un continuado proceso de creación, entonces, el orden jurídico no es propiamente un conjunto o sistema (siempre igual a la suma de sus entidades) sino que es solamente el cuadro de las transformaciones o modificaciones jurídicas unitariamente consideradas; véanse mis trabajos: Sobre el sistema jurídico y su creación, México, UNAM, Instituto de Investigaciones Jurídicas, 1976, p. 134; L’Etat, sujet des transformations juridiques, París, Faculté du Droit et Science Economiques, Université de Paris, 1970, pp. 229-233). El orden jurídico no es, pues, más que un flujo constante de variaciones jurídicas —substituyéndose continuamente los órdenes jurídicos momentáneos—.
INTERPRETACIÓN JURÍDICA
863
den ser ejercidas repetidas veces.40 La autoridad (individuo o grupo) investida con facultades de este tipo puede hacer uso de ellas todas las veces que así lo decida. De esta manera, la autoridad referida podrá crear varias normas en diferentes momentos. Supongamos que la norma n1 confiere a una determinada autoridad la facultad de crear normas jurídicas cada vez que realice (una instancia del acto) a2. La autoridad referida puede crear tantas normas como tantas veces haga uso de sus facultades (tantas veces como realice a2). Esta situación puede observarse en el siguiente diagrama:
Figura 6 Aquí se consideran simplemente momentos del orden jurídico en donde se presupone que las ocurrencias de a1 ya se han realizado; donde las normas creadas por las ocurrencias de a1 se mantienen en “reposo” y se ignora la actividad ulterior del orden jurídico (así como la creación paralela de todas las otras cadenas normativas posibles). Es pues oportuno introducir una distinción entre orden jurídico momentáneo y orden jurídico total o, simplemente, orden jurídico tout court. El orden jurídico momentáneo es, ab obvo, un subsistema del orden jurídico, propiamente hablando. Para cada orden jurídico momentáneo existe un orden jurídico (total) que contiene todas las disposiciones jurídicas de los órdenes jurídicos momentáneos que lo componen. Es lógicamente imposible para un sistema jurídico contener un orden jurídico momentáneo vacío. Por supuesto, no existe un sistema jurídico que no contenga al menos un orden jurídico momentáneo.41 40 41
Véase supra, figuras 3, 4 y 5. Aunque en los trabajos que acabo de citar, consideré esta distinción, voy a hacer algunos comentarios sobre el particular, introduciendo algunos elementos de Joseph Raz
864
ROLANDO TAMAYO Y SALMORÁN
Esta importante distinción puede apreciarse fácilmente en el siguiente diagrama en donde se representa un orden jurídico (total):
Figura 7 Aquí, cada triángulo (a manera de un haz de actos de aplicación que se expanden en el tiempo) representa un orden jurídico momentáneo, donde el triángulo sombreado es el orden jurídico “vigente” que será substituido por los órdenes jurídicos momentáneos que habrán de seguirle (triángulos punteados). VII. FINAL El principio de indeterminación o de incertidumbre de Heisenberg muestra cómo las partículas pueden ser interpretadas en términos de su posición (en el espacio) y de su momentum (en el tiempo), asumiendo que sus patrones y sus momenta han sido medidos. La «mecánica jurídica» muestra que la indeterminación es una característica que acompaña al derecho. Muestra la limitación impuesta por un par de variables, tales como los primeros patrones bien definidos (acta anteriora) y el momentum (cualquier momento en el orden jurídico existente. Como en física, la determinación de uno afecta la determinación del otro. La enorme significación del principio de indeterminación es reconocida por todos los científicos; pero, ¿cómo debe ser entendida jurídicamen(Cfr. The Concept of a Legal System, An Introduction to the theory of Legal System, Oxford, Oxford University Press, 1980, pp. 34 y 35).
INTERPRETACIÓN JURÍDICA
865
te? Tenemos algunos actos (“patrones”) bien prescritos (n1, por ejemplo) que programan “pasos” futuros: actos de aplicación que, en principio, deben “moverse” de conformidad con los “patrones” bien establecidos (acta anteriora o mormæ anterioræ). En este momento los actos de aplicación aún no han sido realizados ni los patrones bien establecidos han sido interpretados. Los primeros actos prescritos lanzan el programa para el desarrollo de un orden jurídico particular. Estos programas pueden ser completados progresivamente por los actos, que eventualmente ocurrirán. Esto se revela con una mirada atenta al funcionamiento del derecho. En efecto, la «mecánica jurídica» muestra la creación no-armónica del derecho (la historia muestra que los órdenes jurídicos varían notablemente en la forma en que se comportan los individuos facultados). Un órgano (re)elabora las variables jurídicas y les asigna la “medida” apropiada que cree les corresponde. Este proceso de “medición” subraya el papel activo de los órganos de aplicación, los cuales, al hacer mediciones (interpretaciones), inciden en el alcance de la norma que supuestamente regula su conducta. En fuerte analogía con la mecánica del quantum de Heisenberg, en el derecho, lo que se revela por una observación activa no es un dato absoluto, sino un theory-laden datum (i. e. un dato relativizado) por la interpretación dada por los órganos de aplicación del derecho. VIII. BIBLIOGRAFÍA AGUILÓ, Joseph, Sobre la derogación. Ensayo de dinámica jurídica, México, Distribuciones Fontamara, 1995, Biblioteca de Ética, Filosofía del Derecho y Política, 41. ALCHOURRÓN, Carlos, “Normative Order and Derogation”, en MARTI NO, Antonio A., Deontic Logic, Computational Linguistics, and Legal Information Systems, Amsterdam-Nueva York, North Holland, 1982. ——— y BULYGIN, Eugenio, Análisis lógico y derecho, Madrid, Centro de Estudios Constitucionales, 1991. ATRIA, Fernando, On Law and Legal Reasoning, Oxford and Portland, Oregon, Hart Publishing, 2001, The European Academy of Legal Theory Series, 1998.
866
ROLANDO TAMAYO Y SALMORÁN
BENTHAM, Jeremy, An introduction to the Principles of Morals and Legislation, Londres, University of London-The Athlon Press, 1959, The Collected Works of Jeremy Bentham. ———, Introduction to the Principle of Morals and Legislation, Darien, Connecticut, Hafner Publishing Co., 1970, The Hafner Library of Classics, 6. BERGER, Adolf, Encyclopædic Dictionary of Roman Law, Philadelphia, The American Philosophical Society, 1968, p. 598. ——— y BENTHAM, J., On Laws in General, HART, H. L. A. (ed.), Londres, Athlone Press, 1970. BIX, Brian, Law, Language and Legal Determinacy, Oxford, Oxford University Press, 1994. BULYGIN, Eugenio, “Tiempo y Validez”, en ALCHOURRÓN, Carlos y BULYGIN, Eugenio, Análisis lógico y derecho. CAPELLA, José Ramón, El derecho como lenguaje, Barcelona, Ariel, 1968. CARACCIOLO, Ricardo, La noción de sistema en la teoría del derecho, México, Distribuciones Fontamara, 1994. COMANDUCCI, Paolo, Razonamiento jurídico. Elementos para un modelo, México, Distribuciones Fontamara, 1999, Biblioteca de Ética, Filosofía del Derecho y Política, núm. 68. Corpus Iuris Civilis. I. Institutiones, Digesta. II. Codex III. Nocellæ. Momsen, Theodor y Krüger, Paul (eds.), con Præfatio de Wolgang Kunkel, Dublín-Zurich, (Weidmannsche Verlagsbuchhandlung, 1973, reimpresión de la edición de Berlín, 1967. ENCYCLOPÆDIA BRITANNICA, “«As If» Philosophy, of”, Encyclopædia Britannica DVD 2002, Chicago, Encyclopædia Britannica, Inc., 1994-2002. ———, “Hans Veihinger”, Encyclopædia Britannica DVD 2002, Chicago, Encyclopædia Britannica, Inc., 1994-2002. ———, “Heisenberg, Werner”, Encyclopædia Britannica DVD 2002, Chicago, Encyclopædia Britannica, Inc., 1994-2002. GEORGE, R. (ed.), The Autonomy of Law, Oxford, Oxford University Press, 1996. GUASTINI, Ricardo, “Produzione di norme a mezzo di norme. Un contributo all’analisi del rgionamiento giuridico”, en GIANFORMAGGIO, Leticia y LECALDANO, Eugenio (eds.), Etica e diritto, Le vie de la giusti-
INTERPRETACIÓN JURÍDICA
867
ficazione razionale, Roma-Bari, 1986, Biblioteca di Cultura Moderna Laterza, 924. ———, Dalle fonti alle norme, Turín, Giappichelli, 1992. ———, “Interpretative Statements”, GARZÓN VALDÉS, Ernesto; KRAWIETZ, Werner; VON WRIGHT, Georg Henrik y ZIMMERLING, Ruth, Normative Systems in Legal and Moral Theory. Festschrift for Carlos Alchourrón and Eugenio Bulygin, Berlín, Duncker & Humblot, 1997. ———, Le fonti del diritto e l’interpretazione, Milán, Guiffrè, 1993. GUIBOURG, Ricardo, Derecho, sistema y realidad, Buenos Aires, Astrea, 1986, Filosofía y Derecho, 13. HART, H. L. A., The Concept of Law, BULLOCH, Penelope y RAZ, Joseph (eds.), Oxford, Oxford University Press, 1994. Existe versión en español de Genaro R. Carrió: El concepto de derecho, Buenos Aires, 1995 (1963). La versión inglesa de 1994 contiene un Postcript. Este Postscript ha sido traducido por Rolando Tamayo y Salmorán: Post scriptum al concepto de derecho, México, UNAM, Instituto de Investigaciones Jurídicas, 2000. ——— “Introduction”, en BENTHAM, Jeremy, Of Laws in General. ———, “Commands and authoritative Legal Reasons”, Essays on Bentham. Jurisprudence and Political Theory, Oxford, Oxford University Press, 1982. KELSEN, Hans, General Theory of Law and State, trad. de Anders Wedberg, Nueva York, Russell and Russell, 1973. Reimpresión de la edición de Harvard University Press, 1945. Existe versión española de GARCÍA MÁYNEZ, Eduardo, Teoría general del derecho y del Estado, México, UNAM, 1979. ———, General Theory of Norms, trad. de Michael Hartney, Oxford, Oxford University Press, 1991. Versión en in glés de la Allge mei ne Theorie der Normen, Vienna, Manzsche Verlag- und Universitätsbuchhandlung, 1979. ———, Introduction to the Problems of Legal Theory, trad. de Bonnie Litschewski y Stanley L. Paulson, Oxford, Oxford University Press, 1996, p. 55. Versión en inglés de la primera edición de la Reine Rechtslehre, Einleitung in die rechtswissenschaftliche Problematik, Aalen, Scientia Verlag, reimpresión de la 1. Auflage, Franz Deuticke, Leipzig-Vienna, 1934.
868
ROLANDO TAMAYO Y SALMORÁN
———, Reine Rechtslehre, Vienna, Franz Deuticke, 1960. Existe versión en español de Roberto J. Vernengo, Teoría pura del derecho, Porrúa-UNAM, Instituto de Investigaciones Jurídicas, 1997. Reimpresión de la edición de la UNAM, Instituto de Investigaciones Jurídicas de1979. ———, Teoría general del Estado, trad. de Luis Legaz Lacambra, Barcelona, Labor, 1934. MARMOR, Andrei (ed.), Law and Interpretation. Essay in Legal Philosophy, Oxford, Oxford University Press, 1995. MAZZARESE, Tecla, Forme de razionalità delle decisioni giudiziali, Turín, G. Giappichelli Editore, 1996, Analisi e Diritto. Serie Teorica, 25. ———, “Legal Interpretation as Translation Insights from a Current Analogy”, Ponencia presentada en el V Seminario García Máynez , celebrado en México, del 5 al 7 de octubre, de 1995. Existe versión en español de Rolando Tamayo y Salmorán: “La interpretación jurídica como traducción”, Isonomía. OHLINGER, Theo, Der Stufenbau der Rechtsordnung. Rechtstheoriestiche und ideologische Aspekte, Viena, Manzsche Verlag- und Universitätsbuchhandlung, 1975. RAZ, Joseph, The Concept of a Legal System. An Introduction to the theory of Legal System, Oxford, Oxford University Press, 1980. Existe versión en español de Rolando Tamayo y Salmorán, El concepto de sistema jurídico. Una introducción a la teoría del sistema jurídico, México, UNAM, Instituto de Investigaciones Jurídicas, 1986. ROBLES MORCHÓN, Gregorio, Las reglas del derecho y las reglas de los juegos, México, UNAM, Instituto de Investigaciones Jurídicas, 1984. ROSS, Alf, Directives and Norms, Londres, Routledge & Kegan Paul, 1968. RUIZ MANERO, Juan, Jurisdicción y normas, Madrid, Centro de Estudios Constitucionales, 1990. SCHMILL, Ulises, “Derecho y lógica”, Isonomía. Revista de Teoría y Filosofía del Derecho, México, núm. 1, octubre 1994. ———, La reconstrucción pragmática de la teoría del derecho, México, Thémis, 1997. TAMAYO Y SALMORÁN, Rolando, L’Etat, sujet des transformations juridiques, París, Faculté du Droit et Science Economiques, Université de Paris, 1970 (tesis de doctorado).
INTERPRETACIÓN JURÍDICA
869
———, Sobre el sistema jurídico y su creación, México, UNAM, Instituto de Investigaciones Jurídicas, 1976. ———, “Rechtsordnung und Verfassung. Eine Kurze Beschreibung des Prozesses der Rechtserzeugung”, en OLIVÉ, León y SALMERÓN, Fernando (eds.), Philosophie und Rechtstheorie in Mexiko, Berlín, Ducker und Humboldt, 1989. ———, “La interpretación constitucional. (La falacia de la interpretación cualitativa)”, en VÁZQUEZ, Rodolfo (ed.), Interpretación jurídica y decisión judicial, México, Fontamara, 1998, Doctrina Jurídica Contemporánea, 4. ———, “How to Make Reasons with Norms. Or How to Convert Norms into Reasons. Or How to Disentangle this Mess”, Proceeding of the XVIIIth World Congress of Philosophy of Law and Social Philosophy. Existe versión en español del autor: “Cómo hacer razones con normas. O cómo convertir normas en razones. O cómo deshacer este lío”, Doxa, Cuadernos de Filosofía del Derecho, vol. II, núm. 21, 1998, Actas del XVIII Congreso Mundial de Filosofía del Derecho, Alicante, Universidad de Alicante, España, junio de 1999. ———, Elementos para una teoría general del derecho. (Introducción al estudio de la ciencia jurídica). México, Themis, 2001. ———, Introducción al estudio de la Constitución, México, Distribuciones Fontamara, 2002, Doctrina Jurídica Contemporánea, 3. ———, Razonamiento y argumentación jurídica. El paradigma de la racionalidad y la ciencia del derecho, México, UNAM, Instituto de Investigaciones Jurídicas, 2003, serie Doctrina Jurídica, núm. 121. ———, “Indeterminación del derecho. Las paradojas de la interpretación jurídica”, en MALEN, J.; OROZCO, J. y VÁZQUEZ, R. (eds.), La función judicial. Ética y democracia, Barcelona, Gedisa, 2003. TARELLO, Giovanni, Diritto, enunciati, usi. Studi de teoria e metateoría del diritto, Bolonia, 1974. TROPER, Michel, “Kelsen, la théorie de l’interprétation et la structure de l’ordre juridique”, Revue Internationale de Philosophie, Bruselas, 1981; reimpreso en TROPER, Michel, Pour un théorie juridique de l’état, París, Presses Universitaires de France, 1994. ———, “Fonction jurisdictionnelle ou pouvoir judiciare?” Pouvoirs, París, Presses Universitaires de France, 1981, reimpreso en TROPER, Michel, Pour un théorie juridique de l’État.
!
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
Ana Lilia ULLOA CUÉLLAR* SUMARIO: I. Introducción. II. La nueva filosofía de la ciencia. III. El derecho y la nueva filosofía de la ciencia. IV. La teoría interpretativa del derecho de Dworkin. V. Bibliografía.
I. INTRODUCCIÓN Como sabido es, a raíz de La estructura de las revoluciones científicas de Thomas Kuhn,1 la filosofía de la ciencia tiene un salto progresivo a nivel cuantitativo y cualitativo. Tradicionalmente se entendía la actividad científica como una actividad consistente en realizar experimentos, reunir datos, explicarlos por medio de hipótesis teóricas simples, progresando así racionalmente y en forma acumulativa hacia la verdad. Pero esto es sólo eso, una vieja imagen de la ciencia. Una vieja imagen cuyos supuestos básicos2 eran, entre otros: — — — —
El carácter neutral de la observación. La noción de una verdad absoluta. Una teoría de la verdad por correspondencia. La elección de teorías como una actividad gobernada por principios autónomos y universales de racionalidad. — La importancia del producto sobre el proceso.
* Instituto de Investigaciones Jurídicas, Universidad Veracruzana, México. 1 Kuhn, Thomas, La estructura de las revoluciones científicas, México, FCE, 1971. 2 Las siguientes ocho características de la ciencia bajo el enfoque positivista, así como las otras siete características de la nueva filosofía de la ciencia, son tomadas del texto: Kuhn y el cambio científico, de Ana Rosa Pérez Ranzans, texto que ha servido de base para la construcción de las dos propuestas fundamentales que se presentan en este artículo. 871
872
ANA LILIA ULLOA CUÉLLAR
— El establecimiento de la objetividad y la suspensión de la subjetividad. — El establecimiento y distinción del contexto del descubrimiento y el contexto de justificación. — La añeja idea de que la filosofía de la ciencia tiene una función exclusivamente normativa, etcétera Sin embargo, de 30 años para acá y como hemos dicho, a raíz de la propuesta de Kuhn, y en particular de su tesis de la inconmensurabilidad, se vio la necesidad de replantear el problema de la comparación y elección de teorías, renovando con ello la discusión sobre la racionalidad científica. El énfasis se cambia ahora en: — Dar cuenta de los procesos del cambio científico como lugar central. — Un estudio serio el carácter complejo y multifacético de esta empresa cognitiva llamada ciencia. — El hecho de que el progreso en la ciencia no tiene que ver con la acumulación lineal. — Un análisis de las nuevas formas en que se conduce la investigación científica y la evaluación de sus resultados, desde la propia historia de la ciencia. — La comprensión de la realidad sólo en términos de un conjunto de presuposiciones y valores. — El establecimiento de cambios en la ciencia, debido más a las relaciones que se establecen dentro de un modelo que al cambio de sus elementos. — Y al establecimiento de nuevas relaciones entre ciencia y mundo, y entre lenguaje y realidad. Esto, a su vez, trae consigo un nuevo impulso a la polémica del realismo (conocimiento y realidad) y un nuevo impulso al problema de la verdad. Y un enfoque relativista en el ámbito de las ciencias naturales —estas ciencias ya no son independientes de las diversas perspectivas locales— enfoque que implica problemas difíciles por resolver o bien aceptarlo con sus graves consecuencias. El trabajo de Kuhn, y en general la nueva filosofía de la ciencia, tiene implicaciones no sólo en las ciencias naturales sino, y quizás en mayor medida, en las ciencias sociales y humanísticas, de manera que también influye a la ciencia que nos ocupa: el derecho.
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
873
En efecto, las propuestas fundamentales de la nueva filosofía de la ciencia, arrojan luz sobre la ontología y la epistemología jurídica e incluso sobre la lógica jurídica. Y considero también, y éste es el asunto que me trae aquí, que la ciencia jurídica puede, a su vez, arrojar luz sobre el propio proceso de construcción y deconstrucción de la nueva filosofía de la ciencia. Y sobre este proceso dialéctico, de ida y vuelta de la filosofía de la ciencia para con el derecho y del derecho para con la filosofía de la ciencia, tratará mi intervención que hoy someto a la consideración y crítica de todos ustedes. II. LA NUEVA FILOSOFÍA DE LA CIENCIA Como he señalado, la filosofía de la ciencia tradicional tiene como objetivo principal estudiar y analizar problemas lógicos, en particular la estructura lógica de las teorías y las relaciones lógicas entre los enunciados que describen observaciones y las leyes y teorías que estos enunciados confirman o refutan, pero todas las cuestiones relacionadas con el contexto socio-político donde se desarrolla la ciencia son ignoradas por ser consideradas materia de otra disciplina: la sociología de la ciencia. ...al utilizar sólo métodos lógicos se pretende que los resultados del análisis filosófico de la ciencia tengan una aplicación y validez generales y, por tanto, un carácter definitivo. El filósofo debe reconstruir la estructura lógica del lenguaje científico, de las leyes, de las teorías y de las explicaciones que éstas ofrecen, así como la estructura de las relaciones de justificación entre las hipótesis y la evidencia. Como señala Wolfgang Stegmüller, la idea era que “con métodos lógicos sólo se puede llegar a aseveraciones válidas para todas las ciencias posibles” (Stegmüller, 1973, p. 19). De esta manera, la atención exclusiva en la reconstrucción lógica eliminaba del ámbito filosófico, como cuestiones no pertinentes, los procesos de producción y desarrollo de los resultados científicos, así como la posible influencia de “factores externos” —que no sean de tipo experimental o lógico— en la aceptación de dichos resultados. Este conjunto de cuestiones se consideró como parte del contexto de descubrimiento, contexto que era de la competencia de la historia, la psicología, la sociología o la pragmática de la ciencia.3 3
Pérez Ransanz, Ana Rosa, Kuhn y el cambio científico, México, FCE, 2000, p. 18.
874
ANA LILIA ULLOA CUÉLLAR
Este tipo de filosofía de la ciencia, desarrollada en la primera mitad del siglo XX, se caracteriza también por sostener entre otras cosas, que el progreso en la ciencia es acumulativo, y que el criterio de demarcación entre lo que es un conocimiento científico y un conocimiento no científico viene dado por la aplicación de reglas, algoritmos, es decir, por el método científico. Este método es considerado como un conjunto “...poderoso de principios o reglas, tanto de razonamiento como de procedimiento, que permitían evaluar objetivamente las hipótesis que se proponen en la actividad científica”.4 Por ello, se consideraba que la principal tarea de la filosofía de la ciencia consistía en formular con precisión las reglas del método, las cuales, al aplicarse correctamente por el científico, daban lugar a la obtención del auténtico conocimiento. A partir de los años sesenta del siglo pasado, este enfoque positivista de la filosofía de la ciencia ha sido duramente criticado por diversos filósofos y científicos como Stephen Toulmin; Thomas S. Kuhn; Russell Hanson y Paul K. Feyerabend. Y es a raíz de las propuestas presentadas en La estructura de las revoluciones científicas por Kuhn, que se empiezan a gestar las tesis fundamentales que conforman la nueva filosofía de la ciencia. Para esta nueva concepción de ciencia y filosofía de la ciencia, la investigación científica consiste en un intento persistente de interpretar la naturaleza en términos de un marco teórico presupuesto. Se presenta un giro histórico que consiste en el rechazo de la lógica formal como herramienta principal para el análisis de la ciencia, y se reconoce, en cambio, la relevancia del estudio detallado de la historia de la ciencia. Pero vayamos por partes. Kuhn se percata que la labor real del científico y el desarrollo de la investigación científica no se da necesariamente con la aplicación de las reglas del método científico; hace entonces un estudio histórico detallado de la ciencia, al término del cual obtiene varios resultados, algunos de éstos, los estudiamos a continuación: 1. Contexto de descubrimiento vs. contexto de justificación Como hemos dicho, el enfoque positivista de la ciencia y de la filosofía de la ciencia consideraba correcto establecer una clara separación en4
Ibidem, p. 15.
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
875
tre el contexto de descubrimiento (las razones sociales, políticas y económicas de los científicos, así como el contexto histórico-social en que se desarrolla la ciencia) y el contexto de justificación. Así, se consideraba que “...el filósofo se ocupaba sólo de cuestiones lógicas presentes después de que ha sido formulada una teoría científica; y el proceso por el que un científico llega a pensar una teoría particular era señalado como campo de trabajo del psicólogo o del sociólogo”. En Philosophy of Social Science Richard Rudner nos dice: Ahora, en general, el contexto de validación es el contexto que nos interesa, cuando, independientemente de cómo hayamos llegado a descubrir o tomar en consideración una hipótesis o teoría científica, planteamos cuestiones acerca de si aceptarla o rechazarla. Al contexto de descubrimiento, por otra parte, pertenecen cuestiones tales como de qué modo, de hecho, llega uno a dar con buenas hipótesis, o qué condiciones sociales, psicológicas, políticas o económicas llevarán a pensar hipótesis fructíferas.5
La historia de la ciencia muestra en cambio, que el contexto histórico y sociopolítico tiene implicaciones o por lo menos está relacionado con el contexto de justificación, de manera que dicha dicotomía debe ser superada. Se trata ahora de reivindicar la dimensión histórica, social y pragmática de la empresa científica, y de explorar su impacto en la dimensión metodológica. Tanto el uso de la teoría como el proceso de su evolución son importantes “el contexto de justificación es así parte del contexto de descubrimiento y no puede trazarse ninguna línea tajante entre descubrimiento y justificación”.6 La ciencia siempre se hace desde un horizonte que apunta necesariamente a una serie de compromisos; compromisos ontológicos, epistemológicos y axiológicos que conforman, como a continuación veremos, modelos conceptuales llamados paradigmas, programas de investigación o tradiciones científicas. 2. Modelos conceptuales La nueva filosofía de la ciencia sostiene que las teorías científicas y en general todo el trabajo de la investigación científica presupone 5 6
Rudner, Richard S., Philosophy of Social Science, Prentice Hall, 1966, p. 6. Brown, Harold, La nueva filosofía de la ciencia, 2a. ed., Barcelona, Tecnos, 1999, p. 170.
876
ANA LILIA ULLOA CUÉLLAR
siempre modelos de conocimiento llamados a veces paradigmas, en la terminología de Kuhn; tradiciones culturales, de acuerdo con Larry Laudan; o entramado conceptual, de acuerdo con León Olivé. Estos modelos o tradiciones de investigación determinan la perspectiva general bajo la cual se ve el mundo: determina los intereses de construir X o Y teorías, así como los problemas que deben resolver y a qué campo de fenómenos deben aplicarse; establecen también los criterios para la evaluación de las mismas teorías: son entonces los lentes con que se ven los fenómenos y se conceptualiza la experiencia. Contienen normas que se aplican dentro de los contextos científicos propiamente dichos; normas que forman parte de los modelos de cientificidad y evaluación de teorías científicas. Incluyen valores a los cuales se orientan las acciones del trabajo científico y que fungen como indicadores para la elección de teorías, y contienen fines en función de los cuales se produce, evalúa y acepta el conocimiento científico. Importante resulta resaltar que todos estos elementos que forman parte de los marcos conceptuales no son fijos ni ahistóricos, y todos ellos a su vez, conforman una concepción de la naturaleza del conocimiento científico, una justificación de este conocimiento, así como una concepción la función de los científicos. Contienen también ideas sobre el progreso en la ciencia, la verdad, la objetividad, el proceso, la racionalidad y por supuesto, fines, valores y normas. De esta manera, tenemos que toda teoría se construye siempre dentro de ciertos modelos o marcos generales. Pero estos marcos conceptuales o tradiciones de investigación se desarrollan y cambian a lo largo de la historia. Otro de los objetivos principales de la nueva filosofía de la ciencia es construir modelos de desarrollo del conocimiento científico que expliquen el cambio de estos marcos conceptuales o paradigmas kuhnianos. 3. El cambio científico Desde la perspectiva histórica se descubre que uno de los problemas importantes en ciencia y filosofía de la ciencia es el cambio científico. En su texto Kuhn y el cambio científico, Ana Rosa Pérez Ransanz nos comenta que la preocupación central de Kuhn es dar cuenta de los procesos del cambio científico; cambio profundo que ocurre al nivel de los presupuestos y compromisos básicos.
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
877
Con el enfoque historicista, la atención se concentra en la dinámica del proceso mediante el cual cambia y evoluciona el conocimiento científico. El proceso adquiere así más relevancia que el producto; la estructura lógica de los resultados pasan a un segundo lugar: ...el análisis del desarrollo del conocimiento exige tener en cuenta el modo como de hecho se trabaja en la ciencia y sólo la investigación histórica nos puede dar esa información. En consecuencia, se otorga primacía, como instrumento de análisis, a los estudios históricos frente a los análisis lógicos.7 Los cambios científicos remiten a los acontecimientos más importantes de la historia de la ciencia; se vuelve entonces imprescindible estudiar, analizar y explicar los cambios de los modelos conceptuales o paradigmas, y estos cambios no pueden ser estudiados ni analizados utilizando sólo métodos inductivos o deductivos, además, la mayor parte del trabajo científico no es hecho con las reglas y el método formal del método científico. Los cambios en los modelos de investigación implican también cambios en las metodologías; se trata entonces no sólo de cambios en la teoría sino en el nivel de los procedimientos experimentales, en los criterios de evaluación, pero sobre todo, en los presupuestos y compromisos básicos. La tarea de la reconstrucción racional de la ciencia viene a ser entonces una tarea empírica y no a priori y el concepto de racionalidad científica sufre fuertes modificaciones, como más adelante veremos. Los estudios históricos sobre el cambio científico develan también que el progreso en la ciencia no es acumulativo. El cambio para Kuhn es entendido como un cambio gestálico, donde los mismos objetos se ven bajo una óptica distinta. El cambio de paradigma, de acuerdo con Kuhn, presenta una nueva ontología y por lo mismo, da lugar a un mundo diferente. El énfasis en el estudio del cambio paradigmático trae consigo una concepción alternativa de ciencia, que da lugar a su vez a una revolución en el nivel del análisis de la ciencia. Como ya hemos señalado, la ciencia es fundamentalmente un fenómeno histórico y enten derla de esta forma es construir una visión más compleja, más flexible y más cercana a la práctica científica. Así, el cambio científico va de la mano con cambios de intereses en la ciencia.
7
Pérez Ransanz, Ana Rosa, op. cit., nota 3, p. 16.
878
ANA LILIA ULLOA CUÉLLAR
4. Inconmensurabilidad Sin duda, una de las tesis que constituyen la columna vertebral del modelo kuhniano para la dinámica científica es la tesis de la inconmensurabilidad. Esta tesis señala, entre otras cosas, que en las ciencias naturales no existe una sola forma de conceptualizar la realidad. Los hechos que se nos dan en la experiencia no son puros y su identificación y su descripción dependen de una teoría, la cual a su vez parte de un entramado conceptual. A diferencia de lo que sostiene la filosofía de la ciencia tradicional, el nuevo enfoque señala que no hay demarcación entre teoría y observación. Los cielos de los [antiguos] griegos eran irreductiblemente diferentes de los nuestros. La naturaleza de la diferencia es la misma que aquella que Taylor describe tan brillantemente entre las prácticas sociales de diferentes culturas. En ambos casos la diferencia está enraizada en el vocabulario conceptual [en los términos de clase]. Y en ningún caso la diferencia puede ser superada mediante la descripción en un vocabulario conductista de datos brutos.8
La observación siempre tiene una carga teórica, y por ello no hay un lenguaje neutral independiente de toda perspectiva local con el cual describir objetivamente la realidad. Esto nos lleva a su vez a la inconmensurabilidad de las teorías, es decir, que puede haber teorías cuyos términos y/o categorías analíticas no se puedan traducir o formular en un lenguaje común. La elección de teorías implica entonces un proceso bastante complejo. Si bien se reconoce la importancia fundamental de la experiencia en la adquisición de conocimiento, se insiste en que la mayor parte de la investigación científica consiste en un intento por comprender la naturaleza en términos de alguna estructura teórica presupuesta. De aquí que se afirme que no hay percepciones puras, independientemente de las perspectivas teóricas locales.9
8 9
Kuhn, op. cit., nota 1, p. 21. Pérez Ransanz, Ana Rosa, op. cit., nota 3, p. 232.
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
879
El problema de inconmensurabilidad apunta también al hecho de que ni en las ciencias naturales ni en las sociales hay método algorítmico para elegir entre teorías rivales, o para medir y comparar el éxito de las teorías. La elección de la teoría es entonces un proceso subdeterminado, en el cual factores externos (sociales, políticos, culturales, metafísicos) intervienen y en varias ocasiones de forma determinante. No sólo los procesos de construcción de hipótesis y teorías están sujetos a la influencia de factores ‘externos’ (factores de ámbito psicológico, social, ideológico, etcétera). Dado que no hay procedimientos algorítmicos para la comparación de teorías rivales, el proceso de elección de teorías está subordinado por la evidencia disponible y los estándares de evaluación aceptados en cada contexto. Esta subdeterminación da lugar a que diversas consideraciones —que pueden ser externas— influyan en las decisiones de los especialistas frente a teorías alternativas, generando desacuerdos y controversias. De aquí el interés creciente de los metodólogos por explicar cómo se forman nuevos consensos en la ciencia “...Como los cánones de evaluación y procedimiento no son autónomos, dado que ellos mismos han sufrido transformaciones como resultado de la dinámica de las diversas disciplinas, se considera que sólo un análisis de esta dinámica nos puede permitir elucidar el tipo de racionalidad que opera en la actividad científica [además] el carácter no autónomo de los estándares epistémicos ha conducido a un movimiento de naturalización de la epistemología, en que ésta se vincula con o incluso se sustituye por teorías empíricas sobre los procesos cognitivos (según se conciban estos procesos, se propone a la psicología, la sociología, la biología, etcétera).10 ...Dos teorías son inconmensurables, cuando sus estructuras taxonómicas no son homologables (cuando clasifican su dominio de investigación de manera diferente).11
Pero si esto es así, entonces no sólo hay problemas con el concepto de racionalidad científica sino también con la posible entrada del relativismo. 5. Racionalidad científica y relativismo A. Racionalidad En efecto, el problema de la inconmensurabilidad y el hecho de que el cambio científico y la aceptación de las nuevas creencias se explican por 10 11
Ibidem, p. 233. Ibidem, p. 189.
880
ANA LILIA ULLOA CUÉLLAR
medio de factores externos, hace que la racionalidad científica adquiera una nueva resignificación. En la filosofía de la ciencia tradicional, se consideraba que la racionalidad del conocimiento científico implicaba, entre otras cosas, la aplicación del método científico, la obtención de la verdad, la relevancia del método deductivo y por ende la aplicación de la lógica formal. Se trataba, entonces, de una racionalidad a priori con puntos de partida incuestionables. Tanto el racionalismo como el empirismo, enfoques pertenecientes a la filosofía de la ciencia tradicional, coinciden en sostener que: ... en la evaluación de hipótesis todos los sujetos que manejan la misma evidencia [información] deben llegar a la misma decisión, si proceden racionalmente. La racionalidad se concibe entonces, como enclavada en reglas de carácter universal, las cuales determinan las decisiones científicas; el énfasis se pone en las relaciones lógicas que conectan las hipótesis con la evidencia, y se minimiza el papel de los sujetos.12 Pero la racionalidad a que apunta la nueva filosofía de la ciencia tiene que ver más con una actividad de ponderación, deliberación, acuerdo y consenso. Se trata de una racionalidad no instantánea, basada en un trabajo de interpretación y de una cuidadosa ponderación de alternativas. Se trata, como ha señalado Ana Rosa Pérez, Ransanz de una racionalidad sin fundamentos. ... la racionalidad científica no es una cuestión de prueba o demostración. El desacuerdo plantea la necesidad de una deliberación, donde la racionalidad queda ligada a la habilidad para emitir juicios, o tomar decisiones, en las situaciones donde no puede haber reglas. Las decisiones que trascienden en la ciencia, es decir, aquellas que al lograr algún acuerdo significativo generan tradiciones fecundas de investigación —trazando de este modo las líneas del árbol evolutivo de las decisiones científicas— son resultado de una deliberación y este hecho en lugar de hacerlas epistémicamente sospechosas, muestra más bien el amplio alcance de la racionalidad, de la habilidad para pensar y razonar más allá del rango de lo que es capturable mediante algoritmos. De aquí que Kuhn sustituya el modelo de reglas por un modelo de razones, y abandone las razones concluyentes en favor de las modestas buenas razones.13 12 13
Idem. Pérez Ransanz, Ana Rosa, “Racionalidad sin fundamentos”, Homenaje a Fernando Salmerón. Filosofía moral, educación e historia, México, UNAM, 1996, pp. 287 y 288.
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
881
B. Relativismo En cuanto al relativismo, que implica a toda propuesta que parte de negar verdades esenciales, universales y a priori, así como la inconmensurabilidad de las teorías, bien puede ser atendido a través de propuestas como la del multiculturalismo pluralista, como la desarrollada por León Olive. Pero sobre todo teniendo presente que, por ejemplo, en la réplica a sus críticos Kuhn ha insistido en que la nueva filosofía de la ciencia no se presenta como una reducción total a los contextos externos, éstos sólo son recuperados, pero manteniendo y reconociendo a su vez la importancia epistémica del análisis estructural de la justificación. En suma, se trata del reconocimiento de las interrelaciones entre el contexto de descubrimiento y el contexto de justificación. ...la racionalidad nada tiene que ver con consensos... que son simple resultado de una moda; es decir, consensos donde los agentes no pueden ofrecer una justificación epistémica de las creencias o decisiones en juego... [ningún] hecho o proceso de la vida científica podría aspirar a la etiqueta de «racional» si fuera explicable sólo por mecanismos de tipo social o... [por] el fenómeno de mimetismo o contagio colectivo”.14 Igualmente la racionalidad científica no implica una noción de verdad absoluta. Pero [el] hecho de que la evaluación se apoye en una plataforma históricamente situada, cuyos componentes son, todos, modificables en principio, no impide que dicha base tenga un carácter relativamente firme y estable. En cada caso de desacuerdo no sólo se comparte un conjunto de valores epistémicos, también subsisten hechos, datos, problemas, técnicas experimentales, generalizaciones empíricas, teorías auxiliares, etcétera, que no están en cuestión en el contexto del debate. Esto es lo que permite que la elección de teorías sea un asunto genuinamente argumentable...] y un auténtico ejercicio de deliberación.15
Resulta importante señalar algo que posteriormente veremos, y es el hecho de que esta nueva concepción de racionalidad científica adquiere su expresión más distintiva en los modelos de argumentación jurídica utilizados por juristas, tanto prácticos como teóricos.
14 15
Ibidem, pp. 288 y 289. Ibidem, pp. 289 y 290.
882
ANA LILIA ULLOA CUÉLLAR
También resulta importante releer los comentarios que Hempel hace respecto a la propuestas de Kuhn en relación a la nueva naturaleza de la racionalidad: Cuando conocí a Thomas Kuhn en 1963, en el Centro para Estudios Avanzados en las Ciencias de la Conducta, me acerqué a sus ideas con desconfiada curiosidad. Mis concepciones en aquel tiempo estaban fuertemente influidas por el antinaturalismo de Carnap, Popper y pensadores afines pertenecientes o cercanos al Círculo de Viena, quienes sostenían que la tarea propia de la metodología y la filosofía de la ciencia era proporcionar “elucidaciones” o “reconstrucciones racionales” de la forma y función del razonamiento científico. Tales elucidaciones debían suministrar las normas o criterios de racionalidad para el seguimiento de la investigación científica, y debían ser formulados con rigurosa precisión mediante el aparato conceptual de la lógica... El acercamiento de Kuhn a la metodología de la ciencia era de una clase radicalmente diferente: se dirigía a examinar los modos de pensamiento que dan forma y dirigen la investigación, la formación y el cambio de teorías en la práctica de la indagación científica pasada y presente. En cuanto a los criterios de racionalidad propuestos por el empirismo lógico, Kuhn adoptó el punto de vista de que si esos criterios tenían que ser infringidos aquí y allá, en instancias de investigación que eran consideradas como correctas y productivas por la comunidad pertinente de especialistas, entonces más nos valía cambiar nuestra concepción sobre el proceder científico correcto, en lugar de rechazar la investigación en cuestión como irracional. La perspectiva de Kuhn consiguió atraerme cada vez más.16
De lo anterior, se desprende que la racionalidad de los cambios, prácticas y valores que ocurren en la ciencia se deben establecer en relación a su relativismo, y que éste se supera con una propuesta de multiculturalismo pluralista como la desarrollada por León Olive, y por tener presente que en la réplica a sus críticos Kuhn ha insistido en que la nueva filosofía de la ciencia no se presenta como una reducción total a los contextos externos, que éstos son recuperados manteniendo y reconociendo a su vez la importancia de los mismos.
16 Hempel, C. G., “Thomas Kuhn, colleague and friend”, World Changes. Thomas Kuhn and the Nature of sccience, Horwich, P. (ed.), Cambridge, The MIT Press, 1993, pp. 7 y 8.
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
883
III. EL DERECHO Y LA NUEVA FILOSOFÍA DE LA CIENCIA Sin duda contamos con abundante literatura sobre la cuestión de si el derecho es o no una ciencia. Generalmente esta disputa inicia por establecer la distinción entre el derecho como un fenómeno empírico y el derecho como un conocimiento jurídico, doctrinal teórico que da lugar a una ciencia y que resulta del análisis y reflexión metodológica de aquel fenómeno empírico llamado derecho. Deseo aclarar que este asunto, aunque importante, no es algo que vaya a tratar aquí, no por lo menos en forma explícita. Lo que me interesa, es más bien ver hasta qué punto las principales tesis de la nueva filosofía de la ciencia pueden arrojar luz sobre la ciencia del derecho, así como ver a la vez lo que el propio derecho puede hacer para el desarrollo de la nueva filosofía de la ciencia. También es cierto que una correcta partida de este trabajo sería iniciar por una historia de la ciencia del derecho, sin embargo, por limitaciones de tiempo, en esta ocasión no presentaré dicha historia. Se partirá entonces de una teoría jurídica contemporánea, a saber, la teoría de la interpretación de Dworkin; y trataré de hacer dos cosas. La primera, ver cómo se insertan en ella algunas de las propuestas de la filosofía de la ciencia. Y la segunda, ver qué tanto la propia ciencia del derecho puede contribuir al desarrollo de esa nueva filosofía de la ciencia. Aquí, por limitaciones de espacio y tiempo, sólo me enfocaré a algunos rasgos importantes de su teoría de la interpretación, expuesta en El imperio de la justicia y en Los derechos en serio, dejando algunas tesis dworkinianas, también fundamentales, para un trabajo posterior. IV. LA TEORÍA INTERPRETATIVA DEL DERECHO DE DWORKIN Siguiendo el estudio histórico de Perelman sobre las teorías fundamentales relativas al razonamiento judicial, desarrolladas a partir del Código de Napoleón, tenemos las siguientes tres escuelas: la escuela de la exégesis, la escuela funcional-sociológica y la concepción tópica o retórica del razonamiento jurídico. La escuela exegética se caracteriza porque concibe al razonamiento jurídico como un razonamiento deductivo representado por un silogismo. De acuerdo con esta escuela, el juez lleva a cabo un trabajo mecánico
884
ANA LILIA ULLOA CUÉLLAR
que consiste en formular su decisión conforme a derecho sin hacer ningún tipo de valoración. La escuela sociológica, por su parte, entiende que el derecho no es un sistema cerrado y que el trabajo del juez debe estar relacionado con los fines y valores de los legisladores. Para esta escuela el razonamiento jurídico no se reduce a una deducción silogística, sino que va hasta la intención del legislador para alcanzar el fin social perseguido por éste. Aquí, la lógica formal resulta entonces insuficiente y se hace necesario recurrir a reflexiones argumentativas que lleven a obtener la voluntad del legislador. La tercera concepción o escuela tópica del razonamiento jurídico, de acuerdo con Perelman, es la que predomina en los países occidentales después de 1945. Ésta se caracteriza también por la importancia atribuida a los principios generales del derecho y a los lugares específicos del derecho. Se trata de un equilibrio entre el valor de la solución y la conformidad con el derecho. Y aunque no le da tanto peso a las cuestiones sociológicas como la segunda escuela, si considera que el razonamiento jurídico remite a un trabajo de ponderación, valoración y argumentación en el cual la lógica formal no juega el principal papel, y la sintaxis y el análisis de los conceptos dejan su lugar protagonista para el análisis pragmático. Es en esta línea de la tópica del razonamiento jurídico en donde se ubica, en términos generales, la teoría de la interpretación de Ronald Dworkin que a continuación se expone brevemente. Para Dworkin el derecho es una práctica interpretativa social, que se compone tanto de un conjunto de reglas como de una serie de principios que dichas reglas pretenden desarrollar. En cuanto a la interpretación, ésta se caracteriza por ser creativa y constructiva y por tener como objetivo principal mostrar el objeto interpretado desde su mejor ángulo. Respecto a la acción interpretativa del intérprete, éste debe partir del hecho de que la práctica posee principios, los cuales tendrán siempre primacía frente a las reglas. En cuanto a la actividad de interpretación, cabe recordar que Dworkin considera que hay varios tipos importantes de interpretación, de las cuales destaca cuatro: interpretación de una conversación, interpretación científica, interpretación artística e interpretación de una práctica social. Sostiene además que tanto la interpretación artística como la interpretación de una práctica social son interpretaciones de algo creado “algo creado por personas” y que adquiere una identidad distinta a la de sus
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
885
creadores; por ello son llamadas interpretaciones creativas. En el caso de la interpretación jurídica ésta es una interpretación creativa cuyo objeto es defender alguna postura acerca del significado o sentido de la práctica social.17 De acuerdo con Dworkin, el proceso interpretativo del derecho presenta tres etapas: la preinterpretativa, la interpretativa y la posinterpretativa. En la primera etapa, se identifica el objeto interpretado y se le clasifica dentro de un determinado género. De acuerdo con ésta etapa, tenemos que para la práctica jurídica, de inicio se hace necesario que exista un acuerdo previo sobre qué prácticas son prácticas jurídicas. La segunda etapa versa sobre el sentido del derecho, el cual viene configurado a través de los valores jurídicos que presuponen la práctica jurídica social. Por otra parte, cabe señalar que una tesis fundamental en la teoría de Dworkin es, sin duda, la integridad del derecho, esta integridad se da a partir de la segunda etapa del proceso interpretativo, la que nos remite al sentido y ésta a su vez a los valores, y los valores son los que dan unidad a todo el material presente en la etapa preinterpretativa, así como a las cuestiones fundamentales de las reglas interpretativas. Esta segunda etapa interpretativa se caracteriza por presentar diversas interpretaciones de una misma cuestión, lo cual se explica a su vez por la diversidad de objetivos y valores que persiguen las reglas jurídicas. De manera que es muy posible que se presenten situaciones incompatibles. Cuando se está ante la presencia de varias interpretaciones incompatibles o no, da inicio la tercera etapa del proceso interpretativo llamada etapa posinterpretativa, aquí se trata de elegir la versión que interprete mejor los materiales jurídicos; para ello se toma como criterio a los valores que pueden mostrar a la práctica en cuestión como el mejor ejemplo posible del género al que se considera que pertenece. En cuanto a la metodología y/o técnica para llevar a cabo esta etapa, por ser una etapa evaluativa-valorativa, es la teoría de la argumentación jurídica con la que se lleva a cabo el trabajo. Dworkin considera que siempre es posible encontrar una interpretación que muestre al objeto interpretado como el mejor caso posible. Se trata de una etapa reflexiva que se lleva a cabo a través tanto de juicios evaluativos primarios por medio de los cuales vemos qué es lo valioso, como de juicios evaluativos secundarios que determinan cómo la práctica jurídica desarrolla al máximo los valores dados a 17
Vease Dworkin, Ronald, Los derechos en serio, España, Ariel, 1989, pp. 49 y ss.
886
ANA LILIA ULLOA CUÉLLAR
través de los juicios evaluativos primarios, obteniendo con esto la mejor práctica posible. Como sabido es, la teoría de Dworkin parte del análisis de casos concretos, pero fuera de esta esfera concreta, el derecho para Dworkin sigue siendo un concepto interpretativo, en el sentido de que es un proceso histórico compuesto por las diferentes etapas interpretativas que arroja diferentes interpretaciones, todas siempre dentro de un contexto social que se lleva a cabo a lo largo de un tiempo en una determinada sociedad. Ésta sería una versión abreviada de la teoría de la interpretación de Ronald Dworkin. Veamos ahora cómo muchas de las propuestas de la nueva filosofía de la ciencia están ya presentes en la teoría de la interpretación de Dworkin. Como ya dijimos, la teoría de la interpretación dworkiniana bien puede ser ubicada dentro de la escuela llamada por Perelman “la tópica del razonamiento jurídico”. Y ésta a su vez, responde a un nuevo modelo o entramado conceptual. Al considerar al derecho con una perspectiva integral, la propuesta de Dworkin desvanece la dicotomía: contexto de descubrimiento y contexto de justificación. En cuanto a la nueva conceptualización de racionalidad que establece la nueva filosofía de la ciencia, ésta es también recogida en la propuesta dworkiniana cuando afirma que en la actividad del juez lo que entra en juego no es la lógica formal, sino una teoría de la argumentación a través de la cual el jurista tiene que ponderar, reflexionar y valorar. De acuerdo con Dworkin, el trabajo del jurista no es un trabajo matemático y analítico, sino un trabajo panorámico, holístico, simultáneo, espacial y creativo. Cuando el jurista se enfrenta con los casos difíciles, la lógica formal resulta insuficiente y el jurista tiene que echar mano de una lógica no formal, por ejemplo, de una teoría de la argumentación como la que ha desarrollado Robert Alexy, y en este momento su trabajo deja de ser técnico para pasar a niveles altos de teorización. Aquí, el trabajo del jurista no es deductivo sino un trabajo de valoración; de ponderar principios, de diálogos y consensos racionales y de conformar y construir los mejores argumentos. Pero estas tesis jurídicas contemporáneas remiten a las tesis que conforman la nueva filosofía de la ciencia que estudiamos al inicio de este trabajo. Tenemos entonces que así como la historia de las ciencias naturales y en particular de la física arrojó luz al funcionamiento real de la ciencia
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
887
y a la manera en que los científicos llevan a cabo su labor, así también la historia del derecho y en particular la historia del razonamiento jurídico arroja luz sobre las propiedades de la ciencia jurídica y la labor científica del jurista. Si partimos de las tres escuelas sobre el razonamiento jurídico que Perelman menciona en su texto La lógica jurídica y la nueva retórica, tenemos, como ya vimos, una época exegética en donde lo que predomina más es, desde el punto de vista lingüístico, la sintaxis, el análisis de los conceptos y desde el punto de vista lógico, el razonamiento deductivo y en general la lógica formal. Frente a este extremo encontramos otro, el de la escuela sociológica donde el peso en la argumentación está dado, casi exclusivamente, o bien por las cuestiones socio-políticas o bien por las cuestiones psicológicas y cotidianas, como las posturas extremas de los realistas, pero también contamos con un nuevo entramado conceptual: la “tópica del razonamiento jurídico”. Por otra parte, la variedad de interpretaciones que se da en el ámbito jurídico, y que son estudiadas por Ronald Dworkin, puede relacionarse, guardando las distancias, con el problema de la inconmensurabilidad que se presenta en la propuesta de la nueva filosofía de la ciencia y es muy probable que la solución que Dworkin establece respecto a las interpretaciones rivales, bajo ciertos ajustes, puede ser tomada como una solución al problema de la inconmensurabilidad de las teorías en la nueva filosofía de la ciencia. Finalmente, el aporte dworkiniano sobre la coherencia en el ámbito del conocimiento jurídico, igualmente puede relacionarse con el asunto de una verdad no absoluta propuesta en la nueva filosofía de la ciencia; a saber, con la teoría de la verdad coherentista. Como estudiosa de la filosofía, quizá tendría que sostener que la relación más importante es la que va de la filosofía de la ciencia a la jurisprudencia, sin embargo, mis estudios en el campo jurídico me llevan a sostener que la ruta más importante es la que va de la jurisprudencia a la filosofía de la ciencia. Por ello en otros trabajos he sostenido la tesis de que la ciencia del derecho debe ser tomada como ciencia modelo o como paradigma de las demás ciencias; además, la racionalidad científica de la nueva filosofía de la ciencia, adquiere su expresión más distintiva en los modelos de argumentación jurídica utilizados por juristas tanto prácticos como teóricos. Y si no olvidamos que el trabajo de clarificación de conceptos y sistematización del ordenamiento jurídico sigue estando vigente en la complejidad de la ciencia del derecho y del trabajo científico del
888
ANA LILIA ULLOA CUÉLLAR
jurista, tenemos entonces que aceptar que la labor jurídica hace uso tanto de las técnicas de la lógica formal como del enfoque argumentativo. De allí la gran importancia de esta ciencia. En efecto, la lógica deductiva juega un papel importante en el campo jurídico, ya que por medio de ella se pueden llevar a cabo funciones fundamentales de la ciencia del derecho, como lo es la sistematización del derecho y los análisis de completitud, decidibilidad y coherencia de los sistemas jurídicos, así como la sencillez y economía de estos. Pero en igual medida, las lógicas no formales juegan también un papel fundamental en la investigación jurídica, en particular la teoría de la argumentación. Además, quisiera señalar que cuando el jurista trabaja con la lógica formal echa andar la maquinaria del hemisferio izquierdo, en cambio, cuando trabaja con las lógicas no formales activa el hemisferio derecho. Si la ciencia del derecho es tomada como una ciencia modelo para las demás ciencias, se abre también el mercado de trabajo para el abogado en otras comunidades científicas. Así, el jurista no sólo puede trabajar en los institutos jurídicos sino que con la potencialidad de su ciencia puede aportar luz sobre cuestiones metodológicas y epistémicas a otras ciencias sociales, y así laborar en otros centros e institutos de investigación social. Debo decir además, que mis investigaciones sobre la potencialidad de la ciencia del derecho y mi propuesta de que sea ésta tomada como paradigma o ciencia modelo de las demás ciencias sociales me llevan a sostener una tesis aún más fuerte, que a continuación enunciaré, dejando su justificación para un trabajo posterior. Esta tesis reza así: “La ciencia jurídica puede ser tomada como paradigma no sólo de las ciencias sociales sino de todas las otras ciencias”. Para esto recurro a las siguientes tres reflexiones: 1. Cuando el abogado en su calidad de científico estudia el derecho sólo en la forma pura —así como magistralmente nos enseñó Kelsen o como actualmente lo siguen haciendo algunos juristas como Eugenio Bulygin— la ciencia jurídica se nos revela como un modelo matemático digno de atención. 2. Cuando el abogado, también en su calidad de científico del derecho, baja al estudio de un área particular del derecho, como por ejemplo el derecho penal, la interpretación de éste nos revela que la investigación jurídica comparte muchas características de la investigación experimental. Aquí el abogado requiere no sólo del conocimiento de la normatividad sino también de conocimientos de psicología, estadística, medicina
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
889
y biología, de tal forma que su actividad va muy paralela a la del científico de las ciencias experimentales. 3. Y, cuando por su parte, nos remitimos a una temática como la del derecho constitucional y en particular al tópico de los derechos humanos, comprobamos también que en el estudio científico del derecho entran en juego las características de las ciencias axiológicas como la ética y la ciencia política, para abordar con ellas los importantes asuntos de la legitimidad, el consenso y la democracia. Todos estos aspectos de la ciencia jurídica son los que proporcionan también el calificativo de cientificidad al derecho y que nos llevan, a su vez, a sostener la tesis fuerte respecto a que la ciencia del derecho puede muy bien ser considerada no sólo como modelo para las ciencias sociales sino también como modelo para las demás ciencias. Durante muchos años con Pitágoras y posteriormente con Cantor, Gödel y Peano, el modelo de ciencia fue la matemática; posteriormente, a partir de las teorías de Newton y sobre todo con las teorías de Einstein, las matemáticas dejaron su lugar privilegiado para ser ocupado por la física. Recientemente la física ha tenido que ceder también su lugar a la biología, en especial por los grandes avances que esta ciencia ha proporcionado a las teorías de sistemas como la de Niklas Luhmann, pero sobre todo por las propuestas lingüísticas y de complejidad desarrolladas por Maturana y Varela. Si esto es así, por qué no pensar que en un futuro próximo la biología ceda su lugar de ciencia modelo a la ciencia jurídica. Ya contamos para ello con dos elementos fundamentales: un conjunto robusto de teorías jurídicas y una sólida comunidad científica de juristas, a la que muchos de ustedes ya pertenecen. V. BIBLIOGRAFÍA AARNIO, Aulis; GARZÓN VALDÉS, Ernesto y UUSITALO, Jyrki (comps.), La normatividad del derecho”, España, Gedisa, 1997. ALCHOURRON, Carlos, y BULYGIN, Eugenio, Introducción a la metodología de las ciencias jurídicas y sociales, Buenos Aires, Astrea, 1993. ALEXY, Robert, Teoría de la argumentación jurídica, España, Centro de Estudios Constitucionales, 1989. ATIENZA, Manuel, Tras la justicia, Barcelona, Ariel, 1993. ———, Introducción al derecho, 2a. ed., México, Fontamara, 2000.
890
ANA LILIA ULLOA CUÉLLAR
———, “Las razones del derecho. Sobre la justificación de las decisiones jurídicas”, Isonomía, Revista de Teoría y Filosofía del derecho, México, núm. 1, octubre de 1994. BARNES, B., y BLOOR, D., “Relativism, rationalism and the sociology of science”, en HOLLIS, M. y LUKES, S. (eds.), Rationality and Relativism, Cambridge, MIT Press, 1982. BROWN, Harold, La nueva filosofía de la ciencia, 2a. ed., Barcelona, Tecnos, 1999. DASCAL, Marcelo (comp.), Relativismo cultural y filosofía. Perspectivas norteamericana y latinoamericana, México, UNAM, 1992. DWORKIN, Ronald, Los derechos en serio, España, Ariel, 1989. EROKSSON, Lars D., “Tendencias conflictivas en el derecho moderno”, en AARNIO, Aulis; GARZÓN VALDÉS, Ernesto y UUSITALO, Jyki (comps.), La normatividad del derecho, España, Gedisa, 1997. GUIBOURG, Ricardo A., El fenómeno normativo, Buenos Aires, Astrea, 1987. HEMPEL, C. G., “Thomas Kuhn, colleague and friend”, World Changes. Thomas Kuhn and the nature of science, en HORWICH, P, (ed.), Cambridge, The MIT Press, 1993. KUHN, Thomas, La estructura de las revoluciones científicas, México, FCE, 1971. NINO, Carlos, Algunos modelos metodológicos de ciencia jurídica, Fontamara, 1993. ———, Introducción al análisis del derecho, 4a. ed., Barcelona, Ariel, 1991. OLIVÉ, León, y VILLORO, Luis (eds.), Homenaje a Fernando Salmerón. Filosofía moral, educación e historia, México, UNAM, 1996. ———, “Multiculturalismo: ni universalismo, ni relativismo”, Homenaje a Fernando Salmerón. Filosofía moral, educación e historia, México, UNAM, 1996. ———, “Relativismo conceptual y filosofía en las Américas”, Relativismo cultural y filosofía. Perspectivas norteamericana y latinoamericana, México, UNAM, 1992. PÉREZ RANSANZ, Ana Rosa, “Racionalidad sin fundamentos”, Homenaje a Fernando Salmerón. Filosofía moral, educación e historia, México, UNAM, 1996. ———, Kuhn y el cambio científico, México, FCE, 1999.
EL DERECHO Y LA FILOSOFÍA DE LA CIENCIA
891
ROSS, Alf, El concepto de validez y otros ensayos, 2a. ed., México, Fontamara, 1993. RUDNER, RICHARD S., Philosophy of Social Science, Prentice Hall, 1966. VELASCO GÓMEZ, Ambrosio, “Tradición y racionalidad”, Homenaje a Fernando Salmerón. Filosofía moral, educación e historia, México, UNAM, 1996.
!
EN TORNO AL DEBATE RAZ/COLEMAN: ¿EXCLUYENTE O INCLUYENTE?* Juan VEGA GÓMEZ** SUMARIO: I. Introducción. II. El positivismo de Raz. III. Las observaciones de Coleman al positivismo incluyente. IV. Para fijar el debate y algunas observaciones en torno al positivismo incluyente.
I. INTRODUCCIÓN Este trabajo tiene como objetivo principal discutir las líneas argumentativas y diferencias —si es que existen— entre lo que se ha venido a denominar positivismo excluyente (PE) y positivismo Incluyente (PI), pero como todos saben, dichas posturas no se limitan a dos autores simplemente, hoy en día hay diferentes y variadas expresiones de cada una de estas vertientes. Aquí sólo me voy a dedicar a las tesis de Raz como defensor del PE y Coleman del PI, por lo tanto debo aclarar que no entraré al debate de otros representantes de las ideas, mucho menos a las observaciones que se le pueden hacer al positivismo en general desde otras trincheras iusfilosóficas. Sólo me anima a presentar el trabajo las observaciones que recientemente publicó Coleman en The Practice of Principle sobre la postura de Raz y su PE. El estudio se divide en tres partes principales: primero doy un resumen de la postura de Raz resaltando su * Este trabajo es parte de una investigación que se lleva a cabo sobre el positivismo jurídico contemporáneo y es posible gracias al apoyo recibido por parte del CONACYT y de la UNAM para realizar una estancia de investigación en la Universidad de Oxford. Estoy sumamente agradecido a estas dos instituciones, así como a la Facultad de Derecho de la Universidad de Oxford y a Joseph Raz quien no sólo amablemente ha apoyado mi estancia en Oxford, sino que me dio la oportunidad de comentar varios aspectos de este trabajo que finalmente se nutre de dichas discusiones. ** Instituto de Investigaciones Jurídicas, UNAM, México. 893
894
JUAN VEGA GÓMEZ
tesis de la autoridad y cómo ésta se liga necesariamente a la tesis de las fuentes sociales del derecho; en un segundo apartado voy a hacer una breve introducción al planteamiento de Coleman, pero lo que me interesa resaltar son las alternativas que propone en relación al PE; por último, doy mi opinión en torno al debate, cuestionando la viabilidad del PI defendido por Coleman, sobre todo en relación a las modificaciones que pretende llevar a cabo a otra de las tesis principales del positivismo, i. e., la tesis de la diferencia práctica. Para ubicar la discusión digamos lo siguiente: En aras del argumento, estamos de acuerdo con Coleman en que una de las tesis principales del positivismo es la tesis de los hechos sociales, i. e., la posibilidad de la autoridad del derecho debe explicarse por ellos, pero mientras Coleman intenta avanzar una convención con una regla de reconocimiento que genera razones para la acción, pero más importante, deberes hacia los oficiales, aquí muchos otros positivistas no insistirían en que la Regla de Reconocimiento desempeñe dicho papel, una forma más concreta de decir lo anterior es: muchos positivistas tendrán dudas respecto a la tesis de la convención de Coleman. El problema principal que esto genera para el PI del tipo que defiende Coleman es que la Cláusula Suficiente en la Regla de Reconocimiento sería inconsistente con la pretensión de autoridad que tiene el derecho. A) Esta es una de las partes importantes de la respuesta de Coleman a esta interrogante y su defensa del PI, donde pretende acomodar esta noción con la tesis de la autoridad de Raz, y B) La otra cuestión que debe ser analizada en este artículo son las dudas que tiene Coleman respecto a la tesis de la diferencia práctica, donde intenta avanzar una nueva interpretación de la misma, pero no a la luz de la tesis de la autoridad en Raz, i. e., sin acomodar y tratar de homologar ambas tesis. II. EL POSITIVISMO DE RAZ1 Antes que nada debemos preguntarnos: ¿Qué implica la tesis de la autoridad en Raz y cómo se relaciona ésta con la tesis de las fuentes sociales del derecho? Hablando en términos de la autoridad del derecho y sus directivas, la tesis de la autoridad nos dice que una vez que hablamos de autoridades legítimas, las directivas generan razones excluyentes para la 1 Intento llevar a cabo una explicación mucho más detallada de la postura de Raz en “El positivismo excluyente de Raz”, Oxford, manuscrito, 2003.
¿EXCLUYENTE O INCLUYENTE?
895
acción (RE) las cuales tienen una justificación independiente de contenido (IC) y finalmente pretenden hacer una diferencia práctica en nuestras deliberaciones. Déjenme desempacar todo esto: las RE son razones adicionales que nos dicen que no actuemos por ciertas razones. Las razones generadas por las directivas no deben agregarse a las razones propias de la regla, finalmente no podemos contar ambas, i. e, las razones que nos dicen qué debemos hacer con base en las directivas mismas y las razones que justifican dichas directivas, en el caso de las directivas en el ámbito jurídico sólo contamos estas RE. Uno de los objetivos que tiene una directiva es prevenir el peso para actuar o no que tiene la misma directiva a través de sus RE, en términos del propio Raz, las razones excluidas son las razones subyacentes propias de las reglas o directivas —también llamadas razones dependientes RD —. El peso que debemos considerar reitero, si estamos hablando de autoridades legítimas, —es el de las RE de la directiva. Estas RE justifican la directiva y su validez, pero la justificación es una independiente de contenido (IC), i. e., su justificación radica no en las razones subyacentes de la directiva, sino en las RE o razones protegidas.2 La justificación que se encuentra detrás de estas directivas es el papel que desempeñan las autoridades, i. e., lo que en la tesis de Raz se denomina la concepción del servicio de la autoridad (CSA), la cual consiste en considerar la tesis de la dependencia y la tesis normal de justificación. La primera de estas tesis sostiene que las directivas de la autoridad se deben basar en razones que ya se aplican a los sujetos y la segunda menciona: “que la manera normal en que se determina que debe reconocerse que una persona posee autoridad sobre otra consiste en demostrar que es más probable que el sujeto que cumple con las razones que ya se le aplican (que no son las de la autoridad) acepte las directivas de la supuesta autoridad como vinculantes e intenta seguirlas, en lugar de que el sujeto mismo intente seguir las razones que se le aplican directamente”.3 Entonces, para explicar cabalmente este aspecto de justificación (IC) tomamos en consideración este papel mediador que desempeñan las autoridades entre los sujetos y las razones correctas para actuar. Esto es debido a que las autoridades en dicho papel mediador desempeñan actividades importantes coordinando las actividades de los individuos en 2 3
Cfr. Raz, J. “Reasoning with Rules”, Current legal Problems, vol. 54, 2001, p. 15. Cfr. Raz, J. Ethics in the Public Domain, Oxford, Oxford University Press, 1994, p. 214. Hay traducción al castellano de María Luz Melon, Barcelona, Gedisa, 2001.
896
JUAN VEGA GÓMEZ
sociedad, permiten —como sostiene Raz— un grado de acuerdo frente a los desacuerdos propios de nuestras sociedades contemporáneas,4 esto sólo por mencionar uno de sus propósitos. La tercera tesis que explica la concepción de autoridad en Raz, es la de la prevención (TP) y es un aspecto que se encuentra en el centro de discusión en el debate entre positivistas. Lo anterior, debido a que la tesis señala que una directiva con sus RE y protegidas las cuales son IC previenen el peso de las razones subyacentes propias de la regla y transfieren dicho peso a las razones adicionales de la directiva. Si tomamos en consideración las otras dos tesis y estamos claros que hablamos de autoridades legítimas, la autoridad resuelve el problema de saber cuáles son las razones correctas a seguir por parte de los sujetos, pasamos dicha decisión —como lo hacemos en muchos otros aspectos de nuestras vidas— a la autoridad y una vez que se generan dichas directivas, seguimos estas razones y no las subyacentes propias de la regla. Sería extraño decir que una autoridad nos exige considerar de nuevo las razones dependientes para saber qué es lo que debemos hacer, dado que esto es precisamente lo que están encomendadas a hacer las autoridades, y a través de dicha actividad solucionar problemas de coordinación que surgen en nuestras sociedades. Esta explicación sobre la naturaleza de la autoridad da buenas razones para seguir otra de las tesis principales del positivismo, la tesis de las fuentes sociales del derecho (FSD): de acuerdo a Raz, una norma goza de una fuente social si su existencia y contenido pueden identificarse por referencia a hechos sociales solamente, sin recurrir a argumentos evaluativos.5 Una razón preliminar para adoptar la tesis FSD y relacionarla con la naturaleza de la autoridad es que para que una directiva pueda cumplir su papel como autoridad, la directiva debe identificarse —su existencia y contenido— de una forma que no nos exija remitirnos a las razones subyacentes sobre las cuales se supone la directiva decide,6 la forma en que debemos llevar a cabo dicha identificación es a través de hechos sociales solamente, no argumentos morales. De nuevo señalo que sería extraño pensar que la autoridad nos exige considerar las razones sobre las cuales está llamada a decidir, esto hace prácticamente inútil el papel de las autoridades. La autoridad precisamente intenta crear una razón ajustada a los 4 5 6
Cfr. op. cit., nota 2, p. 18. Cfr. op. cit., nota 3, p. 211. Ibidem, p. 219.
¿EXCLUYENTE O INCLUYENTE?
897
sujetos para que cumplan con dichas razones subyacentes y esto lo hace generando razones adicionales, pero el señalar que la función la realiza conduciendo a los sujetos a analizar de nuevo las razones subyacentes no tiene mayor sentido, dado que las directivas tienen como objetivo guiar la conducta y resolver problemas de coordinación, esto sólo es posible a través de directivas cuyo contenido y existencia se pueden identificar sin recurrir a argumentos morales, y precisamente la tesis FSD proporciona lo anterior. El argumento principal para aceptar FSD es que la noción de autoridad dentro del derecho nos da razones para aceptarla, estas razones que justifican la tesis son: a) Una directiva solo puede estar dotada de autoridad o ser vinculante si es o se presenta como el punto de vista de alguien que sostiene cómo deben actuar los súbditos; b) debe ser posible identificar dichas directivas como expedidas por la supuesta autoridad, sin recurrir a las razones o consideraciones que dicha directiva intenta solucionar.7 Pero Raz menciona que dado se puede prestar a debate CSA, existe un argumento alternativo (FSDa), que a su vez a nosotros nos sirve para redondear la idea. Este argumento alternativo FSDa menciona: i) si bien no se quiere aceptar CSA, podemos señalar que nuestra noción de autoridad legítima consiste en que la autoridad debe actuar con base en razones, y que su legitimidad depende en la medida en que logren llevar a cabo estos objetivos,8 esto es suficiente para aceptar las condiciones anteriores, sobre todo que sólo lo que se presenta como el punto de vista de la autoridad puede ser una directiva con autoridad; por su parte b) partiendo del acuerdo de que las directivas afectan nuestro razonamiento práctico, Raz dice que la sola existencia de razones —sean éstas las adecuadas a considerar por parte de la autoridad— no puede demostrar que la directiva es vinculante, i. e., para Raz la existencia y contenido de la directiva no depende de las razones exclusivamente, se tiene que expedir dicha directiva reuniendo ciertas condiciones para decir que la ley existe.9 Esto es lo que quiere explicar de manera satisfactoria FSD y si ligamos la tesis anterior con la de la autoridad, estimo que están las condiciones dadas para emprender el estudio de Raz y el llamado PE que defiende.
7 8 9
Ibidem, p. 218. Ibidem, p. 220. Cfr. idem.
898
JUAN VEGA GÓMEZ
III. LAS OBSERVACIONES DE COLEMAN AL POSITIVISMO INCLUYENTE
Antes de fijar cuáles son las diferencias concretas entre la postura de Raz y Coleman, permítanme aclarar y ubicar el proyecto inclu yente de Coleman en su conjunto: en el centro de su PI se encuentra la necesidad de rescatar y defender el proyecto hartiano y, con base en estas ideas, darle una interpretación adecuada a otra tesis fundamental del positivismo, la tesis de la convención (TC). Ésta —de acuerdo a lo anterior— sostiene: la autoridad del derecho se explica a través de una convención, una convención donde los oficiales del derecho tienen como obligación seguir una regla de reconocimiento (RR) para validar las normas con base en esta regla maestra. Esta fue básicamente una de las grandes aportaciones de Hart, al defender la idea de autoridad con base en la RR y no en el hábito de obediencia, una RR que es una regla social y genera una actitud crítica y reflexiva y que a su vez valida las restantes normas del sistema. Pero la explicación de Coleman va más allá de Hart y trata de mejorar la explicación hartiana, sobre todo por la dificultad que genera la idea de una RR identificada con prácticas sociales y cómo puede ser una regla en este sentido, i. e., cómo puede al mismo tiempo una práctica generar razones para la acción y después un deber.10 La explicación de Coleman es la siguiente: La RR existe si se practica, esta práctica no fija el contenido de la regla, la RR valida las demás normas del sistema, pero estas normas no necesitan ser practicadas para cumplir con sus objetivos. Entonces, tenemos una RR que genera razones para la acción e impone obligaciones a los oficiales consistentes en evaluar conductas a la luz del contenido de la RR. El dilema es interesante y es un reto que Coleman afronta directamente. Pero, ¿por qué es un reto importante? bueno, basta ver que resulta prima facie difícil decir que existe una RR que por el hecho de que se practica genera razones para la acción, y más importante, deberes a los oficiales. Fácilmente puede alguien practicar algo colectivamente con 10 Cfr. Coleman, J., The Practice of Principle: In Defence of a Pragmatic Approach to Legal Theory, Oxford, Oxford University Press, 2001, p. 78. De aquí en adelante sólo se hará referencia al número de la página y se entiende que se refiere a este estudio de Coleman cuyo análisis es uno de los objetivos de este trabajo, en caso de citar otra obra del autor se mencionará en su momento.
¿EXCLUYENTE O INCLUYENTE?
899
otros individuos, pero simplemente por tenerlo como práctica no genera esto una razón para la acción, mucho menos obligación, dado que así como fácilmente uno se puede unir a la práctica, igualmente se puede desistir sin mayores problemas. Entonces, la primera interrogante es cómo genera razones para la acción: Para Coleman se debe rescatar la idea del punto de vista interno, un punto de vista interno que genera una actitud crítica y reflexiva. Dice Coleman que este punto de vista interno es la capacidad psicológica de los individuos para adoptar una práctica como norma.11 Utilizando el mismo ejemplo de Coleman, digamos que me impongo la regla de hacer 100 abdominales todos los días, el hábito de hacerlo no agrega razones para ello, pero dice Coleman que se adopta el comportamiento como norma, con una actitud crítica y reflexiva, el punto de vista interno genera esto para el ejemplo y lo genera para los oficiales en torno a la RR. Digamos que aceptamos esta parte del argumento; viene la otra idea de Coleman, interesante también y más trascendente, de argumentar cómo no sólo genera razones para la acción, sino deberes hacia los oficiales de evaluar la conducta con base en la RR. En un principio Coleman ve hacia una idea de actividades compartidas para el fundamento de la idea,12 pero después viene su argumento más sólido con base en las ideas de Bratman de actividades cooperativas compartidas (ACC), las cuales tienen tres características: a) Existe una respuesta mutua, en el sentido de atender las intenciones de los otros participantes, esto sirve como guía hacia la conducta tomando en consideración a los otros participantes. b) Existe compromiso hacia la actividad, se comprometen a la actividad conjunta los participantes, quizás por diferentes razones, pero se comprometen. c) Existe una asistencia mutua, en el sentido de que se auxilian para que cada quien cumpla su parte en la actividad y así llevar a cabo la empresa de manera exitosa.13 Bueno, esto sucede en el derecho para Coleman, citando a Himma,14 menciona cómo es una verdad conceptual que los oficiales coordinan su comportamiento y atienden intenciones de otros oficiales, e. g., Minis11 12 13 14
Op. cit., nota 10, p. 89. Ibidem, pp. 90-94. Ibidem, p. 96. Ibidem, p. 98.
900
JUAN VEGA GÓMEZ
tros de la SCJN y un juez de Distrito. Asimismo, sostiene que es una verdad conceptual que se auxilien mutuamente y se comprometen a una actividad conjunta. Así, Coleman demuestra cómo la convergencia en la conducta no es algo unilateral; es un compromiso conjunto de gobernar con la RR; para Coleman finalmente no hay misterio de cómo esta actividad conjunta puede generar obligaciones, dado que estos compromisos inducen confianza y expectativas justificadas que pueden generar obligaciones.15 Hay que recordar que hasta aquí Coleman no ha dicho nada del contenido de esa RR, y quizás aquí esté lo más importante. Para reiterar: una cosa es la convención que da pie a esta RR, pero dicha convención no determina el contenido, lo trascendente es precisamente que Coleman quiere defender una RR cuyo contenido es moral, puede ser disputado y juega un papel suficiente en el derecho, por suficiente me refiero a que basta que reúna ciertos requisitos morales para que una norma sea jurídica.16 Si lo anterior fue un reto, éste resulta ser uno mayúsculo porque de una convención que necesariamente implica acuerdo quiere sostener Coleman un contenido de RR que, en principio y por referirse a la moral, puede ser disputado. Entonces: puede que el contenido de la RR apele al aspecto moral de una norma para que sea válida, sólo el hecho de que es moral es condición para que sea válida, esto es dentro del PI la versión suficiente. Importante también aquí es resaltar el “puede” i. e., no necesariamente, depende de la RR del sistema, lo que sí es necesario es la existencia de la RR, pero Coleman no sostiene nada en el sentido del contenido de todas las RR. De esta forma llegamos a varias conclusiones: tenemos un fundamento de la autoridad en la convención y concretamente en la RR, esto se explica a través del punto de vista interno y de ACC. Pero el contenido de la regla es una donde una norma moral por el sólo hecho de serlo, puede ser válida jurídicamente. En otras palabras y para ubicarlo ya en términos del debate positivista, digamos que los positivistas están de acuerdo en dar una idea conceptual del derecho en términos de la convención, pero aquí inician las diferencias, dado que para Coleman esta convención no limita de ninguna forma el contenido de una RR, para otros existe la li15 16
Idem. Lógicamente a diferencia de otros PI que alegan no por una RR suficiente, mencionando las llamadas necessity clauses.
¿EXCLUYENTE O INCLUYENTE?
901
mitante de que una convención se explica de la mejor manera atendiendo a ciertos orígenes sociales donde encontramos la manera de identificarlo. Para complicar más la cuestión debemos reiterar varias de las posturas del positivismo en general. Otra de las características del positivismo es que sostiene como verdad conceptual que el derecho tiene como función el guiar nuestras conductas a través de directivas que afectan nuestro razonamiento práctico, i. e., en el dilema de hacer o no hacer algo, el derecho a través de sus directivas actúa de una manera que si existe norma jurídica esto afecta nuestras deliberaciones —llamada tesis de la diferencia práctica (TDP)—. Cómo ya lo mencionamos, esta es una idea que se origina en Raz y Hart que también Coleman trata de rescatar. El problema es el siguiente: ¿Cómo sostener la necesidad de remitirse al contenido moral de las normas en la RR y además sostener que las reglas tienen que tener esta diferencia en el razonamiento práctico, defendiendo con ello la noción conceptual de autoridad? i. e, la RR me exige considerar cada vez que me encuentro ante un problema de validez, aspectos morales o razones dependientes en términos de Raz ya vistos, entonces, ¿dónde queda la au tori dad de las nor mas jurí dicas que para hacer una diferencia en la razón práctica necesitan prevenir la constante revisión de razones dependientes? IV. PARA FIJAR EL DEBATE Y ALGUNAS OBSERVACIONES EN TORNO AL POSITIVISMO INCLUYENTE
Qué está y qué no está en la mesa de discusiones: De nuevo menciono que en aras del argumento coincidimos con Coleman en que los positivistas están de acuerdo en el carácter convencional de la autoridad, sólo aclaro que aquí pueden tomar caminos diferentes tanto Raz como Coleman y los convencionalistas, pero el aceptar o negar esto no tiene consecuencias para las ideas del PI que quiero someter a discusión. Por otra parte, al mencionar Coleman y su PI que la normatividad ya no requiere más restricciones —i. e., fuentes sociales del derecho— sólo la convención, creo aquí es donde resulta difícil de aceptar el PI. Menciona Coleman: “No obstante, no estoy de acuerdo [con Raz] que la pretensión del derecho a la autoridad imponga una limitante a reglas particulares. Es de-
902
JUAN VEGA GÓMEZ
cir, rechazo la idea de que ninguna regla puede ser jurídica salvo que sea capaz de ser una autoridad práctica. Por otra parte, no acepto la explicación de la autoridad de Raz”.17 Entonces, retomando lo que mencionamos en la introducción de este estudio, las observaciones acerca de la viabilidad del PI van a girar en torno a dos de las consideraciones donde probablemente se encuentre la disputa: A) ¿La pretensión de la autoridad implica la tesis FSD? Aquí Coleman trata de acomodar su PI dentro de la tesis de la autoridad de Raz, y B) ¿Cuáles son las dudas de Coleman en torno a la tesis de la autoridad de Raz? Éstas son las consideraciones que voy a abordar en lo que resta del artículo. A) Tiene razón Coleman al mencionar que ambas posturas18 están de acuerdo en que la moral tiene un papel en el derecho que se debe explicar y que las posturas excluyentes e incluyentes se deben ver desde esta diferencia. Pienso que Coleman ve la postura de Raz como algo contra-intuitiva,19 mientras que para Coleman estos aspectos morales se entienden o pueden entenderse como propios de una regla de reconocimiento que mencione elementos de moralidad para su validez, Raz considera esto contrario a la tesis de la autoridad que uno de sus objetivos es generar razones adicionales y aunado a ello decidir sobre las RD que la regla trata de solucionar, el remitir de nuevo a esas RD pierde todo sentido. Déjenme ahora desempacar este argumento: Recordemos TDP, una norma genera razones adicionales, las cuales son IC, pero además genera RE que impiden actuar con base en las RD sobre las cuales se basa la norma, las RE reemplazan a las RD y éstas son las bases de la norma que considero. Qué caso puede tener el contar con una regla de reconocimiento que a los oficiales del derecho les dice: una norma puede ser válida por el hecho de contar con ciertas características morales,20 esto obliga a los oficiales del derecho, y ciudadanía en general a remitirse a las RD que se supone una directiva trata de solucionar, ergo, este es el problema para el PI de Coleman. La respuesta de Coleman a este dilema que se le presenta —en esta etapa del argumento, recordemos que hasta aquí 17 Coleman, op. cit., nota 10, p. 124. Llevo a cabo una traducción del texto en inglés y agrego los paréntesis. 18 Ibidem, p. 125. 19 Ibidem, pp. 110 y 126. 20 Lógicamente me refiero al PI que defiende Coleman.
¿EXCLUYENTE O INCLUYENTE?
903
coincide con la tesis de la autoridad de Raz— es señalar que los límites que impone la tesis de la autoridad giran en torno a la identificación del derecho,21 pero no en cuanto a su validación, i. e, la prohibición de recurrir a las RD está en la identificación solamente. Para Coleman, la regla de reconocimiento valida —puede, pero no necesariamente servir para identificar22 —. Al validar y no identificar, Coleman en un principio sostiene que de esta forma ya no se aplican las restricciones.23 No obstante lo anterior, Coleman se da cuenta que el PE puede responder: si bien es una de validar, para que los oficiales identifiquen al derecho lo tienen que hacer sin recurrir a la moralidad, algo que una regla de reconocimiento incluyente niega totalmente,24 y algo que sólo FSD puede cumplir, i. e., alguien tendrá que inmiscuirse en evaluación moral con una regla incluyente. La respuesta, algo ad hoc, de Coleman es que esto no es necesario: puede identificarse el derecho sin recurrir a consideraciones morales por todos a los cuales el derecho pretende tener autoridad, y podemos imaginar a un experto que utiliza una regla incluyente, pero todos identifican al derecho dentro del sistema sin recurrir a RD. Éste es el famoso caso del sueco en un sistema como el de Estados Unidos, todos en Estados Unidos conocen el derecho sin recurrir a RD, pero existe una regla de reconocimiento que utiliza el sueco, el cual delibera sobre consideraciones morales, pero el Sueco no necesita identificar al derecho sin recurrir a argumentos morales dado que sobre él no pretende autoridad.25 Las objeciones al famoso caso del Sueco son varias y contundentes: Por ejemplo, Shapiro le menciona a Coleman que si aceptamos este supuesto, la autoridad radica en el sueco y no en la moralidad que se supone es elemento que lleva a la validez jurídica en la postura incluyente, i. e., es el hecho de que el sueco mencionó que X norma es jurídica y por ende válida; finalmente aquí radica la autoridad, en el hecho de que el Sueco determina las razones que deben prevalecer, no son las condiciones morales.26 Por otra parte —como el mismo Coleman menciona—27 el sueco es una fuente social, dado que se determina el contenido del derecho viendo hacia el sueco sin analizar las dimensiones de moralidad. Stephen Perry 21 22 23 24 25 26 27
Coleman, op. cit., nota 10, p. 128. Idem. Idem. Ibidem, pp. 128 y 129. Ibidem, p. 130 Ibidem, p. 142. La idea de Shapiro y la cita correspondiente se encuentran adelante. Idem.
904
JUAN VEGA GÓMEZ
también se da cuenta de lo anterior y señala el dilema que esto presenta para el PI de Coleman, agregando a esta respuesta de Shapiro que para que los ciudadanos estadounidenses se den cuenta que el Sueco generalmente llega a soluciones adecuadas en torno a las razones morales aplicables, deben llevar a cabo un análisis de la moralidad que dice Coleman no es necesario efectuar, salvo que consulten a otro experto, y esto puede ser una cuestión de nunca acabar.28 En este sentido, creo que le resulta imposible rescatar la tesis de la autoridad a Coleman para la empresa del PI que defiende. Lo que me gustaría agregar es que si bien ésta es la conclusión a la que se llega, incluso por Coleman, los argumentos no son los completos con base en las ideas de Raz. Con lo anterior quiero decir que incluso en las defensas que a este respecto hace Coleman, las ideas no comprenden todo lo que Raz sostiene con FSD: dos puntos que creo son interesantes: recordemos que FSD no sólo se refiere al segundo argumento para su defensa, sino también incluye la idea de que las directivas para ser vinculantes necesitan expresarse como el punto de vista de alguien sobre cómo deben actuar los sujetos, este aspecto de la defensa de FSD casi es ignorado por Coleman, y lo importante es que esto se relaciona con el argumento alternativo que presenta, i. e, recordar que Raz mencionó que si bien no se quiere aceptar la idea de CSA, existe la noción de que las fuentes sociales resultan necesarias para las directivas, dado que la sola existencia de razones no puede demostrar que la directiva es vinculante, sino que se necesitan otros elementos para saber si la directiva es vinculante. Lo anterior implica la necesidad de fuentes sociales identificables por la sociedad: legislación, precedente y demás requisitos exigidos por los sistemas jurídicos. En este sentido, también falla la caracterización y defensa de Coleman. Este autor menciona: “la autoridad del derecho no depende de cómo uno conoce lo que es el derecho o su contenido, sino en cómo el derecho puede afectar nuestras deliberaciones”.29 También sostiene: “Recordemos que las directivas poseen autoridad en el sentido de Raz en virtud de cómo afectan y figuran en nuestras deliberaciones prácticas, y no en virtud de cómo se crean”.30 El error consiste en que piensa son dos cosas totalmente distintas la afectación en el razonamiento práctico y el conoci28
Perry, S., “Method and Principle in Legal Theory”, Yale Law Journal, vol. 111, 2002, pp. 1789 y 1790. 29 Coleman, op. cit., nota 10, p. 130. 30 Ibidem, p. 131.
¿EXCLUYENTE O INCLUYENTE?
905
miento de dichas directivas y su creación. Pero el problema no es realmente éste, sino que la defensa de FSD sí implica una relación entre estos elementos, ya mencionamos cómo en la explicación alternativa de FSD se menciona que la sola existencia de razones no puede demostrar que la directiva es vinculante, necesitamos los elementos31 de expedición y estos elementos de expedición, junto con la afectación al razonamiento práctico son lo que hace que la tesis de la autoridad implique FSD, y este es el error, pensar que para la defensa del PI se puedan distinguir estos aspectos, creo que el PE lo negaría, o por lo menos tendríamos que aceptar que la tesis de la autoridad de Raz sí implica y proporciona mejores argumentos para defender FSD ante posturas que piensan que no son necesarios estos límites o restricciones al concepto autoridad. Si bien Coleman admite estas objeciones del PE que lo llevan a admitir finalmente que la compatibilidad de su PI y la tesis de la autoridad no puede ser más que un buen deseo, Waluchow nos obliga a remitirnos de nuevo al caso del sueco. Al intentar defender esta línea de defensa de Coleman y el PI, Waluchow aborda cuestiones que estarían pendientes en la línea argumentativa que mencionamos y por ello debemos atenderla, sirva de paso para saber finalmente con las ideas que se mencionan a continuación si debemos continuar explorándola o no. Waluchow atinadamente menciona que el problema radica en que el derecho, para hacer una diferencia práctica, se debe identificar sin recurrir a las RD que menciona Raz, pues esto hace inútil el papel de la autoridad y su reclamo. Aquí es cuando Coleman se ve forzado a recurrir a un sueco fuera del sistema jurídico, dado que sobre él el derecho no pretende autoridad y puede inmiscuirse en la valoración moral, una evaluación que los miembros del sistema no pueden realizar por la pretensión de autoridad. El problema entonces fue que si el sueco determina cuáles son las razones adecuadas para actuar, entonces él y no la moralidad es la autoridad, recordemos que ésta es la objeción de Shapiro, donde el sueco se convierte en la autoridad práctica. Waluchow relata el dilema de la siguiente forma: “tenemos una regla de reconocimiento R que menciona que una directiva D es válida sólo si es conforme con un principio moral PM.32 La defensa de Waluchow gira en torno a la cuestión de que 31 32
Cfr. op. cit., nota 3, p. 220. Cfr. “In Pursuit of Pragmatic Legal Theory”, Canadian Journal of Law and Jurisprudence, vol. XV, núm. 1, enero de 2002, p. 147.
906
JUAN VEGA GÓMEZ
para él, el sueco no necesariamente tiene que convertirse en una autoridad práctica, i. e., que diga y mencione cuáles son las razones adecuadas para actuar. Este paso en el argumento de Waluchow es bastante interesante: El sueco es un mediador entre R y los sujetos a la autoridad, no es un mediador entre R y las razones correctas, tan no es un mediador entre razones correctas y los sujetos de la autoridad, que Waluchow menciona cómo el Sueco no tiene nada que decir en torno a las modificaciones que puede sufrir R,33 dado que las opiniones del Sueco no tienen nada que ver con la existencia y contenido de R, a lo más que puede aspirar el Sueco —dice Waluchow—34 es identificar y registrar si cambió o no, o bien si se eliminó el contenido de R, nada más. El poder llevar a cabo esta función por parte del sueco implica para Waluchow que éste puede permanecer siendo una autoridad epistémica sin convertirse en autoridad práctica y con ello esquivar la objeción de Shapiro de que es finalmente el Sueco y no la moralidad la autoridad en este caso. Permítanme reestructurar este nuevo ejemplo de la siguiente forma: desde mi punto de vista esto lleva a Waluchow a sostener que el papel del sueco al emitir una opinión en torno a R señalaría: D es válida con base en R porque así lo menciona R, i. e., si el papel del sueco no es convertirse en una autoridad práctica y simplemente ser una guía epistémica, y sobre todo al no necesariamente tener que decidir y expresarse sobre las razones correctas, el sueco tiene un papel bastante limitado e inútil para efectos del derecho, desde mi punto de vista caemos de nuevo en el supuesto del árbitro que le menciona a las partes que su decisión es la más justa, en este caso el sueco simplemente menciona que la norma válida es la que se ajusta a R, nada más. En un plano de discusión abierto esto no tendría mayores problemas, la cuestión preocupante es que Waluchow pretende esgrimir esta vía de defensa para sostener que el PI es compatible tanto con la pretensión de autoridad, como con la tesis de la diferencia práctica,35 lo cual resulta también imposible. No es consistente con la pretensión de autoridad por varias razones, sólo menciono algunas: al no decidir sobre razones dependientes, sino simplemente registrar qué es lo que R señala, pierde el sentido de la autoridad, la autoridad actúa con base en razones y como lo mencionó Raz, su éxito depende en 33 34 35
Ibidem, p. 149. Idem. Ibidem, p. 148.
¿EXCLUYENTE O INCLUYENTE?
907
la medida en que generalmente acierte sobre estas razones; por otra parte, señala Waluchow que el sueco puede limitar su actuación a una simple autoridad en torno a qué es lo que requiere R, pero no necesariamente en torno a los criterios que exige R y que no giran en torno a lo que él (sueco) estime son las razones correctas. Si la anterior formulación del argumento de Waluchow es correcta, no cumple con el requisito primordial que sostiene Raz en torno a la autoridad y sus directivas, i. e., que éstas se expresen como el punto de vista de la supuesta autoridad en el sentido de cómo deben actuar los súbditos. Por otra parte, y mucho más sencillo de apreciar, es cómo este argumento de Waluchow no cumple con la tesis de la diferencia práctica: Al decir el sueco que D es válida con base en R porque así lo menciona R y nada más, esto no genera ninguna pauta de guía para el comportamiento, tendría que decidir con base en las RD y con ello generar una RE. Creo que esto ignora el hecho del por qué estamos dedicándole tanto tiempo al caso del sueco. Importante en este sentido es señalar que el argumento de Waluchow gira en torno a la posibilidad de que el sueco no desempeñe un papel de autoridad práctica, sólo epistémica, y con ello una de simplemente reportar qué es lo que R señala sin crear derecho, para Waluchow es el derecho el que sirve como autoridad práctica, pero no el sueco, éste puede limitarse a su papel epistémico: Lo anterior lleva a señalar que el sueco es un experto en el contenido de R, pero no señala nada en torno a cuáles son las razones adecuadas para actuar. Este paso en el argumento que pretende Waluchow también me parece problemático, dado que señala que: puede que el sueco falle en su caracterización de qué es lo que exige el derecho, el hecho de que puede errar el sueco esto se debe a que existe una diferencia entre lo que reporta de lo que es verdadero.36 Del hecho de que simplemente reporta lo que R exige, esto lleva a Waluchow a señalar que no determina el derecho y por ende puede sobrevivir como una autoridad epistémica. Creo que la duda sigue siendo de por qué entonces aludir al sueco si éste no decide en torno a R, reitero, el ejemplo del sueco obedece a la posibilidad de contar con una regla de reconocimiento incluyente, donde alguien se involucra en las deliberaciones morales, pero sobre él el derecho no pretende autoridad, entonces si en este caso de Waluchow tampoco el sueco delibera en torno a las cuestiones morales y simplemente sirve para señalar que es lo que R exige, no contamos con 36
Ibidem, p. 149.
908
JUAN VEGA GÓMEZ
una persona que utiliza la regla de reconocimiento incluyente, el hecho de que Waluchow lo deje en términos bastante amplios señalando que es el derecho el que sirve como autoridad práctica es de poca utilidad, recordemos que el objetivo para el PI es defender —en esta parte del argumento— una regla incluyente suficiente y rescatar a su vez la tesis de la autoridad en Raz. Finalmente estas ideas de Waluchow no dan respuesta a las preguntas que el ejemplo del Sueco trae consigo, i. e., es la moralidad o el sueco quien determina el derecho, si es el Sueco entonces este se convierte en fuente social, si es la moralidad, entonces, para saber si el sueco acierta o no —como lo menciona Perry— debemos inmiscuirnos en la deliberación moral que el PE niega, una deliberación para los miembros sobre los cuales el derecho reclama autoridad, en el caso del sueco puede que esta crítica se elimine, pero el caso de Waluchow se limita a señalar que es una autoridad epistémica, sin determinar el derecho, entonces la pregunta sería: ¿Qué caso tiene contar con una regla de reconocimiento incluyente? i. e., R que apele a la condiciones morales, lo mismo puede hacer el Sueco con una regla de reconocimiento excluyente. Además, Waluchow37 señala que es el derecho el que funciona como autoridad práctica, no el sueco, pero entonces las preguntas subsisten: ¿Cómo puede el derecho ser una autoridad práctica si remite de nuevo a las RD que se supone debe adjudicar? El eliminar la pregunta señalando que el sueco simplemente se dedica a sus funciones epistémicas no agrega nada a favor del PI y su deseo de rescatar la tesis de la autoridad en términos de Raz. En otra interpretación de los alcances de la idea de Waluchow podríamos señalar que el caso es uno donde el sueco finalmente decide en torno a cuestiones de razones correctas, si es así, entonces de nuevo caemos en el supuesto previsto por Coleman, es el Sueco la autoridad práctica, además de ser fuente social, por lo anterior esta interpretación es menos favorable a las ideas del PI en general. B) Coleman sostiene que bien puede no coincidir el PI con la tesis de la autoridad en Raz, no obstante ello, el PI es viable dado que no tiene que estar ligado a dicha idea de Raz:38 a) Coleman tiene sus dudas en torno a que sea una característica conceptual el que el derecho reclame una autoridad legítima moral; b) La autoridad en el derecho no debe funcionar exactamente como lo dice Raz, i. e., intentando prevenir las razones 37 38
Idem. Ibidem, p. 133.
¿EXCLUYENTE O INCLUYENTE?
909
que justifican sus normas, y c) suponiendo que como característica conceptual el derecho reclame autoridad de algún tipo, esto no necesariamente se tiene que entender en el sentido de que cada ley debe ser capaz de hacer una diferencia práctica en nuestro razonamiento sobre lo que debemos hacer.39 Vamos a ubicar estas dudas de Coleman con las ideas de Raz de nuevo para saber qué está o no en la mesa de discusiones: sobre todo me interesan las dos últimas dudas: b) aquí Coleman básicamente pone en duda la tesis de Raz sobre la prevención (TP), la cual, recordemos, sostiene que el hecho de que una autoridad exija el llevar a cabo una acción, es una razón para actuar en correspondencia, razón que no se debe agregar a otras razones relevantes al momento de determinar qué se debe hacer; dichas razones producto de la directiva reemplazan a algunas de las otras razones.40 Para Coleman no todas las directivas tienen que funcionar de esta forma, la autoridad de algunas puede estar en el hecho de que tratan de hacer más explícitas algunas exigencias de moralidad. Es decir, y en pocas palabras, Coleman tiene dudas en torno a TDP, tesis que señala las razones adicionales que proporcionan las directivas (RE o RP) con una justificación IC que son las que reemplazan a las razones dependientes. También c) está íntimamente relacionada con b) sólo que aquí Coleman va más a fondo y no se refiere tanto al aspecto de la autoridad en general, sino a las directivas, i. e., para Coleman no resulta ser una verdad conceptual que todas las directivas para ser jurídicas deban ser capaces de guiar la conducta. Prima facie ¿Cuál es el problema con b? La cuestión es que si tomamos sólo lo que menciona Coleman en el sentido de hacer más explícitas las exigencias de moralidad,41 Raz tampoco estaría en desacuerdo con la noción de que la autoridad del derecho puede que radique en esto, el problema que esto trae a Coleman es que deben las directivas ya expedidas tener una función distinta a la de simplemente ser exigencias de moralidad, precisamente ésta es una de las características conceptuales del derecho, que a través de sus directivas añade razones, razones que son IC y RE, si eliminamos estos aspectos del derecho, la pregunta es: ¿Qué diferencia entonces hace el derecho a nuestro razonamiento? Es precisa39 40 41
Idem. Cfr. op. cit., nota 3, p. 214. Op. cit., nota 10, p. 133.
910
JUAN VEGA GÓMEZ
mente a través de las razones adicionales y la diferencia práctica que tiene el derecho en nuestro razonamiento como puede hacer estas exigencias más explícitas, no veo de qué otra forma se pueda explicar esto dentro de una perspectiva positivista que pretenda resaltar a las directivas como guías para la conducta. Pero la pregunta ahora es: ¿En qué medida el concepto de derecho desde la perspectiva positivista puede alejarse de TDP? Esto creo es lo que trata de salvar Coleman en el capítulo diez de su libro. En este sentido y después de aceptar algunos argumentos de los excluyentes, Coleman sostiene una versión distinta de TDP, i. e., defiende una versión débil de la tesis: Esta versión débil menciona: Es una verdad conceptual que el derecho debe ser capaz de hacer una diferencia práctica en nuestro razonamiento, pero de esto no se sigue que sea una verdad conceptual en relación a cada norma, i. e, para que una norma sea jurídica no necesita hacer una diferencia práctica.42 De esta forma —como dice Perry — TDP parece que se convierte en un dispositivo flotante para el sistema jurídico43 donde en su conjunto debe reunir este requisito, pero no en todas las normas. ¿Qué lectura le podemos dar a esta debilitación de TDP? Creo que más que contestar a Raz, Coleman responde a Shapiro. Sin entrar a particularidades, las objeciones de Shapiro al PI de Coleman son: a) que las normas deben hacer una diferencia práctica, b) puede que esta diferencia práctica sea motivacional o epistémica, c) existe diferencia práctica motivacional si estás motivado por el hecho de que la norma regula la conducta, y epistémicamente cuando conoces de tus obligaciones jurídicas de una regla, donde, dicho sea de paso, no se requiere motivación, d) una regla de reconocimiento incluyente no cumple con la tesis TDP ni motivacionalmente o epistémicamente. ¿Por qué? En el caso epistémico, con una regla de reconocimiento incluyente tendríamos que deliberar para saber si la norma es jurídica o no,44 por su parte, en el caso motivacional, Shapiro argumenta que las reglas válidas bajo la regla de reconocimiento incluyente no sirven de guías en la motivación, dado que una vez validada dicha norma no agrega razones y no hace una diferen42 43 44
Ibidem, p. 143. Cfr. Perry, op. cit., nota 28, p. 1792. Cfr. Shapiro, S., “On Hart’s way out”, en Coleman, J. (ed.), Hart’s Postscript: Essays on the Postscript to the Concept of Law, Oxford, Oxford University Press, 2001, p. 178.
¿EXCLUYENTE O INCLUYENTE?
911
cia porque la regla de reconocimiento de todas formas le exige al juez acudir a la moralidad,45 ergo, una postura incluyente no cumple con TDP fundamental para los positivistas. Aquí se ubica la urgencia de Coleman de decir que no todas las normas deben cumplir con este requisito, i. e., veo más esta relativización para contestar a Shapiro que Raz. Por qué menciono que no se aplica tanto a Raz; porque Raz en ningún momento defiende esta tesis tal como la critica Coleman, nunca se menciona que TDP se debe seguir en relación a cada una de las normas, además, es obvio que Raz explica el concepto derecho no con base en normas en lo particular, sino en su conjunto. No obstante lo anterior debemos preguntar: ¿Siguen existiendo diferencias entre Raz y Coleman en cuanto a la interpretación que Coleman le da a la tesis? Si bien es cierto que pueden existir diferencias en relación a qué tipo de reclamo es el de la autoridad i), si es legítimo moral y qué naturaleza tienen dichos derechos y obligaciones,46 en estos momentos sólo me voy a enfocar a las diferencias en torno a TDP y con ello resaltar los beneficios que proporciona la postura excluyente. El carácter débil que pretende defender Coleman está encaminado a sostener que una de las funciones del derecho puede ser la de dar una expresión concreta e institucional a la moralidad,47 y por lo tanto puede que existan directivas sin hacer una diferencia práctica. Como lo apuntamos anteriormente, creo que Raz no tendría problemas con ello, pero la tesis de la diferencia práctica precisamente se refiere a cómo el derecho puede dar expresión a la moralidad y estimo que ésta es la interpretación adecuada de la tesis desde la perspectiva positivista. Esta interpretación, en un estudio reciente de Raz, menciona cómo podemos ubicarla en su justa dimensión: En primer lugar no debemos pensar que la idea es una de incorporación, sino una modificación en las relaciones del derecho con la moralidad; debemos verlas desde la perspectiva de la moralidad y preguntar qué lugar le corresponde al derecho. Cuando las directivas son legítimas adquieren su sentido a través del papel que juegan al pretender señalar cuál es la acción adecuada conforme a la razón correcta, precisamente analizando las razones dependientes, el derecho da esa expresión y concretiza las demandas de la moralidad, empero, añade en su curso 45 46 47
Cfr. Ibidem, p. 179. Ibidem, p. 143. Ibidem, pp. 133 y 146.
912
JUAN VEGA GÓMEZ
razones, razones excluyentes y protegidas como ya lo mencionamos al analizar la postura de Raz. Es precisamente a través de dichas razones cómo el derecho no incorpora expresamente, pero modifica la forma en que se aplican dichos aspectos de moralidad, Raz menciona tres ejemplos: a) El derecho concretiza consideraciones morales y decide cuál es la acción correcta, una decisión que le pasamos a la autoridad, el derecho pretende acertar en el análisis de dichas acciones; b) A través de sus directivas que proporcionan razones adicionales pretende el derecho asegurar su cumplimiento, incluso facilitando lo anterior y al impedir injusticias entre los que cumplen y los que deciden no acatar las directivas, y c) El derecho coordina las actividades, facilitando la posibilidad de cumplir objetivos y realizar metas.48 Recordemos que a este respecto Raz menciona cómo el derecho permite acuerdos en medio de desacuerdos en nuestras sociedades. Pero la cuestión es resaltar —por lo menos desde la perspectiva positivista— que esto se lleva a cabo a través de la modificación que el derecho hace de cómo se aplica la moral. En este mismo estudio, Raz agrega que no sólo es a través de la expedición de directivas, también la modificación de estos aspectos de la moral se llevan a cabo por el judicial en sus interpretaciones, dado que en muchas ocasiones su función está encaminada precisamente a analizar estas dimensiones morales que se encuentran, por ejemplo, en las Constituciones. Entonces, el derecho al modular, modificar, ajustar estas aplicaciones de la moralidad, debemos verlas desde la dimensión de la diferencia práctica que generan. Ésta es precisamente mi preocupación con un PI de Coleman, dado que se pierde el sentido de cómo el derecho modifica estos aspectos de la moralidad, si no damos una buena cuenta de ello — y creo la tesis débil de la diferencia práctica que sostiene que el derecho en general lo debe llevar a cabo, pero no todas y cada una de las leyes —cometemos un error y dejamos aspectos del concepto sin explicar. Lógicamente no podemos entrar al debate de grados o números en el sentido de preguntarnos cuántas leyes son necesarias para reunir con el requisito, pero la explicación debe ser una detenida y no dejar este aspecto del derecho que el positivismo trata de explicar en un plano flotante —para retomar la observación de Perry— donde el hacer una dife48
Cfr. Raz, J., Even Judges are Human, Oxford, manuscrito, 2003.
¿EXCLUYENTE O INCLUYENTE?
913
rencia práctica parece pasar a un segundo plano frente al objetivo que puede tener el derecho de hacer más explícitas las exigencias de moralidad. Lo anterior sólo fue para mencionar reservas en torno a los problemas generales que veo con este PI de Coleman, ahora menciono la problemática de manera más concreta. Coleman coincide en que es una verdad conceptual que el derecho hace una diferencia práctica en nuestras deliberaciones, pero agrega que el dar expresión a la moralidad política seguramente es uno de los fines que el derecho puede servir. Creo que al avanzar una versión débil de TDP, ésta no constituye una buena interpretación de uno de los pilares del positivismo jurídico. Si el derecho debe ser capaz de hacer una diferencia práctica, esto a su vez no puede descansar en una afirmación en el sentido de sostener que ello es cierto del derecho en general, pero no en relación a cada una de sus normas. Lo anterior hace que TDP descanse en ciertos hechos contingentes que la tesis principal no sustenta.49 Lo anterior no debe interpretarse en el sentido de que todas y cada una de las normas deben hacer una diferencia práctica, creo que el argumento de Coleman, en este sentido, falla totalmente, lo que sucede es que el derecho en su conjunto hace esta diferencia práctica a través de RE. El otro problema con la explicación de Coleman es que su regla de reconocimiento está formulada para dar cabida a otra posible finalidad que el derecho puede cumplir, i. e., la posibilidad de hacer más concretas ciertas exigencias de moralidad. No obstante esta puede ser una de las metas que persiga el derecho, con la función que desempeña su regla de reconocimiento, la noción —de hacer más explícitas ciertas exigencias de moralidad— toma un papel mucho más importante que TDP. Toda la idea del positivismo de Coleman gira en torno a esta aspecto contingente y es por ello que tenemos una versión debilitada de TDP. Pero si vemos lo anterior como una explicación unitaria, TDP no tiene un lugar predominante en este desarrollo, es mas que nada su regla de reconocimiento y la posibilidad de hacer más explícitas las exigencias de moralidad las que toman el lugar de TDP. Coleman finalmente señala que no debemos aceptar TDP de una forma que le genere problemas al PI, y creo que al defender esta posición incluyente, desemboca en una explicación del derecho que descansa en una serie de afirmaciones del tipo puede, pero no necesariamente, que dejan aspectos importantes del concepto sin una de49
Punto también anotado por Perry, véase supra, nota 28.
914
JUAN VEGA GÓMEZ
bida explicación. Mi siguiente pregunta es: ¿Esto nos lleva finalmente a un debate metodológico? Considero que estas exploraciones definitivamente conducen a este sitio para comprender debidamente el problema. No estoy señalando que ésta sea la única perspectiva desde la cual se deba ver el debate, pueden existir otras que iluminen los problemas y conduzcan a soluciones si es que éstas son necesarias, pero sin duda estimo que la perspectiva metodológica es una de ellas. En este sentido, mi conclusión es que la idea del PE da una mejor cuenta y explicación del concepto y que la función de la filosofía jurídica analítica encuentra mejor representación en ella. Otro de mis argumentos es el siguiente: La falta de importancia que con esta versión incluyente del positivismo se le da al tema de los límites en el derecho. Una de las consecuencias que tiene este tipo de regla de reconocimiento es que elimina la posibilidad de identificar los límites en el derecho. Al decir que todo lo que implique la regla de reconocimiento puede ser derecho, no estamos equipados para explicar adecuadamente cuestiones tan importantes para la práctica que giran en torno a enunciados sobre qué es lo que hacen los jueces, legisladores y, en general, oficiales del derecho, lo anterior sólo por mencionar un aspecto. Precisamente una de las preocupaciones de Coleman y su PI para contar con una convención que explica la regla de reconocimiento, —pero que no impone más límites a la misma—, es no contemplar con esta explicación el tema de la tesis FSD, y es precisamente FSD la que nos permite explicar adecuadamente cuándo estamos ante la presencia de derecho existente, inexistente, fijo, cuándo los jueces crean derecho o aplican derecho existente. Como lo menciona Raz, uno de los objetivos de FSD es finalidad en relación a las razones que debemos seguir, esta finalidad se explica con límites que tiene el derecho y una idea clara sobre el derecho existente.50 De nuevo, esta es otra de las razones del por qué la explicación del concepto autoridad y FSD se unen en una mejor explicación conceptual del derecho. Finalmente, Coleman señala que una de las ventajas de su teoría es que “gratuitamente un positivista puede ser un positivista jurídico incluyente”51 y una de las posibles respuestas que a este respecto puede dar el PI sería mencionar que estamos entendiendo mal el objetivo, dado que lo 50 Cfr. Concept of a Legal System, 2a. ed., Oxford, Clarendon Press, 1980, p. 215 (hay traducción de Rolando Tamayo, El concepto de sistema jurídico, México, UNAM, Instituto de Investigaciones Jurídicas, 1986). 51 Coleman, op. cit., nota 10, p. 148.
¿EXCLUYENTE O INCLUYENTE?
915
ventajoso de la teoría es que proporciona una amplia gama de posibilidades para explicar estos aspectos del derecho, i. e., no es que estén en contra de FSD, sino que FSD y una regla de reconocimiento incluyente se pueden explicar desde la perspectiva del PI. Esto me exige reiterar lo que mencioné anteriormente en relación a los problemas explicativos de la teoría. Más que ser una ventaja, creo que juega de manera inversa, constituyendo un aspecto débil de la misma, i. e., al hacer que la explicación del concepto derecho descanse en ciertos hechos contingentes y aquellas condiciones necesarias dan lugar a versiones débiles de sus postulados, —e. g., TDP— el PI quizás esté perdiendo sus alcances y virtudes explicativas del concepto.
!
JUSTICIA Y MULTICULTURALISMO* Ambrosio VELASCO GÓMEZ** SUMARIO: I. Introducción. II. Ley vs. costumbre: sistemas jurídicos vs. usos y costumbres. III. Tradiciones jurídicas. IV. Conclusiones.
I. INTRODUCCIÓN El propósito de este trabajo es proponer y desarrollar el concepto de “tradición jurídica” como un recurso de análisis de los principios teóricos y prácticas jurídicos, en contextos culturales específicos. El concepto de tradición jurídica pretende dar respuesta fundamentada a los problemas y dilemas principales que se han planteado en la antropología jurídica clásica y contemporánea respecto a la distinción entre ley y costumbre (Malinowsky, Radclitte-Brown), así como al debate en términos de la racionalidad de los procesos y sistemas jurídicos modernos vis à vis la irracionalidad de los usos y costumbres tradicionales (Gluckman, Bohanan, Nadier, Collier, entre otros). En la primera parte del trabajo planteo brevemente los problemas y dilemas relativos a la distinción y jerarquía entre ley y costumbre. En la segunda parte, después de referirme brevemente a la rehabilitación reciente del concepto de tradición en varios ámbitos filosóficos (hermenéutica, filosofía de la ciencia, filosofía moral y política, sociología), elaboro un concepto de tradición jurídica. En la tercera parte propongo una clasificación o, mejor dicho, un espectro de tradiciones jurídicas en la que los tipos polares de tradiciones estarían representados por lo que denomino tradiciones de sistemas jurídicos y tradiciones jurídicas de usos y costumbres. En este espectro, * Este trabajo fue desarrollado dentro del Proyecto PAPIIT IN403501 “Republicanismo, ciudadanía y multiculturalismo”. ** Facultad de Filosofía y Letras, UNAM, México. 917
918
AMBROSIO VELASCO GÓMEZ
las tradiciones jurídicas de los pueblos indígenas estarían más cercanas al polo de tradiciones jurídicas de usos y costumbres, mientras que las tradiciones jurídicas modernas nacionales estarían más próximas a las tradiciones de sistemas jurídicos. Si bien se reconoce que las tradiciones de sistemas jurídicos tienen una aceptación más amplia debido al respaldo de las ideologías y poderes nacionales, cuestiono que estas tradiciones sean más racionales que las tradiciones de usos y costumbres que tienen una vigencia acotada en los pueblos indígenas. Por el contrario, se argumenta que este tipo de tradiciones son más racionales que los sistemas jurídicos en términos de su eficiencia para resolver los conflictos que surgen en la convivencia social. Con base en este argumento, en la cuarta parte del trabajo defiendo la necesidad del reconocimiento del pluralismo jurídico, no sólo como una cuestión de facto, sino, sobre todo, como un ideal regulativo. Finalmente, en las conclusiones del trabajo discuto muy brevemente la idea de nación, Estado y democracia que sería adecuada para un país donde se reconozca el pluralismo de tradiciones jurídicas. II. LEY VS. COSTUMBRE: SISTEMAS JURÍDICOS VS. USOS Y COSTUMBRES La distinción que se hace en la antropología jurídica entre ley y costumbre, o en términos más amplios, entre sistemas jurídicos y usos y costumbres, no sólo tiene un propósito analítico sino también y sobre todo una función ideológica: se busca establecer la mayor jerarquía jurídica, epistémica y moral de la ley y de los sistemas jurídicos, frente a los meros usos y costumbres. En cuanto a los sistemas jurídicos, son propios de los Estados nacionales modernos y, por otra parte, los usos y costumbres son considerados como reminiscencias primitivas que sobreviven en las comunidades y pueblos indios, se sigue que estos usos y costumbres tienen que ser sustituidos o en el mejor de los casos, integrados y absorbidos por los sistemas jurídicos nacionales, si es que han de progresar y modernizarse. Si además aceptamos la idea de que los usos y costumbres son prácticas y formas de vida que definen la identidad cultural de pueblos y comunidades históricamente definidos, se seguiría consecuentemente que la única manera como pueden progresar y modernizarse estos pueblos es a costa de diluir su identidad propia en las concepciones, instituciones y sistemas jurídicos del Estado nacional. En otras pa-
JUSTICIA Y MULTICULTURALISMO
919
labras, si los pueblos indígenas han de progresar, deben de dejar ser indígenas.1 Este argumento está en la base de las políticas de tolerancia paternalista que tuvieron las metrópolis respecto a los pueblos indios en la época Colonial, así como en los procesos etnocidas de las Constituciones liberales de las colonias, una vez independizados y continúan también vigentes en las políticas integracionistas que predominan en nuestros países hoy en día. A nivel analítico, las diferencias que se establecen entre ley y costumbre estriban fundamentalmente en que la ley es una norma explícita y diferenciada de las creencias culturales y prácticas morales que tácitamente rigen en la vida social. Estas normas están escritas y codificadas y su aplicación depende de instituciones especializadas a cargo de personas profesionales (tribunales, jueces y abogados). Por el contrario, las costumbres son prácticas y creencias no escritas ni codificadas que están implícitas en la vida cotidiana de una comunidad y que simplemente se usan de una manera “natural” y espontánea en las maneras de plantear los conflictos y dirimirlos entre miembros de una comunidad.2 De manera análoga la distinción entre usos y costumbres, por un lado y, sistemas jurídicos por otros, se establece en función de una separación entre sociedad y derecho, en cuanto este último tiene sus normas y su lenguaje propios, así como sus especialistas profesionales; pueda entenderse “en términos de sí mismo; evoluciona de acuerdo a sus propias leyes internas y puede ser transferido como corpus acabado de una socie1 Jane Collier plantea con claridad que los nuevos Estados independientes se plantearon este dilema al emanciparse del dominio colonial: “Los fundadores de nuevos Estados, por lo tanto, enfrentaron un nuevo dilema: tenían que encarar simultáneamente lados opuestos de una dicotomía conceptual; por un lado afirmar la razón humana universal para poder justificar su capacidad para gobernarse a sí mismos y, por otro, afirmar las tradiciones para justificar sus demandas de autogobierno”. Collier, Jane, “Problemas teórico-metodológicos en la antropología jurídica” en Chenout, Victoria y Sierra, María Teresa (coords.), Pueblos indígenas ante el derecho, México, Centro Francés de Estudios Americanos y Centroamericanos-CIESAS, 1995, p. 70. Claramente en nuestro país y en la mayoría de los países latinoamericanos los gobiernos optaron por la razón universalista occidental a costa de las tradiciones autóctonas de los pueblos indios. 2 Cfr. Sierra, María Teresa, “Antropología jurídica y derechos indígenas: problemas y perspectivas”, Dimensión Antropológica, INAH, año 3, vol. 8, septiembre-diciembre de 1996, especialmente pp. 61-71. Cfr. Collier, F., “Problemas teórico-metodológicos en la antropología jurídica” en Chenaut, Victoria y Sierra, María Teresa (coords), Pueblos indígenas ante el derecho, México, Centro Francés de Estudios Mexicanos y Centroamericanos-CIESAS, 1995, especialmente pp. 46-54.
920
AMBROSIO VELASCO GÓMEZ
dad a otra”.3 A estas características podríamos agregarle que el Corpus de leyes escritas codificadas espera a tener una sistematicidad deductiva, además de contar con instituciones especializadas en aplicar las leyes y las sanciones correspondientes.4 En contraste, los usos y costumbres “no constituyen una esfera diferente o autónoma de la sociedad, por el contrario, aquí lo jurídico se encuentra inmerso en la estructura social, no existe por lo general un aparato administrativo específico ni los especialistas encargados de elaborar y/o aplicar el derecho”.5 La distinción y contraste entre sistemas jurídicos conformados por leyes, por un lado y, usos y costumbres por otro, nos plantea un dilema incómodo. Si valoramos la racionalidad sistemática, la precisión de las leyes escritas y codificadas, la neutralidad y eficiencia de instituciones y de los profesionales encargados de su aplicación, tendríamos que renunciar a un valor fundamental: la fundamentación moral de las leyes, reglas y prácticas su vinculación con los sistemas de moralidad social, que al mismo tiempo que dan cohesión e identidad a comunidades sociales específicas, les brindad legitimidad.6 Si por el contrario, se valora más la fundamentación de las normas y prácticas de derecho en la moralidad social arraigada en las comunidades específicas, tendríamos que renunciar a la generalidad, precisión y sistematicidad de las leyes codificadas. La teoría general del derecho y las visiones gubernamentales claramente tienden a preferir la primera alternativa.7 Con ello el derecho se convierte claramente en un medio de dominación sobre la vida de las comunidades específicas, precisamente porque es ajeno y aun contrario a las creencias, valores, prácticas y costumbres que efectivamente regulan la vida cotidiana de las comunidades que aún tienen una identidad propia. Por lo
3 Stavenhagen, Rodolfo, “Derecho consuetudinario indígena en América Latina” en Stavenhagen, Rodolfo (comp.), Entre la ley y la costumbre, México, Instituto Interamericano de Derechos Humanos, 1989, p. 30. 4 Cfr. Correas, Oscar, “Pluralismo jurídico y teoría general de derecho”, Derechos y Libertades, Madrid, año II, núm. 5, julio-diciembre de 1995, p. 230. 5 Stavenhagen, Rodolfo, op. cit, nota 3, p. 30. 6 Sobre la relación entre moralidad social y derecho véase la obra clásica Durkheim, F., La división social del trabajo, capítulo VII. 7 Cfr. Correas, Oscar, op. cit., nota 4.
JUSTICIA Y MULTICULTURALISMO
921
tanto, el derecho pierde su legitimidad8 para resolver conflictos entre los miembros de una comunidad, de tal manera, que las soluciones restituyan las relaciones de convivencia solidaria (conciliación). Mi posición ante este dilema es opuesto a la de la teoría general del derecho y las posiciones que defienden la validez exclusiva de los sistemas jurídicos frente a los usos y costumbres. Creo, como argumentaré en las siguientes secciones, que las tradiciones jurídicas de usos y costumbres resultan ser más racionales para la regulación y solución de conflictos en sociedades como las comunidades indígenas que aún conservan una fuerte moralidad social identitaria. En todo caso, los sistemas jurídicos de leyes codificadas e instituciones especializadas podrían ser adecuadas para sociedades como las urbanas en las que han desaparecido los sistemas de moralidad social como rasgo identitario.9 Así pues, la propuesta que sugiero ante el dilema entre la facticidad formal de los sistemas jurídicos y la validez moral de los usos y costumbres difiere de algunas propuestas como la de Oscar Correa que considera a esta distinción como incorrecta, pues ambos serían, en sentido estricto, sistemas jurídicos, ya que ambos serían conjuntos de normas dotadas de poder coactivo, ejercido por funcionarios autorizados. Mi concepción mantendría la distinción entre sistema de leyes de usos y costumbres que hemos descrito en los términos de Rodolfo Stavenhagen. Sin embargo, rechazaría las pretensiones jerárquicas que los juristas asocian a esta distinción y buscaría establecer la comparabilidad y posiblemente la complementariedad entre ellos, a través del concepto de “tradición jurídica”. Desde esta perspectiva los sistemas jurídicos modernos y los usos y costumbres de comunidades indígenas serían dos diferentes tipos de tradiciones jurídicas. III. TRADICIONES JURÍDICAS El concepto de tradición ha sido reelaborado y reivindicado en años recientes en muy diferentes campos de la filosofía. 8 Sobre el carácter cultural de la legitimidad de los sistemas de leyes véase Kotz, Esteban, “Antropología y derecho”, México Indígena, año IV, núm. 25, noviembre-diciembre, especialmente pp. 12 y 13. 9 El problema de validez de los sistemas jurídicos modernos y la facticidad moral efectivamente vigente es uno de los problemas centrales que analiza Jürgen Habermas en su reciente libro Facticidad y validez.
922
AMBROSIO VELASCO GÓMEZ
En la filosofía de la ciencia, por ejemplo, autores como Karl R. Popper, Thomas Kuhn y Larry Laudan, entre otros, defienden la idea de que las ciencias son ante todo tradiciones teóricas y prácticas que evolucionan racionalmente gracias a controversias internas y externas. Del mismo modo, en la historia y filosofía de las teorías políticas, autores como Michael Oakshott, Alasdair MacIntyre y Edwards Shills, sostienen que los sistemas de pensamiento político están siempre arraigados en tradiciones teórico-ideológicas históricamente acotadas. Tales tradiciones son portadoras de los principios y criterios de justicia y racionalidad. En este sentido, la discusión sobre la racionalidad de las teorías o instituciones políticas tiene siempre que partir de la reconstrucción histórica de su correspondiente tradición específica. En términos más generales, Hans Georg Gadamer ha discutido, principalmente en su debate con Habermas, las virtudes éticas y epistémicas de la tradición.10 Cabe aclarar que esta defensa no representa necesariamente una posición conservadora, sino más bien intenta enfatizar la historicidad de la cultura humana. En un intento de integrar las connotaciones más relevantes que han desarrollado los distintos autores que hemos mencionado, podríamos caracterizar a una tradición como un conjunto de creencias, valores, teorías, artefactos, principios, criterios, prácticas e instituciones que efectivamente regulan la vida de comunidades históricamente acotadas en determinados ámbitos de vida social y cultural. En este sentido, podemos hablar de tradiciones científicas, tradiciones pictóricas, tradiciones literarias, musicales, políticas, etcétera. Entre las características distintivas de las tradiciones se destaca el hecho de que cambian de manera continua como resultado de las controversias internas a la tradición y de controversias externas como otras tradiciones. Esto presupone que las tradiciones no son monolíticas ni fijas sino flexibles y dinámicas, (o para utilizar la expresión de Habermas son “porosas” e históricas). Además en cada ámbito relevante de la vida social (ciencias, arte, política, religión, etcétera.), existe una pluralidad de tradiciones, gracias a lo cual es posible el diálogo inter-tradicional, lo que a su vez posibilita la evaluación y revisión racional de las tradiciones.
10 Para un análisis crítico de estos diferentes sentidos del concepto de tradición véase mi artículo “Universalismo y relativismo en los sentidos filosóficos de tradición”, Diánoia. Anuario de Filosofía, México, año XLII, núm. 43, 1997, pp. 125-145.
JUSTICIA Y MULTICULTURALISMO
923
A mi juicio estas características de las tradiciones científicas, humanísticas y políticas, son convergentes con las características de los sistemas jurídicos y de lo que denomina María Teresa Sierra “Costumbres jurídicas”.11 En ambos se reconoce la existencia de un conjunto de principios y normas jurídicas, así como prácticas y procesos que interpretan, adecúan y aplican las normas y principios. Estos elementos teóricos y prácticos se encuentran en constante relación tensional no sólo en los usos y costumbres sino también en los sistemas de leyes codificados. Como lo muestra Habermas,12 también en este ámbito los jueces profesionales tienen que reflexionar y deliberar prudencialmente cuáles son las leyes (codificadas) pertinentes para juzgar cada caso, así como elegir entre principios regulativos no escritos que justifiquen la pertinencia de la elección. La necesidad de la elección prudente o razonable de las normas y principios jurídicos pertinentes no sólo es propio de las costumbres de comunidades no modernas, también se requiere, como lo muestra Gluckman, en sistemas jurídicos complejos de sociedades modernas.13 Sin embargo es importante resaltar, como lo observa María Teresa Sierra, que los estilos o formas de argumentación sobre la validez de un juicio jurídico varían significativamente entre los sistemas jurídicos modernos nacionales y las costumbres jurídicas de los indígenas: Se trata no solamente de un conflicto lingüístico, debido al dominio limitado del español, sino también de un conflicto de discursos donde la lógica argumentativa del discurso jurídico se impone sobre otras formas de argumentar, basadas en estilos narrativos y coloquiales y sobre todo de un conflicto cultural, ya que la lógica cultural del indígena, a partir de la cual construye sus referencias y valida sus normas, no tiene lugar en el espacio jurídico.14
Además de estilos argumentativos, habría que destacar también los valores prioritarios que cada tradición defiende y los derechos fundamentales que se derivan de esos valores, así como el manejo de los sentimientos y emociones15 que utilizan las tradiciones jurídicas para asegurar su eficacia. 11 12 13
Cfr. Sierra, María Teresa, op. cit., nota 2, p. 67. Cfr. Habermas, op. cit., nota 9, capítulo IV. Cfr. Gluckman, Max, Order and Rebelion in tribal Africa, Cohen and West, 1963, capítulo 7, especialmente p. 179. 14 Sierra, María Teresa, op. cit., nota 2, p. 77. 15 El manejo de los sentimientos o emociones de los hombres como una dimensión fundamental de la organización social y del control político ha sido un tema central en muchos
924
AMBROSIO VELASCO GÓMEZ
En suma, los elementos constitutivos de las tradiciones jurídicas son: a) un conjunto de normas y principios; b) un conjunto de procesos, prácticas e instituciones a través de las cuales se interpretan y aplican las normas y principios para resolver conflictos; c) un conjunto de valores y derechos fundamentales; d) determinadas formas de argumentación para justificar los juicios jurídicos; e) cierta concepción de la centralidad de ciertas emociones o sentimientos para conservar la cohesión de la vida social. Con base en estas características podríamos distinguir dos tipos (polares) de tradiciones jurídicas que denominaré, siguiendo la distinción ampliamente utilizada, tradiciones de sistemas jurídicos y tradiciones de usos y costumbres. Retomando la caracterización que hace Stavenhagen e integrándola a nuestro concepto de tradición, las tradiciones de sistemas jurídicos se caracterizarían porque el sistema de normas y principios está escrito de manera articulada en sistemas generales de códigos complejos, cuya puesta en práctica requiere de sistemas procesales también codificados y de profesionistas especializados. La generalidad, sistematicidad y complejidad de las normas y los procesos implican su alejamiento y divorcio de la vida cotidiana de la sociedad. Su efectividad no puede estar basada en las costumbres, sino en la coacción violenta y el temor al castigo. Por ello, la capacidad de sanción es un rasgo esencial de las tradiciones de los sistemas jurídicos. Los valores y derechos fundamentales se refieren al individuo, quien es el principal sujeto de derecho. Las formas de argumentación están limitadas a rígidos lenguajes y esquemas que aspiran16 al rigor concluyente de la lógica deductiva, o en su defecto a la evidencia de la inferencia probabilística. En oposición a las tradiciones de sistemas jurídicos, las tradiciones jurídicas de usos y costumbres se caracterizan porque las normas y principios jurídicos no están, por lo general escritas, ni forman códigos, sino autores clásicos de teoría política. Piénsese por ejemplo en Maquiavelo (amor, temor, odio) o en Hobbes (temor). Para un análisis muy completo del papel de las pasiones en el ámbito moral y político véase Remo Bodei, La geometría de las pasiones, México, FCE, 1995. 16 Digo que aspiran, porque los litigantes y jueces por lo común no tienen una sólida formación lógica. La reconstrucción lógica de la argumentación jurídica, política y ética se alejan mucho del rigor deductivo y se enmarcarán en argumentos persuasivos. Como lo han mostrado Stephen Toulmin y C. Perelman. Cfr. Toulmin, Stepehen, An Examiantion of the Place of Reason in Ethics, Cambridge University Press, 1950 y Perelman, C. y Olbrechts-Tyteca, L., Retórica y lógica, México, UNAM, Seminario de Problemas Científicos y Filosóficos, 1987.
JUSTICIA Y MULTICULTURALISMO
925
más bien forman parte de las reglas tácitas propias del sensus communis o de la moralidad social de la comunidad que todos sus miembros han de interiorizar como parte de su proceso de socialización. En este sentido, las normas y principios jurídicos no sólo están separados de la moralidad social, sino que de hecho no pueden distinguirse de normas y principios de otros ámbitos de la vida social (religiosa, económica, política, artística, etcétera). Debido precisamente a la familiaridad que todos los miembros de una comunidad tienen con las normas y principios jurídicos, no se requiere que los usuarios e intérpretes de ellos sean especialistas; por el contrario, cualquier miembro de la comunidad con madurez puede hacer uso directamente de las normas y principios jurídicos para plantear y participar en la solución de conflictos. En virtud de que las normas jurídicas y la moralidad social están estrechamente relacionadas, no se requiere que la coacción violenta sea el principal garante de la vigencia de las normas. Como lo muestra María Teresa Sierra en sus estudios sobre la resolución de conflictos jurídicos de comunidades otomíes en el Valle del Mezquital,17 el ánimo de la conciliación y la eliminación del resentimiento y rencor son los principales apoyos emotivos para hacer eficientes las tradiciones de usos y costumbres. Estos sentimientos apuntan hacia la prioridad de la vida comunitaria sobre los derechos individuales. Por ello, también la argumentación en la solución del conflicto se orienta a construir narrativas que faciliten la aceptación entre las partes para conciliarse. Las tradiciones de sistemas jurídicos se caracterizarían pues por ser externos a las sociedades en las que rigen y por ello las considero, retomando y cambiando la distinción kantiana, heterónomas. Por el contrario, las tradiciones jurídicas de usos y costumbres están integradas a la moralidad social que de hecho rige en las diferentes prácticas de las comunidades específicas. Por esta razón, las considero autónomas, esto es, la propia moralidad social es la que rige jurídicamente. Si comparamos la eficiencia de uno y otro tipo de tradición, las tradiciones de usos y costumbres resultan claramente superiores, pues, al centrarse en la conciliación a través del convencimiento de las partes, aseguran una solución satisfactoria y justa en la que todos ganan o al menos no hay una parte que se sienta agraviada por una decisión injusta. Además el proceso es rápido y no requiere gastos cuantiosos como es el caso de las tradiciones de 17 Sierra, María Teresa, “Lenguaje, prácticas jurídicas y derecho consuetudinario indígena”, Entre la ley y la costumbre, México, III-IDH, 1990, pp. 231-258.
926
AMBROSIO VELASCO GÓMEZ
sistemas jurídicos donde se requieren tribunales y abogados, así como un largo proceso cuyo resultado es incierto. Sin embargo, resulta obvio que las tradiciones jurídicas de usos y costumbres sólo pueden regir ahí donde existe una fuerte homogeneidad cultural, y más específicamente ahí donde una misma moralidad social es compartida por la mayoría de los miembros de una comunidad. Esto restringe su viabilidad a comunidades homogéneas y de fuerte cohesión social. En sociedades urbanas modernas, donde no hay tal homogeneidad cultural, donde existe una pluralidad de moralidades sociales, y donde la identidad comunitaria es pobre o nula, no puede existir tradición jurídica autónoma de usos y costumbres. Dado que en los Estados nacionales contemporáneos coexisten grupos sociales de los dos tipos, tendríamos que aceptar la necesidad de la coexistencia de tradiciones jurídicas, tanto del tipo de sistemas jurídicos, como del tipo de usos y costumbres. Además, es de esperarse que dentro de este último tipo de tradiciones jurídicas exista una gran variedad de tradiciones específicas de usos y costumbres. IV. CONCLUSIONES Sin lugar a dudas, el pluralismo de tradiciones jurídicas plantea un grave problema a la idea de nación-Estado liberal que predomina en la mayoría de los países de nuestros días. Estos problemas se derivan del hecho de que los Estados nacionales contemporáneos presuponen la existencia exclusiva de un sólo sistema jurídico homogéneo en toda la nación. El pluralismo jurídico contradice esta premisa fundamental, y demanda una nueva concepción de la nación y del Estado donde sea posible el reconocimiento de la coexistencia de diversas tradiciones jurídicas. La discusión al respecto es amplísima y se ofrecen propuestas diversas: Estado plurinacional, estado plural, nación pluriétnica y pluricultural, federalización cultural, y otras más.18 Esta discusión escapa con mucho a este trabajo, pero la conclusión cierta que podemos obtener es que el reconocimiento del pluralismo jurídico implica una reconstitución del
18 Véase por ejemplo el reciente libro de Villoro, Luis, Estado plural, pluralidad de culturas, Paidós-UNAM, 1998. Véase también la nueva edición del libro de López Rivas, Gilberto, Nación y pueblos indios en el neoliberalismo, UIA-Plaza y Valdez, 1996.
JUSTICIA Y MULTICULTURALISMO
927
Estado nacional y de la democracia liberal.19 Esta reconstitución democrática de la nación y del Estado tiene que aceptar la autonomía de aquellas comunidades que, como los indígenas, se organizan de hecho a través de tradiciones jurídicas de usos y costumbres específicas. Como la argumenta Luis Villoro, este reconocimiento no implica el reconocimiento de la soberanía, como han señalado para el caso de Chiapas algunos voceros gubernamentales. Puede concebirse la autonomía como una autodeterminación limitada, no total, de los pueblos indígenas o quizás de otras comunidades no indígenas pero con una nítida tradición de usos y costumbres jurídicas. Es más, creo que dichas tradiciones serían un criterio de identidad de pueblos y comunidades que podrían legítimamente demandar el reconocimiento de su autonomía. Los sistemas jurídicos estatales y nacionales tendrían que adecuarse para respetar los ámbitos en los que las comunidades y pueblos pueden regirse de acuerdo a sus usos y costumbres. Desde luego, estos ámbitos tendrían que negociarse y acordarse en cada caso particular. Este tipo de negociación sería ya un ejercicio eminentemente democrático. En este sentido, la democratización del país no habría que entenderla, simplemente en el sentido liberal, como el cambio de un régimen de gobierno autoritario a otro basado en sufragio efectivo, y en la competencia equitativa entre partidos. El reconocimiento del pluralismo jurídico y de la autonomía de comunidades y pueblos específicos demanda que la democratización tiene que entenderse también como el proceso de redefinición de las relaciones entre los pueblos y comunidades con el Estado nacional.
19 Sobre este punto, publiqué recientemente el artículo “Liberalismo y republicanismo: dos tradiciones en conflicto en la democratización del Estado mexicano”, Revista Internacional de Filosofía Política, Madrid, núm. 12, julio de 1999.
!
INTERPRETACIÓN E INDETERMINACIÓN DE LA REGLA JURÍDICA Francesco VIOLA* La creciente relevancia del derecho internacional y del derecho comunitario europeo, así como del derecho comparado, libra la reflexión acerca de la interpretación jurídica de la referencia predominante, cuando no exclusiva, al derecho estatal, y con ello pone en cuestión tesis consolidadas y teorías habituales, aumentando su capacidad explicativa en un nivel más general. Los teóricos del derecho deben reconocer que en este campo hay mucho trabajo que hacer, tanto en el plano descriptivo cuanto en el de la construcción. No se trata solamente, en efecto, de volver a tomar en consideración y sistematizar la variedad de métodos interpretativos ejercitados en la práctica jurídica entendida de manera no restrictiva, sino de preguntarse si de su transformación y su evolución se puede aprender algo más sobre la naturaleza de la interpretación jurídica. Ambos objetivos sobrepasan el propósito del presente trabajo, que solamente quiere formular algunas observaciones y reflexiones acerca de la transformación que se está verificando en la teoría de la interpretación jurídica.1 La primera de estas observaciones procede de la constatación de que el desarrollo más interesante de la teoría de la interpretación proviene de los debates sobre el ámbito de aplicación de las normas a los casos concretos. No se ha de partir del significado abstracto de las normas para determinar su ámbito de aplicación (como quisiera Kelsen), sino que, por el contrario, es desde la perspectiva del caso concreto desde donde se cuestiona la norma o se busca la regla en cuestión. Estas operaciones que en el pasado se entendían como meramente prácticas, es decir, sin relevan* Universitá di Palermo, Italia. 1 En general véase Viola, F. y Zaccaria, G., Diritto e interpretazione. Lineamenti di ermeneutica giuridica, 3a. ed., Roma-Bari, Laterza, 2000. 929
930
FRANCESCO VIOLA
cia teórica, hoy se reconocen centrales para el conocimiento mismo de la regla a seguir. Hasta parece que la regla exista en su identidad de significado sólo ante el caso concreto y que fuera de ahí caiga en lo indistinto e indeterminado. La misma distinción, de la cual quizás se haya abusado, entre casos fáciles y difíciles, se entiende correctamente desde la perspectiva del caso y no desde la de la regla. Es fácil un caso que encuentra con facilidad la regla que debe guiarlo y es difícil un caso que suscita incertezas interpretativas más o menos graves en relación con la regla a elegir. Es trágico un caso que invoca simultáneamente reglas que en concreto resultan contradictorias.2 Pero todo eso depende más de la particularidad del caso, de sus circunstancias y de los contextos en los que se presenta que de la formulación abstracta de la regla. En realidad es la regla la que será de fácil o de difícil interpretación al ser llamada a dar solución a un caso concreto. Y es el caso concreto el que hace fácil o difícil la determinación de la regla positiva que hay que seguir.3 Se trata, sin duda, de una característica peculiar de la interpretación en cuanto que “jurídica”; característica que no puede y no debe ser descuidada por la teoría general, a menudo exclusivamente atenta a aplicar al derecho los métodos de la interpretación en general. La consecuencia más inmediata de estas consideraciones es la constatación de la abolición de toda separación entre interpretación y aplicación del derecho. No sé si esta distinción debe ser rechazada en general —como piensa la hermenéutica—, lo que es seguro es que no tiene sentido en el derecho y en la interpretación jurídica. Sobre este punto Kelsen y Hart divergen claramente. Según Kelsen el examen conoscitivo de los significados de una norma es una operación bien distinta de la elección del significado efectuada por el juez o por el operador jurídico, de igual modo que la razón es bien distinta de la voluntad. Esta distinción no es aplicable a la teoría hartiana (o por lo menos a su lógico e inevitable desarrollo) del núcleo de significado claro y de la zona de penumbra. No es posible determinar a priori cuáles son los casos fáciles y cuáles los difíciles, porque la complejidad de la experiencia jurídica dice que son las
2 Véase Atienza, M., “I limiti dell’interpretazione costituzionale. Di nuovo sui casi tragici”, Ars interpretandi, trad. de S. Sanavio, 4, 1999, pp. 293-320. 3 Un orientamiento de este tipo en Zagrebelsky, G., Il diritto mite, Turín, Einaudi, 1992, pp. 180 y ss.
INTERPRETACIÓN E INDETERMINACIÓN
931
circunstancias las que los hacen fáciles o difíciles4. Si es así, entonces hay que reconocer que la manera concreta de entender la teoría hartiana de la interpretación implica la eliminación de toda barrera entre interpretación y, aplicación5 y que la peculiaridad de la interpretación jurídica es precisamente ésta, es decir su estar dirigida a la aplicación del derecho, su ser en función del buen éxito del derecho.6 Interpretamos porque, interpelados por un caso, nos preguntamos qué regla seguir y cómo seguir correctamente una regla en circunstancias determinadas. Se puede hacer en abstracto, pero ése es un deporte que tiene utilidad sólo como entrenamiento para hacerlo en concreto. Y el derecho está precisamente ahí, es decir, en seguir concretamente una regla, más que en las reglas a seguir en abstracto. La acostumbrada tripartición de las teorías de la interpretación en la tendencia formalista (naturalista), en la escéptica y en la concepción mixta aparece, a esta luz, inadecuada, al estar fundada sobre un interés epistemológico, es decir, sobre la problemática de la objetividad de la interpretación.7 A su vez la problemática de la objetividad implica una concepción del derecho positivo por la que la regla dictada por la autoridad pretende ser completamente pre-formada antes del acto interpretativo, de manera que mientras unos sostienen que la interpretación es una actividad de descubrimiento de significados preexistentes, otros que de invención, otros, por fín, recurren sabiamente a una vía intermedia. Pero, cuando acaece que la actividad interpretativa está llamada a participar de alguna manera en la formación de la regla que de hecho se aplica, enton4 Aquí por “circunstancias” entiendo no sólo las fácticas, sino también las normativas, es decir, el entrelazamiento en cambio continuo de las relaciones entre las normas dentro de un sistema jurídico. 5 Véase, entre los últimos, Velluzzi, V., Interpretazione sistematica e prassi giurisprudenziale, Turín, Giappichelli, 2002, p. 48. 6 Estos resultados de la teoría hartiana están inscritos en sus raíces wittgensteinianas y, en particular, en la problemática del “seguir una regla”. Véase, por ejemplo, Barberis, M., “Seguire norme giuridiche, ovvero: cos’avrà mai a che fare Wittgenstein con la teoría dell’interpretazione giuridica?”, Materiali per una Storia della Cultura Giuridica, 32, 1, 2002, pp. 245-273. 7 Véase, por ejemplo, Coleman, J. L. e Leiter, B., Determinacy, Objectivity, and Authority, en Marmor, A. (ed.), Law and Interpretation. Essays in Legal Philosophy, Oxford, Clarendon Press, 1995, pp. 203-278; Greenawalt, K., Law and Objectivity, Oxford, Oxford University Press, 1992 y Schiavello, A., Positivismo inclusivo, oggettività ed interpretazione del diritto, en Triolo, L. (a cura di), Prassi giuridica e controllo di razionalità, Turín, Giappichelli, 2001, pp. 165-196.
932
FRANCESCO VIOLA
ces este modo de configurar una teoría interpretativa resulta claramente insuficiente. Se puede, en verdad, sostener que ésta no es ya una actividad en sentido propio interpretativa sobre la base de una definición general de interpretación, y sin embargo hay que reconocer que, de hecho, la práctica de la interpretación jurídica en cuanto que “jurídica” es ésta: sin la interpretación la regla no existe (contra el formalismo) y sin la regla no podría haber tampoco interpretación en sentido propio (contra el escepticismo). Esto es, de hecho, lo que se ha de entender cuando se afirma que el derecho es una práctica social de tipo interpretativo.8 Con esto se quiere decir que la interpretación jurídica en cuanto que “jurídica” no es solamente una mera búsqueda de significados (no importa si preexistentes o creados) y que la insuficiencia de las teorías consolidadas depende en la sustancia de la aproximación general al sentido y a la función de la interpretación en el derecho. Quisiera, por lo tanto, mostrar que precisamente la evolución actual de los metodos jurídicos revela la necesidad de poner al día el modo corriente de entender el papel de la interpretación en el derecho. En los últimos decenios la novedad más relevante en el ámbito de los métodos interpretativos reside —a mi modo de ver— en la interpretación constitucional.9 Su importancia va más allá del campo del derecho constitucional extendiéndose al derecho comunitario y en cierto sentido también al derecho internacional. Se prefigura, por tanto, un modelo general de la actividad jurídica interpretativa en el que el método sistemático-teleológico constituye la estructura sustentante a la que los otros métodos están subordinados en función servil, bien en el nivel preliminar, bien en
8 Véase Dworkin, R., Law’s Empire, Londres, Fontana Press, 1986; y Viola, F., Il diritto come pratica sociale, Milán, Jaca Book, 1990. 9 Véase, entre otros, varios autores, Il metodo nella scienza del diritto costituzionale, Padova, Cedam, 1997; Rimoli, F., “Costituzione rigida, potere di revisione e interpretazione per valori”, Giurisprudenza costituzionale, 1992, pp. 3712 y ss.; Baldassarre, A., “L’interpretazione della Costituzione”, y Azzariti, G., “Interpretazione e teoria dei valori: tornare alla Costituzione”, ambos en Palazzo, A. (a cura di), L’interpretazione della legge alle soglie del XXI secolo, Nápoles, ESI, 2001, respectivamente pp. 215 y ss. y 231 y ss; y Cervati, A. A., “In tema di interpretazione della Costituzione, nuove tecniche argomentative e «bilanciamento» tra valori costituzionali (a proposito di alcune riflessioni della dottrina austriaca e tedesca)”, en varios autores, Il principio di ragionevolezza nella giurisprudenza della Corte costituzionale. Riferimenti comparatistici, Milán, Giuffrè, 1994, pp. 55 y ss.
INTERPRETACIÓN E INDETERMINACIÓN
933
el papel de instancia de segundo grado.10 Eso parece dar razón a Fuller en el famoso debate con Hart: para comprender una regla debemos comprender su finalidad; lo que una regla “es” será determinado a la luz de lo que una regla “debe ser”.11 Aquí no importa discutir si la interpretación constitucional se distingue o no de la interpretación jurídica en general, como algunos afirman12 y otros niegan.13 Puestos a elegir, elegiría el segundo grupo (aunque no me aceptarían entre ellos) porque creo que en la interpretación constitucional sale a la luz lo que siempre ha estado presente en la praxis jurídica interpretativa, habitualmente reducida a los cánones tradicionales de la interpretación de la fórmula legislativa. Pero aquí esta diatriba no interesa, por cuanto el derecho constitucional y el comunitario tienen relevancia sólo por haber hecho creíble un modelo general (y generalmente aplicable) de interpretación en el que la ratio legis tiene un papel central y directivo. Es fácil comprender la razón de esta evidenciación de la interpretación teleológica en la época del constitucionalismo. En efecto, la constitucionalización de los valores fundamentales en principios de derecho positivo es en sustancia una positivización de las finalidades fundamentales de las normas pertenecientes a un sistema jurídico dado. Esta indicación de las finalidades que las normas deben tener (o a las que, de todas formas, no deben perjudicar) constituye un criterio normativo para la actividad interpretativa. De esa manera el método teleológico implícita pero necesariamente adquiere un rango oficial y prioritario, revolucionando la jerar10
Sobre el papel de la interpretación sistemático-teleológica en el derecho comunitario Véase, Kutscher, H., “Alcune tesi sui metodi d’interpretazione del diritto comunitario dal punto di vista d’un giudice”, Rivista di Diritto Europeo, 1977, pp. 3-24; Mertens de Wilmars, J., “Réflexions sur les méthodes d’interprétation de la Cour de Justice des Communautées européennes”, Cahiers de Droit Européen, núm. 5, 1986; y Bengoetxea, J., The Legal Reasoning of the European Court of Justice. Towards a European Jurisprudence, Oxford, Clarendon Press, 1993, pp. 233 y ss. En el derecho internacional Véase Corten, O., L’utilisation du “raisonnable” par le juge international, Bruselas, Bruylant, 1997. 11 Véase Fuller, L. L., “Positivism and Fidelity of Law–A Reply to Professor Hart”, Harvard Law Review, 71, 1958, pp. 665-669. 12 Por ejemplo, Baldassarre, A., “L’interpretazione della costituzione”, op. cit., nota 9, p. 215. 13 Por ejemplo, Guastini, R., Lezioni di diritto costituzionale, Turín, Giappichelli, 2001, pp. 123 y ss.
934
FRANCESCO VIOLA
quía tradicional de los métodos.14 Pero todo eso es posible desde el momento en que la justificación es parte esencial del concepto de regla. Cada regla (jurídica) tiene un contenido consistente en la descripción del comportamiento y en la cualificación normativa y en otros niveles de justificación.15 Entre éstos se encuentran las razones que subyacen a la regla y las razones de las razones, en un proceso hacia atrás que antes o después termina en un principio relativamente último. Por lo tanto, el enunciado normativo (o —como se suele decir— la disposición) tiene una multiplicidad explicativa que se extiende hasta las justificaciones últimas. Es como la punta de un iceberg, que muestra mucho menos de lo que efectivamente contiene. Si esto es así, entonces sería reductivo limitar la actividad interpretativa al aspecto meramente textual. La razón de ser de la interpretación descansa, de hecho, en la insuficiencia de la formulación lingüística. Se interpreta precisamente porque la letra del texto no basta para construir una norma. Si se admite el recurso a factores extra-textuales, como la intención del legislador, la coherencia lógica o los trabajos preparatorios, ¿por qué se deberían excluir de la competencia interpretativa las investigaciones sobre las “razones” de las normas? Por el contrario, se debe pensar que el mismo recurso a estos métodos ultraliterales se dirige a comprender las razones que justifican la norma y con ello a identificarla. Cuando esas razones están positivizadas, no cabe ninguna duda de que son objeto de interpretación, ya en sí mismas, ya como factor interno de las reglas que justifican o deberían justificar. En consecuencia, la distinción entre actividad interpretativa y actividad integrativa de la norma se hace más compleja, pues hay una integración que tiene un carácter interpretativo a todos los efectos.16 Cuando se trata de interpretar “razones”, se debe recurrir a la argumentación, porque se aclaran mediante otras razones de segundo nivel con la consiguiente subdeterminación o suprade14 Es conocida la desconfianza de Savigny en la interpretación teleológica, verdadero caballo de Troya para las preferencias subjetivas del intérprete. 15 Asumo aquí como paradigmática la descripción de “regla” de Schauer, F., Playing by the Rules. A Philosophical Examination of Rule-Based Decision-Making in Law and in Life, Oxford, Oxford U. P., 1991. 16 Eso explica porqué Robert Alexy incluye entre los métodos sistemáticos algunos que son tradicionalmente considerados como integrativos. Véase Alexy, R., “Interpretazione giuridica”, Enciclopedia delle scienze sociali, Roma, Treccani, 1996, vol. V, pp. 64-71.
INTERPRETACIÓN E INDETERMINACIÓN
935
terminación del elemento textual. De ese modo, la actividad interpretativa comprende en sí también la argumentativa y las dos pueden ser unicamente distinguidas por el objetivo o el producto al que miran, pero no ya por las operaciones que implican.17 No se puede, pues, negar que desde ese punto de vista la interpretación sea una actividad deliberativa. El modelo teleológico de la interpretación jurídica debe su fortuna al progresivo crecer de la indeterminación18 de la regla jurídica. Este factor, siempre presente por su conexión con el carácter general de la regla, está hoy potenciado por la constitucionalización del derecho. Pertenece a la naturaleza misma de la Constitución ser vaga e indeterminada. Las buenas Constituciones son breves y enigmáticas. Sólo si se parte de principios vagos es posible construir un amplio acuerdo en una sociedad pluralista. Solamente valores indeterminados pueden ser sustraidos a priori a las decisiones democráticas y al mismo tiempo comprometer a las generaciones futuras sin que éstas sean totalmente despojadas de su libertad de elección.19 Ciertamente una indeterminación relativa es rasgo estructural de todo sistema jurídico.20 Como bien nota Schauer,21 en los sistemas exhaustivos, es decir, aquellos en que hay obligación de dar en cada caso una respuesta jurídica, en ausencia de una regla de clausura que especifique el resultado en los casos no explícitamente catalogados, la indeterminación es una característica estructural, en cuanto se atribuye, por lo menos implícitamente, al intérprete la labor de determinar la regla respecto al caso en cuestión. La atribución de tal competencia se puede considerar explícita cuando el legislador usa expresiones que configuran cláusulas generales o estándares de comportamiento, como por ejemplo la conocida “diligencia del buen padre de familia”. En este sentido, la indetermina17 18
Sobre este punto Véase Viola, F., y Zaccaria, G., op. cit., nota 1, pp. 98-104. [En italiano (n. d. t.)] prefiero usar el término “indeterminatezza” en vez de “indeterminazione” para subrayar que se trata de una propiedad de la regla jurídica y no de un defecto, aunque los dos términos son casi equivalentes. 19 Estoy completamente de acuerdo, por lo tanto, con Paolo Comanducci cuando sostiene que la presencia de las principios, en vez de disminuirla, aumenta la indeterminación del derecho. Véase Comanducci, P., Assaggi di metaetica due, Turín, Giappichelli, 1998, pp. 94 y 95. 20 La indeterminación absoluta y radical según la cual en cada caso posible toda solución posible es jurídicamente correcta es tan irrealista como la determinación absoluta del sistema jurídico, aunque haya sido sostenida por los exponentes de Critical Legal Studies. 21 Schauer, F., op. cit., nota 15, pp. 224 y 225.
936
FRANCESCO VIOLA
ción no sólo es necesaria, sino que no es ni siquiera un mal, es un bien necesario. Esto significa que el valor de la certeza del derecho debe constantemente ser conjugado con el de la justicia del caso concreto.22 Un sistema jurídico totalmente determinado en sus normas sería una jaula de acero, falto de elasticidad e incapaz de gobernar la coordinación de las acciones sociales. Por suerte, aunque no raras veces intentado, resulta en la práctica imposible. Quiero decir con eso que el problema de la indeterminación del derecho es un problema práctico antes que epistemológico. Volveré enseguida sobre ese punto. El problema de la determinación del derecho es muy complejo y tiene una historia muy larga. Segun Tomás de Aquino una de las posibles relaciones entre ley natural y derecho positivo es la de ad modum determinationis, en el que la finalidad de la ley positiva está ya dada por el derecho natural y se deja al legislador humano la libertad de elegir los medios más adecuados.23 Pero aquí es evidente que se trata de una determinación legislativa (o, en cualquier caso, de competencia de jueces que tienen un papel creativo), mientras la problemática de la indeterminación del derecho positivo tiene relación propiamente con la interpretación de una regla ya puesta. Es verdad que, según algunos, toda determinación es una decisión y por tanto un acto de voluntad que elige entre posibilidades todas igualmente legítimas. Está claro que las posibles soluciones deben ser más de una para que se pueda hablar de “determinación”. Si, pues, el derecho positivo es estructuralmente indeterminado, su aplicación es el fruto de una decision en todo similar a la legislativa. Esta línea de pensamiento va desde Kelsen al escepticismo interpretativo. Entonces, ¿debemos reconocer que, donde hay determinación, no hay propiamente interpretación? Es precisamente eso lo que quiero refutar. La indeterminación del derecho ha sido definida de maneras distintas y eso es indicativo de la multiplicidad de los aspectos en que ese fenómeno puede ser visto con resultados distintos en relación a nuestro tema.24 22 Sobre la diferencia, pero también la continuidad, entre los procedimientos decisionales basados sobre las reglas generales y las particulares véase Schauer, F., “The Structure of Rules, and their Place in the Law”, Notizie di Politeia, 17, núm. 63, 2001, pp. 117-128. 23 Véase Summa theologiae, I-II, q. 95, a. 2 y el agudo examen de Finnis, J., Natural Law and Natural Rights, Oxford, Clarendon Press, 1980, pp. 284-290. 24 Véase Solum, L. B., “Indeterminacy”, en Patterson, D. (ed.), A Companion to Philosophy of Law and Legal Theory, Oxford, Blackwell, 1996, pp. 488-502 y la bibliografía allí citada.
INTERPRETACIÓN E INDETERMINACIÓN
937
Una primera distinción es la que hay entre indeterminación del sistema jurídico (o —como se suele decir— del derecho) y de la regla jurídica singular. A menudo se piensa que la indeterminación que genera problemas es fundamentalmente la del sistema jurídico, pues la indeterminación de la regla singular se suple con otras reglas del sistema y con la interpretación sistemática. Cuando eso no es posible, será el sistema mismo el que es indeterminado en aquel aspecto, es decir, cuando admite en su interior como verdaderas dos proposiciones normativas, una que contiene el permiso positivo de hacer p y otra la prohibición de hacer p,25 o también cuando no es posible con todos los materiales legales disponibles resolver la cuestion de si una proposición o su contraria es conforme a derecho en sentido propio.26 Sin embargo hay que reconocer que el problema de la indeterminación surge sobre todo en relación a la regla singular y en relación a un caso particular que parece entrar en su ámbito de acción. Podemos decir que no hay regla del sistema jurídico que no pueda resultar indeterminada en los casos particulares, a menos que contenga una cláusula que especifique el resultado en cada caso no explícitamente previsto. En consecuencia, normalmente un sistema normativo es indeterminado porque lo son al menos algunas de las reglas que a él pertenecen. Pero, por desgracia, se ha confundido la problemática de la indeterminación de la regla con aquella del sistema jurídico en su conjunto, con el resultado de alejarla de la teoría de la interpretación. De hecho, en el caso de que un sistema sea indeterminado no queda sino recurrir, cuando es posible, a la integración productiva de nuevo derecho. Si ahora revisamos la problemática específica de la indeterminación de la regla, es con la convicción de que la valoración del modelo sistemático-teleológico de la interpretación a la que antes se ha aludido puede arrojar luz sobre ella. 25 Me refiero, por ejemplo, a la definición de Moreso, J. J., La indeterminación del derecho y la interpretación de la Constitución, Madrid, Centro de Estudios Políticos y Constitucionales, 1997, p. 128. También la de Comanducci hace referencia al sistema jurídico: “…el contenido del derecho es indeterminado respecto a una acción si no son conocibles la consecuencias jurídicas de aquella acción, y es totalmente indeterminado si no son conocibles la consecuencias jurídicas de ninguna acción”. Comanducci, P., op. cit., nota 19, p. 92. 26 Este es el modo en el que Tushnet entiende la indeterminacy thesis. Véase M. V. Tushnet, “Defending the Indeterminacy Thesis”, en Bix, B. (ed.), Analyzing Law, Oxford, Clarendon Press, 1998, p. 224.
938
FRANCESCO VIOLA
La indeterminación de una regla jurídica puede tener que ver con cada uno de sus tres aspectos fundamentales, es decir, con la descripción del comportamiento, la cualificación normativa y la justificación. Ciertamente estos aspectos no están rígidamente separados ya que la indeterminación del supuesto de hecho repercute sobre la de la cualificación normativa. Sin embargo hacen aparecer problemas diferentes. En general, las discusiones relativas a la indeterminación suelen tener como objeto principal las dudas que suscita la asignación de significados determinados a determinadas formulaciones normativas. La descripción del comportamiento puede ser ambigua en cuanto la ambigüedad es una propiedad de los términos y de las formulaciones lingüísticas. Los significados expresos pueden ser vagos en cuanto la vaguedad es propiedad de los conceptos, de las proposiciones o de las normas.27 En cada caso se parte de las dudas interpretativas y se llega a un conflicto de interpretaciones, que no es posible resolver con el recurso a la jerarquía de métodos interpretativos. En consecuencia, no está determinado si el caso en cuestion entra o no en el ámbito de la formulación de la regla. Esta indeterminación es el resultado de un exceso de determinaciones posibles y termina coincidiendo con la incerteza interpretativa. En este punto, antes de abandonar la regla singular para navegar dentro del sistema, se plantea la cuestión de si hay todavía algún recurso interno a la regla, útil para resolver la duda por una vía interpretativa. Como hemos dicho, la justificación es parte integrante de la regla y, en cuanto tal, ella misma es objeto de interpretación. Su relevancia varía según el tipo de sistema jurídico. Mientras en los sistemas de common law se tiende a aplastar la regla en su justificación, desde el momento en que la formulación de la regla ha de ser construida sobre la base del precedente, en los sistemas de civil law acaece lo contrario, es decir, la justificación permanece toda ella interna a la regla y a su formulación, de la que se sigue. El modelo sistemático-teleológico busca poner en evidencia el papel autónomo de la justificación, aunque manteniéndola como parte integrante de la regla. Y sin embargo la misma justificación puede ser indeterminada. La indeterminación de las justificaciones depende de
27 Véase Moreso, J. J., op. cit., nota 25, p. 130; también Luzzati, C., La vaghezza delle norme. Un’analisi del linguaggio giuridico, Milán, Giuffrè, 1990.
INTERPRETACIÓN E INDETERMINACIÓN
939
la variedad posible de justificaciones subyacentes y de su concurrencia.28 Éste es el punto crucial que me interesa subrayar. La indeterminación de la justificación pide un tratamiento bien diverso del de la indeterminación de la descripción de comportamientos o de la vaguedad de los conceptos normativos. Ahora no nos encontramos ante “significados” en el sentido de estados mentales (del legislador o del intérprete) derivados de las formulaciones lingüísticas, sino ante “razones” y éstas se interpretan recurriendo a otras razones. ¿Como hay que entender el concepto de interpretación cuando se trata de interpretar “razones normativas”? ¿Y en que cosa el interpretar razones se diferencia del puro y simple argumentar? La diferencia no puede consistir en el carácter deliberativo del argumentar, es decir en que se razona para decidir, porque esto sucede —como se ha dicho— también al interpretar. En efecto, hay que “decidir” cuál es el contenido de la regla. Muy a menudo las disputas acerca de la interpretación son diálogos de sordos, porque presuponen concepciones bien distintas del interpretar. No hay, en efecto, terreno común de discusión entre quien comprende la interpretación como actividad teorética29 consistente en aclarar un texto mediante la sustitución de una expresion con otra,30 y quien la entiende como una actividad práctica que mira a aplicar o a seguir una regla aquí y ahora. Pero también entre los que sostienen la interpretación como actividad práctica hay una profunda divergencia acerca de cuáles sean los aspectos relevantes, si los deliberativos o los pragmáticos. La referencia a las razones no resuelve el problema, porque es preciso saber si la interpretación alcanza las razones utilizando la razón o —como quisiera Davidson, intérprete de Wittgenstein— mediante el ejercicio de la imaginación que persigue un conocimiento general del mundo y el conocimiento de los intereses y de las actitudes humanas. Desde este punto de vista resulta consecuente pedir al intérprete un 28 Sobre la distinción entre indeterminación de las razones y la de las causas, véase el ensayo de Coleman y Leiter citado en la nota 7. 29 El sujetivismo y el objetivismo presuponen ambos la tesis de que el seguir una regla es una operación mental, un proceso intelectual o teorético. 30 Es lo que Wittgenstein llamaba Deutung en el bien conocido párrafo 201 de las Philosophische Untersuchungen y que —como ha notado Davidson— no ha sido correctamente traducido con interpretation en la versión en inglés. Véase Davidson, D., “The Social Aspect of Language”, en McGuinness, B. y Oliveri, G. (eds.), The Philosophy of Michael Dummett, Kluwer, Dordrecht, 1994, p. 3.
940
FRANCESCO VIOLA
high degree of insightful understanding, es decir, la habilidad o la virtud de comprender las relaciones entre la regla general y los casos particulares por ella gobernados.31 Razonamiento y comprensión intuitiva parecen ambos necesarios para la interpretación si no se quiere tener de ella una concepción en exceso restringida. De todas formas, para que haya interpretación, es necesaria una realidad preexistente sobre la que se pueda ejercitar. Si todo es interpretación, nada es interpretación. Por el contrario, no es necesario que lo que se interpreta esté ya completamente formulado. La regla preexiste a la interpretación sólo a condición de que no se identifique la regla con la formulación (rule as formulation). Además, la interpretación en cuanto que “jurídica” exige otra condición: las razones normativas a interpretar deben ser “puestas” o mejor “usadas” por una autoridad legítima en textos oficiales.32 Una razón normativa es una consideración que cuenta a favor de algo. Qué consideraciones sean las que cuentan como razones normativas depende de lo que en un determinado contexto esté considerado como lo que cuenta a favor de algo. La argumentación desarrolla tales razones de manera que las hace independientes de las distintas concepciones de la vida, de las preferencias personales o de las ventajas de los individuos y los grupos.33 Si nos dedicamos al discurso público en vez de a la negociación, renunciamos implícitamente a exponer las razones personales y nos autocensuramos bajo este aspecto.34 La interpretación jurídica parte, al contrario, de la idea de que lo que cuenta como razón es lo que la autoridad legítima considera que debe contar como razón normativa. La interpretación jurídica depende de ese “hecho”, que hace que la razón para la acción sea preexistente a la actividad interpretativa. El “hecho”, del
31 32
Véase Taylor, Ch., Philosophical Arguments, Cambridge, Harvard U. P., 1995, p. 177. Subraya el estricto nexo entre las teorías de la interpretación jurídica y las teorías de la autoridad Moore, M. S., Natural Rights, Judicial Review, and Constitutional Interpretation, en Goldsworthy, J. y Campbell, T. (eds.), Legal Interpretation in Democratic States, Darmouth, Ashgate, 2002, pp. 208 y ss. 33 Véase Cohen, J., Democracy and Liberty, en Elster, J. (ed.), Deliberative Democracy, Cambridge, Cambridge U.P., 1998, p. 195. 34 Véase Elster, J., “The Market and the Forum: Three Varietes of Political Theory”, en Bohman, J. y Rehg, W. (eds.), Deliberative Democracy. Essays on Reason and Politics, Cambridge, The MIT Press, 1999, p. 12.
INTERPRETACIÓN E INDETERMINACIÓN
941
que depende la interpretación en cuanto que jurídica, es el uso de las razones normativas por parte de los órganos oficiales y en textos oficiales.35 Sin embargo, las razones normativas no dependen de la intención, aunque pueden ser el significado de expresiones lingüísticas y la motivación de comportamientos. Además, hay que distinguir las “intenciones semánticas” (lo que quiere decirse) de las “intenciones pragmáticas” (lo que se busca con ese decir).36 Las razones normativas siguen un curso determinado que se desarrolla independientemente, hasta el punto de que se constituyen en jueces de su misma formulación y del comportamiento que las invoca para su propia justificación. Usar determinadas razones normativas no quiere decir ser propietarios de sus justificaciones y de sus desarrollos argumentativos, es decir, de los contenidos de la regla. Somos libres de usar o no determinadas razones normativas, pero no somos libres de darles el contenido que queramos. Por eso si la interpretación jurídica parte del uso autoritativo, más adelante tiene un carácter deliberativo que construye la regla para el caso concreto.37 Puesto que estamos en el campo de la razón práctica, la reconstrucción de las razones que sostienen la regla no utiliza solamente procesos deductivos, sino también inferencias pertenecientes al campo de lo probable y de lo opinable, impregnadas de juicios de valor. En ese caso el carácter correcto de tal reconstrucción implica la participación del intérprete en los valores del ordenamiento y, por tanto, un punto de vista interno. La característica más interesante de estos intentos de disipar la indeterminación de las justificaciones para dar una determinación a la regla es el hecho de que el resultado pide la aceptación del intérprete en el sentido que debe parecerle “razonable” y sensato y, como tal, defendible. No es casual que el principio de razonabilidad sea hoy la novedad más relevante entre las técnicas interpretativas del derecho, aunque exija un 35 Estoy por tanto de acuerdo con la tesis de Raz cuando afirma que se interpreta el derecho en cuanto es producido por una autoridad, pero no lo estoy cuando ve en ello también su fin, pues la interpretación jurídica está caracterizada, por el contrario, por su carácter práctico y por la exigencia de dar sentido a las acciones sociales. Véase Raz, J., “Why Interpret? ”, Ratio Juris, 9, 4, 1996, pp. 349-363; y Viola, F. y Zaccaria, G., op. cit., nota 1, pp. 435 y ss. 36 Véase Moore, M. S., “A Natural Law Theory of Interpretation”, Southern California Law Review, 58, 1985, pp. 339-344. 37 He desarrollado la tesis del carácter deliberativo de la interpretación jurídica en mi “Democrazia deliberativa tra costituzionalismo e multiculturalismo”, Ragion Pratica, 20, 2003, pp. 33-71.
942
FRANCESCO VIOLA
uso controlado y moderado. La razonabilidad guarda relación, bien con la adecuación de los medios predispuestos al fin, bien con la conexión de las razones del fin a razones más profundas y fundamentales.38 En todo caso es un recurso para la determinación de reglas indeterminadas. Con esto no quiero decir que estos remedios para la indeterminación de la regla tengan siempre éxito. Al contrario, si son utilizados correctamente, es decir, custodiando los vínculos dictados por la formulación de la regla y manteniéndose en el ámbito de juego permitido por su ambigüedad y vaguedad, no es raro llegar a percibir un crecimiento de su indeterminación. Reconozco que, desde mi perspectiva, los límites entre interpretación e integración del derecho son muy sutiles. Y sin embargo, no cabe duda de que mientras el juez habitualmente puede remediar la indeterminación de la regla mediante una actividad interpretativa (aunque entendida de manera no reductiva), la indeterminación del sistema jurídico exige en cambio actividades de tipo integrativo y productivo; actividades que son ciertamente más adecuadas al rol del legislador, ordinario y constitucional. Hay, pues, una indeterminación que sólo puede ser salvada a través de una actividad productora de derecho nuevo. Se trata, sobre todo, de aquella que tiene que ver con la elección de lo medios más adecuados para alcanzar un fin. Y hay también una indeterminación que puede ser resuelta sobre bases interpretativas. Se tratará, en este caso, de elegir la mejor interpretación de la regla, es decir, la más correcta, la más conveniente, la más justa o la más razonable respetando los vínculos dados, y sobre el presupuesto de que la voluntad del legislador de un Estado constitucional, así como la de la comunidad política en su conjunto, consideren la misma razonabilidad como valor constitucional fundamental, junto con la idea de que el mismo juicio de razonabilidad sea susceptible de control de razonabilidad y no sea consecuencia de meras preferencias del intérprete. Si quisiéramos sacar algunas conclusiones provisionales de esta breve y parcial exploración en el mundo de la interpretación jurídica, nos damos cuenta de que el botín no es cosa de poca importancia. El progresivo acercamiento (la casi identificación) entre interpretación jurídica y aplicación del derecho obliga a una redefinición general de la 38 Véase Ruggeri, A., “Ragionevolezza e valori, attraverso il prisma della giustizia costituzionale”, Diritto e Società, núm. 4, 2000, pp. 567-611; y mi “Costituzione e ragione pubblica: il principio di ragionevolezza tra diritto e politica”, Persona y Derecho, 46, 2002, 1, pp. 35-71.
INTERPRETACIÓN E INDETERMINACIÓN
943
actividad interpretativa tal y como ha sido entendida por la dogmática jurídica del siglo XIX y por la ciencia del derecho codificado, además de algunos exponentes actuales de la filosofia analítica del derecho. Pierde sentido la distinción habitual entre lo que una regla significa y lo que se debe hacer; o, al menos, ambas perspectivas se aproximan mucho.39 Parecería obvio que una cosa sea preguntarse cómo se tiene que resolver un caso atendiendo a una regla y otra cosa diferente sea preguntarse si un agente, todo considerado, tiene que decidir una controversia de esa manera o debe seguir en su comportamiento esta interpretación de la regla, es decir, si esta solución es razonable y aceptable. Pero si es verdad que el juicio de razonabilidad es interno a la regla misma y forma parte de la actividad interpretativa, entonces contribuye a construir o a reconstruir el signficado de una regla. Desde esta óptica no tendría sentido afirmar “éste es el significado de la regla, pero no debe ser seguido”, a menos que se piense que la justificación sea externa a la regla y ajena a la actividad interpretativa. Lo cierto es que la constitucionalización del derecho, al hacer depender la validez de las normas de juicios de conformidad constitucional que son a todos los efectos “juicios de valor”, ha convertido oficialmente la justificación en una parte esencial de la regla. Además, el hecho de que salga a la luz ante un caso concreto, hace que no haya un único significado de la regla, en cuanto que son las circunstancias de la aplicación del derecho las que poner en evidencia (o, según otros producen) nuevos significados de la misma regla. A estas alturas es superfluo subrayar que, a la luz de estas consideraciones, una definición de la interpretación como búsqueda de significados (no importa si preexistentes o atribuidos) resulta reductiva si quiere referirse a una actividad meramente conoscitiva en sentido descriptivo. Ciertamente eso depende de la concepción de significado que tengamos40 pero no debemos olvidar que nos encontramos en el campo de la razón práctica, es decir, del conocer para actuar, del interpretar para resolver casos concretos a la luz de las circunstancias del sistema normativo y del decidir cómo se debe actuar jurídicamente en tales circunstancias. 39 La confusión entre estos dos planos es por ejemplo reprochada por Schauer a Dworkin. Véase Schauer, F., Playing by the Rules, cit., nota 15, pp. 211 y 212. 40 Lo subraya oportunamente Villa, V., “Condizioni per una teoria della interpretazione giuridica”, en Velluzzi, V. (a cura di), Significato letterale e interpretazione del diritto, Turín, Giappichelli, 2000, pp. 167-187.
944
FRANCESCO VIOLA
La experiencia jurídica contemporánea no nos enseña sólo eso acerca del tema de la interpretación. En otro lugar he tenido ocasión de mostrar que también el derecho internacional de nuestro tiempo se presenta como un laboratorio interesante para la teoría de la interpretación jurídica.41 En particular, intenta erigir un sistema jurídico sobre la base de la autorreglamentación, que se produce precisamente, no ya cuando las reglas son producidas por aquellos a las que se aplican, sino cuando son interpretadas y aplicadas por aquéllos a los que se dirigen. Me refiero naturalmente a la práctica de la interpretación concertada de los tratados internacionales (simultánea o subsiguiente a la conclusion del tratado) que es un verdadero acuerdo interpretativo. Se trata de un caso de interpretación auténtica, que por otra parte y en sentido diferente se encuentra también en el derecho constitucional.42 También aquí la interpretación se coloca en la encrucijada entre razón y voluntad. También aquí el intérprete participa de la formación de la regla. Cuando falta un contexto estable de vida común —como es el caso del ámbito internacional— hay que acordar los instrumentos lingüísticos que sirven para ponerse de acuerdo. Esto no significa que la interpretación pierda completamente la función conoscitiva en cuanto que se dirige a un acuerdo que ya se ha dado, sino más bien que es imposible distinguir el papel del conocimiento y el de la voluntad. En conclusión, de cuanto se ha dicho podemos extraer esta enseñanza: si cambia el marco general del derecho, debe cambiar también la manera de interpretarlo y, si cambia el modo de interpretar el derecho, quiere decir que la civilización jurídica está cambiando. Reprochar a los jueces o a los legisladores el dejarse llevar hacia prácticas equívocas, manipulativas y, a fin de cuentas, peligrosas para el Estado de derecho, puede ser oportuno pero puede también impedir ver en profundidad el sentido y el papel de la interpretación del derecho. Como ha notado bien Ascarelli, el jurista debe ser, no solamente el guardián de una tradición, sino también el garante de una innovación.
41 Remito a Viola, F., “Apporti della pratica interpretativa del diritto internazionale alla teoria generale dell’interpretazione giuridica”, Ragion Patica, 9, núm.17, 2001, pp. 53-71. 42 Sobre la cuestión de la interpretación auténtica de la constitución Véase A. Ruggeri, “Principio di ragionevolezza e specificità dell’interpretazione costituzionale”, Ars Interpretandi, 7, 2002, pp. 261-324.
Problemas contemporáneos de la filosofía del derecho, editado por el Instituto de Investigaciones Jurídicas de la UNAM, se terminó de imprimir el 30 de junio de 2005 en Formación Gráfica, S. A. de C. V. En esta edición se empleó papel cultural 70 x 95 de 50 kilos para los interiores y cartulina couché de 162 kilos para los forros; consta de 1000 ejemplares.