423 41 27MB
Spanish Pages [505]
.:
Fundamentos
de la Ciencia
Josí A. D í a (Barcelona, 1961) es Doctor en Filosofía por la Universidad de Barcelona con una tesis sobre la teoría de la medición. Ha publicado numerosos artículos en revistas y antologías nacionales e internacionales y en la actualidad es Profesor Titular de Lógica y Filosofia de la Ciencia de la Universitat Rovira i Virgili.
C. ULISESMOULINES (Caracas, 1946) es Doctor en Filosofía por la Universidad de Munich con una tesis sobre las teorías termodinámicas. Ha sido profesor en diversas universidades de México, California y Alemania y en la actualidad es Catedrático de Teoría de la Ciencia de la Universidad de Munich, donde dirige el instituto de Filosofía, Lógica y Teoría de la Ciencia. Es coautor, junto con W. Balzer y J. D. Sneed de An Architectonic for Science. The Structuralist Program (Dordrecht, 1987) y ha publicado, además de numerosos artículos en las principales revistas internacionales, varias obras en castellano, entre otras, La estructura del mundo sensible (Barcelona, 1973), Exploraciones metacientíficas (Madrid, 1982) y Pluralidad y recursión (Madrid, 1991).
Dirño c~tncrtl.Sacho Soriano
k c c . h uclurirw dc cdicibn en espafiol r - r r \ das para ( d o CI mundo: O 1997: Edriorial Antl. S. A. C 6 r a g r 270 OSDOS Barcelona
Singuru pyu dc publicuibn. incluido el diseño dc 12 cuSicm. pucdc rcr rcprojuci3~.rilmacenadn o transmitida cn rn2ncr;l alguna ni pr ningun medio. ya sea eléctrico. quinii:~. mccfrnuo. 6p:ico. dc gnbaci6n o de foiocopia. h i n r*r;niw prrvio del cdrior.
SÓCRATES:He aquí lo que me llena de perplejidad y no acierto a comprender suficientemente: ¿qué puede ser la ciencia? ¿Encontraremos una respuesta a esta pregunta? ¿Qué contestáis vosotros? ¿Quién de entre nosotros será el primero en hablar? PLATÓN, Teeteto
............................................
9
CAPÍTULO 1. Introducción: Naturaleza y función de la filosofía de la ciencia . . . . . 1. La ciencia como objeto. Los estudios sobre la ciencia . . . . . . . . . . . . . . . 2 . La ciencia como objeto de estudio filosófico. La filosofía de la ciencia . . . . . . ? . Nuestro tema: Filosofía general de la ciencia empírica . . . . . . . . . . . . . . . 4 . Panorama sucinto de la historia de la filosofía de la ciencia . . . . . . . . . . . .
15 15 19
Prólogo
25 27
CAPÍTULO 2. Argumentos deductivos y argumentos inductivos . . . . . . . . . . . . . 1. Argumentos. validez y verdad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Argumentos deductivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Argumentos inductivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35 35 41
CAP~TULO 3. Contrastación de hipótesis . 1. Algunos episodios históricos . . . 2 . Elementos de :a contrastación . . . 3 . Condiciones para la contrastación . 4 . Resultado de la contrastación . . . 5 . Consideraciones finales . . . . . .
......................... ......................... ......................... ......................... ......................... .........................
61 63 71 75 79 8s
CAPÍTULO 4 . LOSconceptos científicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. ¿Qué es un concepto? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Conceptos clasificatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Conceptos comparativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Conceptos métricos: estudio preliminar . . . . . . . . . . . . . . . . . . . . . . .
91 91 101 108 112
CAPITULO5 . Las leyes científicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. Tipos de generalizaciones y de leyes . . . . . . . . . . . . . . . . . . . . . . . . 2 . Leyes y regularidades accidentales . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Acaecimientos, causalidad y leyes causales . . . . . . . . . . . . . . . . . . . . . 4 . Cláusulas cererisparibus y leyes no estrictas . . . . . . . . . . . . . . . . . . . . 5. Probabilidad y leyes probabilistas . . . . . . . . . . . . . . . . . . . . . . . . . . 6 . La naturaleza de las leyes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
125
50
126 136 144 149
156 166
+-
CAP~TULO 6. La medición en la ciencia . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . Magnitudes. Medición y metrización . . . . . . . . . . . . . . . . . . . . . . . . 2 . Función de la medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Metnzación fundamental (*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Metrización derivada (*) . . . . . . . . . . . . . . . . . . . . . . . . . :. . . . . 5 . Procedimientos de medición directa (*) . . . . . . . . . . . . . . . . . . . . . . . 6 . Procedimientos de medición indirecta (*) . . . . . . . . . . . . . . . . . . . . . . 7 . Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
173 173 180 184
199 205 211 215
CAP~TULO 7. La explicación científi.ca . . .'. . . . . . . . . . . . . . . . . . . . . . . . . 1 Explicación y explicación científica . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Cobertura Iegal inferencia1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Relevancia estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Pragmática de la-explicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5. Explicación y causalidad . . . . . . . . . . . . . . . . . . . . . .. . .. . . . . . . ... . . . . . . .r .....";)"?. . . .: . . ... ... . . P! . . ...... . .. . . . .< 6. Unificación teófha . . . . . .. .. ... .. .... 7 . Apéndice: Explisación t e l e o l ó ~ ~ % ~ ~ ~ n .@;... ' ~ o. .~.a. .] ;~ ~ ~ '... . :. . . " ."... ! . < ..... ... ! e .
.
$ "
S
. . . . s .
l i
i
.
s
.
t
"
.
.
.
.o.
. . . , S .
.
.
.
..f.
.-
4
327 328
533 337 341
351 365
C A P ~ V L1O1 . Relaciones interteóricas . . . . . . . . . . . . . . . . . . . . . . . . . . . E 367 1 Concepto general de relación interteórica . . . . . . . . . . . . . . . . . . . . . . 367
.
.
2 . Teorización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Reducció . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Equivale cia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . Apéndice . Ciencia especial y ciencia básica; reducción. múltiple realizabilidad y superveniencia (*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
CAP~TULO 12. La evaluación de teorías y el problema de la inducción . . . . . . . . . 1. Evaluación epistémica. El problema de la inducción . . . . . . . . . . . . . . . . 2 . Aproximaciones al problema de la inducción . . . . . . . . . . . . . . . . . . . . 3 . Justificaciones. grado de confirmación y lógica inductiva . . . . . . . . . . . . . 4 . Falsacionismo. grado de corroboración y verosimilitud (*) . . . . . . . . . . . . 5 . Complejidad de las teorías. anomalías y falsación . . . . . . . . . . . . . . . . . 6. Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CAP~TULO 13. Análisis diacránico de teorías: El cambio teórico . . . . . . . . . . . . 1. La perspectiva diacrónica en filosofía de la ciencia . . . . . . . . . . . . . . . . . 2 . Cambio intrateórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3. Cambio interteórico en general . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Cambio interteórico como incorporación . . . . . . . . . . . . . . . . . . . . . . 5 . Cambio interteórico como suplantación . . . . . . . . . . . . . . . . . . . . . . . 6. Consideraciones finales: Las formas del progreso científico . . . . . . . . . . . . APÉNDICE . Recordatorio de teoría de conjuntos . . . . . . . . . . . . . . . . . . . . . 1. Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 . Relaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 . Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . Sistemas y morfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Referencias bibliográficas Índice onornástico
..................................
......................................
Índice temático expandido
..................................
La obra que el lector tiene en sus manos es, básicamente, un "libro de texto" para la enseñanza universitaria de la materia Filosofía de la Ciencia. Su finalidad principal es servir de guía a alumnos y profesores en un curso introductorio general de dicha materia. Ésta es la finalidad que ha determinado tanto la selección de los temas como el desarrollo de los mismos. La puesta en obra de un proyecto como éste exige por parte de los autores una serie de decisiones y compromisos de los que depende, para bien o para mal, el éxito de la empresa. En este caso, las características más destacadas de la obra que se derivan de las opciones tomadas por los autores son las siguientes. En primer lugar, se trata de una introducción temática, no histórica, a la materia. Aunque ambas aproximaciones son legítimas, y cada una tiene sus propias ventajas e inconvenientes, creemos que, en una introducción general a esta materia, es más conveniente centrarse en "los problemas mismos". Eso no excluye, obviamente, las referencias históricas a las diferentes tradiciones y escuelas. Además, en algunos de los temas, como los de la explicación y la estructura de las teorías, el estudio de los mismos sigue aproximadamente el orden histórico de las diferentes alternativas propuestas. En estos casos, el motivo de que la presentación temática siga el orden histórico es que la historia misma del problema tiene algo que enseñarnos. X veces, las primeras propuestas filosóficas no son las primeras por casualidad sino, casi podría decirse, por necesidad conceptual: ellas recogen las intuiciones más inmediatas y las expresan de la forma en principio más natural. Las alternativas posteriores sz encargan de corregir las eventuales deficiencias, poner de manifiesto aspectos más profundos y, llegado el caso, reformar alguna de las intuiciones originales. Cuando eso sucede, una comprensión cabal de las propuestas ulteriores, más desarrolladas y en cierto sentido "mejores", requiere haber percibido antes claramente el núcleo del problema en su versión más simple. Éste es el motivo por el que en algunos capítulos seguiremos en la exposición un orden parcialmente coincidente con el histórico. En segundo lugar, es una introducción temática a la filosofía general de la ciencia, no a la filosofía de las diferentes ciencias específicas. Eso quiere decir que 10s
temas elegidos se centran en problemas comunes a las diferentes ciencias y no en problemas específicos de algunas de ellas (como el de la medición en mechica cuántica, o el de la información en biología). Algunos filósofos que se dedican a la filosofía de una ciencia en especial ponen en duda que haya problemas filosóficos comunes a todas las ciencias. Defendemos la legitimidad de una filosofía general de la ciencia en el capítulo 1 ($3). Presuponiendo dicha defensa, aquí simplemente dejamos constancia de que, en esta introducción general no dirigida específicamente a estudiosos de una ciencia en particular, nos hemos limitado al ámbito de la filosofía general de la ciencia por considerarlo el más acorde con los intereses del lector al que esta obra va dirigida (para una buena introducción a la filosofía de las ciencias particulares, cf. Salmon et al., " 1992, partes I1,III y IV). En tercer lugar, ésta es una obra, en cieno sentido, "clásica". Es clásica en el sentido en que su núcleo principal se centra en temas y problemas "clásicos" de ]a filosofía de la ciencia. Por otro lado, la obra también pretende ser "completa" en tanto pretende abarcar los pfi:ncipaleS'de~e$osp ~ o b h sb4nsa&walejictde , Ips ccmcqgtos . científícos, lai leyes, la meaición, la explica&.ionQ~ndf?ca,lzwes~cpgr&~ gvoluci4$ipx red~cc* de teokis, ia contrahacihn y el problema de la hducci6r9. pretensi-64 cornpletud también lo es regPec\o del deSgriollo iblxio de los,$e&asi.&~o aqui i e b tkPid6 $< llegar a un equilibrio entre la exhaustividad del estudio y el espacio dispo$~le, y a ~isn&mente.~onsidera'bl-e:. Podriam6s h a b ~ r p f u n d i z a d m4.q a enalguqos @m*sa costa dé prescindir de &os, perd j s Ba paiecido un precio ex&six9;,sawificcar alsrligdD \os,temas - . que condderarnos 6ásicos en una intpbducci6n.a la1rnateria., . + - - - ,>-> , cuarto lugar, aunque cl6sica,-&t& obra p$etmd~ +&%.vezsqq :'aGfual:' y a .. En diiciPlina tan joven codó la1&or8fí%*ds~ b oY.Oa, y ;ea b q i i e se $roJuc,4ra, un ritmo inclux, superior al de las restahte3ai5diplhas filos6fi6aaFZps. inüodyciops t CP,-~,~ p g e t q l ~ s cok& el piiigrd de qukd&i&ie:riipidanient'e ~&%sadasi.~lnds~q~&ienfh!rne?t~ 4%eventuales * i -'*-- acnializaciones,heni4 intentado'que ik~p%senke&~Bl;he~~~kgq las*Ú&qa+ cpntribb$nes de interés en los dike~ehdsáfhbitl, en %PPgunosidsor.r&papuntada? +,t$do*a la falta de p&specti& para Valorar su asenta&bwto en la commi&d mtacigntíf$ila. , En 1dg6r,'adnque la dbr; prtsende nex $@tualen-,d seatido,$&icad&.;fib pretende serlo en o&b befitido, niás ~ s ~ ~ ~ i ~ e , ~ ~ ~ n ~ ~ab\$r&.allgum i ~ ~ ~ , . r , nos temes que hctualme~fedd&t&&Yando "ha~eenci8n&;m3chus, teóe< exttf'e~a'da'@eniz alta. h& 13s fuP36r"lcfe ' larga .duráción. -~uy'~robh6lemen'te; por tanto: juán &de+& &&*a enferT medaddpulmonat.crdfiica." "' .< -.; >-, #
I
+
\n\J
a
.*
*
/
J
,
1'
6
,
c'%
*
En general, pses; hay mdy divgrsas c6m6inach~esakeargumedfos'-&educti~9~ %~ *b E'J induchvos con premisas o conBlirion2s @robabilistds"~ h pr@enciazdc@rnac@n&s probabiiistas no sirve por ianto pifa fbkntifichri in geaeih~,el'iiib deba&urnenfo de, ' Se se Y%, .:i trata. HastahA29no hemos utilizdo en 16sej&rkplos~un.m~kadbr espétid para laexpre&"S J ' "'. sión de h pretensi6n iifthkfiva en lenguajen&ciral; Fiefior uñdb, como en la pretChsión ' deductiva, é1 generico *poi tantb7,'y hetlibs dejadi, que el t6riteXfo,o nuistras' declgaciones explícitas, incfiquen la ñafira-l&a indpciida d e los,'&gu~entosque preteg&iamcwposentar como tales. En la p~áCticP'argurnení~~iva co&iána$%cha~veces se añade algo gI .x*$\IIO es la piobabilid,d 49 la coqclusi6n si. mas3:ap imparta ruáa prohab1e.s. la conc-sión "en si misma", independientemente de las premisas (incluso si $iane~senti& . hablar de probabilidad de una a f q m q i 6 ~sin re]a$y\mla a otras, ~obreseshovolvefemos en el cap. 5 $5). Lo que importa es la probabilidad de la conclusión relativamente a (la .í
a
l
?
S
,
ARGUMENTOS DEDUCTIVOS E I S D U ~ V O S
55
verdad de) lus prernisas. En los argumentos deductivos la verdad de la conclusión no determina la validez del argumento, puede haber argumentos deductivos inválidos con conclusión verdadera (y premisas también verdaderas). Análogamente, en los argumentos inductivos la alta probabilidad de la conclusión "en si misma" no determina que el argumento sea válido; puede haber argumentos inductivos inválidos con conclusión muy probable (y premisas verdaderas). Por ejemplo, el siguiente es inductivamente inválido y la conclusión es muy probable (caso de que tenga sentido hablar de probabilidades absolutas): "Todos los días hasta la fecha ha salido el sol. Por tanto, en la próxima tirada de la ruleta saldrá un número diferente de 1." Lo que importa para la validez inductiva, insistimos, es la probabilidad de la conclusión relativamente a la verdad de las premisas (lo que más adelante denominaremos probabilidad condicionada, cf. caps. 5 y 12). Hemos visto que la dificultad más inmediata de la Iógica inductiva es el carácter primafacie gradual de la validez inductiva. Otra no mznos importante tiene que ver con la cuestión de su carácter "formal". En principio, toda lógica es formal. No se estudia tanto la validez de inferencias concretas cuanto patrones o esquemas.de inferencia válida, pues la validez no depende de los aspectos materiales de las inferencias. La Iógica deductiva es el mejor ejemplo de ello. En la Iógica inductiva, sin embargo, no está claro en qué consiste exactamente su carácter formal. La invalidez inductiva absolrcta sí parece ser formal en un sentido inmediato pero poco interesante. Considérese, como ejemplo, el "argumento" (supuestamente inductivo) mencionado en el párrafo anterior, o el siguiente (también, supongamos, pretendidamente inductivo): "los presidentes estadounidenses han sido todos varones hasta el momento, por tanto el próximo par de zapatos que me compre me dará buen resultado". Pero estos casos tan claros, por absurdos, no son interesantes. El problema lo plantean argumentos mínimamente interesantes, por ejemplo A2 y A5. Según qué entendamos por forma lógica, las afirmaciones de A2 y A5 tienen la misma forma Iógica, ambos argumentos tendrían la misma estructura. Pero imaginemos, respecto de la primera premisa de A2, que sólo he comprado un único par de zapatos antes en dicha zapatería; es claro que en tal caso no se pueden equiparar ambos argumentos en validez o fuerza inductiva. Parecería, entonces, que la validez inductiva depende, en algún sentido a precisar, de algunos aspectos "cuasi-materiales" y que por tanto la lógica inductiva no es exactamente formal. La anterior conclusión es sin embargo apresurada. A2 y A5 tienen la misma estructura, la misma forma Iógica, sólo si por forma Iógica de una afirmación entendemos aquí aproximadamente lo mismo que entendemos en la lógica deductiva. La forma Iógica es el esquema que queda cuando abstraemos todas las expresiones salvo las partículas lógicas, esto es, salvo los componentes de los que depende la validez de la inferencia. Pero en ese caso la forma lógica indrictiva de una afirmación no tiene por qué coincidir, o aproximarse, a su forma lógica deductiva, pues los componentes de los que dependen ambos tipos de inferencias no son los mismos. Por tanto, no es que la lógica (validez) inductiva no sea formal, sino que la forma lógica inductiva es extremadamente compleja y toma en consideración algunos aspectos que en la lógica deductiva tienden a considerarse materiales; por ejemplo, los sistemas de lógica inductiva toman en cuenta el número de casos particulares que sustentan una afirmación general (como las primeras premisas de A2 y A5);
algunos de ellos toman en cuenta además la calidad de los casos particulares, otros incluso el nexo causal involucrado. Todo ello hace que esta disciplina sea extremadamente difícil de desarrollar satisfactoriamente, y que, a pesar de haber nacido casi al mismo tiempo que la lógica deductiva, apenas haya avanzado y no se disponga todavía de una versión estándar aceptable para todos.
Las dificultades para el estudio de la validez inductiva se trasladan al de las falacias de este tipo de argumentos. Es difícil establecer en muchos casos si un argumento inductivo, que no sea totalmente descabellado, es (suficientemente) válido o no, Todavía lo es más establecer patrones de inferencias inductivas inválidas típicas. A pesar de ello, algo se puede decir, con todos los matices derivados de la discusión anterior. EI primer error inductivo sobre el que hay que advertir tiene un patrón similar a una de las falacias deductivas. Vimos que una inferencia deductiva inválida tomada a menudo por válida es la falacia de afirmación del consecuente. Quizá se piense que la falacia se deriva de que la pretensión deductiva es excesiva, que la inferencia sí es legítima en su versión inductiva, esto es, si sólo pretendemos que la afirmación del consecuente hace altamente probable el antecedente. Pero no. La afirmación del consecuente no es ni un argument'o deductivo válido ni tampoco un buen argumento inductivo. Un ejemplo típico para mostrar esto, y que reaparecerá más adelante, es el de la paresis, fase avanzada de la sífilis que desarrolla un porcentaje muy pequeño de hombres que han-contraído dicha enfermedad. Supongamos que Juan tiene sífilis y consideremos el siguiente argumento:
Si Juan tiene paresis entonces tiene sífilis Juan tiene sífilis ............................................. Juan tiene paresis Las premisas son verdaderas y sin embargo la conclusión es muy improbable (relativamente a las premisas). La inferencia inductiva es pues inválida, la verdad de las premisas no hace (muy, bastante) probable la conclusión. Contra lo que se suele creer, y en este sentido es una falacia, la ocurrencia del consecuente no hace altamente probable el antecedente. Y lo mismo ocurre con la versión, un poco más sofisticada, con premisas estadístico-probabilistas, incluso si la correlación probabilista es tan alta como queramos. Considérese el siguiente caso: El 99 % de loS ingleses admira a Mana Callas Plácido Domingo admira a Maria Callas Pláci,do Domingo es inglés
I
~
L
L
mw
ARGUMENTOS DEDUCTIVOS E INDtiCnVOS
57
Otra falacia inductiva típica es la de insuficiencia de datos, como ocurriría con A2 en el caso de que la muestra previa haya sido escasa. El caso límite de generalización inadecuada responde al siguiente esquema.
El único caso de P conocido hasta el momento es Q Todos los P son Q
i
1
Sin embargo a veces estamos dispuestos a considerar la inferencia no totalmente desencaminada, "aceptablemente válida", incluso si el número de casos previos es relativamente escaso, sobre todo si la conclusión no es general sino sólo acerca del próximo caso. Por ejemplo, consideremos resultados de actividades que requieren calidad y adiestramiento, y tales que normalmente sus autores mantienen durante cierto tiempo la capacidad de realizarlas satisfactoriamente, actividades como la producción artística, la investigación científica o la práctica deportiva. Que las tres primeras monedas que he extraído de mi bolsillo sean plateadas no es motivo inductivo suficiente para que lo sea la próxima. Pero que las tres primeras piezas musicales de cierto compositor sean obras maestras confiere suficiente fundamento inductivo a que la próxima al menos no sea mala; si en las primeras tres carreras de 100 m un atleta baja de 10 S, está inductivamente fundado esperar, por ejemplo, que en la siguiente no supere los 11 s. De todas formas nuestras intuiciones no son totalmente claras al respecto; quizá podría pensarse que estos casos también son falaces, a no ser que se interpreten como conteniendo premisas ocultas consideradas ausentes en los otros casos que sí nos parecen claramente falaces. Este tipo de argumentos, si no son falaces sin añadir premisas adicionales, sugiere a algunos autores que el peso de la validez / invalidez inductiva no descansa sólo en e1 número de caso previos sino en la calidad de los mismos. Una versión específica de ello es tomar en consideración nexos causales. Entonces, otra forma típica de inducción errónea consiste en errar en los nexos causales. Un modo usual de confusión se da cuando coinciden accidentalmente hechos inesperados. Por ejemplo, es sabido que ciertos acontecimientos no directamente económicos, como una repentina, aunque no grave, enfermedad de un mandatario es muchas veces seguida de una bajada de la bolsa; estos casos, y otros más raros, son indicio de que la "causalidad económica es a veces inescrutable". Si después de un desastre deportivo nacional hay una bajada súbita de la bolsa, tras otro desastre deportivo de igual magnitud alguien puede concluir apresuradamente que también bajará la bolsa. Las falacias por erróneas conexiones causales se pueden producir incluso si las relaciones estadísticas son extremadamente altas. Estas cuestiones nos introducen ya en problemas filosóficos sustantivos relacionados con la causalidad, las leyes, la explicación, etc., cuyo estudio excede la finalidad introductoria de este capítulo. No vamos a detenemos ahora en ellas puesto que serán tratadas en otros lugares (caps. 5, 7 y 12). Para concluir, comentaremos un patrón argumentativo inductivo inválido cuya invalidez es particularmente interesante para cuestiones que hemos de ver más adelante, principalmente la explicación estadística, las leyes probabilistas y el problema de la inducción. En tanto que inferencia inválida, se trata de una
58
FUND.4SIEhTOS DE FILOSOF~ADE LA CIENCIA
falacia inductiva (aunque no está claro que sea un error ar~umentativo"típico" en el sentido de que las personas no adiestradas suelen cometerlo). En los argumentos deductivos el siguiente patrón arsiimentativo de inrrodircción de coizdiciórt arttecedertte es válido: Todos los A son B Todos los A y C son B Por ejemplo: "Todos los filósofos son aburridos. Por tanto, todos los filósofos alemanes n particular derivado d.el son aburridos." Lo mismo sucede con un ~ a t r ó n ~ c oconclusión anterior: Todos los A son B aesAyaesC
Sin embargo, en lógica inductiva el patrón análogo al segundo no es válido: Prácticamente todos los A son B
Por ejemplo: "La gran mayoría de las mujeres tienen hijos. Sor Remedios es mujer y monja. Muy probablemente, por tanto, sor Remedios tiene hijos." Y sin embargo el siguiente patrón s í es inductivamente válido: Prácticamente todos los A son B aesA aes B Quizá se piense que el ejemplo de sor Remedios muestra lo contrario: "La gran mayoría de las mujeres tienen hijos. Sor Remedios es mujer. Muy probablemente, por tanto, sor Remedios tiene hijos." Pero no es así, este argumento inductivo es perfectamente (muy) válido (a no ser que consideremos que la partícula 'sor' en el nombre de la mujer introduce como premisa implícita la premisa adicional de que sor Remedios es monja). Que las premisas sean verdaderas y la conclusión falsa sólo muestra que en los argumentos inductivos válidos, a diferencia de los deductivos, la verdad de las premisas no garantiza la verdad de la conclusión. Pero esto ya lo sabíamos. Precisamente así habíamos introducido la diferencia entre validez deductiva e inductiva. Pues bien, si uno es inductivamente válido y el otro no, es justamente porque de "todos los A son B se deduce "todos los A y C son B , mientras que de "la práctica totalidad (la mayoría, el 99 %, etc.) de los A son B" ni se deduce ni se irzduce "la práctica totalidad (la
mayoría, el 99 %, etc.) de los A y C son B". Este hecho tiene como consecuencia otra diferencia entre la validez deductiva y la inductiva, diferencia que en el fondo no es más que otra versión de la anterior: mientras que en la lógica deductiva podemos "conyuntar" las conclusiones de diversos argumentos si combinamos las prernisas, en la lógica inductiva no. Si de "al y ... y a"se concluye deductivamente Di, y de ' ' ~ yi ... y cr," se concluye deductivarnente b, entonces necesariamente de "al y ... y u, y afiiy ... y a"se concluye deductivamente "P1 y P;'. Sin embargo, aunque de "ul y ... y a,''se concluya inductivay ... ya;' se concluya inductivamente p2,no necesariamente de "aly ... mente Di, y de "a,, y a, y CL+I y ... y a"se concluye inductivamente "P, y P2>'. Esta peculiaridad es lo que Hernpel denomina ambigüedad inductiva, sobre la cual nos extenderemos en otros lugares (cf. cap. 7' sobre la explicación y cap. 12 sobre la inducción).
En este capítulo vamos a estudiar los procedimientos de contrastación d-, hipótesis científicas. Las hipótesis científicas, y su contrastación, plantean numerosas cuestiones filosóficamente sustantivas, como las relativas a la causalidad, la inducción, las leyes científicas, su organización en teorías, etc. Esta primera aproximación pretende ser estrictamente rnetodológica, vamos a limitarnos aquí a analizar la metodología de la contrastación de hipótesis sin entrar en problemas epistemológicos y ontológicos sustantivos. En particular, este estudio puramente metodoló,oico va a obviar las siguientes cuestiones:
a ) La elaboración o invención de hipótesis. Esto se tratará parcialmente en el capítulo 12 dedicado a la inducción. b) La naturaleza de las hipótesis. Vamos a suponer que lo que se somete a contrastación son "hipótesis" (empíricas) en el sentido más general del término, esto es, cualquier afirmación, simple o compleja, que tenga consecuencias empíricas constatables. No vamos a distinguir de momento entre grandes agregados de hipótesis, como la teoría newtoniana, o leyes aisladas, como la de dilatación de los metales, o hipótesis en un sentido más básico que no reciben el calificativo de ley, como la de Semmelweis sobre el origen de la fiebre puerperal. De las leyes nos ocuparemos en el capítulo 5 y de las teorías en los capítulos 8,9, 10 y 13. c) La naturaleza de los datos. Supondremos que los datos en relación a los cuales se contrasta la hipótesis son "neutrales" o "aproblemáticos". Algunos comentarios que haremos sobre las hipótesis auxiliares mostrarán ya que este supuesto es discutible, pero pospondremos la discusión explícita del mismo a los capítulos 8 y 12. 4 .El carácter aproximativo que, en la actividad científica real, tienen las afirmaciones o hipótesis así como las observaciones y mediciones mediante las que aquéllas se contrastan. e ) Aspectos específicos de la contrastación de las hipótesis cuya predicción es esencialmente estadística o probabilista, como ocurre por ejemplo en las hipótesis causales sobre las correlaciones entre el consumo de tabaco y algunas formas de cáncer y
afecciones de corazón. Algunos aspectos de esta cuestión se tratarán en el capítulo 5 dedicado a las leyes y en el 7 dedicado a la explicación. j) Las consecuencias de la contrastación para la dinámica científica, e.e., las acciones que realizan o actitudes que adoptan los científicos tras la contrastación, así como la supuesta fundamentación. o no, de dichas acciones y actitudes en los resultados de la contrastación. Estas cuestiones se tratarán en e1 capítulo 12 dedicado al problema de la inducción y la evaluación de teorías y en el capítulo 13 dedicado al cambio teórico. 4 ) Relacionado con el punto anterior, la evaluación epistemológica de la contrastación. No vamos a tratar aquí de si cabe o no atribuir ciertas propiedades epistémicas a las hipótesis en función del resultado de la contrastación, ni de si, caso de que quepa tal atribución, cuáles son esas propiedades y qué problemas filosóficos suscitan. De ello se tratará en el capítulo 12. Las dos últimas restricciones son especialmente importantes ¿Qué queda, se dirá, después de prescindir de todas estas cuestiones, y especialmente de las dos últimas? Pues quedan los aspectos puramente estructurales y metodológicos. Los científicos siguen aproximadamente una misma práctica a la hora de contrastar sus afirmaciones con la experiencia. Realizan sus afirmaciones de modo tal que de ellas se siguen ciertas predicciones sobre hechos empíricos particulares constatables, y reconocen que la presencia o ausencia z a evidencia a favor o en contra de sus afirmaciodel hecho predicho constituye p r i ~ ~ facie nes. Quizá tengan después buenos motivos para relativizar los efectos de esa evidencia en sus acciones y actitudes. quizá los filósofos tengan o no razón acerca de si en base a esa evidencia es o no posible atribuir a las afirmaciones determinadas propiedades epistémicas. Pero antes de estas importantes cuestiones hay que clarificar los elemzntos, estructura y procedimientos de la práctica en cuestión, de la "puesta a prueba" con la experiencia. A esto nos referimos con la dimensión puramente metodológica de la contrastación. Aunque los aspectos filosóficamente más interesantes queden provisionalmente aplazados, este estudio previo contiene ya suficientes elementos de interés para la comprensión de una parte esencial de la práctica científica. La caracterización de los procesos de contrastación se puede presentar de diversos modos. Se puede presentar la estructura de tales procesos en forma de un argumento o de una serie de ellos, o presentarlo más bien como un programa o proceso algorítmico de decisión. Originalmente se tendía a presentarlo del primer modo (cf. p.ej. Popper, 19351958, caps. IV y X y 1963, cap. 1 y Apéndice; Hempel, 1966a, cap. 3; Salmon, 1966, y el clásico Giere, 1979, cap. 6), pero la generalización en los últimos años de los modelos cognitivos y computacionales ha motivado enfoques más algorítmicos (el caso paradigmático es Giere, 1991, revisión sustancial en términos cognitivistas del original, 1979). No hay grandes o sustantivas diferencias entre uno y otro modo de presentar o reconstruir el proceso de contrastación, las preferencias responden en gran medida a criterios estéticos o de orientación metacientífica general (logicistas iSerszrscognitivistas). Lo importante, independientemente de la presentación que se prefiera, es que en el proceso de contrastación intervienen una serie de elementos, que estos elementos están en ciertas relaciones y que en el proceso se han de satisfacer una serie de condiciones. Veremos primero cuáles son
esos elementos y condiciones, y con ellos reconstruiremos después el proceso de contras(ación. Para esto último, vamos a seguir aquí en general el modelo argumentativo clásico, pero incluiremos también una versión algorítmica simplificada a modo de resumen final. La presentación de la metodología de la contrastación va precedida de una serie relativamente amplia y variada de episodios históricos, que tienen la función de servir de 'ejemplos para la presentación de las diversas nociones y de proporcionar material para que el lector contraste su comprensión de los conceptos básicos aplicándofos a esos casos a modo de ejercicios.
1. Algunos episodios históricos
Como es sabido, para Aristóteles el movimiento sólo se produce ante la presencia de una fuerza actuante. Generalizando sobre efectos dinámicos cotidianos, principalmente sobre la tracción (dos bueyes mueven más rápido un carro que uno; un buey mueve más rápido un carro que dos carros), Aristóteles formula una especie de ley mecánica general: la velocidad es directamente proporcional a la fuerza actuante e inversamente proporcional a la cantidad de materia y a la resistencia o rozamiento del medio. Para dar cuenta de hechos conocidos, esta teoría era completada con una hipótesis "de umbral": dados un cuerpo y un medio, por debajo de cierto umbral la fuerza no produce movimiento (un hombre sólo tirando de un barco no lo mueve). En el siglo siguiente, Arquímedes, el creador de la polea, la palanca y la estática de sólidos, refutó dicha hipótesis al mover (según la tradición) con una sola mano, mediante un sistzma de poleas, un barco totalmente cargado en el puerto de Siracusa.
El primer modelo de sistema astronómico geocéntrico es el de las esferas hornocéntricas. Este sistema es propuesto inicialmente por Eudoxo y Calipo. discípulos de Platón, y desarrollado posteriormente por Aristóteles. El sistema, ideado para dar cuenta de los movimientos aparentes de los astros, consiste en una serie de esferas concéntricas encajadas unas en otras, con movimientos rotacionales con diferentes ejes, velocidades y direcciones que se van acumulando; los diferentes planetas están "clavados" en algunas de esas esferas. En este modelo la distancia de cada uno de los planetas a la Tierra es por tanto siempre la misma. Puesto que se aceptaba que el brillo de los astros depende sólo dc su distancia a la Tierra, no debería apreciarse ningún cambio de brillo en la observación nocturna. Sin embargo, al menos Venus y Marte manifestaban un claro cambio de brillo a lo largo del año. Este hecho fue considerado un problema para el modelo homocéntrico por Apolonio e Hiparco, quienes propusieron y desarrollaron como alternativa el modelo de epiciclos, deferentes y excéntricas, en el que la distancia de los planetas a la Tierra es
63
FCSDAI\iEI\TOS DE FILOSOFL~DE LA CIENCIA
variable. Otros astrónomos consideraron sin embargo que la evidencia se podia acomodar haciendo depender el brillo no sólo de la distancia sino de la densidad de las esferas y postulando diferentes densidades.
El sistema heliocéntrico sustituye el movimiento de las esferas celestes en tomo a la Tierra estática e inm6vil por el movimiento de rotación diario de la Tierra sobre sí nlisma y el de traslación anual alrededor del Sol?en tomo al cual giran también los otros planetas. El movimiento de rotación da cuenta de los movimientos aparentes diarios y el de traslación de los movimientos anuales a través de la eclíptica. Ya en la antigüedad Aristarco (siglo III a.c.) había propuesto el modelo heliocéntrico, pero fue desestimado por presentar diversas dificultades empíricas. Una de las principales objeciones iba dirigida contra la rotación de la Tierra, cuya posibilidad planteó por primera vez Heráclides de Ponto (siglo IV a.c.). Si la Tierra girase constantemente sobre su eje, se objetaba desde la física aristotélica dominante, al lanzar un objeto hacia arriba debería caer al suelo en un punto diferente y retrasado respecto del original, pues durante el intervalo temporal el lanzador, sujeto a la superficie de la Tierra, se habría movido con ella. Pero nada así se observaba. Como mostraron los físicos del í~nperusde final de la Edad Media, esta objeción descansa sobre el supuesto cuestionable de que los movimientos no se acumulan. Si, como se manifiesta en los barcos en movimiento al dejar caer un objeto desde el mástil, el movimiento de traslación horizontal se conserva y "combina" con el moviniiento vertical de caída, la objeción pierde su peso.
1.3. PARALAJE ESTELAR
Otra objeción tradicional, y para muchos definitiva, al sistema heliocéntrico, en este caso a su hipótesis del movimiento anual de la Tierra en tomo al Sol, tenía que ver con la aparente ausencia de paralaje estelar. Al girar la Tierra en tomo al Sol, desde posiciones opuestas de la órbita, e.e. cada seis meses, se deberían observar modificaciones en la forma aparente de muchas constelaciones por efecto de la perspectiva. Pero nada así se observaba. Este hecho ya era conocido por el primer defensor conocido del heliocentrismo, Aristarco (siglo 111 a.c.), quien parece ser que justificó esta evidencia contraria a su teoría postulando que el radio de la órbita terrestre era despreciable comparado con la distancia a la esfera de las estrellas fijas (la esfera en la que se suponía que estaban "incrustadas e inmóviles" las estrellas). Copémico utiliza la misma defensa en el siglo XVI, aumentando para ello casi doscientas veces el diámetro del universo estimado hasta entonces. Esto le parecía una estrategia inaceptable a Tycho Brahe, quien, disponiendo pocos años después de observaciones incomparablemente más precisas, seguía sin observar paralaje. De ahí no infería Tycho la validez del sistema geocéntrico tradicional. Tycho propuso un sistema geocéntrico mixto, con el Sol y la Luna girando en tomo a la Tierra y el resto
de planetas girando en tomo al Sol, que implicaba también, como el tradicional, la ausencia de paralaje. Ni siquiera Galileo con su telescopio pudo observar este fenómeno, que no sería detectado sino hasta 1838.
Es tradicional considerar que con las observaciones de los cielos mediante telescopio realizadas por Galileo el heliocentrismo recibe un impulso definitivo. Sin embargo, muchas de esas observaciones, como la de las lunas de Júpiter, no eran directamente contrarias al modelo geocéntrico tradicional. Por eso los partidarios del heliocentrismo recibieron como una confirmación definitiva la observación por Galileo en 1610 de las fases de Venus. Según el modelo geocéntrico tradicional, Venus debería verse desde la Tierra, aproximadamente, con la misma forma luminosa siempre. Según el modelo heliocéntrico, Venus debe presentar cambios considerables en la superficie iluminada, deben observarse fases crecientes y menguantes muy marcadas. En 1610 Galileo observó con su telescopio que la forma luminosa de Venus cambiaba desde un disco prácticamente negro hasta otro iluminado casi en su totalidad, lo que se consideró una victoria definitiva del heliocentrismo. El fenómeno, sin embargo, no le hubiera parecido tan definitivamente favorable al heliocentrismo a Tycho Brahe, muerto en 1601, pues su propio sistema mixto también predecía fases en Venus. Así pues, el fenómeno sólo constituye evidencia clara contraria del modelo geocéntrico tradicional no tycheano, no proporciona una evidencia clara favorable al sistema heliocéntrico.
En la época de Galileo, y ya desde antes, se sabía que en un pozo la bomba no puede elevar la columna de agua mucho más de 10 m por encima de la superficie. Algunos aristotélicos explicaban el fenómeno apelando al horror vncrri. Galileo ensayó contra ellos cierta explicación, pero no tuvo éxito. Torricelli, discípulo de Galileo, propuso siguiendo a Baliani la siguiente explicación: el mar de aire que rodea la tierra ejerce, por su peso, una presión sobre la superficie del pozo, que es la que empuja el agua hacia arriba cuando se libera el pistón; el límite de altura se debe a que para esa altura la presión del agua iguala la del aire. Para contrastar su conjetura, predijo que en un tubo lleno de mercurio, al invertirse y sumergirse en un recipientz con esa sustancia, la columna de mercurio descendería hasta alcanzar 1/14 de la altura para el agua, pues la densidad del mercurio es 14 veces la del agua. La prueba resultó exactamente como había predicho. Años más tarde Pascal (que había repetido el experimento de Torricelli con vino obteniendo la altura predicha de aproximadamente 18 m) realizó una confirmación adicional. Según la hipótesis de Torricelli, la columna de mercurio debe ser mayor en la base de una montaña que en su cima, pues la columna de aire envolvente decrece con la altura. Predijo que la diferencia debería ser aproximadamente de 1 cm por cada 200 m de
desnivel. En 1648 su cuñado Périer (Pascal era un enfermo crónico) realizó la prueba en el Puy-de-Dome y observó los resultados esperados. Pascal consideró el resultado una refutación decisiva de la teoría aristotélica y una confirmación de la de Torricelli. Sin embargo, algunos aristotélicos se defendieron apelando a una supuesta disminución del horror ilacrri con la altura.
A finales del siglo xv~rse aplica la teoría newtoniana al estudio de los cometas, cuerpos celestes tradicionalmente considerados misteriosos por sus apariciones aparentemente irregulares. La teoría es compatible tanto con que los cometas describan elipses muy excéntricas (con los focos muy separados) como con que describan parábolas; en el primer caso el astro pasa varias veces por una misma región, en el segundo no. En 1682 se produjo la visita de uno de esos cometas, y Halley, entre otros, observó y anotó cuidadosamente los datos del mismo. Halley defendía la hipótesis de que al menos ese cometa era de órbita elíptica y, por tanto, recurrente. Repasó los datos astronómicos disponibles de los 150 años anteriores, con más de veinte visitas de cometas, y vio que al menos en dos casos (1530 y 1606) podría tratarse del mismo cometa. Sobre la base de esos datos predijo que el cometa aparecería nuevamente a finales de diciembre de 1758. El día de Navidad de 1758 apareció efectivamente de nuevo un cometa en el cielo visible, que se identificó con los anteriores y que desde entonces lleva su nombre. El episodio se consideró una validación no sólo de la hipótesis sobre la órbita elíptica del cometa sino también, en general, de toda la teoría newtoniana.
La teoría del flogisto, desarrollada durante el siglo XVIII por Stahl, explica la combustión atribuyendo a los cuerpos combustibles una sustancia, el flogisto, que éstos liberan al arder. La teoría daba cuenta de diferentes fenómenos; por ejemplo, explicaba que una vela encendida encerrada en un recipiente acabara apagándose puesto que el aire se satura de flogisto y ya no permite más liberación de esa sustancia proveniente de la vela. A finales de siglo, Lavoisier, que se oponía a la teon'a del flogisto, diseña un experimento para contrastarla. Una consecuencia inmediata de la teoría es que los cuerpos combustibles pierden materia al quemarse, por lo que los restos más las cenizas deben pesar menos que el cuerpo íntegro antes de la combustión. En el experimento de Lavoisier se coloca una determinada cantidad de sustancia combustible (p.e. mercurio) sobre un sólido flotante en agua y se encierra bajo una campana de cristal. Mediante una lupa se enciende el mercurio. De acuerdo con la teoría se tendrían que observar dos cosas: a) el cuerpo 'flotante está menos sumergido tras la combustión, pues la cantidad restante de sustancia junto con las cenizas debe pesar menos que la cantidad inicial; b) el volumen de aire dentro de la campana debe aumentar como efecto de la asimilación de flogisto, y con
ello el nivel del líquido encerrado debe ser más bajo que al comienzo. La realización del experimento produjo justamente los resultados opuestos.
Hacia 1830, en la Primera División de Maternidad del Hospital General de Viena, había una mortandad alarmante producto de una enfermedad que por su sintomatología se denominabafiebre puerperal o posparto (8,2 % de muertes en 1844,6,8 en 1845 y 1 1.4 en 1846). En la Segunda División de Maternidad, el porcentaje era muy inferior y aproximadamente estable (2,3,2 y 2,7 respectivamente). Después de buscar durante años la causa y probar soluciones infructuosamente, en 1847 Semmelweis, uno de los médicos de la División Primera, realizó una nueva conjetura al observar que un colesa había muerto con síntomas parecidos tras cortarse con un bisturí usado para realizat una autopsia de una embarazada: las muertes podían deberse a la irrupción de "materia cadavérica" (infecciosa) en la sangre. Las diferencias se deberían a que a menudo él, sus colegas y sus alumnos intervenían a las mujeres de la División Primera inmediatamente después de realizar autopsias, mientras que en la División Segunda eran atendidas mayoritariamente por comadronas. Ellos eran los transmisores de la materia infecciosa. Si ésa era la causa, deberían desaparecer las diferencias entre ambas divisiones, e incluso bajar algo el nivel de la Segunda, si se desinfectaban antes de intervenir. Ordenó que todo el personal se lavara con sal clorada, un fuerte desinfectante, antes de atender a las pacientes. En 1848 la mortandad fue de 1,27 70en la División Primera y de 1,33 7é en la Segunda.
Durante los siglos XVIII y xuc la dinámica newtoniana, con su teoría de la gravitación, se había aplicado desde sus inicios con notable ésito a la astronomía, aunque presentaba tambiér, algunas anomalías importantes. Uno de los principales problemas a mediados del siglo XIX era el de la órbita de Urano, que difería de los valores previstos por la teoría bastante más de lo que eventuales errores de medida podían explicar. La mecánica celeste estaba bastante bien contrastada, de modo que tenía que haber una solución acorde con la teoría. Algunos astrónomos (Adams y Leverrier) conjeturaron que las anomalías en la órbita de Urano podían deberse a la presencia en sus alrededores de un astro de gran tamaño hasta entonces desconocido. Aplicando las leyes de la mecánica celeste a los datos de la órbita de Urano, calcularon cuál debía ser la órbita aproximada del supuesto astro. En 1846 Leverrier descubrió el nuevo planeta, Neptuno, en una posición y momento acordes con la órbita prevista. Bajo la influencia del notable éxito obtenido en el caso de la órbita anómala de Urano y el descubrimiento de Neptuno, los astrónomos aplicaron el mismo expediente a otra anomalía recalcitrante, la órbita del planeta más interno, Mercurio. Las anomalías serían explicables si existiera otro planeta entre Mercurio y el Sol. Leverrier calculó de
68
FLIND.4hIEh'TOS DE RLOSOFí4 DE LA CIENCIA
nuevo la supuesta órbita del nuevo planeta, al que llamó 'Vulcano', pero ni él, ni nadie después de él, lo ha descubierto.
Desde los orígenes de la revolución científica? la naturaleza de la luz ha sido motivo de fuerte controversia. A finales del siglo XVII se establecen dos teorías de la luz rivales. Una, la teoría corpuscular defendida por Newton, sostiene que los haces de luz están formados por "corpúsculos", pequeñas partículas luminosas. Otra, la teoría ondulatoria iniciada por Huygens, considera a la luz un fenómeno ondulatorio análogo al sonido, esto es, perturbaciones en un medio que se transmiten como ondas. Algunos fenómenos eran explicados igual de. bien por ambas (reflexión, refracción), de los restantes, unos los explicaba de forma más natural la teoría corpuscular (polarización) y otros la ondulatoria (superposición, difracción). Durante el siglo X\~III, y bajo la influencia de la estela de Newton, se impuso en general la teoría corpuscular, pero a principios del siglo XIX la teoría ondulatoria recibió nuevo impulso de la mano de Young y Fresnel. Las espadas se mantuvieron.en alto hasta mediados de siglo. Según la teoría corpuscular, la velocidad de la luz debe ser mayor en vidrio o agua que en aire; de acuerdo con la teoría ondulatoria, ocurre justo lo contrario. Cuando en 1850 Foucault realizó la prueba comparando las velocidades e n el aire y en el agua, resultó ser mayor en el aire, y aproximadamente en la cantidad predicha por la teoría ondulatoria. A partir de entonces se impuso casi unánimencnte el modelo ondulatorio de la luz, reforzado por su congmencia con los trabajos postrriores de Maxwell sobre electromagnetismo. Esta dominancia se quiebra a principios del siglo xx, cuando se descubren nuevos fenómenos aparentemente explicables sólo en :Crxinos corpusculares.
Y MORLEY 1.12. EL ÉTER Y LOS EXPERIMEhTOS DE MICHELSON
A finales del siglo x r x , Ia teoría ondulatoria concebía la luz como una vibración transversal en un medio universal, el éter, que tenía dos características fundamentales: debía ser penetrable por la materia y estacionario. De existir, el éter constituye entonces un sistema de referencia absoluto respecto del cual medir el movimiento "real" de los cuerpos. En 188 1, siguiendo una sugerencia teórica de Maxwell (quien no obstante la consideraba irrealizable prácticamente), Michelson diseña y realiza un experimento destinado a medir la velocidad absoluta de la Tierra. El aparato consta (aproximadamente) de un emisor de Iuz hacia dos espejos a igual distancia y que forman con él un ángulo recto. Si el éter es el medio permeable estacionario en el que se propaga la luz con velocidad finita, el tiempo. de ida y regreso de un rayo de luz lanzado en dirección del movimiento de la Tierra debe ser diferente que el del otro perpendicular. La diferencia detiempos debe manifestarse (de un modo que no podemos explicar ahora) en un desplazamiento de las bandas de interferencia al rotar el sistema de espejos, montado sobre un flotador de
mercurio para evitar distorsiones; a partir de este desplazamiento se calcula la velocidad de la fuente de emisión. Éste es el informe de Michelson: "No hay desplazamiento de las bandas de interferencia. La consecuencia de la hipótesis de un éter estacionario se muestra incorrecta, y la conclusión que necesariamente sigue es que la hipótesis es errónea" (Michelson, 1881, p. 128). En colaboración con Morley, Michelson repitió el experimento tres veces en los años siguientes con igual resultado. Algunos, sin embargo, lo interpretaron de otro modo. Incluso si hay éter, puede obtenerse ese resultado si los aparatos se "contraen" en la dirección del movimiento. Ésta es la tesis de la contracción de Lorentz y Fitzgerald.
Hasta los años cincuenta, el ADN se concebía como una cadena de nucleótidos, compuestos cada uno de tres moléculas (azúcar, base y fosfato)..El primer modelo de 1952 que Watson y Crick conjeturaron para la estructura del ADN era de triple hélice. De la estructura y composición, junto con ciertas propiedades y leyes químicas conocidas, se podía inferir la cantidad de agua contenida en determinadas muestras del ácido. Las medidas experimentales daban sin embargo como resultado cantidades diez veces mayores, motivo por el que abandonaron su primer modelo. Cuando propusieron en 1953 el modelo de doble hélice, consideraron una ventaja del mismo que las cantidades de agua predichas con el nuevo modelo coincidieran con las medidas experimentales, pero no la tomaron como definitiva pues sabían que se podían obtener las mismas predicciones introduciendo diversas complicaciones en el modelo de triple hélice simple anterior. Lo que sí consideraron definitivo fue el dato proveniente de las fotografías con rayos X. El modelo de doble hélice predecía unas imágenes en rayos X específicas muy improbables si el ADN fuese otro tipo de cadena. Esa imagen era justamente la que R. Franklin había obtenido en sus fotografías un año antes.
Hay acuerdo generalizado acerca de que los dinosaurios se extinguieron hace 65 millones de años por los efectos de un calentamiento global extremadamente fuerte de la corteza terrestre. Pero hay un considerable desacuerdo sobre el origen de dicho calentamiento. Dos son las hipótesis rivales. Según una de ellas, el calentamiento fue producto del impacto contra la Tierra de un enorme meteorito, o cometa, que liberó una cantidad de energía 6.000 millones de veces la bomba atómica de Hiroshima. Según la otra, fue el resultado de un período de numerosas, intensas y extraordinariamente fuertes erupciones volcánicas. Ambas teorías predicen una presencia generalizada, en los estratos sedimentarios de aquella era en diversos lugares de la corteza terrestre, de partículas de cuarzo fracturadas. En el primer caso, por efecto de la colisión y de la onda expansiva; en el segundo, por el efecto combinado de las erupciones y las altas presiones. Sin embargo, el
tipo de fractura predicho no es exactamente igual, la fractura por impacto tiene unos patrones específicos muy improbables si se ha producido de otro modo. Los datos geológicos más recientes, correspondientes a muy diferentes lugares de la corteza, coinciden en que el tipo de fractura de las partículas de cuarzo presente en los sedimentos es el predicho por la hipótesis del impacto.
-
Hasta los años sesenta, había dos hipótesis rivales en pugna sobre el origen de los continentes. La primera, surgida a finales del siglo pasado y ligeramente dominante entonces, es la teoría contraccionista: la corteza estaba originalmente en estado líquido debido a las altas temperaturas y por efecto del enfriamiento se solidifica, se contrae y se "resquebraja" dando lugar a las formas actuales de los continentes (que por tanto nunca se han "movido"). La explicación alternativa, desarrollada por Wegener hacia 1915, es la teoría de la deriva continental: la primera masa sólida era al principio única (Pangea) y tras la fractura los trozos resultantes se desplazan horizontalmente; los continentes actuales no han tenido siempre la misma forma, y de hecho siguen en movimiento. Los principales indicios favorables a la deriva eran la complementariedad de muchas costas continentales, la presencia de registro fósil común en África y Sudamérica, y la presencia de jóvenes cadenas montañosas a lo largo de la costa oeste americana. Sin embargo, la teoría contraccionista tenía sus propias explicaciones de estos hechos. La principal dificultad con la deriva radicaba en la aparente ausencia de fuerzas horizontales. Esta dificultad queda subsanada por la teoría de las convecciones propuesta por Hess en los sesenta: en el interior del planeta hay corrientes geológicas de convección, como en un líquido hirviendo. Esta nueva versión de la teoría de la deriva predice la presencia de ciertos patrones magnéticos específicos en los sedimentos de los fondos marinos, extremadamente improbables y sorprendentes para los contraccionistas. Los datos sobre el magnetismo recogidos a mediados de los sesenta coinciden plenamente con los anunciados por la teoría de la deriva, que después de ello fue inmediata y generalmente aceptada por la comunidad científica.
Una de las afirmaciones más sorprendentes, para la visión clásica, de la teoría gravitatoria relativista es que la luz no viaja en línea recta en el sentido usual. En las proximidades de una masa, los rayos de luz se curvan por los efectos gravitatorios. Una consecuencia de ello es la siguiente: si entre la Tierra y un emisor puntual de luz se encuentra un cuerpo de gran masa alineado con los anteriores, desde la Tierra el punto emisor se observa en forma de anillo luminoso (e.e. la sección del cono convergente formado por los rayos curvados al pasar cerca de la gran masa). Ésta es una de las predicciones más extrañas de la teoría, y completamente improbable sin ella. Reciente-
mente se ha observado en un telescopio de radio un fenómeno con esa apariencia. Tras sucesivas pruebas, los investigadores han descartado que la imagen sea resultado de interferencia~o producto de una fuente directa de esas características (p.e. los restos de una supernova). Parece una de las confirmaciones más impresionantes de las teorías de Einstein.
2. Elementos de la contrastación Esta larga serie de episodios históricos responden a un patrón de contrastación común. Empezaremos viendo aquí cuáles son los elementos involucrados en este tipo de episodios. El lector debe tratar de identificar estos elementos en los ejemplos históricos que dejemos sin comentar.
2.1. H I P ~ T E S(H) I S Y SUPUESTOS AUXILLARES (SA) La hipótesis es la afirmación que se somete a prueba, postulada para dar cuenta de determinado fenómeno y acerca de la cual buscamos evidencia a favor o en contra. Ya hemos indicado que no vamos a detenemos ahora en la estructura fina de las hipótesis. Como muestran los ejemplos, las hipótesis pueden ser muy variadas: teorías enteras complejas, como en los casos de las fases de Venus, el flogisto, las teorías de la luz o la deriva continental; o partes centrales de teorías, como en el caso del anillo de Einstein o el del éter; o leyes más o menos específicas, como la de la presión atmosférica; o incluso hipótesis concretas relativamente aisladas, como en el episodio de la fiebre puerperal. Es importante señalar que no siempre está claro cuál es la hipótesis que explícitamente se somete a prueba. Por ejemplo. en los casos del cometa Halley y de Neptuno, parece que las hipótesis en juego son, respectivamente, que el cometa tiene órbita elíptica y no parabólica, y que existe un nuevo planeta con determinada órbita. Pero el éxito se extendió a la mecánica celeste en su totalidad, que de algún modo también se consideraba en juego. Esto nos conduce al siguiente elemento de la contrastación. La hipótesis central sometida a prueba no basta en general para derivar una predicción contrastadora. En el caso del paralaje, la observación del mismo no se sigue sólo de la teoría heliocéntrica, hace falta suponer además que la distancia de la Tierra a la esfera de las estrellas fijas no es despreciable, a efectos observacionales, comparada con el diámetro de giro. En su estudio del cometa, Halley supone que las perturbaciones debidas a Júpiter son despreciables. En el caso de la fiebre puerperal, el supuesto adicional es que la sal clorada elimina los agentes infecciosos. En el experimento de Michelson, se suponen ciertos hechos aceptados sobre la relación entre velocidad de transmisión y bandas de interferencia, además de (muy implícitamente) que los materiales no se contraen con el movimiento. Junto con supuestos específicos como éstos, las contrastaciones incluyen frecuentemente otros supuestos auxiliares muy generales del tipo "ningún factor extraño desconocido afecta el proceso". Por ejemplo, en el caso de la fiebre puerperal se supone
que ningún agente extraño anula el poder desinfectante de la sal clorada, o en el del cometa Halley se supone que la trayectoria no es afectada significativamente por otros cuerpos celestes desconocidos. En general, la contrastación suele presuponer cláusulas como "si nada extraño se produce". La suposición de Michelson (si realmente era tan implícita) de que no se produce contracción podría colocarse en este cajón de sastre. Pero hay que tener cuidado con este tipo de cláusulas pues, como veremos, por su vaguedad y generalidad son susceptibles de usos perversos. No siempre es fácil distinguir entre hipótesis y supuestos auxiliares. Éste es el motivo de la relativa indefinición de la hipótesis en algunos casos. En el caso de Halley, una parte clara de la hipótesis es que el cometa es de órbita elíptica, y un supuesto claramente auxiliar es que las perturbaciones debidas a los otros astros conocidos son despreciables. Pero no está claro si el conjunto de las leyes de la mecánica celeste con cuya ayuda se realiza la predicción forma parte de la hipótesis o más bien de los supuestos auxiliares. A juzgar por la lección extraída del nuevo paso del cometa, parece que también estaba en juego la teoría general. Pero no hay límites claros. El caso de Neptuno se parece al del cometa Halley, por lo que tomaríamos la mecánica newtoniana como parte de la hipótesis, pero el episodio de Vulcano muestra que en esos casos no se ponía a prueba la teoría con cuya ayuda se hace la predicción, pues la no observación de Vulcano se consideró evidencia contraria sólo contra su existencia, no contra la teoría newtoniana. En general, la diferencia entre hipótesis y supuestos adicionales específicos (leyes o teorías complementarias) es vaga, contextual y fuertemente pragmática. Qué sea la hipótesis se deriva de las intenciones presentes en el contexto de la contrastación: la hipótesis es aquella afirmación (o conjunto de afirmaciones) para evaluar la cual se ha tenido la intención de realizar la contrastación. Por tanto, lo que son hipótesis y supuestos auxiliares en un contexto pueden invertir su papel en otro. Pero la vaguedad y la dependencia del contexto no elimina la distinción. El lector debe ir acostumbrándose a que va a ser así en la mayoría de distinciones que seguramente considera nítidas, y también a que ello no disminuye un ápice su interés filosófico, simplemente hace las cosas más difíciles.
La predicción constituye la "piedra de toque" de la contrastación. Debe ser una afirmación empírica constatable experimentalmente de modo más o menos "inmediato". Aunque sea una trivialidad, hay que insistir en la necesidad de que se realice una predicción si lo que queremos es contrastar, y no meramente afirmar, una hipótesis; por ejemplo, algunas personas sostienen la hipótesis de las visitas extraterrestres para dar cuenta de ciertos restos arqueológicos, pero no hacen la menor predicción constatable. Por otro lado, la condición de inmediatez de la constatación experimental es, aunque vaga, importante para diferenciar la predicción de la hipótesis, pues en cierto sentido la hipótesis es ya ella misma constatable empíricamente, a saber, ?nediaramente,a través de la predicción. Se puede caracterizar la predicción de dos modos. Uno la presenta en forma de i~?zplicació~z contrastadora (1) (cf. p.ej. Hempel, op. cit.). En esta caracterización, la pre-
dicción es una afirmación condicional del tipo "en tales y cuales circunstancias empíricas específicas se observará tal fenómeno". Por ejemplo: "al lavarse el personal las manos con sal clorada, se producirá antes de seis meses un descenso significativo de la mortandad"; "según losdatos registrados en 1530, 1606 y 1682, el cometa aparecerá en determinada región del cielo a finales de diciembre de 17.58"; "haciendo rotar el sistema d e espejos d e cierto modo, se observarán desplazamientos en las bandas de interferencia"; etc. El otro modo de presentar las cosas consiste en separar el antecedente y el consecuente de la anterior implicación contrastadora distinguiendo a ) la predicción propiamente dicha (P), esto es, el hecho simple que se espera observar, de b) las condiciones iniciales (CI), los hechos-condiciones particulares antecedentes que deben darse para que se dé lo predicho. Ambas caracterizaciones son equivalentes, I equivale a CI-+P. Por ejemplo, en el caso de la fiebre puerperal, las condiciones iniciales (más destacadas) son que el personal se lava las manos ,con sal clorada, y la predicción propiamente dicha es que se producirá un descenso significativo de la mortandad; en el caso del cometa Halley CI son los datos observados en los años 1530, 1606 y 1652, y P es que aparecerá un cometa a finales de diciembre de 1758. Como hemos dicho, estos dos modos de presentar las cosas son equivalentes, su diferencia es sólo cuestión de matiz o énfasis. Al decir que la predicción es una implicación contrastadora estamos enfatizando el hecho de que lo que la hipótesis predice por sí sola (junto con S,4) es un estado de cosas condicional. Aquí, sin embargo, vamos a seguir por lo general la segunda opción puesto que esquematiza de forma más transparente la compiéjidad de la implicación contrastadora; cuanto más atómicamente puedan caracterizarse los elementos de la contrastación, tanto mejor. La predicción se describe casi siempre como un hecho particular, como sucede por ejemplo en los casos del cometa Halley, de Neptuno o de la fiebre puerperal. A veces, sin embargo, en algunos episodios la predicción se describe en términos generales. Por ejemplo, "las imágenes fotográficas de ADN tienen tal patrón" o "los restos más las cenizas de un combustible inflamado pesan menos que la pieza original". Es inmediato ver que estas primeras versiones generales de la predicción implican (un número ilimitado de) otras predicciones particulares que son las que se constatan empíricamente. De todos modos, en ocasiones es relevante que la predicción sea general, en cuyo caso es especialmente necesario repetir la contrastación varias veces, siendo un supuesto auxiliar que nada incontrolado produce la coincidencia de resultados (cf. el caso del anillo de Einstein).
La predicción es un hecho posible, y detectable si efectivamente ocurre. Los datos son los hechos efectivamente detectados en el momento de la contrastación, cuya coincidencia o no con la predicción constituye la evidencia positiva o negativa para la hipótesis. En el caso de Arquímedes, el hecho observado es el movimiento del barco; en el caso del paralaje, la coincidencia en las formas aparentes de las constelaciones observadas con seis meses de diferencia; en el caso de Neptuno, la presencia de un cuerpo en determinado lugar en determinado momento; en el de Vulcano, la ausencia de un cuerpo tal; etc. Una
condición esencial que han de satisfacer los datos es que los procedimientos para su recogida o detección no presupongan la verdad o la falsedad de la hipótesis, en caso contrario estaríamos ante estrategias autoconfirmadoras o autorrefutadoras. Normalmente el proceso de recogida de datos es muy complejo y, si no se va con cuidado, a veces se puede incumplir esta condición. Este riesgo es mayor en los casos de experimentos complicados, pero también está presente en la observación directa. Como veremos en otros lugares (caps. 8 a 1 l), es esencial que el análisis de la estructura de las teorías y de su base de contrastación recoja esta condición. Los datos se detectan mediante la observación. La observación está vinculada casi siempre a la realización de un experimento, en cuyo caso parte al menos de las condiciones iniciales las constituyen las condiciones de realización del experimento. Pero a veces se observa sin experimentar en sentido estricto. En ese caso se espera que las condiciones iniciales se produzcan espontáneamente comprobando luego si se da o no también la predicción. Esto ocurre cuando algunos de los factores intervinientes no son, por diferentes motivos, accesibles o manipulables. El motivo más inmediato es la imposibilidad física o tecnológica. No podemos coger el cometa y moverlo de aquí para allá a discreción para contrastar nuestras predicciones. Halley tuvo que morir sin ver confirmada su hipótesis porque sólo le cabía esperar a 1758 para realizar la observación. Éste es el tipo de limitaciones al que se refiere Hempel cuando habla de contrastaciones no experimentales (cf. 1966a, 33.1). Pero muchas veces la imposibilidad no es tecnológica sino "moral". Esto ocurre cuando la realización de un experimento es técnicamente posible pero involucra la manipulación de personas u otras entidades de modos que se consideran inaceptables según los valores de la comunidad. Los casos paradigm á t i c o ~corresponden a algunas ciencias sociales y a la investigación bioniédica. La contrastación del doctor Semmelweis podía haber tenido fácilmente un carácter experimental más riguroso, por ejemplo si hubiera mantenido como grupo de control a un grupo de pacientes de la División Primera tratadas con personal sin desinfectarse para ver si continuaban muriendo a igual ritmo. Pero es obvio que este tipo de mejora experimental es considerado moralmente inaceptable. La distinción entre "simple observación" y "observación con experimento" es otra de las que no se pueden considerar radicales. Entre los casos de Halley, que aprovecha condiciones que ocurren espontáneamente, y de Michelson, que involucra un complejo experimento, hay ciertamente una gran diferencia, pero entre medio hay muchos otros que no están tan claros. Un ejemplo es el mismo caso del doctor Semmelweis, pues en cierto sentido muchos afirmarían que sí hizo un "experimento" (quizá técnicamente mejorable) en la acepción col.oquia1 del término. O incluso el de Halley, pues aunque no manipulara el cometa mismo la contrastación incluye muchos aspectos experimentales complejos que suponen la manipulación de ciertos aparatos, muestras, etc. La distinción en cuestión es por tanto gradual, y cuanto más experimental es una observación más parecen ser los supuestos teóricos auxiliares que intervienen en la contrastación. Sobre estos temas, la posibilidad o no de observación pura y sus consecuencias epistemológicas, entre ellas el riesgo de caer en estrategias autojustificadoras, volveremos más adelante en los capítulos dedicados a la estructura de las teorías y al problema de la inducción.
3. Condiciones para la contrastación
En la presentación de los diversos elementos involucrados en la contrastación hemos mencionado de pasada algunas relaciones entre ellos. Vamos a explicitar ahora en detalle qué relaciones deben mantener para que se den las condiciones apropiadas para una buena contrastación. Las condiciones en cuestión se refieren a los dos resultados posibles que pueden proporcionar los datos, esto es, que la predicción ocurra o que no ocurra. Como veremos, la relación entre los diversos elementos en ambos casos es de diferente tipo.
i
En este primer ca o la condición es que la predicción debe ser un estado de cosas cuya ocurrencia es implic da por los restantes elementos H, SA y CI: C1 H y SA y CI implican (conjuntamente) P. i l
4
(En la versión de Hem el la condición es "H y SA implican f', pero puesto que la implicación contrastadorq I dz Hempel es en realidad "si CI entonces P",su condición es lógicamente equivalente Cl.) Así, por ejemplo, en el caso del cometa Halley, C l tiene la siguiente forma: "Si el c erpo celeste en cuestión es un cometa de trayectoria elíptica, la Y leyes de la mecánica celepte de Newton son correctas, y las posiciones del cuerpo celeste en 1530, 1606 y 1652 so tales y cuales (y además no hay distorsiones en su trayectoria producidas por motivos d sconocidos), de todo ello se sigue que el cuerpo reaparecerá en nuestro cielo visible a fin les de diciembre de 1758." ¿Qué estatuto lógi o debe tener C1 para que sea una buena condición de contrastación? Es absolutamente qsencial darse cuenta de que la implicación contenida en C1 no puede consistir meramende en una implicación (un condicional) material. La implicación lógicamente verdadero. La en cuestión debe ser material verdadero predicción no debe ser cuyo antecedente es condicional en cuestión debe ser una verdad lógica, de H, SA y CI. En el ejemplo dado, la esto es, P debe indicada se infiere mediante un proceso de los cometas, de las leyes de intervienen factores extraños). para la caracterización de los procesos de contrastación que en la metodología de la contrastación es suficiente que C1 exprese simplemente un dondicional material verdadero. Pero no es así. Si no se precisa este punto, la referencia elrplícita a algunos supuestos auxiliares sería superflua y, con ello, la identificación de los elementos involucrados en la contrastación sería incompleta. Si bastara que C1 expresaralun condicional material verdadero, para que se satisficiera C1 bastaría, por ejemplo, quq fuese verdadera P, o que fuese falsa H, en cuyo caso SA y CI
E
podrían ser cualquier cosa, o simplemente "no estar". Por tanto, enfatizar que C1 no expresa un condicional materialmente verdadero sino lógicamente verdadero es enfatizar la necesidad de recoger en los supuestos auxiliares todas las hipótesis adicionales necesarias para inferir deductivamerzte la predicción, y lo mismo respecto de las condiciones iniciales. Por otro lado, debe notarse que atendiendo a esta caracterización, C1 es extremadamente sencilla de comprobar. Sólo hace falta saber si hemos deducido correctamente la predicción de los restantes elementos. Así es como se procede en los casos históricos. Otra característica que debe tener C1 para ser una condición adecuada de contrastación es que H,SA y CI ocurran esencialnzerzte. Esto significa que P se deduce de todos ellos tomados conjuntamente pero de ninguno de ellos por separado, ni siquiera de dos de ellos. Los tres elementos del antecedente, no sólo la hipótesis principal, han de ser esenciales en la derivación de la predicción. Algunos autores añaden la exigencia de que la hipótesis en juego explique el hecho predicho. No vamos a incluir ni comentar ahora esta exigencia. La relación entre hipótesis, explicación y deducción será estudiada en el capítulo 7.
RELATIVA A LA NO OCURRENCIA DE LA PREDICCI~N 3.2. CONDICI~N
C1 no es suficiente para una contrastación completamente satisfactoria. Si sólo
tenemos en cuenta las condiciones establecidas en ese caso para la ocurrencia de la predicción, los resultados pueden ser muy limitados. La cuestión es la siguiente. Una hipótesis puede por supuesto predecir hechos que también son predichos por otras hipótesis diferentes, nada malo hay en ello, al contrano. Ése no es el problema; el problema no es que una hipótesis prediga hechos que también predicen otras hipótesis alternativas, 'sino usar esa clase de hechos como predicciones para realizar la contrastación. No es adecuado intentar contrastar una hipótesis mediante predicciones que comparte con otras hipótesis diferentes. En esas condiciones la contrastación es (parcialmente) insatisfactoria. Para una contrastación plenamente satisfactoria la predicción debe estar "especialmente ligada" a la hipótesis que se contrasta. La cuestión es cómo precisar esta segunda condición. La condición no puede consistir en que de la falsedad de la hipótesis se deduzca, dados SA y CI, la no ocurrencia de la predicción: (1) " no H y SA y CI implican (deductivamente) no Pt. (1) es equivalente a (2) "si SA entonces: no-H implica que en condiciones CI no ocurre P", esto es, de los supuestos auxiliares se infiere que ninguna otra hipótesis, conocida o desconocida, predice lo mismo que H. Esta afirmación es extremadamente fuerte y difícilmente aceptable; supuestos auxiliares de este calibre no pueden permitirse en el proceso de contrastación. Sin embargo, algo aparentemente próximo, pero en realidad mucho más débil y de naturaleza totalmente distinta, sí parece que estamos dispuestos a aceptar al contrastar una hipótesis (aunque la naturaleza de esa aceptación es extremadamente difícil de precisar). La clave la dan algunos pasajes de los relatos de los episodios históricos. Se trata de afirmaciones del tipo: "pero tales patrones de magnetismo en los sedimentos submarinos serían muy improbables de otro modo"; "no es esperable ese tipo de fracturas en el cuarzo por otros motivos"; "la imagen anular en el ordenador del telescopio de radio era
inesperada". La condición en cuestión. implícita en estos pasajes, e s q u e la predicción es muy improbable o inesperada de no ser por la hipótesis, esto es, que si la hipótesis no fuese correcta la predicción sería muy improbabie o inesperada. Podemos expresar esta condición, exigida explícitamente por diversos autores (cf. p.ej. Popper, 1935-1 955, apéndice *IX y 1963, apéndice $3;Salmon, 1966, p. 265 y Giere, 1979, cap. 6, 3 y 1991, cap. 2, 48). del siguiente modo: C2 Si no-H y SA y CI, entonces muy probablemente no-P.
No hay duda de que algo así se supone en los casos de contrastación, el problema es dar una interpretación satisfactoria de ello, determinar el estatuto exacto de la implicación involucrada en C2. Aquí haremos sólo unos comentarios generales y dejaremos la cuestión como un problema parcialmente abierto que se retomará en el contesto dzl probIema de la inducción (cap. 13). En primer lugar, en este caso no se puede tratar de que la alta probabilidad de no-P se deduce de no-H, SA y CI. Esto supondría que mediantz H, Sil y CI estamos haciendo afirmaciones sobre lo que prediczn o dejan de predecir otras hipótesis, conocidas a desconocidas. Puesto que H claramente no hace eso, y CI tampoco, sólo podría hacerlo Sit. Por tanto, considerar que C2 expresa una inferencia deductiva es tanto como aceptar que entre los supuestos auxiliares se incluyan afirmaciones como "es muy probable que sólo H prediga que dadas CI ocurre P . Pero ello parece excesivo. Una cosa es que entre los supuestos auxiliares incluyamos afirmaciones vagas y extraordinariamente generales como "ningún cuerpo celeste desconocido afectará en estos años la órbita del cometa significativamente", o "ningún agente desconocido contrarrestar5 el efecto desinfectante de la sal clorada". Otra cosa es que aceptemos entre los supuestos la afirmación de que muy probablemente la predicción sólo se sigue de nuestra hipótesis. Eso es efectivamente un "supuesto" en la contrastación, por eso se recoge como segunda condición, pero ello no significa que sea una hipótesis auxiliar comparable al uso de leyes complementarias o incluso a las condiciones extraordinariamznte genrrales sobre la ausencia de perturbaciones desconocidas. Parece una expectativa de otro tipo, no asimilable a los supuestos auxiliares. Por tanto, si la improbabilidad de la predicción en caso de falsedad de la hipótesis no se puede considerar un supuesto auxiliar, la improbabilidad de la predicción no se infiere deductivamente de no-H, SA y CI. Otra posibilidad sería que C2 exprese una inferencia lógico-inductiva. Esto es, que el "probablemente" pertenezca al condicional y que éste exprese entonces una inferencia inductiva: la no ocurrencia de la predicción se infiere inductivamente de la falsedad de la hipótesis, más SA y CI. Pero esto tampoco puede ser. Eso significaría que antes de la contrastación, como condición para someter a prueba la hipótesis, presuponemos la validez del siguiente argumento inductivo:
A pesar de que las intuiciones sobre lósica inductiva son débiles, los episodios históricos no presentan indicios para considerar que antes de que la contréstación tenga lu_oarse haya realizado ya alsún tipo de argumento i~zductivo.Con C1 es diferente, pues en los episodios históricos claramente se nos informa de que se ha calculado, inferido o deducido cieno hecho a partir de la hipótesis, junto con SA y CI; en la "preparación" de la contrastación sí se realizan ciertas inferencias deductivas, recogidas en C1. Pero nada indica que en la preparación de la contrastación se realice tal inferencia inducuva. Así pues, C2 no expresa tampoco una inferencia inductiva. Por otro lado, nótese que, según qué lógica inductiva usemos, si C2 expresara dicho q u m e n t o inductivo, podríamos estar ante una especie de petición de principio. Si en la 16gica inductiva vale la contraposición, entonces ese.argumento equivale a este otro:
Pero, como veremos, éste es justamente (parte de) el argumento para la confirmación de hipótesis, que es inducriva~nenteinválido a menos que incluyamos C2 como premisa adicional. Si la condición C2 para la contrastación no expresa ni una inferencia deductiva ni una inductiva, entcjnces debe tomarse como un enunciado probabilista condicional simplemente verdadero. La dificultad ahora con C2, en tanto que enunciado probabilista que se pretende que es simplemente verdadero, es cómo se comprueba su cumplimiento. Vimos que C1 es muy sencillo de comprobar, pues expresa una inferencia deductiva, y sabemos muy bien cómo comprobar esas cosas. Si C2 expresara una inferencia inductiva, aunque resultaría muy complicado tendríamos al menos una idea de en qué consistiría su comprobación: consistiría en lo que la lógica inductiva (de haberla) dijera. Pero jcómo comprobar C2 en tanto que mera verdad material? En algunos casos es fácil comprobar que es falsa: cuando se conoce al menos otra hipótesis H' incompatible con H y de la cual también se infiere P. Por ejemplo, en el caso de las fases de Venus, la ocurrencia de este fenómeno se deriva tanto del sistema heliocéntrico de Copémico como del sistema mixto de Tycho. Por tanto es fácil saber en algunos casos, como éste, que la condición no se cumple. Pero, jcuándo podemos establecer que se cumple? ¿Es suficiente simplemente que se desconozca la existencia de otras hipótesis incompatibles con H pero con las mismas predicciones para considerar bien fundada C2? La respuesta a esta cuestión depende de elementos pragmáticos muy difíciles de precisar. Pero no hay duda de que en algunos casos la aceptación de C2 es razonable, en especial cuando la predicción es un hecho completamente inesperado hasta entonces, que nadie había pensado que ocurriera. Por ejemplo, el anillo de Einstein, los patrones magnéticos de Hess, o la misma reaparición del cometa Halley. ¿A quién se le podría haber ocumdo que a finales de 1758 aparecería un cometa en determinada región del cielo visible? Y sin embargo, ni siquiera en esos casos parece haber garantías plenas de que se cumple C2. Por ejemplo, se puede predecir la misma aparición conjeturando la existencia
de una serie específica de diferentes cometas parabólicos (resultado quizá de la desinte-
gración de cierto astro). Se dirá que eso no es jugar limpio, a posteriori siempre es posible idear hipótesis diferentes que predigan lo mismo; la gracia es hacerlo "el primero". Bien, en parte es cieno que es un expediente en principio ilegítimo, semejante al de las hipótesis ad hoc que comentaremos más adelante. Pero eso no elimina e1 hecho de que, estrictamente hablando, y si C2 se considera relativa a cualquier hipótesis alternativa posible, entonces C2 es falsa en ese caso, aunque hayamos creído justificadamente en ella. El problema radica en que no es razonable considerar que para determinar el cumplimiento o no de C2 debemos tomar en consideración cualquier hipótesis alternativa posible. C2 se ha de considerar relativa sólo a hipótesis alternativas que están en juego en el conte,rto en el que se reoliza la contrasración. Esto es, hipótesis alternativas presentes (o "fácilmente concebibles") y "aceptables como aIternativas" dados los presupuestos del contexto (esto es, no demasiado extravasantes, ni claramente contradictorias con otras hipótesis muy bien asentadas, etc.). Esto hace que las condiciones de aceptación de C2 sean relativamentz vasas y fuertemente dependientes del contexto y de sus presupuestos teóricos. Esto conduce de lleno a cuestiones filosóficas sustantivas sobre los presupuestos teóricos involucrados en los procedimientos de contrastación; puesto que la finalidad en este capítulo es puramente metodológica, no vamos a ocuparnos aquí de estos problemas epijtemoló,oicos, cuyo estudio queda aplazado a otros capítulos (cf. esp. cap. 12). Por último, la discusión muestra quz C1 y C 2 no son ambas igualmente imprescindibles para la realización de una buena contrastación. Mientras C1 es siempre necesaria, C2 no. De hecho hemos visto algunos episodios, como el de las fases de Venus, en que claramente es incumplida y, como veremos, ello no impide proceder a una buena contrastación con resultados limitados. Si nos limitamos a los casos de evidencia negativa o refutación, C1 es suficiente. Pero si la contrastación ha de ser eficiente sean cuales sean los datos resultantes, incIuida la evidencia positiva, entonces C2 sí es necesaria. Quizá se piense que por razones análogas se podría defender entonces que C 1 no es necesaria en los casos de evidencid positiva. Pero no es así, pues C2 ha de establecer que la falsedad de H implica muy probablemente la falsedad de P, siendo P un hecho predicho por la hipótesis H,esto es, cumpliéndose C 1.
4.
Resultado de la contrastación
Veamos ya qué consecuencias tienzn los datos observados para la contrastación de hipótesis. Reconstruiremos el establecimiento de estas consecuencias en forma de argumentos. Comenzaremos con el caso en que los datos constituyen evidencia en contra de la hipótesis, veremos después el opuesto, la evidencia a favor, y presentaremos una especie de algoritmo a modo de resumen. Concluiremos comentando un tipo de contrastaciones específicas, aquellas en que un mismo dato se utiliza para contrastar hipótesis rivales. Recuérdese que la condición C 1 ha de satisfacerse siempre. Irt
4.1 .
EL-IDESCI.~ NEG.J,TI\:4 (REFLT~CI~S). ESTR~TEGI.-\S .4D HOC
Es difícil resistirse a la fuerza de episodios como los del flogisto: la teoría predice que el material pesará menos después de la combustión. se hace el experimento y se encuentra que pesa m&, por tanto la evidencia empírica es contraria a la teoría. Puede que haya buenos motivos filosóficos para matizar, cuestionar o rechazar algcnas consecuencias epistemológicas que aparentemente se siguen de episodios como éste. pero no hay duda de que la predicción incumplida constituyeprit~zafacie evidencia c o ~ z r r a ~a ala hipótesis en juego. El modo en que se establece que la evidencia es negativa o contraria a la hipótesis tiene la forma de un argumento que concluye que la hipótesis no es correcta. Encontramos este arpmento formulado implícitamente en muchos episodios científicos. Incluso a veces es formuIado explícitamente, como vimos en el caso de Michelson: "90hay desplazamiento de las bandas de interferencia. La consecuencia de la hipótesis de un éter estacionario se muestra incorrecta, y la conclusión que necesariamente se sigue es que la hipótesis es errónea." El argumento contrario a la hipótesis que parece sugerir Michelson es un argumento deductivo muy sencillo que responde a la forma rnodus rollens, que tiene como premisas a ) que la hipótesis tiene como consecuencia cierto hecho, y b) que el hecho no ocurre, y como conclusión c) que la hipótesis es errónea: si H entonces P (*) no P (#)
no H
Éste es efectivamente un argumento deducti\po válido, pero no es exactamente el qUe establece que la evidencia es negativa. Como vimos más arriba, la primera premisa es más complicada, la predicción no se sigue de la hipótesis sola. La primera premisa es en realidad la condición C1. Tendríamos entonces el siguiente argumento: (Cl) si H y Sil y CI entonces P (*) no P
Pero ahora este argumento deductivo es inválido. Lo que se sigue de las dos premisas por inodus roflens no es la falsedad de H sino de todo el antecedente complejo: (Cl) si H y SA y CI entonces P (*) no P
i'iiesto que "no (H y SA y Ci)" es equivaIente a "no H o no SA o no CI",para obtener legítimamente comoconclusjón la negación de la hipótesis, hay que añadir como premisa adicional la ocurrencia de SA y CI:
(Cl) si H y S,4y C/ entonces P (*) no P (**) SA y CI
Así, el argumento [REF] para la refutación de hipótesis es un arjumento deductivo válido complejo que tiene como premisas CI (*) y (**). De las dos primeras establece provisionalmente (+) por rnodrls tollens, y de ésta conclusión intermedia y (**) establece finalmente (#). Éste es el patrón al que respondzn los episodios del flo_oisto y, según propio testimonio de Michelson, del éter. Pero a él también deberían responder otros episodios en los que, ante aparentemente la misma situación. no se concluye (S),no se acepta que la evidencia es contraria a la hipótesis. Contemplemos el caso del paralaje estelar. Del heliocentrismo, decían los geocentristas. se infiere que en determinadas posiciones se debe observar paralaje. pero no se observa, por tanto la hipótesis heliocéntrica es errónea. S o , respondían los copemicanos (y parece que ya Aristarco). La existencia de paralaje en ciertas condiciones iniciales se sigue de la hipótesis sola, pero la observación del mismo no. Que se deba observar paralaje se sigue de la hipótesis heliocéntrica y del supuesto adicional de que el diámetro de la órbita terrestre es significativo observacionalmente en comparación con la distancia a la esfera de las estrellas fijas. Es cierto que no se observa paralaje, pero todo lo que se sisue de ello, suponiendo que las condiciones iniciales estén bien comprobadas, es que o el heliocentrismo o el supuesto adicional sobre las distancias comparativas, al menos uno de ambos, es falso. Para concluir que es la hipótesis heliocéntrica la que es falsa hay que establecer previamente que son verdaderos, además de las CI, los supuestos auxiliares, entrz ellos el referente a las distancias comparativas. Y eso es precisamente lo que rechazaban los copemicanos. Como se ve, los supuestos auxiliares pueden dar mucho juego a la hora de no aceptar la refutación de una hipótesis. En este caso los copemicanos aceptan la validez del argumento [REF], pero rechazan su conclusión al considerar que la tercera premisa es falsa, que uno de los supuestos auxiliares es falso. ¿Es eso una estrategia legítima o una simple estratasema elusiva? Seguramentz hoy nos parece legítimo; después de todo los copernicanos han acabado teniendo razón. La relación entre dichas distancias impedía la observación del paralaje a simple vista, no mediante potentes telescopios (instrumentos que ni Copérnico ni Tycho conocían), y de hecho así se detectó en 1538 (constituyendo una confirmación tardía, y en ese momer:to completamente superflua, del heliocentrismo). Pero en su época se corisideró, P.e. por Tycho, una escapatoria ile,'Oitlma. . Cuando tras una contrastación negativa se apela a este tipo de hipótesis auxiliares para salvar la hipótesis central de la refutación, decimos que se trata de hipótesis ad hoc. e.e. especialmente destinadas a defenderse de la refutación. Entiéndase bien, no se introducen en sentido estricto después de la contrastación. Rzcordemos que entre los SA suele haber uno muy general y vazo del tipo "nada extraño ocurre o interfiere" o "nada más afecta al resultado predicho". Las hipótesis ad hoc explotan este cajón de sastre diciendo
que ?se es el supuesto auxiliar que ha fallado. Pero. claro, esos supuestos no dicen
simplemente de modo indeterminado que algo no contemplado originalmente influye en la predicción. Dan una propuesta específica. En este sentido sí son "post:riores" a la contrastación, son una precisión a posteriori de elementos (supuestamente) determinantes para la predicción cuya influencia se excluía por esa cláusula general en SA. Un caso típico de hipótesis ad hoc ilegítima se produjo en el episodio de1 flogisto. Hubo defensores de la teoría del flogisto que la pretendieron defender de la refutación de La\,oisier diciendo que el flogisto tiene masa negativa. Efectivamente, si el flogisto tuviese masa negativa el experimento daría el mismo resultado aun siendo cierta la hipótesis de que los combustibles se inflaman liberando flogisto. La estrategia es la siguiente. Entre los supuestos auxiliares se puede considerar que, camuflado en la cláusula "nada anormal pasa, de nada más depende la predicción", hay uno que afirma que "el flogisto es normal", esto es, tiene masa positiva. De la contrastación negativa se sigue que o la hipótesis de la combustión liberando flogisto, o el supuesto auxiliar oculto de que el flogisto tiene masa positiva, al menos uno de ambos es falso. Y los partidarios del flogisto mantienen que el supuesto falso es el segundo, con lo que la hipótesis principal podía ser verdadera. Esta estrategia es formalmente semejante (si ignoramos hechos posteriores) a la de los copernicanos con el paralaje, pero suena bastante peor que aquélla. Postular en aquella época masas nezativas parecía claramente una estratagema elusiva, aunque no olvidemos que hoy día hay teorías muy serias que lo hacen. A veces se califica de ad hoc cualquier hipótesis introducida, utilizando los SA más genéricos mencionados, para salvar de la refutación la hipótesis principal. Otras veces se califica así a la hipótesis adicional sólo si su introducción se considera ilegítima. Usemos los nombres que usemos, debe quedar claro tras los ejemplos vistos que la diferencia entre hipótesis ad hoc legítimas e ilegítimas es, una vez más, cuestión de grado. Depende de elementos pragmáticos muy variables y difusos. Hay algunos casos muy claros, como la quiromancia, la astrología y otras paraciencias. En la (escasa) medida en que hacen predicciones concretas, si se les presenta un episodio refutador siempre se sacan una hipótesis ad koc de la manga. Pero usualmente no es tan claro. La defensa de los copemicanos parece hoy bastante aceptable, pero jnos lo parecería en su época?, ¿y en la de Aristarco? La defensa de los partidarios del flogisto parece inaceptable, ¿como la del astrólogo? ¿Qué decir del experimento de Michelson? A él le pareció una refutación clara de las hipótesis centrales en juego, pero a Maxwell le pareció que se podían salvar si se producían ciertos efectos de contracción con la velocidad, semejantes a los que más tarde se seguirían de las teorías de Einstein. No hay una respuesta general sencilla y nítida para este tipo de cuestiones; la posición razonable en cada caso depende de elementos pragmáticos muy variables de cada contexto específico. Por supuesto que esto no quiere decir que "todo vale"; por pragmático no hay que entender dependiente de cuaIquier aspecto contextual sino, principalmente, dependiente del contexto cie!ztljíco, esto es, de las posibilidades de integración teórica con hipótesis bien eitnbl~cidas. Cuestionar el cumplimiento de los supuestos auxiliares es la estrategia más común para eludir la refutación de la hipótesis. Pero no es la única. Hemos dicho que casi siempre las condiciones iniciales de experimentación o simple observación son comproba-
das y aceptadas sin mayores problemas. Pero a veces, cuando la confianza en la hipótesis es extremadamente fuerte y no se ve ningún supuesto auxiliar que pueda ser incorrecto, se puede llegar a replantear la aceptación del cumplimiento de las condiciones iniciales. Es entonces cuando se insiste, una y otra vez, en que algo ha ido mal en el diseño experimental. Cuando Millikan presentó la hipótesis de la unidad de carga eléctrica, Ehrenhaft repitió los experimentos de Millikan, consistentes en fa medición de las velocidades de descenso y ascenso de partículas de aceite cargadas eléctricamente moviéndose entre las placas de un condensador. Ehrenhaft obtuvo resultados que, en su opinión, refutaban la hipótesis de Millikan. Éste, que consideraba su hipótesis bien establecidaexperimentalmente, adujo en algunos de los casos el incumplimiento de las condiciones correctas de experimentación, por ejemplo, que las partículas se habían desviado del foco óptico, o que habían perdido su forma esférica. Los resultados posteriores mostraron que la actitud de Millikan era razonable. Pero también puedz ser a veces una estrategia puramente elusiva. Los creyentes del Tarot dicen que para que la lectura adivinatoria de las cartas sea conecta se deben mantener las piernas sin cmzar para dejar circular la energía vital; una estrategia muy utilizada ante predicciones mínimamente precisas que resultan- incumplidas es que, inadvertidamente, en algún momento se cruzaron las piernas.
Es difícil resistirse a la fuerza de episodios como el del cometa Halley: la teoría predice la aparición de cierto cuerpo celeste en una región precisa del cielo en un período determinado, algo que parece completamente inesperado de otro modo; se realiza la comprobación y efectivamente la predicción es correcta; por tanto la evidencia empírica es favorable a la hipótesis. Puede que haya buenos motivos filosóficos para matizar, cuestionar o rechazar algunas consecuencias epistemológicas que aparentemente se siguen de episodios como éste, pero no hay duda de que la predicción exitosa constituye prima facie evidencia favorable a la hipótesis en juego. El modo en que se establece que la evidencia es positiva o favorable a la hipótesis tiene la forma de un argumento que concluye que la hipótesis es correcta. Pero, a diferencia del caso anterior, el argumento ahora no es deductivo. El argumento no es:
(C 1) si H y SA y CI entonces P (*) P (#)
HOI S A Y CI)
Esto no es un argumento deductivo válido; como vimos en el capítulo precedente, es un caso de falacia de afirmación del consecuente. El argumento utilizado en la confirmación de hipótesis no es deductivo sino inductivo. Quizá se piense que este argumento inductivo consiste simplemente en debilitar la pretensión del anterior, esto es, en la versión inductiva de la afirmación del consecuente:
(C1)
si H y SA y CI entonces P (*) p (#)
H (YSA Y CI)
Pero no es así. Cuando estudiamos los argumentos inductivos vimos que la afirmación del consecuente no es tampoco en general una inferencia inductiva válida. El argumento inductivo que establece que la evidencia es favorable a la hipótesis no usa como premisa C1 sino C2. Es aquí donde entra en juego el que la predicción sea improbable de ser falsa la hipótesis. Ahora bien, el argumento inductivo no concluye directamente H de C2 y P:
(C2) si no H y SA y CI entonces muy probablemente no P (*> p ............................................................. (#)
H
Éste es un argumento inductivo inválido. Lo que se sigue inductivamente de estas premisas es lo siguiente: (C2) si no H y SA y CI entonces muy probablemente no P (*> p (+)
no (no Hy SA y CI)
Puesto que "no (no H y SA y CI)" es equivalente a "H o no SA o no Cl",para obtener legítimamente H como conclusión hay que añadir como premisa adicional la ocurrencia segura de SA y CI:
[CONF] (C2) si no H y SA y CI entonces muy probablemente no P (*> p (**) SA y CI
(#>
H
Así, el argumento [CONF] para la confirmación de hipótesis es un argumento inductivo válido complejo que tiene como premisas C2, (*) y (**). De las dos primeras se establece provisionalmente (+) por una inferencia iitductiva, y de ésta conclusión intermedia y (**) se establece finalmente (#) mediante una inferencia deductiva. [CONF] es por tanto un argumento mixto, con una parte inductiva y otra deductiva. El argumento completo se debe considerar inductivo puesto que al menos una de sus inferencias lo es, el paso inductivo imprime carácter inductivo a todo el argumento. Recuérdese que este argumento depende esencialmente de C2, y será tanto mejor como argumento inductivo cuanto más justificada esté C2, cuanto más improbable sea la predicción caso de ser falsa la hipótesis. Éste es el aspecto más problemático d e la
metodología de la confirmación, pues como vimos más arriba la naturaleza de C2 y de su comprobación es extremadamente problemática. Aparte de las intuiciones, como en el caso de Halley, no está en general claro cómo se establece C2. Lo que sí está claro a veces es que no se cumple. Si ése es el caso, si hay buenos motivos para no aceptar C2, entonces la predicción exitosa no conduce a la conclusión de que la evidencia es favorable a la hipótesis; la contrastación no es concluyente. Éste es el caso de las fases de Venus, cuya observación Tycho no hubiera considerado suficiente para confirmar la hipótesis heliocéntrica pues también se predecían en su sistema mixto. Por último, y al igual que en la refutación, otro modo de eludir la conclusión de que la predicción exitosa constituye evidencia favorable a la hipótesis es objetar a la premisa (**), esto es, sostener que algún supuesto auxiliar es incorrecto o alguna condición inicial ha fallado.
El cuadro de la página siguiente resume a modo de algoritmo la metodología de la contrastación. Las flechas indican que el paso en cuestión es argumentativo; si la flecha es continua, la infzrencia es deductiva; si es discontinua, la inferencia es inductiva (las conclusiones están contenidas en las elipses). Nótese que el diagrama incluye también los diversos modos en que la contrastación puede considerarse insuficiente, esto es, las circunstancias en las que la predicción fallida no se considera evidencia contraria o la predicción exitosa no se considera evidencia favorable.
Cuando presentamos la predicción como uno de los elementos de la contrastación, no mencionamos algiinas condiciones que es razonable exigir. El incumplimiento de estas condiciones constituye un tipo de falacia de contrastación semejante en su carácter "tramposo" al uso ilezítimo de las hipótesis ad hoc. No las mencionamos entonces porque se percibe mejor su necesidad tras haber visto en detalle las condiciones y el mecanismo de la contrastación. La primera de estas condiciones que debe satisfacer la predicción P es la precisión. Si la predicción es imprecisa o vaga la contrastación se presta a todo tipo de recursos ilegítimos. Un caso paradigmático lo constituyen los horóscopos. Es usual leer en las secciones de horóscopos de los periódicos "predicciones" del tipo "este mes le pasará algo importante", o "este mes recibirá apoyo de una persona cercana". Predicciones tan vagas no sirven para la contrastación. Por un lado, por su imprecisión es prácticamente imposible establecer firmemente que no se cumplen. Por otro, de su "cumplimiento" no se puede concluir legítimamente apoyo alguno a la hipótesis, en este caso que las posiciones astrales influyen causalmente en nuestras vidas. Intuitivamente se ve que ello es así, pero después de estudiar las condiciones para una contrastación satisfactoria, podemos establecer este punto con más precisión. Este tipo de predicciones no cumplen C2: no es cierto que la predicción sea
¿Se ded
NO
................. Gont;astación inviable
I
¿Es muy improbable Psi no H, SA y CI?
NO ............... ., Datos inconcluyentes
H o no SAo n o C I
............... Datos inconcluyentes
NO ................. Datos inconcluyentes
FIG,3.1. Continstuciún de la Iripótesis H mediante la predicción P con supueslos uuxiliurrs S A y condiciones iniciufes CI
improbable si la hipótesis es falsa; por su vaguedad, la interpretación mínima les confiere tal amplitud que son altamente probables en cualquier circunstancia. En realidad, en algunos casos no es claro que se satisfaga siquiera C1, pues muchas veces la hipótesis en juego no desempeña un papel efectivo en el establecimiento de la predicción. Un caso semejante al anterior es el de la predicción múltiple disyuntiva P = P, o P2 o ... o P,. En sentido estricto, no es una predicción vaga, pues si cada Pi está bien determinada, también lo está la predicción global P. Cada Pi puede ser precisa, pero su disyunción puede resultar inaceptablemente amplia si las Pi son muchas o parcialmente complementarias. Un caso extremo de esta segunda posibilidad es que entre todas las Pi, o simplemente dos de ellas, cubran todas las alternativas posibles. En ese caso no se ha hecho ninguna predicción empírica propiamente dicha, pues P es una verdad lógica. Lo que hay entonces no es una predicción vaga o inaceptablemente amplia sino, simplemente, ausencia de predicción. Otro caso de ausencia de predicción, presente también a menudo en las paraciencias, consiste en predecir sólo posibilidades: "el año próximo puede hacer un viaje". Si la posibilidad se interpreta en sentido estricto, se predice simplemente una perogrullada, esto es, no se predice nada. Puede ser que la posibilidad se interprete como probabilidad, pero entonces sin más precisiones es un caso de vaguedad, o de amplitud inaceptable. Una última observación sobre recursos ilegítimos que involucran la predicción. En el caso que vamos a exponer, la estratagema no afecta a contrastaciones aisladas sino a series de ellas. La estratagema en cuestión consiste en repetir incansablemente la predicción hasta que sucede. Los seguidores de muchos equipos de fútbol suelen predecir cada año que su equipo ganará el campeonato, y si efectivamente un año el equipo lo gana, no es extraño oír a algunos ufanarse del acierto. Cuentan que un futurólogo proclamó que había predicho el crack económico de 1929, pero resultaba que llevaba diez años prediciendo cada año que el año siguiente iba a haber un desastre financiero. De acuerdo con la metodología vista, en estos casos se trata simplemente de varias contrastaciones sucesivas en las que los resultados refutadores son abrumadoramente más numerosos que los confirmadores.
Para concluir esta sección comentaremos brevemente un tipo especial de contrastación, aquél en el que están en juego dos hipótesis alternativas rivales. A estas contrastaciones se las considera contrastaciones cruciales porque supuestamente deben servir para decidir entre ambas hipótesis; cuando la comprobación de la ocurrencia o no de la predicción se realiza mediante experimentación, se habla entonces de e-cperimentos cruciales. En las contrastaciones cruciales las hipótesis rivales se enfrentan entre sí con respecto a la misma predicción. Una de las hipótesis, H. predice con ayuda de los supuestos auxiliares SA que en las condiciones CI se dará P. La hipótesis rival H' predice, con ayuda de sus propios supuestos SA', que en las mismas condiciones iniciales CI se dará no-P.La ocurrencia o no de P debe eventualmente proporcionar evidencia en favor de una
88
T'L1ND.i51E4;TOS DE F I L O S O F ~DE LA CIENCIA
y en contra de otra. Un ejemplo típico de contrastación crucial es el relativo a las teorías ondulatoria y corpuscular de la Iuz con el experimento crucial realizado por Foucault en 1850 sobre la velocidad de transmisión de la luz en aire y en agua. En este caso el resultado se aceptó en general como una confirmación de la teoría ondulatoria y una refutación de la teoría corpuscular. Técnicamente, una contrastación crucial entre dos hipótesis no es más que la combinación de dos contrastaciones de dos hipótesis que hacen predicciones contradictorias sobre el nlismo fenómeno. Por tanto se aplica punto por punto todo lo que hemos visto en los apartados anteriores. Se aplica en especial lo relativo al cumplimiento de C2. Esta condición se debe cumplir respecto a cada una de las hipótesis para que el resultado, sea cual sea, pueda considerarse la refutación de una y la confirmación de la otra. El incumplimiento de esta condición hace que algunos casos que parecen contrastaciones cruciales en realidad no lo sean, o puedan no ser considerados así por quienes no reconocen que se cumple esta condición. Esto es lo que ocurre en el episodio de las fases de \'enus. En principio se podría considerar una contrastación crucial entre el geocentrismo clásico y el heliocentrismo, siendo el resultado final contrario al primero y favorable al segundo. Pero Tycho no hubiera estado dispuesto a considerarlo así. Estaba de acuerdo en que las fases de Venus refutan el geocentrismo clásico, pero no en que confirman el heliocentrismo, pues el fenómeno observado es predicho también por su propia teoría geocéntrica mixta. Tycho no aceptaría en este caso C2 y defendería que por tanto la contrastación es inconcluyente a efectos confirinatorios. Además de lo relativo a C2, a los experimentos cruciales se aplican también las posibles estrategias elusivas basadas en el rechazo de SA y CI. Éste es el tipo de escapator i a ~en que piensa Hempel cuando niega la existencia de experimentos cruciales stricto sensu: "ni siquiera la más cuidadosa y amplia contrastación puede nunca refutar una de entre dos hipótesis y probar la otra; por tanto, estrictamente interpretados, los experimentos cruciales son imposibles en ciencia" (1966a, cap. 3 53). Pero a continuación matiza: "un experimento como el de Foucault L...] puede ser crucial en un sentido menos estricto, práctico: puede mostrar que una de entre dos teorias rivales es inadecuada en importantes aspectos, y puede proporcionar un fuerte apoyo a la teoría rival; y, en cuanto resultado, puede ejercer una influencia decisiva sobre el sesgo que tome la subsiguiente labor teórica y experimental" (ibid.). 5. Consideraciones finales
Hasta aquí hemos estudiado' la metodología de la contrastación de hipótesis. Otra cosa son las actitudes que se pueden tomar, que los científicos pueden tomar, frente a sus resultados. La aceptación de los resultados de la contrastación depende de muchos factores, entre otros, de la cantidad, la calidad y la variedad de las contrastaciones realizadas. Usualmente una sola contrastación no basta, pues siempre hay lugar para las casualidades. Por ello, como en el caso de Michelson y Morley, se suele considerar necesario repetirlas un número sujciente de veces (de nuevo los límites de esta suficiencia son pragmáticos y
difusos); repetirlas si la contrastación es experimental y se puede reproducir, o realizar otras análogas si no se pueden repetir mediante experimento. A veces, sin embargo, una contrastación se puede considerar suficiente si es de "extraordinaria calidad". La calidad de las contrastaciones depende de muchos factores, especialmente del rigor del diseño experimental y del grado de precisión de la predicción y lo inesperado de la misma. Por último, la variedad de las predicciones es también un valor fundamental. Recientemente unos investigadores de Harvard han afirmado encontrar evidencia empírica contra la hipótesis, hasta ahora generalmente aceptada, según la cual las mutaciones biológicas son procesos azarosos. Los principales resultados empíricos corresponden a unas pruebas realizadas sobre un tipo específico de bacterias. Algunos científicos han aconsejado prudencia hasta que no se comprueben resultados semejantes en otras bacterias o, mejor todavía, en otros organismos. Uno de los principales motivos de la rápida expansión y aceptación de la teoría newtoniana era la inmensa variedad de fenómenos a los que se aplicaba y con los que se podía contrastar. Estos factores que influyen en la aceptación o no de los resultados corresponden a características internas de las contrastaciones. Hay sin embargo otros factores tambiín influyentes que no tienen que ver directamente con el proceso mismo de contrastación sino con algunas cualidades de la hipótesis, principalmente la simplicidad, belleza e iiltegración teórica. La simplicidad parece ser un principio metodológico generalmente aceptado: si en todo lo demás son iguales, prefiérase la hipótesis más sencilla. Entre las ventajas de su sistzma, Copérnico aducía como una de las fundamentales su simplicidad en comparación con el monstruo en el que se había convenido el modelo geocéntrico de epiciclos y deferentes, aunque en este caso concreto se trató de una argucia propagandística, pues para que el sistema copemicano original funcionara había que complicarlo casi de igual modo. En el episodio de las fases de Venus, la evidencia empírica era contraria al geocentrismo tradicional, pero no inmediatamente favorable al heliocentrismo pues el sistema mixto de Tycho predecía lo mismo. Sin embargo casi nadie apostó por el sistema de Tycho por considerarlo innecesariamente más complicado (a pesar de que tenía algunas ventajas claras entonces, como por ejemplo la predicción de la ausencia de paralaje). Una de las cosas que convenció a Kepler de lo correcto de su hipótesis de las órbitas elípticas era la enorme simplificación del sistema heliocéntrico que permitía. La simplicidad está relacionada con otro de los factores que puede influir en la suerte de una hipótesis, su "belleza". La simplicidad es un valor a la vez epistémico y estético, además de ventajas de cálculo confiere a la hipótesis cierta belleza. Pero la simpIicidad no es el único valor estético; hay otros que, aunque más subjetivos y variables, pueden ser en ocasiones determinantes. Por último, otro valor fundamental es la posibilidad de integrar la hipótesis con otras hipótesis o teorías generales de1 mismo o diferente ámbito. A finales del siglo xrs se consideró que 13 integración de la teoría ondulatoria de la luz en el electromagnetismo de hIa't\vell proporcionaba a aquélla nueva fuerza. El principal motivo por el que, a pesar de no h3ber evidencia en favor, algunos físicos actuales defienden la existencia del gravitón (partícula que transmitiría la fuerza gravitatoria) es la posibilidad de unificar el tratamiento de las cuatro fuerzas fundamentales (electromagnética. nuclear débil, nuclear fuerte y gravitatoria).
Otros factores que influ~enen las actitudes que los científicos tonian ante las hipótesis tienen un carácter más social. En este caso, lo que se considera valioso de la hipótesis es su coherencia con determinadas creencias socialmente extendidas o con determinadas ideologías vinculadas con el poder político o económico (como el catolicismo en Europa hasta el siglo xvrr o el materialismo dialéctico en los países comunistas en el siglo XX). Para algunos teóricos de la ciencia actuaIes, los sociologistas radicaIes, estos factores sociales son los únicos realmente determinantes. En algunas ocasiones así lo parece, como en el actual resurgir de las biologías creacionistas en Estados Unidos. Pero en general son sólo elementos que se añaden a los factores anteriores más directamente determinantes. Sobre algunas de estas cuestiones volveremos en el capítulo dedicado a la evaluación de las teorías y el problema de la inducción.
Los conceptos son las unidades más básicas, y por ello mismo imprescindibles, de toda forma de conocimiento humano, y en especial del conocimiento científico. Podemos concordar con Kant en que la experiencia humana, si no pasara a través del tamiz de un sistema conceptual, sería "ciega", es decir, no nos permitiría comprender lo que experimentamos. Cuanto más articulado y complejo sea el sistema de conceptos que utilicemos para dar cuenta de una parcela determinada de nuestra experiencia, tanto más articulado y eficaz será también nuestro conocimiento de la realidad derivado de esa parcela. Esta correlación es especialmente válida para la forma de conocimiento que calificamos de "científica", y es por ello que el estudio de las formas en que se presentan los conceptos científicos tiene una importancia de primer orden para la filosofía de la ciencia. En este capítulo trataremos primero someramente de la cuestión de la naturaleza de los conceptos en general, para luego analizar los tres tipos principales de conceptos que pueden distinguirse en la articulación del conocimiento científíco: conceptos clasificatorios, conceptos comparativos y conceptos métricos. Estos últimos, los conceptos métricos, xracterísticos de las teorías cuantitativas, son sin duda los más útiles para la articulación y desarrollo del conocimiento científico. En este capítulo, sin embargo, nos limitaremos a una primera aproximación muy general a los mismos. En el capítulo dedicado específicamente a la medición (cap. 6) se tratarán con más detalle tanto su estructura como su función.
1. ;Qué es un concepto?
La naturaleza de los conceptos en general es una de las cuestiones más difíciles de la filosofía y de más amplia tradición, que se remonta por lo menos a Platón. Es una cuestión íntimamente ligada al llamado problema de los universales, y sobre la que ha habido, y continúa habiendo, un sinfín de controversias. Esta cuestión atañe a aspectos centrales tanto de la ontología como de la teoría general del conocimiento, estando involucrados prácticamente todos los grandes temas de la filosofía teórica. Puesto que en este
92
FUND.I\íEhTOS DE FILOSOF~ADE LA CIENCIA
libro no podemos entrar en los temas específicos de dichas ramas de la filosofía, soslayaremos en la medida de lo posible los aspectos estrictamente metafísicos y epistemológicos. y nos centraremos fundamentalmente en aspectos estructurales y metodológicos; en filosofía de la ciencia no interesa tanto la temática de los conceptos en general, cuanto el carácter específico de los conceptos científicos y sus diferentes formas. Por esta razón, tampoco pretenderemos aquí defender alguna posición determinada en la ontología y la epistemología de los conceptos, sino que nos limitaremos en este apartado a formular algunos supuestos, a modo de "hipótesis de trabajo", de los que partimos para nuestra tarea de analizar los diversos tipos de conceptos científicos. Las únicas posiciones filosóficas que rechazamos explícitamente son a ) un nominalismo extremo según el cual sencillamente no existen los conceptos o éstos no son sino expresiones verbales de los seres humanos, y b) la idea de que hay conocimiento "no conceptual"; esta última posición, incluso si fuese defendible de algún tipo de conocimiento, es claramente inadmisible en relación con el conocimiento científico.
Printer supuesto: Los conceptos son entidades, en principio identificables, a las que tienen acceso los seres humanos en tanto sujetos epistémicos y que les permiten a éstos conocer el mundo real y orientarse en él. La presencia de conceptos es condición necesaria de todo conocimiento, y en especial del conocimiento científico. Un sistema conceptual es uno de los dos constituyentes esenciales de todo sujeto epistémico, y muy en especial del sujeto de conocimiento científico (el otro es un sistema de órganos o instrumentos sensoriales que canalizan la experiencia). Aunque ya hemos dicho que aquí no podemos entrar en la discusión de qué son exactamente los conceptos como entidades, sí podemos decir que partimos del supuesto de que 120 son objetos elnpíricos, al modo por ejemplo de los objetos físicos o de los fenómenos psíquicos. Tentativamente, podríamos adscribirlos al "reino de los sentidos" del que habla Frege o al "tercer mundo" (junto al mundo físico y al psíquico) del que habla Popper, y que es característico del conocimiento objetivo del ser humano. Sin embargo, estas caracterizaciones deben quedar aquí al nivel de vagas metáforas. Baste señalar que asumimos que los conceptos no son entidades localizadas espaciotemporalmente como lo son los objetos físicos, ni tampoco acotadas temporalmente como lo son las entidades del mundo psíquico. En este sentido, podemos decir que los conceptos son entidades abstractas. Por el momento, 110necesitamos mayor precisión para lo que sigue. Seglrr~dosupuesto: Los sujetos epistémicos contraponemos en cierto modo un sistema de conceptos al "mundo real" que es su objeto. Naturalmente, éste no es el lugar para determinar lo que entendemos por "mundo real", cuestión que excede los presentes límites. Podemos contentamos con asumir que el mundo real ("externo") es todo aquello que no se identifica con el sujeto epistémico, y que este mundo está compuesto de diversas clases de objetos. La naturaleza exacta de estos objetos no es, en este contexto, una cuestión relevante. Nos limitamos a observar que por "mundo real" no ha de entenderse necesariamente s61o la totalidad de los objetos físicos ni mucho menos sólo la totalidad de los objetos detectables por nuestros sentidos. Cuáles
CONCEPTOS CIENT~FICOS
93
sean los "objetos reales" considerados dependerá, entre otras cosas, de convicciones ontológicas fundamentales que tampoco podemos discutir aquí. Si creemos que los puntos espaciales son reales, entonces el mundo real constará no sólo de cosas tales como astros, patos y moléculas, sino también de puntos espaciales; si creemos que los números son reales, entonces contendrá también números; si creemos que las formas geométricas, las estmcturas formales, las propiedades de los objetos físicos y las relaciones entre ellos son reales, entonces el mundo real también contendrá todas estas cosas, y así sucesivamente. Lo único que importa constatar aquí es que, sean cuales sean los objetos reales, si logramos conocerlos y reconocerlos es gracias, entre otras cosas, a los conceptos de que disponemos. Los conceptos nos permiten identificar, diferenciar, comparar, etc., los objetos de los que consta el mundo real. Ello ocurre fundamentalmente a través de una operación intelectual que llamamos subsunción. Por ella, diversos objetos quedan subsumidos bajo un mismo concepto; un concepto srlbsurne uno o varios objetos (en general muchos). Otro modo equivalente de decir que un concepto subsume un objeto es decir que el objeto cae bajo el concepto, o que el concepto se aplica al objeto. Por ejemplo, subsumimos diversos objetos de observación nocturna bajo el concepto astro, diversos objetos de nuestra indagación matemática bajo el concepto nlímero prirno, o diversas relaciones identificables bajo el concepto simetría. Podemos decir entonces, ante un objeto particular, que ese objeto cae bajo el concepto correspondiente: por ejemplo, que la Luna cae bajo el concepto de astro, que el 3 cae bajo el concepto de número primo y que la fraternidad cae bajo el concepto de relación simétrica. También podemos decir quz el concepto de astro se aplica a la Luna, el Sol, Mercurio, Venus, etc.; que el concepto de número primo se aplica a los números 1, 2, 3, 5, 7, 11, etc.; que el concepto de simetría se aplica a las relaciones de fraternidad, igualdad, semejanza, etc. Todo objeto cae bajo algún concepto. Incluso si admitimos la posibilidad de objetos por principio inaccesibles al sujeto epistémico y que por tanto no caen bajo ningún concepto usual, ellos serán subsumibles bajo el concepto objeto inaccesible al conocimiento humano. En cambio, hay muchos conceptos bien constituidos bajo los cuaIes es dudoso o probablemente falso que caiga algún objeto; por ejemplo, el concepto habitante del sol tiene perfecto sentido pero no subsume ningún objeto. A estos conceptos que no se aplican a ningún objeto se les suele denominar 'conceptos vacíos'. Los conceptos vacíos, cuando son usados con la pretensión de aplicarse de hecho a objetos, como el concepto flogisto, suponen un "acto epistémico fallido". Pero también pueden usarse para otros fines no epistémicos, como los artísticos, por ejemplo en la ficción literaria; en estos casos el concepto no tiene valor epistémico pero sí artístico. O también pueden usarse para fines estrictamente filosóficos, como cuando decimos que el concepto habitante del sol es vacío. Desde un punto de vista científico. en cualquier caso, los conceptos que interesan son aquellos que se usan con la pretensión de subsumir objetos realmente existentes, como los ccnceptos Jogisto y oxígeno, aunque el primero es vacío y el segundo no (o eso creemos hoy). Debe quedar claro que si en su día se consideró interesante científicamente el concepto de flogisto fue porque se consideraba (erróneamente) que se aplicaba a algo. Una vez se demuestra que no es ése el caso, el concepto deja de interesar a fines científi-
93
WND.4SlEI\TOS DE FILOSOF~ADE LA CIENCIA
cos. Por tanto, supondremos que los conceptos con los que nos las tenenos que haber aquí, los conceptos científicos, son conceptos (pretendidarnente) no vacíos. Esquemáticamente podemos representar la correlación entre los dos "mundos", el real y el conceptual, como se muestra en la figura 4.1.
SISTEMA CONCEPTUAL
-
de --.. aeirn
R
concepto de número primo
MUNDO REAL 3
17
101
objetos
Tercer supuesto: En el primer supuesto hemos establecido que los conceptos son, en cierto modo, entidades abstractas, no Iocalizables espaciotemporalmente y por tanto no identificable~con objetos físicos. De ello se sigue, entre otras cosas, que los conceptos no deben identificarse con palabras o en general expresiones de un lenguaje dado, las cuales son, a fin de cuentas, entidades físicas. Por ello tampoco debemos identificar la tarea del análisis conceptual con la de un análisis puramente lingüístico (como han querido algunos filósofos). Dicho esto, no obstante, también debemos advertir que hay una íntima conexión entre un sistema de conceptos y un sistema lingüístico, entre conceptos y palabras. La relación que existe entre ambos tipos de entidades es una relación semanticamente muy importante: la expresión. Las palabras, o en general los términos de un lenguaje, expresan conceptos. Y como no tenemos un acceso sensorial directo a los conceptos, pero sí a las palabras, es por ello que el análisis lingüístico a fin de cuentas sí puede resultar relevante para el análisis conceptual, en el sentido de que nos puede dar indicaciones acerca de la estructura conceptual subyacente al lenguaje. Las palabras nos remiten a los conceptos, nos permiten apresarlos y comunicarlos en la mayoría de los casos, aunque quizá no en todos, pues debemos admitir la posibilidad de conceptos inexpresables (o no bien expresables) mediante el repertorio de palabras existente en una lengua dada. Conviene notar que la
95
CONCEPTOS CIENT~FICOS
relación de expresibn es (idealmente) una función, esto es, un mismo término lingüístico (idealmente) sólo expresa un único concepto; en caso contrario estamos ante un fenómeno de ambigüedad lingüística en el que la misma entidad físico-lingüística encubre, por así decir, dos significantes diferentes (como 'banco' o 'gato' en castellano). Por otro lado, la conversa no es cierta: la expresión no es una función biunívoca, pues puede haber palabras diferentes que expresen el mismo concepto; esto es lo que ocurre con las expresiones sinónimas, tanto de diferentes lenguas como de una misma lengua (como 'burro' y 'asno' en castellano). Las expresiones lingüísticas de una lengua, sus términos, palabras o frases, son objetos reales en principio comparables a otros objetos empíricos como astros o gatos. Pertenecen también al mundo real. Pero la relación entre los términos del lenguaje y los conceptos que ellos expresan es muy distinta de la relación entre un objeto real y el concepto que lo subsume. Por ello conviene enriquecer el esquema anterior del siguiente modo. (La fig. 4.2 recoge el hecho de que diferentes términos pueden expresar un mismo concepto. Por otro lado, en tanto que objetos del mundo real, los términos mismos pueden ser subsumidos a su vez por otros conceptos, por ejemplo conceptos como térinino predicativo, término singular, adjetivo, etc. No incluimos este hecho en- el gráfico para no dificultar la visualización de los otros hechos que ahora queremos destacar.)
n conceptos
SISTEMA CONCEPTUAL
.. . .
.
expresión .-.' ./
MUNDO REAL
(
1' ''1
términos
subsunción
'A-
Naturalmente, no todos los componentes de una lengua dada son aptos para expresar conceptos. Por ejemplo, es muy dudoso que lo sean la mayoría de los llamados "términos sincategoremáticos" (artículos, preposiciones, etc.). También puede ocurrir que, aun cuando dos o más palabras expresen conceptos, su combinación (aunque sea gramaticalmente conecta) no exprese ningún concepto. Así, las palabras castellanas 'redondo' y 'triángulo' expresan ciertamente cada una un concepto, pero su combinación gramaticalmente correcta 'triángulo redondo' seguramente no expresa ninguno (de expresarlo sería un concepto necesariamente vacío). También se suele admitir (aunque esto es más discuti-
96
FL'SD.AI\lEI\TOS DE F I L O S O F ~DE ~ LA CIENCIA
ble) que los nombres propios o terminos singulares, como 'Marilyn Monroe' o 'la capital de España' no expresan conceptos. En el contexto de los lenguajes científicos, que es el que a nosotros nos interesa aquí, podemos partir de la observación de que prácticamente todos los términos no-sincategoremáticos introducidos expresan un concepto. Y estos términos tienen casi unánimemente una determinada forma Iógica: son predicados. Con ello pasamos a nuestro siguiente supuesto.
Cuarto supuesto: En los lenguajes científicos, los términos que expresan conceptos tienen (casi) siempre la forma Iógica de predicados n-ádicos, con 11 2 1. Los conceptos más simples serán aquellos expresables mediante predicados monádices (como luego veremos, éste es el caso de los conceptos clasificatorios); los conceptos más complejos se expresarán mediante relatores diádicos, triádicos, o incluso más complicados. En cualquier caso, dado que, en un contexto científico, las expresiones que más interesan son las predicativas, podemos aplicar todo el arsenal simbólico de la Iógica de predicados para formalizar las conexiones entre conceptos en nuestro sistema conceptual. Por ejemplo, la relación entre los conceptos hurnailo y mol-tal quedará fijada en la fórmula predicativa 'dx (Hx -+ hfx), donde ' H ' es la abrei~iacióndel predicado 'es hiclnaiio' y 'M' la de 'es mortal'. O bien podremos expresar la "verdad conceptual" de que, si una persona es progenitora de otra, la segunda no lo será de la primera, mediante la fórmula
vx, y (.x Py -+ 7 y Px), donde 'P' es la abreviación del predicado relaciona1 'es progenitor de'. .E Ahora bien, de las disciplinas formales no es sólo la Iógica de predicados la que contribuye decisivamente al análisis conceptual; otra rama de las ciencias formales muy útil a nuestros fines, sobre todo en un contexto científico, es la teoría de conjuntos. La razón de ello es que, para muchos fines del análisis conceptual, aunque no para todos, conviene sustituir el tratamiento de los conceptos mismos (o de los predicados que los expresan) por el de las exrensiones de los mismos, esto es, por el de los conjuntos de objetos que caen bajo cada concepto. Con eso llegamos a nuestro último supuesto, que es el que fundamenta este recurso a las extensiones en el análisis conceptual.
Qui~ttosupuesto: Existen conjuntos (en el sentido de la teoría estándar de conjuntos) y la extensión de un concepto cualquiera es un conjunto en ese sentido, el conjunto de 10s objetos que caen bajo él (o de los pares de objetos, si es binario; o de los tríos, etc.). Por supuesto, no todo conjunto es la extensión de un concepto; por ejemplo, el conjunto formado por Marilyn Monroe, el número 3 y el planeta Neptuno no es la extensión de ningún concepto, aunque, desde el punto de vista de la teoría de conjuntos,
es un conjunto tan bien formado como cualquier otro. Quizá seria más cauteloso decir sólo que conjuntos como ése no son la extensión de ningún concepto "razonable", pues en cierto sentido se podría defender que s í hay un concepto correspondiente. a saber, el concepto ser Marilyn Monroe o ser el nlí~nero3 o ser el planeta Neptuno. Es seguro que éste no e s un concepto "razonable", y es más que dudoso que se pueda considerar siquiera un concepto legítimo, más bien es algo así como "un conjunto disfrazado de concepto", o incluso "un mero predicado". Aclarar esta cuestión a fondo requiere un análisis del concepto de concepto en el que no podemos entrar aquí. En cualquier caso, consideraremos en general que tales supuestos conceptos son, cuando menos, "perversos". Cuando disponemos de conjuntos que sí son extensiones de conceptos dados, les podemos aplicar a ellos los principios y las operaciones de la teoría de conjuntos, y establecer o revelar así indirectamente determinadas conexiones entre los conceptos que tienen tales extensiones. Denotaremos en general la extensión de un concepto C mediante Así, por ejemplo, podemos reformular conjuntistamente la relación entre el el signo concepto de humano y el de mortal mediante sus extensiones:
'e'.
Y el enunciado sobre la asimetría de la relación de prozenie se convierte en:
Ahora bien, no siempre es adecuado sustituir la consideración directa de los conceptos por la consideración sobre sus extensiones. En general, si vale fi M, entonces una afirmación que incluye el predicado 'H'implica otra consistente en sustituir en la primera el predicado 'II' por el predicado 'M'. Por ejemplo, si es cierto que Luisa tropezó con un hombre, entonces tambiin es cierto que Luisa tropezó con un mortal. Pero no siempre ocurre así. Por ejemplo, si Judas cree que Jesús es hombre entonces, por mucho que siga valiendo de hecho fi c iG,puede no ser cierto que Judas crea que Jesús es mortal (el motivo, obviamente, es que Judas puede no creer que de hecho ocurra 9 c fi, o incluso creer que de hecho no ocurre). Los contextos o formas de discurso en los que no es legítima la, sustitución de las relaciones entre extensiones por las relaciones entre los correspondientes conceptos, son los denominados contestos o discursos irztensionnles, por oposición a los contextos e,rre~zsionales,en los que si vale tal sustitución; así, típicamente los contextos que incluyen operadores epistémicos (como 'creer') o modales (como 'posible' o 'necesario') son intensionales. Aunque muchas de las cuestiones metacientíficas son susceptibles de un andlisis puramente extensional, en algunos casos especialmente importantes, como en el análisis de la explicación o de las leyes, intervienen esencialmente fenómenos intensionales. Éste no es el caso, sin embargo, de nuestra actual finalidad, el anUlisis de la estructura lógica de los diversos tipos de conceptos científicos. Por tanto, en el resto de este capítulo adoptarelnos una perspectiva puramente e.rtensionalista, es decir, consideraremos siempre legítimo sustituir los conceptos por sus extensiones, con lo cual
tendremos siempre a nuestra disposición todo el instrumental de la teoría de conjuntos para llevar a cabo un análisis conceptual lo más sistemático y preciso posible. Desde esta perspectiva e~tensionalista,denominaremos 'representación' a la relación que se da entre un conjunto y el concepto del cual es extensión: si la extensión del concepto C es el conjunto t,diremos que representa a C. Nótese que esta relación no es una función, esto es, un mismo conjunto puede representar conceptos diferentes. El motivo es que puede haber diferentes conceptos con la misma extensión, que se aplican a los mismos objetos, por ejemplo los conceptos aniirml racional y bípedo irnplume. Pues bien, si admitimos la hipótesis ontológica de que los conjuntos son entidades reales (al menos tan reales como los números y las formas geométricas), entonces convendrá enriquecer nuestro esquema de la relación entre los conceptos y el mundo del siguiente modo. (La fig. 4.3 recoge el hecho de que diferentes conjuntos pueden representar un mismo concepto. Por otro lado, en tanto que objetos del mundo real, los conjuntos pueden a su vez ser subsurnidos por otros conceptos, por ejemplo conceptos como conjuntojnito, conjunto con inás de ocho elementos, conjunto infinito, etc. No incluimos este hecho en el gráfico para no dificultar la visualización de los otros hechos que ahora queremos destacar.)
n conceptos
SISTEMA CONCEPTUAL
MUNDO REAL UNIVERSO DE
LENGUAJE
objetos
En 10s apartados que siguen estableceremos una distinción tripartita entre tres grandes clases de conceptos científicos (y los correspondientes términos que los expresan), atendiendo a su estructura lógico-matemática característica, la cual, a su vez, refleja el diverso carácter y valor metodológico de cada una de estas clases de conceptos. La distinción en cuestión está conectada con el tradicional problema de distinguir entre un sistema conceptual cualitativo y uno cuantitativo para las ciencias, si bien, como veremos,
CONCEPTOS CIENT~FICOS
99
permite reformular esta cuestión de manera más exacta y matizada que la formulación tradicional. Es tos tres grandes tipos de conceptos son: los clasflcatorios, los cornpnrativos (o ropológicos) y los métricos. A los conceptos de los dos primeros tipos se les puede considerar "cualitritivos", mientras que 10s del último, los métricos, son "cuantitativos". Se ha discutido mucho sobre sus respectivas ventajas y desventajas, sobre si determinadas disciplinas deberían tender al uso de conceptos cualitativos o bien cuantitativos, etc. Sin pretender negar que en esta discusión se han señalado algunos aspectos que constituyen problemas genuinos de metodología, como veremos más adelante, antes de entrar a fondo en ella es conveniente hacer las siguientes aclaraciones. a) La distinción entre lo cualitativo y lo cuantitativo se ha tomado con frecuencia como una distinción fundamentalmente ontológica, cuando debería en realidad tomarse como una distinción epistemológica, basada ante todo en la estructura conceptual con la que nosotros conceptualizamos la realidad. A veces se afirma que hay propiedades o fenómenos del mundo real que son en sí mismos cualitativos y otros que son en sí mismos cuantitativos; es decir, se supone que la realidad es en ciertas partes cualitativa y en otras cuantitativa, y que nuestro uso de conceptos cualitativos o cuantitativos depende del tipo de realidad que estemos investigando, por lo que no podemos o no debemos aplicar conceptos cuantitativos a una parte cualitativa de la realidad, o a la inversa. TambiSn es frecuente que se haga una división entre disciplinas científicas según que estudien aspectos cuantitativos o bien cualitativos de la realidad; por ejemplo, se suele decir que la física es una ciencia que estudia los aspectos cuantitativos, mientras que las ciencias sociales estudiarían aspectos puramente cualitativos, que por su misma naturaleza no pueden ser tratados cuantitativamente. Todo esto son confusiones derivadas de la confusión básica entre el plano ontológico y el epistemológico. Ni el mundo globalmente considerado, ni ninguna parcela del mismo es en sí misma cualitativa o cuantitativa. Carece de sentido decir que un fenómeno o proceso real es en sí mismo cualitativo o cuantitativo. No es la realidad misma o un fenómeno particular lo que es cualitativo o cuantitativo, sino el modo como lo describimos, es decir, el aparato conceptual que utilizanlos para aprehenderlo. Depende esencialmente del sujeto epistimico, y no de la realidad misma, sea ésta lo que sea, el que usemos conceptos de una u otra clase para subsumirla bajo elIos. A veces es más provechoso, o más sencillo, usar un tipo de conceptos que otro tipo. El dominio de experiencia de que se trate no es lo que decide por sí solo esta cuestión, aunque es cierto que hay aspectos de la realidad que, al menos de momento, "no se dejan" conceptualizar cuantitativamente de modo interesante (sobre esto volveremos en la sección final del capítulo 6 dedicado a la medición). b) A veces se otorga una prioridad absoluta a los conceptos cuantitativos frente a los cualitativos, e incluso se piensa que una disciplina cualquiera no es realmente científica mientras no use conceptos cuantitativos. Y en este contexto se suele seguir, consciente o inconscientemente, la idea kantiana de que en una disciplina hay tanta ciencia como matemáticas hay, con lo cual, además, se suele identificar el nivel de matematización de una disciplina con su nivel de cuantificación. Y, en consecuencia. I
n~uchosinvestigadores de áreas aún poco desarrolladas, especialmente en las ciencias sociales, tratan de introducir conceptos cuantitativos aun cuando ello sea a veces muy forzado. Hay, en esta tendencia o actitud, por lo menos dos confusiones que conviene aclarar. En primer lugar, es cierto que una disciplina científica se desarrollará tanto más rápida y eficientemente cuanto más claros y exactos sean sus conceptos y más rigurosa su construcción, y ello implica en muchos casos la necesidad o la conveniencia de utilizar un lenguaje matemático. Pero matematizar no es equivalente a usar conceptos cuantitativos. Hay muchas ramas de las matemáticas, desde la topología hasta la teoría de grafos pasando por la teoría de grupos, que pueden ser útiles a las ciencias empíricas (y que de hecho ya han sido aplicadas con éxito en algunas áreas) y que sin embargo no presuponen conceptos cuantitativos. Estos últimos son, como veremos, una forma muy especial de construcciones matemáticas. En segundo lugar, la introducción de conceptos cuantitativos no es la panacea que promueve automáticamente el desarrollo de una teoría. Ni siquiera son siempre necesarios. Hay muchos ejemplos de uso de conceptos cuantitativos en las ciencias sociales que no han aportado el desarrollo esperado. Y hay casos, como el de la taxonomía clásica en biología, que han significado grandes avances en el conocimiento científico sin que en ellos se haya hecho uso de conceptos cuantitatison los más útiles vos. En conclusión, si bien es cierto que los conceptos cuantitati~~os para el desarrollo rápido de la ciencia (por razones que veremos más adelante), hay que juzgar con cautela y de modo pragmático en esta cuestión, y no rechazar dogmáticamente una disciplina como no-científica por el simple hecho de que no aparezcan conceptos cuantitativos en ella. Tras estas consideraciones podemos iniciar ya el estudio de cada uno de los diferentes tipos de conceptos. Como se verá, hay relaciones de correspondencia muy estrechas entre ellos. Aunque en sentido estricto no podemos decir que un concepto métrico es también un concepto comparativo, o que uno comparativo es también clasificatorio, sí hay un sentido más lato en que ello es cierto: cada concepto métrico se corresponde con un concepto comparativo, y cada concepto comparativo con uno clasificatorio. Así, un mismo concepto en términos intuitivos, como por ejemplo rttasa, se puede reconstruir metateóricamente como un concepto clasificatorio, como uno comparativo o como uno métrico. En este sentido el concepto de masa es a la i-ez de los tres tipos. Veremos que ello no siempre es posible: aunque a todo concepto métrico le corresponde otro comparativo y a todo comparativo uno clasificatorio, las conversas no son ciertas, hay conceptos comparati\~osa los que no corresponde ninguno métrico, y conceptos clasificatorios a los que no les corresponde ninguno comparativo. Así pues, los conceptos métricos son los más fuertes, después vienen los comparativos y por último los clasificatorios. Empezaremos nuestro análisis por estos últimos, los más débiles, y después iremos progresando en fuerza expresilva (como fuente histórica, el trabajo clásico es Hempel, 1952).
2. Conceptos clasificatorios
Los conceptos clasificatorios son los usados más comúnmente en la vida cotidiana. Son los primeros que se aprenden. La gran mayoría de conceptos que emplea un niño son herramientas para subsurnir los objetos que lo rodean de acuerdo a ciertos criterios vagamente especificados, generalmente basados en ejemplos y relaciones de analogía. Así es como el niño aprende a usar conceptos clasificatorios de color (rojo, azul, etc.), conceptos clasificatorios de f o m a (redondo, cuadrado, etc.), conceptos clasificatorios de temperatura (caliente, tibio, frío), de animales y plantas (perro, águila, pájaro, árbol), de sustancias (oro, agua), de objetos de uso (mesa, plato, martillo) y muchos otros. Este enorme acervo de conceptos sigue siendo usado por el adulto en las situaciones normales de su vida cotidiana, y sólo es en contextos especiales, particularmente los científicos, cuando se nota la insuficiencia de los conceptos clasificatorios y hay que pasar a otro tipo de conceptos. Clasificar es la manera más simple y directa de subsumir múltiples y diversos objetos bajo un mismo concepto y aprehender rasgos interesantes del mundo que nos rodea, y en una amplia variedad de situaciones nos basta con ello para dar cuenta de las cosas y transmitir información. Desde el punto de vista de su forma lógica, los términos que expresan conceptos clasificatorios son muy simples: son predicados monádicos. Desde el punto de vista conjuntista, la extensión de un concepto clasificatorio es un conjunto simple, sin estructura interna. La idea básica que se halla tras estos conceptos es la de clasificación. Clasificar cierto dominio de objetos no es más que a;mparlos en grupos disjuntos, ninguno de ellos vacío, y tales que entre todos los grupos estén todos los objetos del dominio en cuestión. Una clasificación de un dominio es simplemente, en términos conjuntistas, una partición del mismo. Pues bien, si dicha partición se realiza mediante criterios sistemáticos, entonces es preciso recurrir a ciertos conceptos, a una colección de conceptos que den los criterios de agrupación. Estos son los conceptos clasificatorios, elementos de un sistema conceptual que conjuntamente generan una partición del dominio de aplicación. La siguiente definición semiformal expresa esta idea.
-7
-
-
-
-
-
Definición 4.1 : Un concepto C es un concepto clasificatorio para el dominio (no-vacío) de objetos D si y sólo si pertenece a un sistema de conceptos {ei,..., C,),con n 2 2, que cumple las dos siguientes condiciones: (1) Los objetos de D se subsumen bajo cada C, (1 Ii 5 n) de acuerdo a criterios sistemáticos. (2) Las extensiones de cada Ci (1 5 i I n) constituyen, tomadas en su conjunto, una partición de D. Muchas pretendidas clasificaciones violan claramente los dos requisitos mencionados. Un caso extremo y divertido, pero además interesante porque revela de manera insuperable el modo como no debe .hacerse una clasificación, es la supuesta "enciclopedia china"
-
102
~
-
RIND.4SIEh'KlS DE FILOSOF~ADE L.4 CIENCIA
que Jorge Luis Borges nos presenta en su relato El idiorna atzalírico de Johii li'ilkirzs, según la cual "los animales se dividen en: a) pertenecientes al Emperador, b) emkalsamados, c) amaestrados, 4 lechones, e) sirenas, f) fabulosos, g) perros sueltos, h ) incluidos en esta clasificación, i) que se agitan como locos, j) innumerables, k) dibujados con un pincel finísimo de pelo de camello, T ) etcétera, m) que acaban de romper el jarrón, n) que de lejos parecen moscas".' Es obvio que esta pretendida clasificación no cumple con los dos requisitos arriba mencionados ni siquiera de manera aproximada. En efecto, no se puede detectar en absoluto ningún criterio siguiendo el cual se haya construido esta clasificación de los animales de modo sistemático, sino que es patente la absoluta arbitrariedad de la caracterización de los diversos grupos; por otro lado, las condiciones formales de una partición tampoco se cumplen, ya que hay clases vacías (como las categorías e ) y f)), animales que pueden pertenecer a dos clases distintas (por ejemplo, que pertenezcan a a) y b) a la vez) o a ninguna de las mencionadas (en realidad, la mayoría de los animales). Naturalmente, ningún científico en su sano juicio propondría en serio una clasificación como la de la "enciclopedia china" de Borges. Sin embargo, en muchas clasificaciones que se proponen en contextos científicos, si las analizamos con cuidado, encontraremos disonancias como las ejemplificadas jocosamente por Borges, aunque naturalmente mucho menos obvias. Así, es frecuente que haya disputas entre los propios científicos sobre el criterio o los criterios que haya que seguir para construir la clasificación sistemáticamente; y en cuanto a su carácter de partición, suelen admitirse más o menos veladamente y de mala gana algunas "excepciones". No se trata de negar, por supuesto, el valor que puedan tener en un momento dado del desarrollo de una disciplina clasificaciones que no cumplan exactamente con los requisitos mencionados; pero la comunidad científica debe ser consciente del carácter provisional de una clasificación no plenamente satisfactoria y ello debe servir de estímulo para buscar mejores métodos de construcción de clasificaciones. Dado que fijar una partición sobre un dominio es lo mismo que determinar cierta relación de equivalencia que "induzca" la partición, en vez de proceder directamente a definir cada una de las clases que supuestamente van a constituir la clasificación, en muchos casos lo más expedito y controlable es determinar primero en general una relación empírica (atendiendo a criterios empíricamente controlables y sistemáticos) entre los objetos del dominio que queremos clasificar, de la cual suponemos o comprobamos que es una relación de equivalencia. Si logramos identificar una relación con tales características, ya habremos dado el paso esencial, puesto que una relación así nos inducirá automáticamente una partición perfecta sobre el dominio estudiado. Y, además, no sólo obtendremos la partición deseada, sino que ésta habrá sido establecida a través de un criterio sistemático, universal, que es el. determinado por las condiciones empíricas expresadas por la misma relación de equivalencia; Veamos algunos ejemplos. Después de una larga historia de intentos de clasificar los cuerpos en sustancias por sus diversas propiedades químicas, actualmente disponemos de una relación de equivalencia, apoyada en condiciones empíricamente controlables, que determina la partición 1. Cf. J. L. Borges: Obras completas, Emecé, Buenos Aires, 1974. p. 708.
de cierto dominio de cuerpos en verdaderas clases de equivalencia que son lo que llamamos "elementos químicos". La relación de equivalencia en cuestión es la de igualdad en el número de protones en los átomos respectivos; más precisamente, la relación RE que buscamos entre cuerpos puede definirse así: "Dados dos cuerpos, x, y: x R E y de protones que los átomos de y."
SYSS
los átomos de x tienen el mismo número
Obviamente, ésta es una relación de equivalencia. Las condiciones empíricas para establecer esta relación las proporciona la física atómica. Está claro que esta clasificación no agota todos los cuerpos existentes en la Naturaleza; pero dentro del ámbito relativamente restringido de los cuerpos que son sustancias puras no ulteriormente disociables en sustancias químicamente distintas, la división en elementos es una buena partición. Otro ejemplo es el siguiente. Desde los principios de la rama de la lingüística que conocemos como 'fonología', hubo interés en segmentar el discurso hablado en unidades mínimas de significación, es decir sonidos constituyentes de una palabra que no pudieran modificarse sin que un hablante normal de la lengua en cuestión sintiera que se ha cambiado de palabra. De tales sonidos se dice que poseen un "valor distintivo". Así, el sonido castellano "11" tiene el mismo valor distintivo que "y", porque en el discurso hablado no se distingue la palabra "halla" de "haya" (a pesar de que puede haber ciertas diferencias dialectales o hasta individuales en la forma como se pronuncian dichos sonidos). En cambio, "11" tiene diferente valor distintivo que "i", pues si en la palabra "olla" sustituimos la "11" por "I", obtenemos "ola", que todo hispanohablante reconocerá como una palabra de significado distinto. A las clases de equivalencia de sonidos que tienen el mismo valor distintivo se las llama "fonemas". Y la relación de equivalencia RF que da lugar a la partición en fonemas podríamos definirla así: "Para dos sonidos cualesquiera x, y: .u R f y syss el valor distintivo de x es el mismo que el de y para un hablante normal."
i
1
r
Ésta es una relación que se puede determinar y controlar por métodos empíricos de carácter general (fonéticos, estadísticos), y el hecho de que sea o no efectivamente una relación de equivalencia (en particular, de que sea transitiva) es una cuestión empírica, pero que parece bastante bien confirmada. La historia que está detrás de estos dos ejemplos, y de muchos otros que podríamos mencionar, así como los problemas empíricos y teóricos que suscita el establecimiento y control de las relaciones de equivalencia en cuestión, muestran que no es fácil fijar de una vez por todas cuál de varias relaciones de equivalencia que se presentan como posibles en un dominio dado es efectivamente el candidato más adecuado para obtener la clasificación que tenemos en mente. El proceso de selección de la relación de equivalencia adecuada es a veces un proceso muy largo y costoso, para el que ni siquiera está claro que se haya llegado a una conclusión satisfactoria. Este proceso puede incluso llegar a formar parte de los esfuerzos centrales de una disciplina. Un buen ejemplo de ello es el caso de la
-
--
-
-
-
-
-
-
101
FL.SD.\IlE?,"OS
DE F I L O S O F ~DE LZ : CIENCIA
!
taxonomía biológica, en particular de la clasificación de los organismos en especies. En un princjpio, el criterio básico de clasificación de los organismos fueron sus diversas caractensticas morfológicas. Sin embargo, con el progreso de los estudios comparativos y los análisis de detalle, pronto se vio que en muchas ocasiones es difícil decidir cuáles de las características morfológicas deben ser consideradas como las esenciales a una especie, o bien la decisjón se tomaba de manera arbitraria (es decir, no sistemática). Por ello se buscó un mejor método de clasificación, basado en el criterio universal de la capacidad reproductiva. Así, en los Prirtcipios de :oología sistemática de Ernst Mayr encontramos que una especie se define como "un grupo de [organismos de] una población natural que se aparean actual o potencialmente, y que están reproductivamente aislados de otros grupos semejantes". Tratemos de fijar más precisamente la relación de equivalencia que subyace a esta partición de los organismos en especies. La relación podría definirse así en primera instancia: "Dados dos organismos cualesquiera s,y: x pertenece a la misma especie que y syss x puede aparearse reproductivamente con y bajo condiciones normales." En una elucidación más rigurosa hay que tomar en cuenta el hecho banal de que x e y pueden tener el mismo sexo o incluso ser el mismo organismo. Si usamos 'S' como abreviatura notacional de 'pertenece a la misma especie que', y 'A' como abreviatura de 'es apareable reproductivamente con', entonces podremos definir la relación que buscamos de la siguiente manera:
Admitiendo que el aparearse reproductivamente es una relación simétrica, es fácil ver que la relación así definida es una relación de equivalencia (dejamos la prueba de ello al lector como ejercicio). Ahora bien, si pretendemos aplicar esta relación universalmente nos enfrentaremos a problen~asdifíciles de resolver en algunos casos concretos. A veces será difícil decidir cuáles son las "condiciones normales" que deben darse para que se posibilite un apareamiento reproductivo; asimismo, está claro que el criterio no es aplicable a los organismos asexuados, y sin embargo, también queremos clasificar éstos en especies; finalmente, la existencia de híbridos también nos puede provocar algún problema. En consecuencia, si bien la propuesta de una relación de equivalencia para los organismos basada en el criterio de apareamiento reproductivo es muy útil en una gran mayoría de casos, todavía no es perfecta, dado que habrá casos en que su aplicación será dudosa cuando no imposible. En particular, el requisito de partición no siempre quedará satisfecho, ya sea porque no se agota el dominio entero de los organismos (los asexuados quedan fuera), o bien porque algunos organismos (los que son capaces de engendrar híbridos) pertenecerán a dos clases distintas. En el primer caso se viola la condición de exhaustividad y en el segundo la de mutua exclusión. Por todo ello, los biólogos han tratado de desarrollar un criterio de especie que sea más general y confiable que el criterio reproductivo y que no dé lugar a
j1 8
3 {
i
3
1
:
!
? i
CONCEPTOSCIENT~FICOS
: t
1 O5
excepciones y traslapes; ello se ha intentado a través de nociones genéticas. Sin embargo, también aquí han surgido problemas en los ÚItimos años, sobre todo con el auge de la ingeniería genética, que parece haber afectado seriamente la idea misma de especie, al menos a nivel de los microorganismos. Hemos considerado este ejemplo con cierto detenimiento porque es bastante típico de la clase de problemas que puede enfrentar el intento de una clasificación científica, y al mismo tiempo del papel que juega el esfuerzo por aproximarse a las condiciones ideales de una clasificación para el progreso de una disciplina. Ambos requisitos estipulados, y especialmente el de partición, constituyen un ideal hacia el cual tienden o se aproximan las clasificaciones científicas. Su papel es estimular la investigación, a veces a un nivel muy profundo, para dar con clasificaciones mejores que las presentes, cuando éstas no cumplen exactamente los requisitos mencionados. Los principales problemas metodológicos que pueden surgir al intentar una clasificación científica de cierto dominio son los siguientes. En primer lugar, los criterios sistemáticos que haya que seguir para establecer la relación de equivalencia necesaria pueden no estar claramente formulados o ser muy difíciles de aplicar en la práctica; además, puede no haber consenso entre los especialistas acerca de cuál de entre vanos criterios posibles es el más adecuado. En segundo lugar, las dos condiciones necesarias para obtener una verdadera partición pueden encontrar "excepciones", es decir, la relación que subyace a la partición puede no ser exactamente una relación de equivalencia, sino sólo serlo de manera aproximada: pueden encontrarse objetos del dominio que no han sido "cubiertos" por ninsuna clase de la partición, o bien otros objetos que pertenecen a la vez a dos clases distintas. Hay, naturalmente, un cierto margen de tolerancia para tales excepciones. Si no son muy numerosas, o sistemáticas, puede que la clasificación se acepte tal como está ... hasta nuevo aviso. Además de los dos requisitos postulados para toda buena clasificación (el de sistematicidad y ei de generar una partición), pueden tomarse en consideración otras características posibles de las clasificaciones que, si bien no son necesarias, pueden resultar convenientes en un área dada. Entre estas condiciones adicionales que se pueden requerir de una clasificación está, en primer Iugar, la de que el número de clases de equivalencia de que conste la partición no sea demasiado reducido para nuestros propósitos. En general, cuanto mayor sea el número de clases de equivalencia obtenida en la partición, tanto mejor pues tanto mayor será la capacidad de discriminación de la clasificación propuesta; aunque, claro está, este número tampoco debe ser tan grande que haga que la clasificación resulte impracticable. Las clasificaciones más pobres desde el punto de vista de su poder discriminatorio son las dicotómicas, que constan sólo de dos clases de equivalencia. Y, dentro de las dicotomías, las menos útiles son las que resultan simplemente de afirmar o negar una determinada propiedad de los objetos de un dominio. Por ejemplo, si dividimos los habitantes de un país entre los que poseen un título universitario Y los que no lo poseen, aunque ésta es una clasificación que satisface perfectamente los dos requisitos fundamentales, sin embargo no es un tipo de clasificación que nos sirva de gran cosa desde un punto de vista científico. Más interesantes son las dicotomías basadas en dos propiedades lógicamente independientes, pero que empíricamente resulta que ago-
FlJh'D..ZhlEhTOS DE FILOSOF~ADE LA CIENCIA
106
tan entre ambas el dominio que se considera. Piénsese, por ejemplo, en el valor que tiene para la biología la división de los organismos sexuados entre machos y hembras (que no hay que confundir con una posible división, mucho menos interesante, que se hiciera entre hembras y no-hembras, pongamos por caso). Como regla general, sin embargo, las dicotomías son poco interesantes desde un punto de vista científico (si bien son muy frecuentes en nuestra irida cotidiana como un modo "rápido" de enfrentarnos al mundo que nos rodea: divisiones como las que se establecen entre "buenos" y "malos", "amigos" y "enemigos", "ricos" y "pobres", etc.). Cuando sobre un mismo dominio se han establecido dos diferentes clasificaciones, cuyas particiones correspondientes P, y P2 cumplen lo siguiente:
es decir, intuitivamente, que las clases de equivalencia de que consta la partición P ison "subdivisiones" de las de Pz (y por tanto P, tiene un mayor número de clases que P2), entonces diremos que la clasificación correspondiente a Pies másfina que la clasificación correspondiente a P2. Está claro que, dadas dos clasificaciones del mismo dominio, tales que una sea más fina que la otra, preferiremos adoptar la más fina, pues nos proporciona mayor poder de discriminación. Las clasificaciones más útiles son las que forman parte de jerarquías taxonómicas o, como también se las llama, árboles clasificatorios. Se trata de árboles, o "pirámides" resultantes de la sucesiva superposición de clasificaciones de tal manera que en cada nivel de la pirámide tenemos una clasificación más fina que en el nivel anterior. Un ejemplo sencillo de una pirámide taxonómica lo encontramos en la clasificación de los cuerpos desde el punto de vista químico: Cuerpos
homogéneos
soluciones
heterogeneos
sustancias
elementos
compuestos
Ésta es una clasificación muy simple porque procede por sucesivas dicotomías (aunque esto no le quita su valor). Jerarquías taxonómicas mucho más complicadas las encontramos en biología, donde han jugado un enorme papel en la investigación. Un segmento de una de esas jerarquías es el siguiente:
Animales
protozoos
poriferos
celenterados
equinodermos
verrnes
artrópodos
moluscos
vertebrados
mamiferos aves
protocordados
reptiles anfibios peces
Otra jerarquía zoológica mucho más refinada consiste en la siguiente piramide: Animales
protozoos
metazoos
mesozoos
parazoos
eurnetazoos
celenterados
bilateralios
gastroneuralios archicelorados notoneuralios
cordados
tumicados
acranios
vertebrados
agnatos
gnatótornos
peces
tetr8podos
anfibios
reptiles aves
cordados
mamíferos
Cada uno de los rótulos representa una clase de equivalencia de una partición de los animales a cierto nivel. Las clasificaciones son cada vez más finas de arriba abajo. Naturalmente que estos esquemas representan sólo una pequeña parte de la pirámide total de la clasificación de los animales. Cuando las clases de equivalencia de una partición forman parte de una pirámide o jerarquía taxonómica se las suele denominar 'taxones'. En estos ejemplos, cordado, i'ertebrado y tnarnijcero son tres distintos taxones de clasificaciones sucesivamente mas finas en las jerarquías respectivas.
3. Conceptos comparativos Desde un punto de vista metodológico, los conceptos comparativos constituyen una categoría intermedia entre los conceptos clasificatorios y los métricos o cuantitativos. Históricamente, ha ocurrido con frecuencia que los conceptos comparativos han sido la antesala de los conceptos cuantitativos que se han introducido posteriormente. Ello sugiere que, cuando una rama de la ciencia aún no ha alcanzado una fase de su desarrollo que le permita la introducción sistemática y adecuada de conceptos métricos, no por ello hay que creer que está limitada al uso de conceptos clasificatonos, sino que posiblemente se halle en capacidad de hacer uso de conceptos comparativos. Los conceptos comparativos, si se definen adecuadamente, son mucho más potentes que los conceptos clasificatorios que les corresponden, puesto que no sólo nos permiten clasificar un dominio dado, sino que además permiten ordenarlo. A cada concepto comparativo genuino se le asocia invariablemente un conjunto de conceptos clasificatorios, de modo que puede decirse que el primero implica los segundos; pero implica algo más: un ordenamiento de los objetos subsumidos bajo él. Los conceptos comparativos fueron muy usuales en los estadios iniciales de la física; por ejemplo, los conceptos de peso y calor se usaron sistemáticamente como conceptos comparativos antes de que se pudieran manejar apropiadamente como conceptos cuantitativos en sentido genuino. Asimismo, los conceptos comparativos son todavía muy útiles en otras áreas de la ciencia: en psicología (por ejemplo, los conceptos de inteligencia, introversión, neuroticidad), en biología (el concepto de adaptación y otras nociones de la teoría de la evolución), en geología (el concepto de dureza, por ejemplo), en química clásica(e1 concepto de acidez). Desde un punto de vista lógico, los conceptos comparativos son de carácter relacional; o, dicho más rigurosamente, los términos que expresan conceptos comparativos están constituidos lógicamente hablando por dos predicados diádicos estrechamente interconectados: uno 'K' que denota una relación de coincidencia o equivalencia en cierto respecto, y otro 'P'que denota una relación de precedencia. Ambas relaciones deben estar definidas, naturalmente, sobre el mismo dominio de objetos empíricos. La primera relación es 1a.que nos permite clasificar ese dominio y la segunda (junto con la primera) ordenarlo. La idea es que 'XKJJ'significa "x es tan ... como y", o "x es equivalente en ... a y" (p.ej., x es tan duro como y, o x es equivalente en dureza a y); y 'xPy' significa "x es más ... que y", o ''x precede en ... a y" (p.ej., x es más duro que y, o x precede en dureza
a y). Se pueden presentar las cosas de modo equivalente mediante una única relación de orden R. cuya interpretación pretendida es que 'xRy' significa "x es tan o más ... que y" (p.ej. x es tan o más duro que y). Ambas presentaciones son equivalentes: si utilizamos la primera, podemos definir 'xRy' como 'xKy o xPy' (R es "la unión" de K y P);si utilizamos la segunda, podemos definir 'xKy' como 'xRy y y k ' y 'xPy' como 'xRy y no y&'. Aquí vamos a seguir la primera versión pues es más intuitiva, y notacionalmente más cómoda, para introducir los conceptos comparativos; en otros lugares, donde interese especialmente la conexión entre conceptos comparativos y conceptos métricos, será más conveniente utilizar la segunda (cf. próxima sección y el capítulo 6). Para que el concepto que lleva asociadas las relaciones K y P sea un concepto comparativo, estas relaciones deben satisfacer ciertas condiciones específicas, tanto cada una por separado como conjuntamente. La idea es entonces que C es un concepto comparativo -si su extensión es la unión de dichas relaciones. Las condiciones en cuestión son, utilizando de nuevo el instrumental de la teoría de conjuntos, las que establece la siguiente definición. Definición 4.2:
Un concepto relaciona1 C es un concepto comparativo para el dominio (no-vacío) de objetos D si y sólo si existen dos relaciones K y P sobre dicho dominio tales que la extensión de C es K u P y se cumplen además las siguientes condiciones:
(1) (2) (3) (4) (5)
DomK=RecK=DomP=RecP=D. K es reflexiva, simétrica y transitiva, e.e., una relación de equivalencia. P es transitiva. K y P son mutuamente excluyentes: V.r, y E D (.rKy + -I xPy). K y P son conjuntamente conexas: V,x, y E D (xKy v xPy v yPx).
Está claro que, por el carácter que tiene K de relación de equivalencia, induce una partición en clases de equivalencia del dominio D y por lo tanto una clasificación de dicho dominio. Por su parte, la relación P cumple la función de ordenar el dominio, puesto que es una relación d e orden, esto es, es al menos asimétrica y transitiva. Que es transitiva es inmediato por (3). Para ver que es asimétrica supongamos, por reducción al absurdo, que no lo es, e.e., que hay x, y tales que xPy y yPx. Puesto que es transitiva, obtenemos xPx. Por otro lado sabemos que xKx pues K es reflexiva. Pero las dos cosas, xPx y xKx, no pueden ocumr, pues por (4) K y P son excluyentes. Por tanto, si xPy entonces no yPx (QED). Además de las condiciones formales generales establecidas en la definición, el concepto comparativo debe satisfacer determinadas condiciones materiales u operacionales; su extensión no se puede determinar de modo puramente formal, se debe determinar de modo sistemático pero "operacional": las relaciones K y P no pueden ser escogidas de una manera puramente formal, sino que deben ir asociadas a ciertas operaciones o situaciones empíricamente controlables, las cuales permitan decidir si se dan o no dichas
relaciones en un dominio de objetos. A veces, esto se determina a partir de alguna teoría empírica general ya aceptada, pero en otras ocasiones, especialmente en áreas relativamente elementales o en fases iniciales de una disciplina, la validez empírica de tales relaciones puede establecerse a partir de operaciones sencillas de laboratorio junto con ciertas hipótesis bastante elementales, de bajo nivel teórico. Veamos un ejemplo de esta última situación. Consideremas el concepto peso antes de que fuera metrizado, o incluso en situaciones actuales en las que no es necesario presuponer que disponemos del concepto métrico de peso, sino sólo de su correlato comparativo. En realidad, desde el punto de vista de la física teórica, lo que vamos a considerar a continuación es el concepto masa, pero a efectos de la discusión presente podemos asumir que estamos tratando del concepto más cotidiano de peso, tal como se aplica, por ejemplo, en los mercados. Pues bien, para determinar operacionalmente este concepto debemos asociar a operaciones empíricamente controlables la noción comparativa de peso; esto es, debemos dar un sentido operacional a la relación Kp de coincidencia de pesos y a la relación P, de precedencia de pesos. Esto se puede hacer mediante el uso de una balanza de brazos iguales. Compararemos el peso de dos objetos x, y del dominio considerado (objetos macroscópicos no demasiado grandes ni demasiado pequeños) colocándolos cada uno en uno de los dos platillos de la balanza. Entonces, determinaremos operacionalmente las relaciones Kp y Pp de la siguiente manera: a ) si los platillos de la balanza permanecen ambos a la misma altura, diremos que x pesa igual que y, xKy; b) si la balanza desciende del lado del platillo con x, diremos que x pesa más que y, xPy (por otro lado, cuando x = y, convenimos en que en tal caso también xKy). Es fácil comprobar que las relaciones Kp y Ppasí determinadas operacionalmente mediante operaciones con una balanza cumplen las condiciones de un concepto comparatiyo. En efecto, la relación "ser tan pesado como", determinada del modo indicado (nivelación de platillos de la balanza) cumple con los requisitos de reflexividad (por convención), simetría (da igual si cambiamos de platillo los objetos, éstos seguirán estando al mismo nivel si lo estaban antes) y transitividad (si el objeto x permanece al mismo nivel que el objeto y y luego vemos que el objeto y permanece al mismo nivel que el objeto z, podemos comprobar que el objeto x también permanecerá al mismo nivel que el objeto 2). Con ello queda garantizado que la relación Kp, al menos dentro de los límites de este modo de aplicarla empíricamente, es una relación de equivalencia. Análogamente es fácil comprobar que la relación "ser más pesado que", así determinada (diferencia de nivel de los platillos), es transitiva (si el platillo con y está más bajo que el platillo con x, y luego el platillo con z está más bajo que el platillo con y, también el platillo con z estará más bajo que el platillo con x). Igualmente fácil es comprobar que ambas relaciones son mutuamente excluyentes y conjuntamente conexas (dejamos la constatación de estos dos últimos casos al lector). Es ifnportante señalar que el hecho de que podamos asociar (no "definir") las nociones de coincidencia y precedencia de peso a operaciones empíricas con una balanza de la manera indicada, garantizando que se cumplan las condiciones de definición de los conceptos comparativos, es un resultado empírico, apoyado en ciertas hipótesis empíricas
t
l
1
f
1
1
acerca del comportamiento de una balanza, y no un asunto de mera convención. Solamente la reflexividad de K, y la mutua exclusión de Kp y Pp se derivan analíticamente d e convenciones o del uso normal de nuestro lenguaje. La satisfacción de los demás requisitos es, en cambio, un asunto empírico, lo cual se constata en e1 hecho de que podríamos imaginamos situaciones en que no se satisficieran. Por ejemplo, consideremos la transitividad de Kp en la determinación del peso mediante la balanza: podría ocurrir que cuando están sobre los platillos los objetos x e y. permanecieran a igual nivel, y lo mismo cuando estuvieran y y z;pero que, en cambio, al colocar sobre los platillos x y z, se notara una diferencia de nivel. Que esto no ocurra no es una necesidad lógica, sino una hipótesis empírica acerca de las balanzas (de hecho, en balanzas algo "defectuosas" se viola a veces la transitividad). La misma constatación podemos hacer con respecto a la simetría de K, y a la transitividad de PP.Incluso la conexión conjunta de Kp y Pp es una hipótesis empírica, pues podría ocurrir que, en ocasiones, al colocar sobre los platillos dos determinados objetos, la balanza se pusiera a oscilar permanentemente sin alcanzar nunca un equilibrio, por lo que no podríamos determinar si se da coincidencia o precedencia de pesos en algún sentido u otro. En resumen, el hecho de que podamos aseverar que un determinado concepto comparativo va asociado a ciertas operaciones u observaciones empíricas es una cuestión hipotético-empírica (y a veces incluso fuertemente teórica) y no un asunto de mera definición. En general, no podemos decir que los conceptos comparativos vienen definidos por las operaciones u observaciones empíricas asociadas a ellos (como tampoco lo podemos decir en el caso de los criterios empíricos asociados a los conceptos clasificatorios). Con frecuencia, las relaciones empíricamente determinadas que van asociadas a un concepto comparativo que queremos introducir de nueva cuenta en una disciplina científica no cumplen exactamente las condiciones formales de la definición de conceptos comparativos, sino sólo de modo aproximado. Análogamente al caso de los conceptos clasificatorios, las condiciones formales representan un ideal al que hay que tender pero que no siempre se alcanza plenamente. Un buen ejemplo de ello es el concepto comparativo dureza, que se introduce en mineralogía asociándolo a la prueba empírica de la "raya". Las relaciones de precedencia y coincidencia en este caso se determinan operacionalmente del siguiente inodo: x es más duro que y si y sólo si x raya a y; x es tan duro como y si y sólo si x no raya a y ni y a x. También en este caso, las condiciones de reflexividad de la coincidencia y de mutua exclusión de coincidencia y precedencia se desprenden analíticamente de nuestro uso lingüístico, pero no así el resto de condiciones, cuya satisfacibilidad depende de hipótesis empíricas acerca de los minerales. Pero, además, en este caso dichas hipótesis no siempre se cumplen, por lo que algunas de las condiciones postuladas para los conceptos comparativos (especialmente la transitividad) sólo se cumplen de manera aproximada. No obstante estas dificultades, la "pmeba de la raya" se conserva en la mayoría de los casos como determinación operacional del concepto de dureza hasta tanto no se encuentren mejores determinaciones operacionales o hasta tanto las determinaciones altemativas sean demasiado difíciles de aplicar en la práctica. Hemos indicado ya que todo concepto comparativo, a través de la relación P de precedencia, implica un ordenamiento de los objetos del dominio considerado de "más a
menos" (o de "menos a más", sesún se quiera considerar), además de la clasificación de dichos objetos en clases de objetos coincidentes. Este ordenamiento de los objetos se expresa en ocasiones mediante números, mediante lo que se llama una "escala ordinal". El orden de los números refleja así el orden de los objetos a los que se adscriben dichos números. Por ejemplo; en el caso del concepto de dureza introducido en mineralogía, Friednch Mohs estipuló yna escala numérica del 1 al 10, según la cual, al mineral más blando, el talco, se le asigna e1 número'l y al más duro, el diamante, se le asigna el 10, siendo los demás minerales ordenados entre estos dos extremos según su mayor o menor grado de dureza por comparación con los demás. Asimismo, en psicología, al concepto.de inteligencia (que es un conccpto comparativo) se le asigngn números, llamados 'cocientes de inteligencia', que representan el nivel de inteligencia de manera fácilmente comparable y memorizable. Todos estos ejemplos de conceptos comparativos a los que se asignan números, sin embargo, no nos deberían confundir y hacer creer que estamos Watando con conceptos realmente cuantitativos, métricos. Las escalas numéricas introducidas en estos casos son s61o escalas vdinales, no escalas métricas, en un sentido genuino, sobre cuya naturaleza hablaremos en el próximo apartada. La difereicia esencial entre ambos tipos de asignaciones numéricas se comprueba por el hecho de que con los números asignados a los conceptos comparativos no t i e ~ esentido efectuar las consabidas operaciones aritrnéticas y aigebraicas, como sumar, multiplicar, sacar raíces, @c., y mucho menos aplicar las operaciones de ~5lculosuperior (;qué sentido tendría sumar cocientes de inteligencia Q sacar la iaíz cuadrada de un grado de dureza?, sobre ésto, cf. más adefante cap. 6). Los números que se utilizan en el caso de los conceptos comparativos no expresan realmente la medida de ninguna magnitud, sino que son sólo un modo simple y conveniente de expresar un orden; en vez de números, también podríamos usar las letras del alfabeto y estipular, por ejemplo, que en una escala de dureza,,al talco le corresponde la letra 'a' y al diaman$ la letra 'j'. Los números asignados a los conceptos comparativos son en realidad únicamente nu~ierales,no eTpresan cantidades o magnitudes; no presuponen una métrica definida demanera "natural" sobre el dominio en cuestión, es decir, una métrica asociada a operaciones matemáticas que reflejan operaciones o relaciones empíricas.
4. Conceptos métricos: estudio preliminar Los conceptos métricos o cuantitativos son característicos de las ramas más avanzadas de la' ciencia. Casi todos los conceptos fundamentales de la física son métricos, pero ellos también'aparecen en otras disciplinas de naturaleza bastante distinta a. la de la física, como pueden ser la genética de poblacion,es, la teoría del aprendizaje o la microeconomía. El uso sistemático y generalizado de conceptos métricos en una disciplina implica, entre otras cosas, que está a nuestra disposición para esa área de estudios empíricos todo el potencial de la matemática. Al pro'ceso que conduce a tal uso se le llama a veces "mat~matización"de una disciplina dada, proceso que, como sabemos, fue el elemento probablemente más decisivo de la revolución científica del siglo XVII y el que dio lugar a la física moderna. Ahora bien, la frase 'matematizar una disciplina'
,
debe tomarse con un poco de cuidado, ya que, a fin de cuentas, no sólo el uso de conceptos métricos, sino la introducción adecuada de conceptos clasificatorios y comparativos implica ya ciertos supuestos de carácter matemático (conjuntista), si bien de nivel elemental. Si la idea de "matematizar" se asocia generalmente con la introducción sistemática de conceptos métricos es porque sólo estos últimos permiten un uso generalizado de las porciones más "potentes" de la matemática (y al mismo tiempo las más clásicas), como son la aritmética, la geometría, el álgebra y el cálculo. Es sólo a través del puente que constituyen los conceptos métricos entre la realidad empírica y dichas porciones de las matemáticas que un amplio espectro de procesos empíricos puede tratarse como si fueran operaciones matemáticas, y esto a su vez es lo que permite un alto grado de precisión en la explicación y predicción de dichos procesos. Los conceptos métricos están íntimamente conectados, como indica su nombre, con la idea de medir cosas y procesos. Ahora bien, medir no consiste simplemente en asignar números a las cosas, puesto que ello también puede realizarse de manera trivial en el caso de los conceptos clasificatorios y comparativos. Medir es asignar números a objetos empíricos para representar determinadas propiedades específicas de los objetos denominadas ntagnintdes, representación que permite utilizar de modo empíricamente significativo operaciones matemáticas interesantes (adición, multiplicación, potenciación, derivación e integración, etc.) entre los valores numéricos asignados. En otras palabras, la mediciónpermite hacer cálculos con relevancia empírica, y en particular permite hacer predicciones muy precisas. Podemos resumir las ventajas de los conceptos métricos sobre los clasificatorios y comparativos en los siguientes puntos. a ) Las divisiones y diferenciaciones que pueden hacerse empleando conceptos métricos son mucho más finas y precisas que las que pueden hacerse mediante los otros tipos de conceptos. Es decir, los conceptos métricos también permiten clasificar y comparar los objetos de un dominio dado, pero lo hacen de manera mucho más precisa que sus contrapartidas no-métricas. Por ejemplo, en vez de clasificar las diversas velocidades de los cuerpos de acuerdo a los conceptos de 'muy lento', 'lento', 'rápido' y 'muy rápido', o de compararlas según una "mayor o menor rapidez", introducimos el concepto métrico de velocidad y podemos hacer las clasificaciones y comparaciones de manera mucho más fina. b) Los conceptos métricos permiten enunciar leyes empíricas que son más generales y precisas, y por ende mejor controlables, que las leyes formuladas con conceptos no-métricos. c) Como consecuencia de las características a) y b), los conceptos métricos permiten explicaciones y predicciones mucho más exactas y controlables.
Desde un punto de vista formal, la extensión de un concepto métrico es una fiinción numérica,o mejor, como en seguida veremos, un conjunto de tales funciones. Lo esencial de los conceptos clasificatorios es que ellos nos permiten realizar clasificaciones de los objetos del dominio, por eso se caracterizan porque su extensión es (un elemento
114
F U S M S ~ E S ~ SDE FILOSOF~ADE LA CIENCIA
de) una partición. Lo esencial de los conceptos comparativos es que nos periniten realizar comparaciones cualitativas entre los objetos del dominio, por eso se caraccerizan porque su extensión es una relación de orden (KP). Pues bien, lo esencial de los conceptos métricos es que nos realizar asignaciones numéricas a 10s objetos del dominio de rnodo empíricamente significativo, y por eso se van a caracterizar porque sus extensiones .. son (determinados tipos de) funciones numéricas sobre dicho dominio. Así pues, el problema básico en el intento de metrizar un área de conocimiento consiste en encantrar la función o conjunto de funciones métricas apropiadas. Una vez encontrado ello, podemos decir que, en cierto sentido, hemos "identificado" los objetos del dominio estudiado con números reales (o entidades matemáticas derivadas, como vectores, matrices, tensores, etc.). Entonces, en vez de considerar directamente las relaciones y operaciones empíricas que se dan entre los objetos estudiados, podemos concentrar nuestra atención sobre las relaciones y operaciones entre los números que representan las propiedades de los objetos empíricos, y a través de ello, indirectamente, ganamos información sobre los mismos objetos y sus propiedades representadas. Este modo de proceder nos permite un grado mucho más alto de exactitud y potencia predictiva del que obtendríamos operando directamente con los objetos empíricos, puesto que las teorías matemáticas existentes nos informan detallada y exactamente sobre cómo operar con números y sobre las propiedades generales que tienen tales operaciones. Además, los límites prácticos que suelen darse en la manipulación de objetos empíricos no se dan en la manipuIación de números, para lo cual lo único que necesitamos es papel y lápiz, o a lo sumo una computadora. Este proceso de identificar los objetos empíricos con números y las operaciones empíricas con operaciones matemáticas, manejando luego estas últimas para obtener información indirecta sobre los primeros, es a lo que puede denominarse más genuinamente "matematización de la realidad". Al contrario del caso de los conceptos comparativos, la asignación de números a objetos empíricos en este proceso no es arbitraria y no-operacional, sino que con ella se expresan importantes y reales conexiones empíricas entre los mimosobjetos. Operamos con los números "como si" operásemos con los objetos. En la primera sección dijimos que los conceptos comparativos suponen un refinamiento o reforzamiento respecto de los clasificatorios, y que lo mismo ocurre con .los métricas respecto de los comparativos. En la sección anterior hemos visto en qué sentido es así en el primer caso: a todo concepto comparativo "subyace" uno clasificatorio (expresado mediante la relación de coincidencia K). Pues bien, en ese mismo sentido es así en el segundo caso. A. cualquier concepto métrico subyace explícita o implícitamente un concepto comparativo correspondiente (y por tanto otro clasificatorio); medir determinada magnitud en un dominio de objetos implica, entre otras cosas, la posibilidad de (clasificarlos y) compararlos en relación con dicha magnitud. La recíproca, naturalmente, no es cierta, pues no siempre la introducción de un concepto comparativo permite construi; ipso facto un concepto métrico correspondiente (como tampoco la introducción de un concepto clasificatorio permite siempre la introducción de otro comparativo). Entre muchos filósofos y científicos prevalece la idea de que un concepto métrico, para ser adecuado, debe ser 4'construido" a partir de un concepto comparativo previo. .A veces se llega incluso más allá en este requerimiento y se exige que el concepto
CONCEPTOS C~ENT~HCOS
115
métrico sea definible en términos de un concepto comparativo. Y se afirma que, aun cuando en muchos casos ello no se ha llevado a cabo efectivamente, eso se debe al estado conceptualmente defectuoso de los fundamentos de la disciplina, y que la misión del filósofo de la ciencia o del investigador de fundamentos debería consistir justamente en proporcionar tal definición en los casos en que no se ha hecho. Esta visión de la relación entre los conceptos métricos y comparativos es característica del operacionalismo y otras corrientes metodológicas .afines, según las cuales todo concepto científico, métrico o no, debe estar completamente determinado por observaciones u operaciones de laboratorio (cf. Bridgman, 1927, 19.51~y 1951b). La idea básica es que un concepto métrico no es empíricamente adecuado hasta que no se muestre que, "en principio", es reducible a uno comparativo previamente introducido. Esta visión tan restrictiva de los conceptos métricos descansa en el prejuicio de que sólo es posible introducir un concepto métrico a través de su definición o construcción a partir de un concepto comparativo previamente disponible. El hecho de que a todo concepto métrico subyace otro comparativo no quiere decir que la introducción de un concepto métrico sea siempre bbposterior"a la introducción de uno comparativo "previo". En muchos casos así es, y los conceptos métricos introducidos de manera independiente corresponden de modo bastante natural a conceptos comparativos previos, en un sentido o bien histórico (porque ya se aplicaban en la disciplina en cuestión antes de que ésta fuera metrizada), o bien epistemológico (porque nuestro conocimiento del modo de aplicarlo o controlarlo es más directo en el caso del concepto comparativo que en el de su asociado métrico). Así ocurre por ejemplo con los conceptos métricos de masa, longitud o temperatura (termométrica). Pero esta prioridad (histórica o epistemológica) de los conceptos comparativos frente a los métricos no tiene por qué darse siempre. Con frecuencia se introduce un concepto métrico directamente, ya sea a partir de una teoría establecida o como simple recurso de cálculo, sin que se haya pensado previamente en un concepto comparativo correspondiente y sin que éste tenga ningún interés. Esto suele ocurrir en ramas particularmente avanzadas y abstractas de la ciencia. Conceptos métricos como el de intensidad de campo en el electromagnetismo, entropía en termodinámica, lagrangiano en mecánica clásica ofunción de onda en mecánica cuántica, fueron introducidos en su momento, y se manejan en la actualidad, sin tomar en cuenta el concepto comparativo subyacente. En estos, y muchos otros casos, lo que confiere significado empírico a la mayoría de conceptos métricos es su inserción en una teoría empírica determinada a la cual podemos atribuir un significado empírico en su totalidad. De qué manera ocurre esto, lo veremos en capítulos posteriores de este libro (cf. caps. 8, 9 y 10). De momento, baste señalar que en muchos casos (de hecho en la mayoría), la introducción de un concepto métrico, con su significado empírico propio, se realiza en el contexto de una teoría, es decir, en conexión con otros múltiples conceptos (métricos o no), y no por el expediente de reducirlo a un concepto comparativo. Para la mayoría de conceptos métricos no hay razón, pues, para exigir que sean introducidos a partir de conceptos comparativos previos, eso sólo es así de algunos conceptos métricos, como los mencionados más arriba. Volveremos sobre estos dos modos de introducir conceptos métricos en el capítulo 6. Estas consideraciones no suponen negar que en muchos casos sea interesante y
116
FUSD.4hlEh'lDS DE F I L O S O F DE ~ LA CIENCIA
fructífero identificar el concepto comparativo implicito en un concepto métrico dado, y averiguar cuál es la relación formal entre ambos, Ello tiene un doble interés: empíricocientífico, por contribuir a un mejor control empfricu del concepto métrico en casos de duda; y metacientífico o filosófico, porque permite establecer ciertas distinciones entre subtipos de conceptos métricos y su modo de ser aplicados. Esta cuestión, a la que se.ha dedicado mucha atención en la literatura de filosofía de la ciencia, tanto en susrprimeros tiempos como en época reciente, se estudiará en detalle en el capítulo 6. Por el momento, bastarán para esta introducción preliminar las observaciones siguientes. Cuando el concepto métrico es introducido a partir de uno comparativo previo, se debe dar cierta condición de dependencia entre ambos, consistente fundamentalmente en que la función correspondiente al concepto métríco preserva el orden de la relación correspondiente al concepto comparativo. Si K u P es la extensión del concepto comparativo y f . . es una de las funciones de la extensión del concepto métrico, entonces: (Mi) Dom(KuP)=Domf. (M2) Rec f c Re. (M3) V x, y (xKy +-+fix)=&)). (h14) V x, y (xPy +-+Ax) >&)).
.
,
Para que, dado un concepto comparativo, exista una función con estas características, y que podamos por tanto-decir que ,existe un concepto m6trico que corresponde al comparativo, es necesario que la relación cualitativa de comparación K v P satisfaga ciertas condiciones. Por lo general hay varias posibilidades, vanos grupos de condiciones suficientes que gkantizan la existencia de una función tal. En casi todos los casos, tales condiciones invoEucran elementos adicionales a K u P, por ejemplo una operacidn de combinación, o una relación de comparación ewre pares de objetos, u otros más complicados. cuando es así, hay que añadir a MI-M? otras cláusulas adicionales que expliciten el modo en que la función'numérica debe preservar esos elementos erdpíricos cualitativos adicionales. No vamos a ver aquí las diversas posibilidades y los diversos grupos de condiciones para cada una. De ello se ocupa la llamada Teoría de la Metrización Fundamental, que veremos en el capítulo 6 ($3). ~oncluiremosesta presentación preliminar de los conceptos métricos presentando la noción de escala y, en relación con ello, aclarando el sentido en el que conviene identificar la extensión de un concepto métrico, no con una única función métrica, sino con una clase de tales funciones, equivalentes en cuanto a suiapacidad representacional. Las' funcionesf especificas que asignan números reales a cada. objeto dei dominio son lo que tradicionalmente se denomina escalas. Por ejemplo, una función específica asigna a determinado objeto que hay en un museo de Pan's, representando su masa, el número 1 y al objeto que el lector está leyendo el número 0,4; otra función para la masa asigna a los mismos objetos, respectivamente, el 1.O00 y el 400; otra asigna al-primero el número 0,001 y al segundo 0,0001; otra 2,2 y 0,88; etc. Estas funciones numéricas miden la misma propiedad, la masa, pero asignan números diferentes a los mismos objetos. Cada una de estas funciones es una diferente escala para la masa: la primera es la "escala
CONCEPTOS CIE~T~FICOS
117
Kilogramo" (sistema iMKS), cuyo uso hacemos explícito posponiendo al numera1 el signo 'kg.'; la segunda es la "escala gramo" (sistema cegesimal). cuyo uso hacemos explícito posponiendo al numeral el signo 'gr.'; la tercera la "escala Tonelada métrica", que denotamos posponiendo 'Tm.'; la cuarta es la "escala libra" (sistema anglosajón) que denotamos posponiendo 'lb'; etc. Todas estas escalas, y muchas otras, son igualmente válidas para medir la masa, son de hecho escalas equivatentes en un sentido del que diremos algo a continuación y que quedará plenamente clarificado en el capítulo 6. Éste es e1 motivo por el que no es correcto identificar la extensión de un concepto métrico con una única de las funciones numéricas, con una escala particular. Lo correcto es identificarlo con el conjunto de todas las posibles escalas para Ia magnitud que corresponde al concepto, esto es, con la clase de todas las posibles funciones numéricas que representan dicha magnitud. La extensión del concepto masa es pues el conjunto &,L.,fm,f;h, ...l. Y lo mismo en el caso, por ejemplo, de la longitud: tenemos las escalas "centímetro", "metro", "kilómetro", "milla", "yarda", "pulgada", etc., por lo que la extensión del concepto longitud se debe identificar con la clase de todas ellas: If,,fm, f,, fmi,f;, ...}; Igualmente, con algunas diferencias que en seguida comentaremos, en el caso de la temperatura.Una función métrica específica asigna al agua en ebullición el 100 y al agua en congelación el O; otra les asigna, respectivamente, 32 y 212; otra el 273,15 y el 373,15; etc. La primera es la escala Celsius, la segunda es la escala Fahrenheit, la tercera la escala Kelvin, y todavía hay otras, como la escala Rankine o la escala Réaumur. La extensión del concepto temperatura es pues el conjunto C f ~ , f i f , ~...,}. Podemos dar ahora una definición provisional de los conceptos métricos que metrizan un concepto comparativo previo, en la que se haga patente que la extensión del concepto comparativo no es una única función numérica sino una clase de ellas representacionalmente equivalentes. Insistimos en que ella sólo se refiere a los conceptos métricos introducidos a partir de conceptos comparativos previos y, como hemos advertido, no todos los conceptos métricos se introducen así; otros (la mayoría) se introducen a través de su relación con otros conceptos métricos en el contexto de una teoría científica. Por otro lado, la definición es reconocidamente insatisfactoria, no es tanto una definición en sentido estricto cuanto una caracterización provisional que deja numerosos aspectos por elucidar. Estos aspectos serán clarificados con detalle en el capítulo 6 ($3 y $5).
Un concepto funcional C es un concepto métrico para el dominio (no-vacío) de objetos D, que corresponde al concepto comparativo (para ese mismo dominio) cuya extensión es K v P, si y sólo si la extensión de C es un conjunto Cfi,h,... } de funciones tales que cadaf, cumple las condiciones h.11-M4 respecto de K u P. 1
1
Concluiremos con la presentación introductoria de las nociones de tipo de rransformación y tipo de escala, que nos permitirán una primera aclaración del sentido en el que las diferentes escalas para la misma magnitud son equivalentes. Como hemos advertido, en este estudio preliminar esta clarificación sólo puede ser parcial. Para realizarla de
modo plenamente satisfactorio hay que referirse a las condiciones empíricas que, si son satisfechas por la relación de comparación cualitativa K u P, hacen posible la existencia de funciones numéricas que cumplen MI-M4. Esta referencia se introducirá también en el capítulo 6 en el contexto de lo que denominaremos rnerriraciónficndameizral($3). Las diferentes escalas de una misma magnitud son equivalentes en el sentido siguiente: determinados valores numéricos se preservan en todas ellas. Tomemos las escalas para la masa. El valor absolirro asignado a cada objeto no se preserva en Ias diferentes escalas, una asigna a este libro el 0,4, otra el 400, etc. Pero sí se conserva otro valor, a saber, el cociente entre valores absolutos asignados a los objetos. El cociente entre los valores asignados al objeto del mencionado museo de París y a este libro es el mismo en todos los casos, se preserva bajo cambios de escala: 1/0,4 = 1.0001400 = 0,001/0,0004 = 2,210,88. Y lo mismo para cualquier otra escala de masa: si m, y mz son dos escalas cualesquiera para la masa sobre el mismo dominio, entonces para cualesquiera objetos x, y de1 dominio ocurre: rn,(x)/~n,(~) = ~ n ~ ( x ) l r n dLas ~ ) . escalas para la masa preservan las proporciones (razones, cocientes). Hay muchas otras magnitudes que se miden mediante escalas que tienen también estas características, por ejemplo la longitud (metros, centímetros, yardas, ...), o el tiempo-duración (segundos, horas, días, ...). A este tipo de escalas se las denomina 'escalas proporcionales' o 'escalas de razón', para connotar justamente que los cambios de escala preservan las proporciones o razones. Así, en general, si fp y gp son dos funciones numéricas para medir la propiedad P presente en los objetos de cierto dominio, o sea, dos escalas diferentes para la misma magnitud P, decimos que son escalas proporciolzales, o de razóit, si y sólo si para todo x, y se cumple: fp(x)lfp(y) = gp(x)lgp~). Nótese que aunque 'escaia proporcional' se diga de las escalas sueltas, sólo tiene sentido dicho de una escala en su relación con otras, como miembro de un grupo de escalas, pues decimos que una escala es proporcional cuando preserva cierto valor matemático (en este caso el cociente entre asignaciones), es decir, cuando dicho valor es el mismo para todas las escalas del grupo. En sentido estricto, por tanto, sería más adecuado decir, no que una escala es una escala proporcional, sino que ir11 grupo de escalas es un grupo de escalas proporcionales. Esto es, que la extensión de determinado concepto métrico (p.ej. masa) es un grupo de escalas proporcionales. La misma advertencia debe hacerse con respecto a los demás tipos de escala que se introduzcan a continuación. No todas las escalas que miden magnitudes son escalas proporcionales. Las escalas termométricas, por ejemplo, no lo son. No sólo, por ejemplo, las escalas Celsius y Fahrenheit asignan valores absolutos diferentes al agua en ebullición y al agua en congelación, sino que el cociente entre los valores asignados tampoco es el mismo: 0/100 en la escala Celsius, diferente de 321212 en la escala Fahrenheit. Por lo tanto, las escalas termométricas para la temperatura no preservan los cocientes entre valores asignados. Sin embargo también preservan algo, aunque más débil que las escalas proporcionales. En este caso lo que se preserva es el cociente entre irttel-valos o diferencias de valores asignados. Veámoslo. La escala Celsius, además de asignar el O al agua en congelación y el 100 al agua en ebullición, asigna 10 al agua del puerto de Barcelona a medianoche del 3 1 de diciembre de 1996 y 20 al agua de ese mismo lugar a mediodía del 1 de agosto de 1996. La escala Fahrenheit, además de asignar 32 y 212 a los primeros, asigna respectivamente 50 y 68 a los segundos. Pues bien, ahora los
valores asignados por cada escala resultan ser tales que el cociente entre las diferencias de pares de asignaciones es siempre el mismo: en el primer caso, grados CeIsius, la diferencia entre, p.ej., las asignaciones al agua en ebullición y al agua de Barcelona el 1 de agosto es 100-20, y la diferencia entre las otras dos asignaciones es 10-0; en el segundo caso, grados Fahrenheit, la primera diferencia es 212-68 y la segunda 50-32; como se ve (100-20)/(21268) = (10-0)/(50-32). Debe quedar claro que éste es un hecho general, no depende de cuáles sean 10s pares de objetos elegidos para cada diferencia, lo mismo valdría si los intervalos fuesen, por un lado, para el agua en ebullición y congelación y, por otro, para el agua de Barcelona el 1 de agosto y el 31 de diciembre: (100-0)/(212-32) = (20-10)/(68-50). A las escalas de este tipo se las denomina 'escalas de intervalos' o 'escalas de diferencias', para connotar que lo característico de ellas es que los cambios de escala preservan los cocientes entre los intervalos o diferencias de asignaciones. Así, en general, s i 6 y g ~ s o ndos funciones numéricas para medir la propiedad P presente en los objetos de cierto dominio, o sea, dos escalas diferentes para la misma magnitud P, decimos que son escalas de intervalos, o de diferencias, si y sólo si para todo x, y, z, w se cumple: IfP(x)-fPh)] 1 CfP(z)-fP(w)] = [gp(x)gpCY)I 1[gp(z) - gp(w)I. Es sencillo ver que cada tipo de escala se caracteriza por un modo específico de realizar los cambios de escala o, como se dice técnicamente, por un tipo de transformación. Una transformación es una función que nos permite pasar de una escala a otra, esto es, una función tal que al valor de cada objeto en una escala le asigna el valor del objeto en otra escala. Por ejemplo, para pasar en la masa de la escala-kilogramo (sistema MKS) a la escala-gramo (sistema cegesimal) se debe tomar el valor asignado por la primera y multiplicarlo por 1.000, la función transformación F(x) que permite pasar de una escala a otra es F(x) = 1.000.~;para pasar de kilogramos a toneladas se debe multiplicar por 0,001; para pasar de kilogramos a libras se debe multiplicar por 2,2; etc. A este tipo de transformaciones se las denomina 'transformaciones similares'. Una transformación similar es cualquier función F(x) sobre los reales de la forma F(x) = ax, con a E Rec. Así, si tengo una escala f para una maznitud, aplicarle una transformación similar es multiplicar cada valor de f por un mismo número real positivo a. O equivalentemente, si tenemos dos escalas, decimos que una es una transformación similar de la otra, o que están relacionadas mediante una transformación similar, si y sólo si los valores de una resultan de multiplicar los de la otra por una constante. Como hemos visto, las escalas de la masa están relacionadas mediante transformaciones similares, podemos pasar de una a cualquier otra multiplicando por cierto número. Con las escalas de la longitud ocurre lo mismo: para pasar de metros a centímetros multiplicamos por 100, para pasar a kilómetros multiplicamos por 0,001, para pasar a millas multiplicamos por 0,00054, etc. Y no sólo con la masa y la longitud. Como hemos anunciado, los tipos de transformación están asociados a los tipos de escala; por tanto, cualquier escala de un grupo de escalas proporcionales está relacionada con cualquier otra del grupo mediante una transformación similar: si la extensión de un concepto métrico es un grupo de escalas proporcionales, entonces si f y g son dos escalas proporcionales cualesquiera de dicho grupo, hay un real positivo a tal que para todo objeto x del dominio .Y(.Y)= afT.r). El motivo es claro, a saber, que son justamente las transformaciones similares
]as que preseman 10s cocientes de asicpaciones. Si f y g son dos escalas relacionadas mediante una transformación similar, e.e. tales que g(s) = r?f(x-)(a E Re+), entonces es inmediato que son escalas proporcionales, e.e. tales que para todo x, y,fi.x)/f(y) = ~ ( X ) / ~ O : ) , pues g(l-)/gb) = af(x)/afC,.)= fls)/Xy). Así, un tipo de escala, las escalas proporcionales, está asociado a un tipo de transformación, a las transformaciones similares. Las diferentes escalas proporcionales de una misma magnitud están relacionadas mediante transformaciones similares. Esto aclara en qué sentido las diferentes escalas de una misma magnitud, las diferentes funciones numéricas pertenecientes a la extensión de un concepto métrico, son equivalentes. Como el lector puede fácilmente comprobar, la relación "ser una transformación similar de" es una relación de equivalencia entre funciones numéricas, funciones que, por tanto, son "equivalentes" bajo ese tipo de transformación. Análogamente sucede con las escalas de intervalos. También ellas llevan asociado un tipo de transformación, sólo que ahora no se trata de transformaciones similares. El cambio de una escala termométrica a otra no consiste en general sólo en multiplicar las asignaciones de la primera por una constante. Por ejemplo, para pasar de grados Celsius a Fahrenheit hemos de multiplicar por 9/5 y sumar 32. A este tipo de transformaciones que consiste en multiplicar por una constante (positiva) y sumar otra se las denomina 'transformaciones lineales'. Una trurzsfol-inacióiz Ii?lenl es cualquier función F(x) sobre los reales de la forma F(x) = ax + b, con a E Re+y b E Re. Así, si tengo una escala f para una magnitud, aplicarle una transformación lineal es multiplicar cada valor de f por un mismo número real positivo a y sumarle otro real b. O equivalentemente, si tenemos dos escalas, decimos que una es una transformación lineal de otra, o que están relacionadas mediante una transformación lineal, si y sólo si los valores de una resultan de multiplicar los de la otra por un número real positivo y sumar a ese resultado otro número real. A veces a puede ser 1, por ejemplo para pasar de grados Celsius a Kelvin basta sumar 273,5 (e.e. "y multiplicar por 1"). Y por supuesto que, asimismo, a veces b puede ser 0, por ejemplo para pasar de grados Celsius a Réaumur basta multiplicar por 415 (e.e. "y sumar O ) , pero eso no debe hacer pensar que en este caso la escala entonces es proporcional. Recuérdese que las escalas no son proporcionales, o de intervalos, "a solas" sino "en grupost, y lo que importa por tanto es el tipo de transformación que las relaciona a todas ellas. Pues bien, así como las escalas proporcionales están relacionadas mediante transformaciones similares, es igualmente sencillo mostrar que el tipo de transformación que corresponde a las escalas de intervalos es el de las transformaciones lineales. Si f y g son dos escalas relacionadas mediante una transformación lineal, e.e. tales que g(x) = aJqx)+ b (a E Ret, b E Re), entonces es inmediato que son escalas de intervalos, e.e. tales que para todo x, =,w, Hx) -fi>l / Wz)-f(iv91 = [g(x>- gb)I 1 [Q(z) - g(\t9)l,pues [g(x-) - gO1)l/ [g(z) g(i.v)]= [ (afix) + b ) - (a&) + b)]/ [(uJ(z)+ b) - (af(1v)+ b)]= [a&) + b - a f i ) - b] / [aflz) + b - afliv) - b] = aV(x) / aRz) -JTw)l = H.Y)-jQ)/][f(z) -fltt3)I. Así, las diferentes escalas de intervalos de una misma magnitud son equivalentes en este sentido, están relacionadas mediante transfornlaciones lineales, siendo "ser una transformación lineal de" (al igual que "ser una transformación similar de") una relación de equivalencia. Las escalas proporcionales y de intervalos son las más usuales, pero no las únicas. Puesto que cada tipo de escala se define o caracteriza por un tipo de transformación, el -
-
)1
-m)]
CONCEPTOS CIENT~FICOS
12I
lector avisado habrá adivinado que hay tantos tipos de escala como tipos de transfonaciones. Cada tipo de escala se caracteriza por determinado valor que permanece constante tras los cambios de escala,f(x)l') en las proporcionales,f(x) -f(y)/f(z) -fTw) en las de intervalos. Estos valores permanecen constantes en cada caso porque en cada uno el cambio de escala es una transformación de un tipo específico, similar en el primero, lineal en el segundo. Entonces, otros tipos de transformaciones dejarán invariantes otros valores y caracterizarán por tanto otros tipos de escalas. En realidad hay tantos tipos de escalas como tipos posibles de transformaciones. Entre todos los tipos posibles sólo algunos son empíricamente interesantes, se corresponden con la medición en sistemas empíricos conocidos. Los tipos de escalas más interesantes, como hemos dicho, son el de las proporcionales y el de las de intervalos, pero algunos otros más inusuales son de aplicación en algunos ámbitos de las ciencias sociales y de la conducta. La referencia clásica sobre tipos de escalas y sus correspondientes transformaciones son los trabajos de Stevens (cf. especialmente 1946, 1951 y 1959). Presentamos a continuación los diferentes tipos de escalas a que se refiere Stevens, a los que añadimos algún otro que complementa los iniciales dz modo natural. Cada tipo de escala se identifica por su tipo de transformación o, alternativamente, por el valor que permanece invariante tras las transformación. Como dijimos más arriba, las dos primeras, a pesar de que las incluye explícitamente Stevens, no se pueden considerar propiamente escalas de medición, esto es, correspondientes a conceptos genuinamente métricos. Se trata simplemente de "escalas" correspondientes a conceptos sólo clasificatorios o sólo comparativos.
Escalas nominales. Tipo de transformación característica: cualquier función biyectiva. No preserva ningún valor matemáticamente significativo. Ejemplo: cualquier numeración, como la de los canales de televisión o la de los jugadores de un equipo de basket. Estas "escalas" son en realidad meras clasificaciones disfrazadas de asignaciones numéricas; los valores asignados a los objetos hacen 13s veces de meras marcas de las clases de equivalencia de la clasificación. Escalas ordinales. Tipo de transformación característica: cualquier función monótona creciente. No preserva ningún valor matemáticamente significativo. Sólo preserva el orden de las asignaciones: si f(x) entonces cualquier transformada g es tal que g (x) I gb). Ejemplo: escala de Mohs para la dureza, escalas para la inteligencia. Estas "escalas" son en realidad meras relaciones de comparación disfrazadas de asignaciones numéricas; los valores asignados a los objetos no tienen significado cuantitativo, hacen las veces de meras marcas que indican el orden de los objetos.
>m),
Escalas de intervalos o diferencias. Tipo de transformación característica: cualquier función de la forma F(x) = nr + b (a E Re+,b E Re), o sea, transformaciones lineales. Valor que preserva: A.r) -fi)lAz)-fTrt.). Ejemplo: temperatura termométrica. Escala de intervalos logarítrnicos. Tipo de transformación característica: cualquier función de la forma F(.x) = n.r (a, n E Re+), o sea, transformaciones exponencia-
les. Valor que preserva: log f(x) - log fO.)1 logf(z) - logfl~v).No hay ejemplos en las ciencias físicas pero, según Stevens, sí en las humanas y sociales (aunque este autor no es del todo claro en este punto y a veces parece referirse sólo a que hay leyes psicofísicas del tipo 4 = apn,cf. Stevens, 1959).
Escalas de iizrenlalos absolutos. Tipo de transformación característica: cualquier función de la forma F(x) = x + b ( b E Re), o sea, transformaciones lineales de coeficiente l . Valor que preserva: flx) -fb).Ejemplo: tiempo calendario (fechas en los diversos calendarios). Escalas proporcionales o de razón. Tipo de transformación característica: cualquier función de la forma F(x) = ax (a E Re+),o sea, transformaciones similares (esto es, transformaciones lineales de constante O, o transformaciones exponenciales de expoEjemplos: longitud, masa, duración. nente 1). Valor que preserva:f(x) la!). Escalas de proporciones logarítinicas. Tipo de transformación característica: cualquier función de la forma F(x) = x" ( n E Re-), o sea, transformaciones exponenciales de coeficiente 1. Valor que preserva: log flx) / 103 fCy). (Ejemplos: escalas "multiplicativas" de la masa, la longitud, la duración, etc.; cf. más adelante cap. 6, $3.) Escalas absolutas. Tipo de transformación característica: la función identidad F(x) = x. Valor que preserva:flx). Ejemplo: la probabilidad. Esta lista está presentada por orden de "fuerza" en tres niveles. Prescindiendo de las nominales y ordinales, demasiado débiles para ser consideradas propiamente escalas métricas, las escalas menos fuertes son las de intervalos y las de intervalos logarítmicos; después vienen las de intervalos absolutos, las proporcionales y las de proporciones logarítmicas; y por último las absolutas, el tipo más fuerte de todas. La fuerza de una escala depende del valor que preserva la transformación, de lo que permanece invariante tras los cambios de escala. Cuanto menor sea el número de objetos a que refiera el valor preservado, más fuerte es la escala y, como se ve, en las dos primeras se precisan cuatro objetos, en las tres segundas se precisan dos, y en la última sólo uno. Estos hechos son importantes pues la utilidad de una escala, el uso que se puede hacer de ella, depende de cuán fuerte sea. La idea es que si las escalas han de servir para expresar cuantitativamente determinados hechos relativos a los objetos medidos, entonces las afirmaciones que hacemos mediante ellas serán útiles o "significativas" sólo si tales afirmaciones preservan su valor veritativo tras los cambios de escala. Si determinada afirmación sobre las asignaciones no se preserva tras un cambio de escala, es decir, es verdadera en una escala pero falsa en otra, entonces es que no expresa información sólo de los objetos sino que depende de aspectos convencionales involucrados en la determinación de las escalas. Por ejemplo, si digo que en cierta escala el valor de un objeto x es un número r, y la escala en cuestión es proporcional, esa afirmación no se puede considerar significativa pues pasa a ser falsa cuando cambiamos de escala; esa afirmación sólo es
significativa si la escala es una escala absoluta. O si digo que en cierta escala el cociente entre las asignaciones a dos objetos x, y es un número r, y la escala en cuestión es de intervalos, esa afirmación no se puede considerar significativa pues pasa a ser falsa cuando cambiamos de escala; esa afirmación sólo es significativa si la escala es una escala proporcional. Esto es lo que se conoce como el problema de la significatividad, esto es, del uso empíricamente significativo que se puede hacer de los valores asignados por las escalas: ¿qué afirmaciones se pueden hacer con estos valores que expresen hechos objetivos y que por tanto no sean verdaderas en una escala pero falsas en otra escala que mide la misma propiedad? En el capítulo 6 trataremos en detalle esta y otras cuestiones que aquí han sido sólo apuntadas. Como allí se verá, el problema de la significatividad está relacionado con otro que hasta ahora apenas hemos mencionado, a saber, qué es lo que permite decir que diferentes escalas son escalas que miden la misma propiedad. Sabemos que si tenemos las diversas escalas que miden una propiedad, esto es, si tenemos la extensión del concepto métrico correspondiente, entonces podemos determinar de qué tipo de escalas se trata investigando cuál es el tipo de transformación que permite pasar de unas a otras. Pero la cuestión es cómo se determina ese conjunto de escalas, cómo se establece la extensión del concepto métrico. Para ello será imprescindible referirse a las condiciones empíricas que debe satisfacer un orden cualitativo para ser representado numéricamente. Tales condiciones son las que permiten establecer, mediante los llamados teoremas de representación, el conjunto de escalas para la propiedad, la extensión del concepto métrico.
En el capítulo anterior hemos examinado la estructura lógica de los conceptos científicos. Dijimos entonces que los conceptos son las unidades mínimas de significación, y efectivamente así es, pero hay que advertir inmediatamente que ese mínimo es, por así decir, demasiado poco. En la ciencia, como en el discurso ordinario, el lenguaje se usa primariamente para realizar aserciones (aseveraciones), para decir que ciertas cosas son de cierto modo. Para este uso los conceptos son esenciales, pero no bastan considerados aisladamente; los conceptos por sí solos no constituyen unidades asertivas. Las unidades aseverativas deben ser necesariamente complejas o articuladas, no hay aserción sin articulación, y la complejidad no es en general esencial a los conceptos. Es cierto que algunos conceptos son complejos (p.ej. bípedo irnplume), pero esta complejidad no es del tipo requerido para constituir aseveraciones. Las unidades aseverativas mínimas son las proposiciones o, en tirminos lingüísticos, los enzrnciados, entidades que sí son esencialmente complejas o articuladas. En el discurso científico, un tipo especialmente importante de unidades proposicionales son las leyes, que se pueden articular a su vez entre ellas conformando unidades más amplias, las teorías. Nuestro objetivo en este capítulo es analizar la estructura lógica. los tipos y la naturaleza de las leyes científicas. La siguiente relación contiene ejemplos representativos de los diversos tipos de leyes, y los diversos aspectos de las mismas, que vamos a tratar:
(1) Cualesquiera dos cuerpos se atraen con una fuerza directamente proporcional al producto de sus masas e inversamente proporcional al cuadrado de la distancia entre sus centros de masa. (2) Los planetas giran en órbitas elípticas, con el Sol en uno de los focos, barriendo áreas iguales en tiempos iguales. (3) Un grave en caída libre cerca de la superficie terrestre recorre en un intervalo temporal t una distancia d = 4.9t2. (4) En un péndulo en la superficie terrestre, la relación entre el período T y la longitud L es T = ~ n d ( ~ 91).. 8
Todo cuerpo sufre una aceleración igual al cociente entre la sucia de fuerzas a las que está sometido y su masa inercial. La probabilidad de que un electrón disparado contra una barrera de potencial la atraviese es de 0,1 y la de que se refleje es de 0,9. La probabilidad de que un átomo de radio permanezca estable después de 4800 años es 0,125. Para cada cantidad de gas, el cociente de la presión por el volumen entre la temperatura absoluta es constante. En condiciones normales, las piezas de fósforo se inflaman tras la fricción sobre superficies rugosas. Salvo mutaciones genéticas, al cruzar células homocigóticas, una con un par de genes recesivos y la otra con un par de genes dominantes, los individuos de la segunda generación tienen una probabilidad de 0,25 de exhibir los rasgos de los genes recesivos. El consumo continuado de tabaco aumenta la probabilidad de desarrollar cáncer de pulmón. La sensación de peligro produce, salvo factores inhibidores, un repentino incremento de la producción de adrenalina. Si una persona desea p , y cree que realizando cierta acción lo obtendrá, y si además la acción es posible y la persona así lo cree y no cree que hacer p se opone a nada que desee tanto o más que p, entonces (si nada interfiere) realizará la acción. El aumento de la oferta produce, a igualdad de los restantes factores, la disminución en el precio del producto. Las leyes científicas, del tipo de las ejemplificadas en esta lista, son unidades aseverativas mínimas del discurso científico, pero no son las únicas. Hay otras aseveraciones también mínimas (y en cierto sentido, que veremos en el capítulo 12 dedicado a la inducción, más básicas), a saber, los informes sobre acaecimientos particulares, p.ej. "el cometa Halley reapareció el 25 de diciembre de 1758", "0,002 gramos de este pedazo de uranio se desintegrarán antes del año 2025", o "acaba de bajar el precio de la gasolina". Presentar de este modo la contraposición entre los dos tipos de unidades aseverativas mínimas del discurso científico supone dar ya una primera caracterización implícita de las leyes. Las leyes son las unidades aseverativas mínimas que no son informes sobre acaecimientos particulares, esto es, las leyes son (un tipo de) aseveraciones generales, expresan regularidodes.
1.
Tipos de generalizaciones y de leyes
En este capítulo partiremos de esta primera caracterización según la cual las leyes son (o son expresadas por) aseveraciones generales. Esta caracterización, dominante. en la
LEY ES C~ENT~FICAS
127
literatura, presupone dos cosas, ambas cuestionadas por algunos autores. En primer lugar, presupone que las leyes son (o que son expresadas por) aseveraciones. Más adelante (cf. cap. 10) veremos que hay un modo menos enunciativo, más modelista, de entenderlas, pero incluso bajo esa interpretación las leyes mantienen algunos elementos aseverativos que son los que en este capitulo van a centrar nuestra atención. En segundo lugar. presupone que son afirmaciones generales, que expresan regularidades del tipo "todos los tal son cual", o "siempre que ocurre tal cosa ocurre tal otra". Esto excluye eventuaIes leyes e.xistenciales como "hay unidades mínimas de energía" o "hay al menos un agujero negro en el universo". Pero ello no es tan grave como en un primer momento puede parecer. Por un lado, casi todas las leyes aparentemente existenciales del primer tipo son en el fondo generales. Por otro, dista de ser claro que haya leyes genuinamente existenciales interesantes, esto es que no se obtengan como meras existencializaciones sobre hechos particulares. En cualquier caso, los ejemplos paradigmáticos de leyes son indudablemente generales. Así pues, aquí vamos a aceptar, al menos provisionalmente, estos dos supuestos. La mayoría de los aspectos de las leyes que vamos a presentar y discutir en este capítulo son en gran medida independientes de los mismos; cuando no lo sean se comentará explícitamente el sentido en que se ven afectados por estos supuestos. Antes de iniciar nuestro estudio propiamente dicho es necesario hacer algunas aclaraciones. En primer lugar, 10 que hemos aceptado no es que las leyes sean (o expresen) meras generalizaciones. Al decir que son aseveraciones generales queremos indicar que son nl menos eso, no que sean sólo eso. Esto es, la caracterización que hemos aceptado provisionalmente como punto de partida no supone que cualquier generalización sea una ley, lo cual es patentemente erróneo; lo que se ha aceptado es algo mucho más débil, a saber, que toda ley involucra al menos una aseveración general del tipo "todos los As son Bs". Parte de este capítulo va a estar destinado precisamente a elucidar la diferencia entre leyes y meras generalizaciones. La segunda aclaración tiene que ver con las cautelas contenidas en los párrafos anteriores. Hemos dicho que las leyes son, o son expresadas por, aseveraciones generales. La formulación alternativa se debe a la necesidad de distinguir entre las entidades lingüísticas (los enunciados mismos, o los actos aseverativos consistentes en proferir tales enunciados) y lo que las entidades lingüísticas expresan o significan (los hechos mismos o, si se prefiere, las proposiciones). Confundir ambos niveles es confundir uso y mención, esto es, no distinguir entre hablar de expresiones lingüísticas y hablar de lo que ellas expresan. En el caso de las leyes se puede defender tanto que ellas mismas son las aseveraciones o enunciados generales, como que son lo que las entidades lingüísticas expresan, las proposiciones (pero, claro está, no las dos cosas a la vez). Ambas alternativas son posibles, si se formulan con el suficiente cuidado. En el primer caso, cuando queramos hablar de las regularidades naturales deberemos decir que son lo expresado por las leyes, en el segundo caso que son las leyes mismas, aunque aquí son necesarias cautelas adicionales. Si bien es conveniente optar por una de las alternativas y atenerse a ella, aquí no vamos a ser muy estrictos en este punto. En general nos inclinamos por la segunda y, por tanto, tenderemos a usar 'ley' para las regularidades naturales mismas, y 'enunciado legal' (o 'enunciado de ley') para los enunciados generales que las expresan. Sin embargo, y siempre que el
contexto lo permita, en ocasiones mezclaremos ambas prácticas, o usaremos expresiones más indefinidas que refieran indistintamente a ambas entidades (p.ej. 'afirmación', que en sentido laxo puede referir tanto al enunciado como a su contenido, la proposición). Cuando la cuestión que se esté tratando exija una distinción clara, explicitaremos el sentido en que usamos el término y los extremos de la discusión que dependen de ello. La última aclaración se refiere al alcance de nuestro estudio. Hay un aspecto de las leyes que por lo general \'a a quedar al margen del tratamiento que vamos a hacer de ellas en este capítulo. Nos referimos a su carácter aproxintotii.~o idealizador. Las leyes, especialmente ]as cuantitativas, contienen diversas idealizaciones que hacen que sólo quepa esperar su aplicabilidad aproximada. Eso tiene la consecuencia de que, si exigimos una aplicación estricta, muchas (jtodas?) leyes aparecerán como, o bien vacuamente verdaderas, o bien "irremediablemente" falsas. Si, siendo totalmente estrictos, la propiedad A no se aplica a ningún individuo, entonces la afirmación "todos los A son B" es vacuamente verdadera por ser su antecedente siempre falso. Por ejemplo, la primera ley de Newton, o ley de la inercia, afirma que todos los cuerpos para los cuales la suma de fuerzas externas sea nula mantienen constante su velocidad, pero seguramente no hay ningún cuerpo que satisfaga el antecedente, con lo que la ley es vacuamente verdadera. La literatura ha prestado mucha atención a situaciones de este tipo (cf. p.ej. Tooley, 1977 y Armstrong, 1983), pero en ocasiones se le concede una importancia a nuestro juicio excesiva. Lo mismo sucede con la "necesaria" falsedad de las leyes cuando, si exigimos roral precisión, A se aplica pero B no. El fenómeno general de la aproximación en la ciencia, y sus límites de admisibilidad, requiere un tratamiento específico que no podenlos presentar aquí. En el capítulo 6 se hacen algunas consideraciones sobre el mismo en el contexto de la función de la medición, y en el capítulo 10 en relación con las afirmaciones empíricas de las teorías. En el presente capítulo sólo vamos a tratarlo en una versión muy específica del mismo, a saber, cuando está relacionado con las idealizaciones contenidas en las leyes con cláusulas cetel-isparibus (sección 4 ).
Hemos dicho que íbamos a partir de la caracterización usual según la cual las leyes son generalizaciones, aunque no cualesquiera generalizaciones sino generalizaciones de cierto tipo específico, a las que denominaremos gei~eraliracionesitómicas. El adjetivo 'nómico' proviene de la voz griega 'noilios', que se traduce por 'ley' (o 'norma', en contextos jurídicos). Decir que las leyes son generalizaciones nómicas, esto es generalizaciones "legales", no aclara por tanto nada por sí sólo. Lo primero que debemos hacer es establecer las características más generales que distinguen a estas generalizaciones de las oeneralizaciones de otros tipos. En esta sección estableceremos tales características muy superficialmente y de modo intuitivo, por contraposición con varios ejemplos de los otros tipos de generalizaciones. En la sección siguiente presentaremos de un modo más sistemático las peculiaridades de las generalizaciones nómicas, principalmente en relación con las regularidades meramente factuales. b
Hay cuatro tipos bisicos de regularidades: regularidades analíticas o conceptuales, regularidades nómicas o leyes, regularidades factuales o accidentales y regularidades epistémicas. La distinción entre ellas tiene que ver con la modalidad. Y la modalidad tiene a su vez que ver con las nociones de necesidad y posibilidad, se refiere al rnodo en que algo es verdadero o falso; si tomamos las leyes como enunciados, debemos decir que son verdaderas o falsas, si las consideramos como hechos, que ocurren o que no ocurren. Siguiendo también aquí la práctica anunciada más arriba, cuando no produzca confusión utilizaremos a menudo indistintamente 'verdadero' y 'que ocurre'. Pues bien, hay afirmaciones verdaderas que son izecesariarnente verdaderas, mientras que otras son verdaderas pero podrían ser falsas; o en término de hechos, hay hechos que ocurren necesarinmertte y otros que ocurren pero podríarz no haber ocurrido. Esto se aplica también a las generalizaciones, esto es a los "hechos" generales del tipo "Todos los A son B . Hay generalizaciones verdaderas que son necesariamente verdaderas, mientras que otras también verdaderas podría~zser falsas. Necesidad y posibilidad son conceptos duales: algo es posible si y sólo si su negación no es necesaria, y viceversa. Por otro lado, la necesidad implica la posibilidad, todo lo necesario es posible; pero no a la inversa, la mayoría de las cosas posibles no son además necesarias, son sólo posibles. Por último, cuando algo es verdadero pero no es necesariamente verdadero decimos que es contingente. Como diría Aristóteles, la necesidad se dice de muchas maneras. El término 'necesario' tiene varios sentidos y cada uno de ellos determina un tipo de modalidad. La diferencia entre los cuatro tipos de regularidades tiene que ver con las diversas nociones modales, con los diversos sentidos de 'necesario' y 'posible' involucrados. Cada modalidad es relativa a un cierto "sistema" o "marco" que se considera fijado: fijadas tales y cuales cosas, algo es necesario/posible relativamente a ese marco si y sólo si su negación es inconsistente/consistente con las cosas que se han fijado. Así, los diversos marcos que fijemos determinan los diversos tipos de modalidad. En el presente contexto nos interesan especialmente tres tipos de cosas que podemos fijar, las correspondientes a las modalidades conceptual, nómica y epistémica. Aquí atenderemos especialmente a las dos primeras (la modalidad epistémica, que mencionaremos muy brevemente, presenta problemas específicos que no conviene abordar ahora). Como el lector advertirá inmediatamente, la distinción entre necesidad conceptual y necesidad nómica presupone la distinción analíticohintético, esto es, la distinción entre verdades en virtud del significado y verdades ernpíricns. Esta distinción tradicional ha sido cuestionada en el presente siglo por algunos filósofos, principalmente Quine en su famoso artículo "Dos dogmas del empirismo" (1951). No vamos a detenemos aquí en estas objeciones. Nuestra finalidad ahora es puramente introductoria y la exposición que hacemos de ésta y otras distinciones es preteórica, no prejuzga ulteriores análisis filosóficos sustantivos de Ias mismas. La modalidad conceptual, o analítica, se deriva de tomar como fijos nuestros conceptos o, equivalentemente, los significados del lenguaje. Algo verdadero es conceprlrnlrnente necesario (en breve: 'C-necesariamente verdadero') si y sólo si su nesación es inconsistente con nuestros conceptos. esto es, si no hay modo de concebir su falsedad sin contradicción; o en términos de significados: algo es C-necesariamente verdadero si y sólo si, manteniendo fijo el significado que tienen las palabras, no hay modo de describir
coherentemente una situación en que eso sea falso. (Esta caracterización presupone las nociones lógicas de consiste~tcia,no contradicció~lo coherencia, esto es, presupone la noción de necesidad Iógica, que consideramos aproblemática en el presente contexto.) Hay muchas verdades que son C-necesarias, y muchas de ellas sc,n "generales". involucran regularidades. La siguiente lista contiene algunas regularidades que inmediatamente se ve que son C-necesarias, otras que inmediatamente se ve que no lo son, y alguna otra (20) sobre la que no sabríamos quizá qué decir sin una inspección mucho más detenida. Los animales racionales son animales. Los solteros no están casados. Los hermanos tienen los mismos progenitores. Las superficies verdes son coloreadas. Ninguna superficie es a la vez totalmente blanca y totalmente negra. Nadie es su propio ancestro. Todos los metales se expanden al calentarlos. Todos los cuerpos cargados eléctricamente con cargas del mismo signo se repelen con una fuerza proporcional al producto de sus cargas. Nadie puede levantarse tirándose de los cordones de los zapatos. (15)-(19) son claramente C-necesarias, no se puede concebir coherentemente su negación, no podemos describir una situación en la que sean falsas. Quizá se piense que sí. Por ejemplo, si 'verde' significase "caliente", entonces (1 8) no sería C-necesaria, pues podemos describir una situación en la que una superficie caliente es incolora. Pero eso es hacer trampa, pues se están cambiando los significados de las palabras. Como muestra la explicación, lo que es entonces C-posible es que una superficie caliente sea incolora, no que una verde sea incolora. Una cosa es describir coherentemente una situación en la que las palabras significan otras cosas y el enunciado 'las superficies verdes son coloreadas' sea con esos otros signifícados falso, y otra muy diferente describir coherentemente una situación en la que ese enunciado con los sig,zificados usuales sea falso, esto es, en la que no ocurra que las superficies verdes son coloreadas. Lo primero es posible, lo segundo, que es de lo que se trataba, no, Análogamente con (19)' si se cree que es C-posible que sea falsa es porque se da otros significados a 'blanco' y 'negro'; se puede pretender, por ejemplo, que una superficie totalmente gris es a la vez totalmente blanca y totalmente negra, pero ese no es el significado usual. Por otro lado, es claro que (21)-(23), aunque verdaderas, no son C-necesarias. Podemos describir coherentemente una situación en la que un metal no se dilate al calentarse, o en la que dos cuerpos cargados positivamente se repelan con una fuerza proporcional al producto del cuadrado de sus masas. Y lo podemos hacer sin cambiar el significado de nuestras palabras, basta con idear un mundo con otras leyes físicas (la buena literatura de ciencia ficción, e.e. la que no describe situaciones contradjctorias, contiene numerosas descripciones de este tipo). Sin embargo, aunque (21)-(23) no son C-necesarias, son necesarias en algúlz sentido. Aquí es cuando interviene la modalidad física o ~zómica.La
modalidad nómica se deriva de tomar como fijas, además de nuestros conceptos, las leyes naturales. Algo verdadero es nómicamente necesario (en breve: 'N-necesariamente verdadero') si y sólo si su negación contradice las actuales leyes naturales, esto es, si no hay modo de describir (teniendo las palabras sus significados usuales) una situación en la que sea falso y sigan cumpliéndose las leyes naturales que de hecho rigen en la naturaleza. Según esta caracterización (y presuponiendo, por mor de los ejemplos, la validez de las leyes naturales que hoy creemos conocer), es claro que, además de (21)-(23), (24) y (25) son regularidades N-necesarias y que (26)-(30) no lo son. (24) (25) (26) (27) (28) (29) (30)
Ningún varón se queda embarazado. Todas las esferas de uranio tienen menos de 1 km de radio. Todas las esferas de oro tienen menos de 1 km de radio. Todos los bípedos implumes son humanos. Todos los cuervos son negros. Todas las cebras son rayadas. Todas las monedas del bolsillo derecho de los pantalones de Quine en Nochevieja de 1990 son doradas.
Tomando como ejemplos paradigmáticos (25) y (26), es inmediato por qué aunque ambas regularidades son verdaderas, la primera es N-necesaria y la segunda no: (25) es implicada por las leyes físicas, (26) no. La existencia de una esfera de uranio de tal tamaño es incompatible con las leyes físicas sobre la estabilidad límite del uranio, mientras que en el caso del oro, aunque de hecho tampoco haya ninguna esfera así, el que la hubiera no violaría ninguna ley física. Análogamente con (30): que, aunque de hecho no la tuvo, Quine tuviera una moneda no dorada en su bolsillo en dicha fecha no parece violar ninguna ley natural. Con (28) y (29) no es quizá tan inmediato, pero un poco de reflexión muestra que tampoco son N-necesarias. Por lo que hoy sabemos, las leyes naturales son compatibles con la existencia de cuervos no negros. Por ejemplo, tales leyes no parecen excluir que algunos cuervos pudieran haber emjgrado a zonas árticas y, tras un tiempo y como resultado de la selección, haber desarrollado plumaje blanco, sin dejar por ello de ser cuervos. A las regularidades que aun siendo verdaderas no son N-necesarias se las denomina regularidades fácticas o accidentales. La primera expresión, si se interpreta sugiriendo sólo que estas regularidades son "hechos", es engañosa pues las regularidades nómicas también son hechos. Por 'fáctico' se debe entender aquí "meramente ocurrente", esto es, que ocurren como cuestión de hecho pero no de derecho, que ocurren pero N-podrían no ocurrir. Eso es lo que connota 'accidental'. Ambas expresiones son pues sinónimas de 'N-contingente'. Nótese que la distinción entre regularidades accidentales y nómicas sólo discrimina regularidades si no todo hecho general está cargado de necesidad física, esto es, si el mundo no es determinista (en uno de los sentidos de 'determinismo', pues según otro sentido hay regularidades nómicamente necesarias indeterministas, las leyes probahilistas, cf. sobre esto más adelante sección 5). En caso contrario no habría propiamente regularidades N-contingentes, todas las regularidades verdaderas, todos los estados de
cosas generales "que ocurren", serían físicamente necesarios. Hasta el que las monedas del bolsillo de Quine en tal fecha sean doradas sería N-necesario, pues en un mundo deteminista (en esta acepción) todo lo es. Eso no quiere decir que la distinción sea incorrecta, pues ella es independiente de lo que ocurra de heclzo en última instancia con el deteminismo. La distinción distingue dos conceptos realmente diferentes, sólo que si el mundo resulta ser determinista uno de esos conceptos, el de regularidad accidental, n o se aplicaría a nada: las que ahora nos parecen regularidades accidentales serían simplemente aquellas regularidades nómicas acerca de cuyas leyes no tenemos la menor idea ni siquiera de que existan. La modalidad epistémica, de la que no hemos dicho nada hasta ahora, tiene que ver con casos como (28) y (29). En la modalidad epistémica se consideran fijadas las regularidades que constituyen nuestro acceso epistémico usual a cierto ámbito. Así, aunque la esencia de los cuervos no implique la negrura de su plumaje, esa regularidad no Al-necesaria interviene esencialmente en el modo como típicamente reconocemos a los cuervos. En ese sentido, episré~nico,(28) es "necesario". Pero se trata de una "necesidad" claramente antropomórfica, no está "en la naturaleza" (la prueba es que N-puede haber cuervos blancos) sino en nuestro modo de acceder a ella. Sólo está en la naturaleza en el sentido en que nuestro conocimiento es también un fenómeno natural. Hay otras modalidades antropomórficas. Por ejemplo la deóntica, que queda determinada al fijar las regularidades o normas morales. También en ese sentido hay cosas "necesarias", cosas que deben ocurrir en el sentido de que se deben lzacer; por ejemplo, si fuese una norma moral no acumular determinada cantidad de oro, (26) sería deónticamente necesario. Como se apreciará, estas modalidades no implican que la regularidad sea verdadera. por lo q u e para algunos es mejor no hablar en estos casos de ~zecesidad;se trataría s610 de modalidad "aparente", de lo que puede o no puede ocurrir en el sentido sólo de que es compatible con nuestras creencias (modalidad epistérnica), o con nuestras leyes moraIes (modalidad deóntica). Esta cuestión, que afecta a cualquier modalidad antropomórfica, es en parte nominal y no vamos a discutirla aquí; bastará admitir que en la llamada modalidad epistémica el uso de 'necesario' es al menos tan legítimo (o ilegítimo) como su uso en la modalidad deóntica. De momento no vamos a abundar más en la modalidad epistémica. Nos interesaba sobre todo la modalidad nómica, su diferencia con la conceptual y su contraposición con la accidentalidad o mera facticidad. Las leyes son las regularidades verdaderas nó~nicaiíteitre itecesarias. Nótese que esto no constituye un análisis del concepto de ley mediante el de necesidad nómica, pues hemos definido la modalidad nómica en términos de las leyes naturales. No pretendíamos aquí analizar el concepto de ley, sino tan sólo mostrar que dicho concepto involucra cieno tipo de necesidad y contrastar intuitivamente el tipo de modalidad propio de las leyes con otras modalidades, especialmente la conceptual, y con las regularidades nómicamente contingentes, accidentales. Antes de abandonar esta primera aproximación intuitiva conviene mencionar una consecuencia relativamente extraña que se sigue de la caracterización que hemos hecho. Si las regularidades nómicas son aquellas cuya falsedad queda excluida por las leyes naturales, entonces (31) y (32) son regularidades nómicas.
LEYES CIENTIFICAS
( 3 1)
133
Todos los metales negros se expanden al calentarse.
(32) Ningún varón que toma píldoras anticonceptivas se queda embarazado. Estas re~ularidadesson verdaderas y no son en absoluto accidentales. Las leyes de la física son incompatibles con que un metal negro no se expanda a1 calentarse, y las de la biología con que un varón que toma píldoras se quede embarazado. Se trata pues de regularidades con el tipo de necesidad que caracteriza a las regularidades nómicas, y sin embargo parece que en algún sentido no son leyes del todo genuinas. El motivo, en términos intuitivos, es que contienen elementos nómicnmente irrelevnntes, pero es extremadamente difícil dar una caracterización precisa de esa irrelevancia. Parece en principio que estas regularidadzs se caracterizan por ser derivadas o implicadas por otras leyes más simples (en estos casos, (21) y (24) respectivamente). Esas otras leyes son mAs fuertes, pues no vale la implicación inversa, y por tanto las más débiles resultarían prescindibles. Pero esta estrategia para distinguir regularidades nómicas de leyes genuinas no funciona. La ciencia está repleta dz leyes implicadas por otras y que en absoluto contienen elementos irrelevantes. En realidad los casos de irrelevancia parcial no son más que casos particulares de un fenómeno general dzrivado del hecho de que la necesidad nómica se preserva bajo la implicación lógica: si u es N-necesaria y P es consecuencia lógica de a, entonces j3 tambiin es N-necesaria. Por tanto, si "Todos los A son B" es una regulariada nómica, también lo es "Todos los A y C son B", sea lo que sea C. En algunos casos, como (31) y (32), C es nóniicaments irrelevante, pero en otros quizá no. Por ejemplo, "Todos los C son B" puede ser también una ley, en cuyo caso "Todos los A y C son B" no contiene elementos nómicamente irrelevantes sino nótnicanzer~teredundnrztes. Puesto que el origen es el mismo, a saber, la clausura de la nomicidad bajo implicación lógica, no parece que se deban tratar de modo diferente los casos de irrelevancia y los de redundancia. O cualquier otro caso debido al mismo fenómeno, como los disyuntivos: si "Todos los A son B" y "Todos 10s C son D" son leyes, entonces la generalización "Todos los A o C son B o D" es nómicamente necesaria. Esto suscita el problema general de la conveniencia o no de distinzuir entre leyes y generalizaciones nómicac: las leyes serían aquellas generalizaciones nómicas que cumplen además cierta; condiciones adicionales. En tal caso, aunque toda consecuencia general de una ley es por definición una regularidad nómica, no toda consecuencia general de una ley sería otra ley; la legalidcrcl no se preservaría bajo la consecuencia lógica, o como se dice a veces. el operador 'es un ley ...' no es veritativo-funcional, no se preserva bajo relaciones de implicación lógica (cf. p.ej. Fodor, 1974). Esta es una cuestión todavía abierta y que no vamos a tratar aquí en detalle. Algunos aspectos de la misma surgirán más adelante en este mismo capítulo y en otros posteriores, como el dedicado a la explicación. En general, y salvo advertencia en contrario, seguirenios identificando leyes y regularidades nómicas. Mientras que la presunta diferencia entre leyes y resularidades nómicas es discutible, la diferencia entre regularidades nómicas (o leyes) y regularidades accidentales no lo es, no requiere discusión sino elucidación. De ella nos ocuparemos en la próxima sección. Concluiremos ésta presentando 10s principales tipos de leyes que se van a tratar en el resto de este capítulo y en otras partes de la obra.
134
1.3.
R-ND.%SIE\TOS DE R L O S O F ~ DE LA CIENCIA
TIPOSDELEYES
Hay varias tipologías de las leyes, dependiendo de los criterios que se usen para su clasificación. Una posibilidad es distinguirlas por la relación temporal entrz los estados del sistema. Un sistema (p.ej. un gas, un péndulo, unas bolas de billar) es un complejo de entidades que se pueden relacionar de diversos modos. Cada uno de esos modos es un estado posible del sistema y las leyes restringen las relaciones entre los posibles estados (sobre la noción técnica de estado, cf. cap. 10, $4.3). De todas las relaciones conceptualmente posibles, sólo algunas de ellas, las permitidas por las leyes, son nómicamente posibles. Si las restricciones que impone una ley se refieren a estados temporalmente simultáneos, se trata de una ley de coexistencia. si se refieren a la sucesión o transición entre estados, de una ley de sucesión. Son leyes de coexistencia, p.ej., la ley de Boyle "(P x V)/T= cte." o la del péndulo "T = 2xd(~9,81)".Las leyes (cuantitativas) de coexistencia establecen una relación entre los valores siinultáneos de las diversas magnitudes involucradas. Así, la ley de Boyle establece que, de todos los tríos de valores lógicamente posibles (siendo p, v y t, respectivamente, valores específicos de la presión, el volumen y la temperatura) sólo aquellos en los que O, x v)/t es cierta constante (que depende de la cantidad y naturaleza del gas) son físicamente posibles. Contra lo que en principio podría parecer, también en las leyes de coexistencia tiene sentido hablar de las "condiciones antecedentes" y del "resultado-consecuente": las primeras son los valores en determinado momento de todas las magnitudes menos una, y el segundo es el valor de dicha magnitud. Las leyes (cuantitativas) de sucesión establecen las relaciones que deben darse entre dos estados sucesivos para que uno pueda transformarse en el otro. Son Ieyes típicas de sucesión las diversas leyes que establecen el incremento en una magnitud como efecto de la variación de otras (el de longitud de una vara metálica por variación de la temperatura, el de la temperatura de una sustancia por efecto del calor, el de la velocidad de un móvil por efecto de una fuerza, etc.) o los diversos principios de conservación (del momento lineal, de la energía cinética, etc.). Por ejemplo, en los choques elásticos los estados del sistema se determinan por la masa y la velocidad de cada partícula, esto es, son tétradas cml, m., vi, v2>, y el principio o ley de conservación del momento lineal establece que, para que un estado x =