294 29 11MB
Spanish Pages [417]
MÉTODOS DE ENCUESTA TEORÍA Y PRÁCTICA, ERRORES Y MEJORA
M.a Ángeles Cea D ’Ancona
U n iv e r s id a d ALBERTO HURTADO B IB L IO T E C A
EDITORIAL
SINTESIS
© EDITORIAL SÍNTESIS, S. A. Vallehermoso, 34 - 28015 Madrid Teléf.: 91 593 20 98 http: //www.sintesis.com Depósito Legal: M. 42.101.2004 ISBN: 84-9756-250-X Impreso en España - Printed in Spain
A mis hijos Irene y Adrián por su paciencia y beneplácito
ÍNDICE
INTRODUCCIÓN
11
CAPÍTULO 1: LA ENCUESTA COMO ESTRATEGIA DE INVESTIGACIÓN SOCIAL 1.1. 1.2. 1.3. 1.4. 1.5.
Orígenes de la encuesta............................................................................ Características esenciales de la encuesta: sus posibilidades y límites........ Articulación de la encuesta con otras estrategias de investigación............ Fases de la encuesta................................................................................. Errores en la aplicación de la encuesta .................................................... 1.5.1. Errores de “no observación” .......................................................... 1.5.2. Errores de observación o de medición............................................ Lecturas complementarias .............................................................................. Ejercicios propuestos......................................................................................
13 28 30 33 40 41 43 45 46
CAPÍTULO 2: LA ELECCIÓN DEL MÉTODO DE ENCUESTA: SU EFECTO DIFERENCIAL EN LOS ERRORES DE ENCUESTA 2.1. Encuesta cara a cara ................................................................................ 2.2. Encuesta telefónica.................................................................................. 2.3. Encuesta autoadministrada...................................................................... 2.4. Combinación de métodos de encuesta ..................................................... Lecturas complementarias .............................................................................. Ejercicios propuestos......................................................................................
51 64 80 93 99 99
CAPÍTULO 3: EL DISEÑO DE LA MUESTRA 3.1. 3.2. 3.3. 3.4.
Delimitación del universo de estudio ............................................................ La elección del marco muestra! y su repercusión en el error de no cobertura ... El tamaño de la muestra................................................................................ La selección de las unidades de la muestra: métodos de muestreo probabilísticos y no probabilísticos ................................................................ 3.4.1. Muestreo aleatorio simple .................................................................... 3.4.2. Muestreo aleatorio sistemático ............................................................ 3.4.3. Muestreo aleatorio estratificado .......................................................... 3.4.4. Muestreo aleatorio por conglomerados ............................................... 3.4.5. Muestreo de áreas y rutas aleatorias .................................................... 3.4.6. Métodos de selección de individuos en una misma vivienda................ 3.4.7. Muestreo por cuotas............................................................................. 3.4.8. La aplicación de otros muestreos no probabilísticos en la investigación mediante encuesta................................................................................ 3.4.9. La especificidad de la encuesta telefónica ............................................ 3.5. El error muestral, uno de los integrantes del error total de encuesta............. Lecturas complementarias .................................................................................... Ejercicios propuestos ............................................................................................
102 105 115 124 125 130 132 140 149 158 165 170 173 177 187 188
CAPÍTULO 4: EL DISEÑO DEL CUESTIONARIO 4.1. De los conceptos teóricos a los indicadores empíricos:el error de especificación 4.2. La formulación de las preguntas: sus efectos en el error de medición........... 4.2.1. Recomendaciones para la redacción de las preguntas .......................... 4.2.2. El formato de la pregunta: abierto versus cerrado................................ 4.2.3. La especificidad de la medición de actitudes........................................ 4.3. La ubicación de las preguntas en el cuestionario.......................................... 4.4. La presentación del cuestionario .................................................................. 4.5. La prueba del cuestionario y su redacción final............................................ Lecturas complementarias ................................................. .................................. Ejercicios propuestos............................................................................................
192 208 218 241 262 280 286 298 307 307
CAPÍTULO 5: LA ADMINISTRACIÓN DEL CUESTIONARIO 5.1. La contribución del entrevistador a los errores de encuesta.......................... 5.1.1. Características sociodemográficas ........................................................ 5.1.2. Factores psicológicos............................................................................ 5.1.3. Actuación inadecuada del entrevistador ............................................. 5.2. La supervisión del trabajo de campo............................................................ 5.2.1. Revisión de los cuestionarios................................................................ 5.2.2. Verificación de los cuestionarios.......................................................... 5.2.3. Observación del desarrollo de la entrevista.......................................... 5.3. La no respuesta ....................... ................................. .................................... 5.3.1. Factores que inciden en la participación en la encuesta....................... 5.3.2. La reducción del error de no respuesta ................................................
309 311 315 316 335 337 338 339 341 348 356
5.3.2.1. Actuaciones preventivas para la reducción de la tasa de no respuesta........................................................................ 5.3.2.2. Ajustes estadísticos de la no respuesta: la ponderación y la imputación........................................................................ Lecturas complementarias .................................................................................... Ejercicios propuestos............................................................................................
358 372 385 386
CAPÍTULO 6: EL TRATAMIENTO DE LA INFORMACIÓN 6.1. La preparación de los datos para su análisis.................................................. 6.1.1. Edición de los cuestionarios ................................................................ 6.1.2. Codificación de las respuestas.............................................................. 6.1.3. Grabación de los datos ......................................................................... 6.2. El análisis de los datos de encuesta............................................................... 6.2.1. La exploración univariable .................................................................. 6.2.2. La elaboración de tablas ..................................................................... 6.2.3. Opciones analíticas multivariables....................................................... 6.3. La calidad de los datos de encuesta y su evaluación..................................... 6.3.1. La validez de los datos de encuesta ...................................................... 6.3.2. La comprobación de su fiabilidad........................................................ 6.4. La redacción del informe de los resultados de la encuesta ............................. Lecturas complementarias .................................................................................... Ejercicios propuestos ............................................................................................
389 391 393 394 398 399 406 414 423 423 441 449 454 455
ANEXO. Tabla de números aleatorios ........................................................................
461
BIBLIOGRAFÍA.........................................................................................................
465
INTRODUCCIÓN
Hoy día son pocas las personas que no saben qué es una encuesta, aunque sea de for ma aproximada. La televisión, la radio y la prensa suelen hacerse eco de las encuestas que despiertan su interés, ya sea por su temática, su ámbito de ejecución o por sus ha llazgos sorprendentes. En las citas electorales es cuando las encuestas adquieren un es pecial protagonismo y, también, cuando más se pone en cuestión la metodología de és tas, sobre todo, si yerran en el pronóstico electoral. Entonces se suceden los debates sobre las encuestas, se indaga en las causas de sus “fallos”, se destacan las buenas y las malas prácticas de encuesta y aumenta el escepticismo hacia ellas, haciéndose común el comentario “las encuestas siempre fallan”. Pero, ¿por qué fallan?, ¿cuáles son los errores?, ¿cómo superarlos? Éstas son las cuestiones más generales que han espoleado esta monografía. Ciertamente, del título y del índice del libro el lector ya habrá vislumbrado su con tenido. No trata de la encuesta en singular, sino de los métodos de encuesta en plural. De sus especificidades, coincidencias y complementariedades. Es un libro ambicioso, más extenso de lo inicialmente programado, por el deseo de ofrecer una visión pa norámica y pormenorizada de la metodología de encuesta, en cada una de sus fases, y especificando por método de encuesta. El libro está estructurado en seis capítulos, de extensión dispar, en función de la complejidad de los contenidos temáticos que se abordan. Los dos primeros tienen un carácter más genérico. El capítulo 1 presenta la encuesta como estrategia de investi gación social fundamental en la metodología cuantitativa. Si bien, precisa de un uso ar ticulado con otras estrategias de investigación. Se describe la génesis y el desarrollo de la encuesta, sus potencialidades y límites, destacándose los distintos errores que de terioran su calidad y la consiguiente significatividad de la información que aporta.
La elección del método de encuesta a aplicar tiene un efecto diferencial en los erro res de encuesta. De ello se habla en el capítulo 2. En él se destacan las ventajas y los inconvenientes de cada método, su empleo combinado, cómo pueden resolverse sus de bilidades y la aportación de los avances tecnológicos en la reducción de los distintos errores de encuesta, aparte de reducir sus costes económicos y temporales. Los cuatro capítulos siguientes abordan aspectos concretos en la ejecución de la encuesta, desde sus preámbulos hasta la redacción del informe, con el que se concluye su realización. Todas las fases de la encuesta son decisivas en su desarrollo y no están exentas de errores, que pueden empañar los esfuerzos realizados en estadios precedentes y poste riores. Para comprender mejor su incidencia y qué los origina, los errores de encuesta se analizan en la fase en que aparecen. Los errores de no cobertura y de muestreo, en el ca pítulo 3, dedicado al diseño de la muestra. Allí se insiste en la concepción del error total de encuesta. Los errores de especificación (debidos a la no correspondencia de la pregunta con los objetivos de la encuesta) y de medición (ocasionados por la redacción de la pre gunta, sus opciones de respuesta, su ubicación en el cuestionario) en el capítulo 4. El capítulo 5 trata de la contribución del entrevistador a los diversos errores de en cuesta; de cómo pueden solventarse con una adecuada selección, formación y super visión de los entrevistadores. Se hace mención específica al error de no respuesta, en los distintos métodos de encuesta, y a las diferentes actuaciones preventivas y paliativas de dicho error. El capítulo 6 se ocupa de los errores de medición debidos al tratamiento de la in formación. Además, ofrece una visión genérica de posibilidades analíticas con datos de encuesta. Concluye con el análisis conjunto de los distintos errores de encuesta y su incidencia en la calidad. Sin duda, esta calidad depende, también, de los recursos (eco nómicos, materiales y humanos) con los que se cuente. Aquí nos ocupamos de los as pectos más técnicos de la calidad de la encuesta, relacionados con el diseño y su eje cución. Por ello, en cada fase se destaca la teoría (qué debe hacerse), la práctica (qué se hace), los errores que surgen por actuaciones “impropias”, en cada método, y recomendaciones para su mejora. Cada capítulo concluye con una selección de referencias bibliográficas, a modo de lecturas complementarias, y una propuesta de ejercicios. Con su realización puede com probarse si realmente se han asimilado los contenidos esenciales del capítulo. Para ayudar a la comprensión de los contenidos teóricos, éstos se acompañan de ejemplos ilustrativos y de referencias a estudios teóricos y empíricos. La intención úl tima es contribuir a un mejor conocimiento de las debilidades de los distintos métodos de encuesta y los modos de prevenirlas.
LA ENCUESTA vCOMO ESTRATEGIA DE INVESTIGACIÓN SOCIAL
En la metodología cuantitativa, la encuesta continúa siendo la estrategia más popular en la investigación social. A ello contribuyen sus amplias posibilidades para la ob tención de información, diversa, de un conjunto amplio de la población. Pero la cali dad y la consiguiente significatividad de los datos de encuesta están supeditadas al ri gor aplicado en su diseño y ejecución, al control de los distintos errores que puedan darse en su realización. A la descripción pormenorizada de cada una de las fuentes de error en la encuesta, y su resolución propia, se dedican los capítulos siguientes. Este primer capítulo quie re, en cambio, ofrecer una visión general de la encuesta, que ayude en la contextualización de los posteriores. La calidad de la encuesta ha de comprobarse no de forma aislada, sino mediante la conjunción de cada una de sus partes. Por ello, este texto co mienza con una presentación genérica de la encuesta para después proceder al deta lle, por separado, de sus integrantes. En su presentación no puede faltar una breve des cripción de sus orígenes, ni de las características que la diferencian de las demás estrategias de investigación social.
1.1. Orígenes de la encuesta La necesidad de recabar información de la población se remonta a los orígenes de la civilización. Los primeros recuentos “censales” datan de los tiempos del emperador Yao en China y, con posterioridad, de las civilizaciones asiría, egipcia, griega y roma na. Su finalidad era esencialmente tributaria y militar. El conocer los recursos huma nos y económicos de los que se disponía, con fines bélicos y de fiscalidad. Pero no es
hasta el siglo x v i i cuando estas “cuantificaciones” adquieren carácter científico, gra cias a los avances en el campo de la estadística. En especial, al desarrollo de la teoría de la probabilidad (por Galilei, Fermat, Pascal o Bernoulli); y a la aportación de dos escuelas estadísticas principales: los aritméticos políticos ingleses (Graunt, Petty, Davenant, King, Halley) y la escuela estadística alemana (Seckendorff, Conring, Achenwall). Movidos por el deseo de aplicar modelos estadísticos al conocimiento de la rea lidad social. En el siglo x v i i i aparecen las primeras investigaciones sociales empíricas, de la mano de los llamados reformadores sociales. Un conjunto de profesionales de distintas áreas de conocimiento (médicos, ingenieros, naturistas), unidos por un mismo propósito: aportar evidencia empírica de los problemas sociales de su época, consiguientes al de sarrollo de la Revolución Industrial y al rápido crecimiento de las ciudades. Su finalidad era eminentemente política: movilizar a la opinión pública para exigir medidas concretas de reforma social. De ahí su denominación de “reformadores sociales”. La recogida de información a través de parroquias y de las inspecciones fiscales, que hasta entonces había imperado, ahora se muestra insuficiente. Con la Revolución Industrial las parroquias dejaron de existir como unidades administrativas y comien za a promoverse la realización de encuestas sociales, desde distintas sociedades esta dísticas que fueron creándose en varios estados europeos. Principalmente, en Ingla terra, Francia y Alemania. Se pedía la cumplimentación de un cuestionario “estandarizado”, más sobre aspectos objetivos (o de hechos) que subjetivos (actitudes, opiniones, valores). Incluía información variada sobre las condiciones de vida y de vi vienda de la clase trabajadora, preferentemente. También, de su práctica religiosa, escolarización, hábitos de higiene y de salud, en general. Los “entrevistadores”, o per sonas responsables de su administración, obtenían la información mediante la observación “directa” de los barrios obreros y la proporcionada “verbalmente” por los propios afectados o por terceros (empresarios, personal escolar, sanitario, religiosos). En el desarrollo de los censos de población (el primero data de 1801 en Inglaterra y Francia; en España, de 1857) y en la elaboración de los “cuestionarios” tuvo una gran repercusión -destacada por Kovaliova (1989) y Garrigós (2003)- el estudio de John Sin clair, The statistical account ofScotland (1791-1825). Una monumental investigación, de 21 volúmenes, sobre los problemas de la población rural en Escocia. La información se obtuvo de un cuestionario diseñado ex profeso. Contenía 116 preguntas referentes a diversas características sociodemográficas de la población (sexo, edad, ocupación, mortalidad, práctica religiosa), de su entorno (orografía, recursos minerales y agrícolas) y de la actividad económica de la región (desempleo, producción agrícola, ganadera). Para su realización, el autor contó con la colaboración del clero escocés, que le pro porcionó información de 881 parroquias de Escocia. Pero no es a esta investigación, sino a la realizada por Charles Booth, de 1889 a 1897 (Labour and the life o f the people o f London. Macmillan and Co. Londres, 1902-1903), a la que Easthope (1974) sitúa en los orígenes de la encuesta moderna. Es ta investigación fue realizada y financiada por el mismo Booth, un acaudalado naviero británico. Describe, con minuciosidad, las condiciones de vida de la población traba-
jadora londinense. La información se obtiene del uso combinado de distintas fuentes de datos: el Censo de Población británico de 1881; informes policiales, de organiza ciones de beneficencia, de inspectores escolares y sanitarios; la observación directa, por el mismo autor, de varios barrios obreros, donde vivió durante algún tiempo; la rea lización de entrevistas a hombres de negocios y a asistentes escolares (school attendance offtcers), para indagar en las condiciones de vida de los escolares y de sus familias. Ade más, procedió a la selección aleatoria de representantes de familias de los diferentes grupos sociales, excluyendo al inferior. ^ A Booth se le reconoce el acierto de perfeccionar “la metodología de sondeos, re chazando la ayuda de los intermediarios -observadores de la clase media- y apelando directamente a los obreros, cuya situación estudiaba” (Kovaliova, 1989:131). El hecho de haber entrevistado directamente a las familias le convierte en “uno de los primeros en llevar a cabo una encuesta mediante entrevista cara a cara” (De Leeuw y Collins, 1997:199). Además, se le atribuye la introducción de “un estándar científicamente de finido de necesidades básicas con respecto a los que medir la incidencia de la pobre za” (Plat, 2000: 85). En 1901, también en la editorial Macmillan, se edita una investigación similar llevada a cabo por uno de los seguidores de Booth: Benjamín Seebohm Rowntree. El estudio de la pobreza ahora se circunscribe a la ciudad de York, de donde era originario el autor. Se edita con el título Poverty. A study oftown life. El cuestionario que se aplicó incluyó, igualmente, información descriptiva variada, referida a las condiciones de trabajo (sa larios, jomada laboral) y de vida (características de las viviendas, condiciones de higie ne, de salubridad, necesidades alimenticias), de las clases sociales más desfavorecidas en la Inglaterra de finales del siglo xix. Distinguió la pobreza primaria (familias que care cían de recursos para cubrir las necesidades mínimas) de la secundaria (que disponían de recursos suficientes, pero los malgastaban, quedándose en la pobreza). Otra aportación notoria fue la obra de Fréderic Le Play, Les ouvriers européens (su primera edición, de 36 monografías, data de 1855; la segunda, en seis volúmenes, de 1877 a 1879, e incluye 57 monografías de familias). Una investigación que ha sido ca lificada por Nisbet (1966: 61) como “el primer trabajo sociológico genuinamente científico del siglo xix”, y que puede encontrarse recensionada en la monografía de Garrigós (2003). Destaca por la elección de la familia como unidad de observación. Le Play describe las características externas y “morales” (sentimientos, valores, deseos) de varias familias obreras (de trabajadores de la industria, la agricultura, la artesanía y el comercio), con las que convivió, él o sus colaboradores (también ingenieros de minas), en sus viajes por varios países europeos (España, Inglaterra, Francia, Suiza, Austria, Hungría, Prusia, los Países Nórdicos e, inclusive, Rusia). Un total de 22 familias, en cuya se lección se primó que fuesen “representativas” de una población concreta. Los “encuestadores” o colaboradores debían permanecer con la familia de 8 a 10 días. Durante ese tiempo de convivencia cumplimentaban un cuestionario con pre guntas referidas a vivienda (muebles, utensilios, animales domésticos, propiedades fa miliares), hábitos alimenticios y de trabajo de los miembros de la familia. Esta infor
mación recabada mediante observación directa, por los colaboradores, se complementó con la obtenida de la interacción y entrevista a los integrantes de la familia. También se interrogó a personalidades de la localidad, de gran ayuda para la selección de fa milias “representativas”. Otro de los defensores de extraer la información de los propios trabajadores, pa ra saber de sus condiciones de vida y de trabajo, fue Karl Marx. A él se le atribuye la primera encuesta por correo, que data de 1880. Cuando envía 25.000 cuestionarios a obreros franceses, pensaba que éstos eran quienes mejor podrían describir sus con diciones sociolaborales. No obstante, la respuesta a esta primera iniciativa fue mínima. La investigación quedó paralizada. Más éxito tuvo otro de los padres fundadores de la sociología: Max Weber. Aun que su obra fue determinante en el desarrollo de la metodología cualitativa, realizó una importante contribución empírica al desarrollo de la encuesta. Principalmente, en dos aspectos metodológicos clave: la correcta selección de los informantes y la mejora del cuestionario. Sus aportaciones han sido resaltadas por Lazarsfeld y Oberschall (1965), y cabe sintetizarlas en las cuatro que se exponen a continuación. 1. Su participación en una investigación sobre las condiciones del trabajo rural en Alemania, promovida por la Verein für Sozialpolitik, una asociación creada en 1892 por un grupo de profesores universitarios, preocupados por el creciente an tagonismo de los trabajadores alemanes (organizados en sindicatos socialistas) ha cia el Estado alemán. Además de solicitar reformas sociales, querían minimizar la influencia del pensamiento marxista en los trabajadores. Algo más de 3.000 terratenientes recibieron un cuestionario detallado pa ra que describiesen su situación particular. El 70% lo respondió. Asimismo, se enviaron 600 cuestionarios a personas que se creía ofrecerían una visión más ge neral. Aproximadamente el 50% lo devolvió rellenado. Era costumbre de esta asociación clasificar las respuestas por región geo gráfica y pedir a cada miembro que, voluntariamente, realizase cada serie. Weber hizo el informe de Prusia del Este, en 1892, y fue el único que efectuó un análisis comparativo. Comparó su material con los resultados de estudios an teriores. El propósito era proporcionar una perspectiva histórica. De este es tudio Weber criticó que sólo se utilizase, como informantes, a los terratenien tes; además del contenido del cuestionario: demasiado énfasis en las condiciones materiales de los trabajadores y escaso análisis de los aspectos subjetivos. 2. En 1893 Weber lleva a cabo otra encuesta, sobre trabajadores del campo, en cargada por el Congreso Social Evangélico. Éste demandaba un mayor conoci miento de las condiciones de vida de los grupos de población de renta más baja. Envió 10.000 cuestionarios a clérigos por dos razones principales: una, el Congreso tenía un registro central de todas las parroquias; dos, pensaba que éstos podrían mejor informar de problemas psicológicos. El cuestionario fue más breve que el de la encuesta anterior. Se centró más en la movilidad social y laboral, y en los orí genes de los distintos grupos de campesinos. También, quiso conocer las actitu
des de los trabajadores hacia formas no tradicionales de trabajo. Le fueron de vueltos 1.000 cuestionarios. Los resultados de esta investigación se publicaron en periódicos y en informes del Congreso Social Evangélico. 3. En 1907 Weber participó en una serie de investigaciones, efectuadas por Verein für Sozialpolitik, sobre la selección y adaptación de los trabajadores en las gran des industrias. Esta vez la información se obtuvo combinando datos disponibles, en las oficinas de las fábricas seleccionadas, con observación participante y en trevistas “directas” a los trabajadores. Para estas entrevistas se diseñó un cues tionario de 27 preguntas relativas a la ocupación de los padres, actividades de tiempo libre, elección ocupacional o metas en la vida. 4. Sobre esta misma temática, en 1908 Weber realiza un estudio detallado de la productividad de los trabajadores en una fábrica textil, que pertenecía a la fa milia de su esposa. Los resultados los publica en un informe que titula La con sideración de los aspectos psicofísicos del trabajo en la industria textil en Ale mania al Este del Elba. Este estudio destaca por su cuidadoso análisis estadístico de los resultados: la tabulación cruzada. También, porque demuestra que las per sonas de renta baja pueden ser “buenos” informantes. Otro ejemplo ilustrativo de la prevalencia de los sondeos a la población trabajadora en la investigación empírica alemana es el estudio de Adolf Levenstein, de 1912, con el título genérico La cuestión obrera. Describe la situación de los obreros de la in dustria alemana, a partir de los resultados de una encuesta por correo, enviada a 8.000 obreros, de tres categorías (de la industria minera, metalúrgica y textil), de ocho regiones industriales, a razón de 1.000 cuestionarios por cada región, desde 1907 a 1911. Para aquel entonces, obtuvo un porcentaje de cuestionarios devueltos elevado: el 63% de los enviados. Pero la encuesta carecía de rigurosidad. Presentaba serios errores (Lazarsfeld y Oberschall, 1965; Kovaliova, 1989), desde la óptica actual. De ellos destacan los re feridos a la población analizada. En un principio, los cuestionarios se enviaban a amigos y conocidos entre los obreros. Después se pedía, a quienes respondían, que lo distribuyesen entre sus conocidos o amigos. El cuestionario incluía 26 preguntas clasificadas en cuatro apartados. Uno, de datos per sonales: nombre, edad, ocupación, estado civil, número de hijos, ingresos (remuneración, duración, jomada laboral). Dos, de actitud ante el trabajo: cansancio, monotonía, tipo de remuneración que preferían, los pensamientos durante el trabajo, esperanzas y deseos re lacionados con el trabajo. Tres, de asuntos culturales y políticos: lectura, intereses políticos, creencias religiosas. Y cuatro, de problemas relacionados con el ocio. En su análisis, Levenstein siguió la recomendación de Weber, publicada en su ar tículo, de 1909, “Zur methodik sozialpsychologischer enqueten und ihrer bearbeitung” (“Sobre la metodología de las encuestas socio-psicológicas y sobre su análisis”). En él le pedía que hiciese un análisis estadístico de sus datos, indicándole la manera de ha cerlo. Levenstein siguió su asesoramiento, aunque se negó a que su codificación y ta bulación fuese comprobada por estudiantes y profesores universitarios, como le pedía
Weber. A destacar, su uso de tipologías en la clasificación de los obreros. Si bien, La zarsfeld y Oberschall (1965:191) puntualizan: Puede legítimamente considerarse uno de los más tempranos esfuerzos para estu diar las actitudes. Pero ni él ni Weber hicieron explícita la idea de que las actitudes pue den medirse, que los materiales de cuestionario pueden ser combinados para formar va riables a lo largo de los cuales clasificar a la gente.
Ninguna de las encuestas sociales aquí expuestas se adecúan a lo que hoy se en tiende por encuesta (“encuesta por muestreo”). Más bien se asemejaban a censos. In tentaban cubrir las poblaciones totales de las comunidades que se analizaban. Aunque tienen un importante valor como primera aproximación al estudio empírico de la so ciedad de su tiempo. En concreto, de la situación de la clase trabajadora. Los avances de la encuesta precisó de aportaciones varias, procedentes de distin tos ámbitos de conocimiento. En 1883, Galton delimita (en Inquines into the human faculty) algunos requisitos básicos de los cuestionarios. Éstos han de cubrir los objetivos de la investigación siendo, al mismo tiempo, fáciles de entender y de contestar. Pero los beneficios más notorios proceden del área de la estadística, de la aplicación de la teoría de la probabilidad en la selección de las unidades de observación. Arthur L. Bowley, el primer profesor de estadística en la London School of Economics and Political Science, fue quien introdujo el muestreo probabilístico en la práctica de encuesta. A él se le atribuye la primera encuesta que se realiza mediante selección aleatoria de los informantes. Se trata de la investigación que realiza junto con A. R. Burnett-Hurt, financiada por organizaciones caritativas, y que publica en 1915 con el título Livelihood and poverty (en la editorial londinense Bell). En publicacio nes precedentes había defendido la necesidad de aplicar muestras aleatorias repre sentativas en la investigación mediante encuesta. A destacar: • “Presidential address to the Economic Section of the British Association for the Advancement of Science”, de 1906 (Journal ofthe Roy al Statistical Society, 69: 540-558). • “Working class households in Readings”, de 1913 (Journal ofthe Royal Statis tical Society, 76: 672-691). • O su texto sobre la medición de los fenómenos sociales, de 1915, The nature and purpose ofthe measurement o f social phenomena (P. S. King and Son, Ltd., Lon dres), con el que contribuyó a la definición de los parámetros de calidad de los datos de encuesta, además de al desarrollo de la encuesta por muestreo. Aunque fue A. N. Kiaer (el director de Norwegian Bureau of Statistics de Oslo) quien primero defendió la exigencia de que la encuesta se hiciera sobre muestras re presentativas, en 1897, en su libro Representative method o f statistical surveys (en la edi torial Kristinia, de Oslo). En él expone que, de la información extraída de una mues tra relativamente pequeña de la población, pero cuidadosamente seleccionada
mediante algún procedimiento aleatorio, pueden estimarse los parámetros pobla cionales, sin necesidad de elaborar un censo completo de la población, como hasta en tonces se creía. Si bien, ello exige que la muestra sea “representativa”; que constituya una representación en miniatura de la población de estudio. Además, propone un procedimiento para evaluar los resultados de encuesta: la replicación. El repetir la operación de muestreo, el extraer una serie de submuestras com parables. Dos años ántes, en 1895 introdujo, por vez primera, el término investigación representativa, en un informe para el Instituto Nacional de Estadística (ISI: Interna tional Statistical Institute) que, a finales del siglo xix, era el centro de debate para es tadísticos oficiales. La propuesta de Kiaer de aplicar la estratificación en la selección aleatoria de la muestra fue posteriormente desarrollada por Jerzy Neyman, en 1934. En un artículo, ya clásico: “On the different aspects of the representative method: the method of stratified sampling and the method of purposive selection” (Journal o f the Roy al Statisti cal Society, 97: 558-606). Junto con la estratificación óptima y el muestreo por con glomerados,, en él desarrolla el muestreo en poblaciones finitas, la distribución muestral (la serie de resultados posibles en el diseño de la muestra) y el error de muestreo (o va riabilidad de las estimaciones muéstrales). Demuestra que este último puede medir se calculando la varianza del estimador. A partir de los años cuarenta del siglo xx se diferencia el error de muestreo del error total de encuesta. Con posterioridad, la réplicación adquiere un nuevo desarrollo de la mano del es tadístico hindú P. C. Mahalanobis. En dos de sus publicaciones principales, de 1944 (“On the large scale sample surveys”. Roy al Society Phil. Trans. B., 231: 329-451) y de 1946 (“Recent experiments in statistical sampling in the Indian Statistical Institute”. Journal ofthe Royal Statistical Society, 19: 325-378), aboga por el uso de la réplicación. A lo que denomina “interpenetrar muestras”, para medir la precisión de estimaciones derivadas de una encuesta. En esta última publicación también enfatiza la necesidad de incluir los “errores humanos” (la variabilidad introducida por entrevistadores, codificadores y su pervisores), junto a los de muestreo, en la estimación de la precisión de una encuesta. La aportación de estos estadísticos notorios es continuada por la publicación de cé lebres manuales de muestreo. Entre los cuales sobresalen: • F. Yates (1949): Sampling techniques ofcensuses and surveys. Griffin. Londres. • W. E. Deming (1950): Some theory of sampling. Wiley. Nueva York. • M. H. Hansen, W. N. Hurwitz y W. G. Madow (1953): Sample survey methods and theory. Wiley. Nueva York. • W. G. Cochran (1953): Sampling techniques. John Wiley and Sons. Nueva York. • P. V. Sukhatme (1953): Sampling theory of surveys with applications. The Indian Society of Agricultural Statistics. Nueva Delhi. • L. Kish (1965): Survey sampling. John Wiley and Sons. Nueva York. En todos ellos se mide el efecto del diseño de la muestra en la imprecisión de las estimaciones de encuesta. El primero, destaca por su influencia en la Encuesta Mun
dial de Población de 1950. Pero, el primer manual de Cochran (segunda edición en 1963, tercera en 1977) fue, de acuerdo con O ’Muircheartaigh (1997:7) el de mayor éxi to, “el más matemático y menos influido por intereses no estadísticos y no de mues treo”. No obstante, habría asimismo que destacar el texto igualmente clásico de Kish de 1965 (de gran repercusión en España), que ha tenido una nueva edición, aún re ciente, de 1995, en la misma editorial. Desde la psicología, la aportación al desarrollo de la investigación mediante en cuesta se focaliza en la medición de los conceptos teóricos, en su fiabilidad y validez. Entre las primeras publicaciones que comprueban los efectos de cambiar la formula ción de la pregunta mediante experimentos destacan: • A. Hobson (1916): “The use of the correspondence method in original research”. Journal o f the American Statistical Association, 15: 210-218. Contrasta dife rentes tipos de cuestionarios y su formulación en encuestas por correo. • B. Muscio (1917): “The influence of the form of a question”. The British Jour nal o f Psychology, 8: 351-389. Sobre medición de actitudes fueron clave las aportaciones de los siguientes in vestigadores, quienes demuestran que no sólo lo objetivo, sino también lo subjetivo (las actitudes), puede medirse con preguntas estandarizadas, en un formato de en cuesta: • E. S. Bogardus (1925): “Measuring social distances”. Journal o f Applied Sociology, 9: 299-308 / (1933): “A social distance scale”. Sociology and Social Research, 17: 265-271. • L. L. Thurstone (1928): “Attitudes can be measured”. American Journal o f So ciology, 33: 529-544 / (1931): The measurement o f social attitudes. University of Chicago Press. Chicago. • L. L. Thurstone y E. J. Chave (1929): The measurement o f attitudes. University of Chicago Press. Chicago. • R. Likert (1932): “A technique for the measurement of attitudes”. Archives o f Psychology, 140: 44-53. • L. Guttman (1944): “A basis for scaling qualitative data”. American Sociologi cal Review, 9:139-150 / (1947): “The Cornell techniques for scales and intensity analysis”. Educational and Psychological Measurement, 7: 247-280. • C. E. Osgood y P. H. Tannembaum (1955): “The principie of congruence in the prediction of attitude change”. Psychological Bulletin, 62:42-55. • C. E. Osgood, G. J. Suci y P. H. Tannenbaum (1957): The measurement ofmeaning. University of Illinois Press. Urban III. A finales de los años veinte y principios de los treinta del siglo xx comienzan a apa recer, en Estados Unidos, empresas de investigación de mercados para la investigación comercial y la realización de sondeos preelectorales. Precisamente fue el acierto en la
predicción de un resultado electoral, las elecciones presidenciales de 1936, lo que su puso un fuerte impulso a la encuesta mediante muestreo. Una macroencuesta, por correo, para la revista The Literary Digest (que defendía la práctica de a mayor número de personas encuestadas, mejor es la predicción), a mi les de suscriptores con teléfono fracasó en su predicción electoral, frente a una encuesta más modesta bajo la dirección de Gallup y Crossley. Esta última encuesta predijo la vic toria de Roosevelt, tras sólo con haber entrevistado a 1.500 votantes norteamericanos, elegidos al azar, y establecidas unas cuotas por edad y sexo. Mostró que una muestra pequeña, pero cuidadosamente extraída, podía reflejar mejor la realidad social que una gran encuesta de “una muestra parcial, con poco o ningún esfuerzo para alcanzar por centajes de respuesta razonables” (Rossi, Wrigth y Anderson, 1983: 5). Los encuestados para The Literary Digest no fueron aleatoriamente seleccionados del conjunto de electores norteamericanos, sino extraídos del listín telefónico de suscriptores a la revista y de propietarios de automóviles. Ello introdujo un importante sesgo en los resultados del sondeo. Según estimaciones de Biemer y Lyberg (2003), en aquellas fechas sólo un 35% de los hogares norteamericanos disponían de teléfono. Además, esta población se caracterizaba por ser desproporcionadamente republica na. Lo que explica la preferencia de sus sondeados por el republicano Landon. Se ex cluyó a las personas de nivel de renta más bajo, que fueron quienes más votaron por el programa de recuperación económica defendido por Roosevelt. A este importan te error de cobertura hay que sumar otros, igualmente decisivos, como el relacionado con el bajo porcentaje de respuesta obtenido. Tan sólo un 22% de los diez millones de cuestionarios enviados fueron contestados y devueltos por correo. A partir de entonces, los sondeos realizados por Gallup, Crossley y Ropper ad quieren un mayor protagonismo en el análisis de la opinión pública. Comienzan a ex pandirse los institutos de opinión pública en Estados Unidos y Gran Bretaña. Asi mismo, Gallup volvió a acertar en su pronóstico electoral, con muestreo por cuotas, en las elecciones presidenciales de 1940 y 1944. Pero no en 1948, debido a la no corres pondencia de los datos del Censo de Población de Estados Unidos de 1940, utilizado para el muestreo por cuotas, con la población real de 1948. La Segunda Guerra Mun dial supuso, además de pérdida de población, el desplazamiento de habitantes del cam po a las ciudades, donde se registró una mayor preferencia por los demócratas. En el período de 1936 a 1949 Gallup llevó a cabo aproximadamente 400 experi mentos sobre los efectos de la redacción de preguntas en cuestionarios. Muchos de es tos experimentos fueron diseñados por Hadley Cantril, quien en 1940 crea The Offi ce of Public Opinión Research, en la Universidad de Princeton. Quería que éste se convirtiera no sólo en centro de referencia en el estudio de la opinión pública y de las técnicas a seguir en su análisis, sino también en un archivo de sondeos de opinión pa ra cualquier investigador que estuviese interesado. Junto con sus colaboradores publica, en 1944, en la editorial de la Universidad de Princeton, un compendio de estudios so bre el diseño de la encuesta, su ejecución y análisis, y que titula Gauging public opinion. De los temas en él tratados destacan, en especial, los referidos a la formulación de las preguntas, su significado, el efecto de las baterías de preguntas y la medición de la in
tensidad de las opiniones. Además, se analizan los sesgos debidos al entrevistador y a su formación. Por aquel entonces, Paul F. Lazarsfeld funda The Bureau of Applied Social Research, en la Universidad de Columbia. Anteriormente había creado The Office of Radio Re search, en la Universidad de Newark. En 1944, Lazarsfeld publica, en la editorial de la Universidad de Columbia, una investigación que había realizado junto con H. Gaudet y B. Berelson: The people’s choice: how the voter makes up his mind in a presidential compaing. Esta publicación adquiere una gran trascendencia en la investigación social por ser pionera en tres aspectos clave para la investigación mediante encuesta: 1. El estudio de la conducta de voto mediante encuesta por muestreo (desde la so ciología académica). 2. La aplicación de una encuesta panel (un mismo cuestionario se pasa a la misma muestra de individuos en varias fechas sucesivas). La investigación tiene por ob jetivo principal el análisis de las intenciones de voto de los electores del condado de Erie (Ohio), en las elecciones presidenciales de 1940. Para ello, los autores pasaron tres veces un mismo cuestionario a una muestra de electores extraída al azar. La primera vez, antes del nombramiento de los electores. La última, mo mentos antes de la elección. Mediante este seguimiento de la muestra querían comprobar el efecto de la campaña electoral en la intención de voto. Unas mis mas personas son seguidas en el transcurso de la campaña electoral. A su vez, utilizaron otras tres muestras como grupos de control, con el propósito de comprobar los efectos de aplicar varias veces el mismo cuestionario a la mues tra principal. 3. El análisis de datos de encuesta. En concreto, por su introducción de las tablas cruzadas, de más de dos variables, y por su contribución a la realización de ti pologías. Pese a los aciertos de esta investigación, se observan algunas debilidades meto dológicas. Rossi, Wright y Anderson (1983: 6) critican la no aplicación de modelos de inferencia estadística. Ninguna prueba de significatividad estadística ni estimación de intervalos de confianza aparecen en la monografía del estudio. Asimismo, censuran el procedimiento de muestreo seguido: “visitar cada cuatro viviendas”. Durante la Segunda Guerra Mundial se crea The National Opinion Research Center (NORC) y un departamento de investigación del ejército norteamericano. Este úl timo bajo la dirección de Samuel A. Stouffer de 1941 a 1945. Entre sus colaboradores estaban los sociólogos Louis Guttman, Edwards A. Suchman, Robin Williams, Shirley Star o John Clausen; junto con los psicólogos Cari Hovland, Arthur Lumsdaine y William Bennet, quienes después proseguirían su andadura en distintos departamentos universitarios. Este equipo investigador llevó a cabo una investigación, de gran envergadura, sobre la moral, opiniones y actitudes del soldado americano durante la Segunda Gue rra Mundial: The American Soldier (1949). Éste es el nombre comúnmente utilizado en
referencia al susodicho estudio. Sus resultados fueron publicados por la editorial de la Universidad de Princeton en cuatro volúmenes, de 1947 a 1950, bajo el título genérico Studies in social psychology in World War II. Su propósito inicial era eminentemente práctico: proporcionar información a las autoridades gubernamentales de las opiniones y actitudes de su personal militar. Pero acabó teniendo una gran repercusión en el de sarrollo de la metodología de encuesta. En especial, en el diseño de las encuestas autocumplimentadas (a una muestra aleatoria de 5.000 soldados se les pidió que rellena sen un cuestionario diseñado al efecto), en la práctica de formular varias preguntas para medir un mismo concepto teórico y en el análisis de los datos de encuesta. Robert K. Merton y Paul F. Lazarsfeld (1950), quienes habían estado muy próxi mos al equipo investigador, aunque formalmente no participaron en el estudio, se re fieren a esta investigación como el primer trabajo que capacita al lector no especiali zado en la investigación socio-psicológica, para aprender los detalles de los métodos más avanzados en el campo, relativamente nuevo, de las encuestas de actitudes. Platt (1996) destaca su contribución a la consideración de la encuesta como el méto do líder en la recogida de información. Pese a los contenidos dados por Hovland, Lumsdaine y Sheffield, y a los comentarios repetidos de Stouffer sobre la superioridad del método experimental. La monografía de Merton y Lazarsfeld (1950) sobre la in vestigación tuvo mucho que ver en ello, por la orientación que se hizo de la encuesta y de su accesibilidad. En los años cincuenta aparecen dos monografías sobre la entrevista, de gran in fluencia en la práctica de encuesta mediante entrevista: • H. Hyman y colaboradores (1954): Interviewing in social research. Chicago University Press. Chicago. Analiza cómo las expectativas del entrevistador afectan a los datos de encuesta. • R. L. Kahn y C. F. Cannell (1957): The dynamics o f interviewing: theory, techniques and cases. John Wiley and Sons. Nueva York. Destaca la responsabilidad del entrevistador en el resultado de la encuesta. Ambas consolidan los fundamentos de la entrevista de encuesta, llamada la en trevista estandarizada. Del entrevistador se espera que se convierta en un “instrumento neutral”; en un profesional que se limite a leer las preguntas del cuestionario tal y co mo están redactadas, sin implicar ningún favoritismo, sorpresa o satisfacción hacia al guna respuesta concreta. “El entrevistador ‘ideal’ es descrito como una persona bas tante estructurada, reforzado por una formación rigurosa y con ninguna característica de rol extra que pudiese ser saliente para las preguntas que se formulan” (O’Muircheartaigh, 1997:13). Pero no fueron éstas las primeras monografías sobre la entrevista de encuesta. En 1934 aparece una edición revisada (en la editorial Harper, de Nueva York) de How to interview, de W. V. Bingham y B. V. Moore. En esta publicación se defiende, igual mente, la necesidad de estandarizar la actuación del entrevistador en la encuesta. Ade más, se multiplican los artículos en los que se analizan los efectos de la actuación del
entrevistador en los resultados de encuesta, y se establecen pautas para su mejora. Al gunos de los más citados son: • S. A. Rice (1929): “Contagious bias in the interview”. American Journal o f So ciology, 35:420-423. Analiza posibles influencias de los entrevistadores que “con taminan” la encuesta. • J. Wechsler (1940): “Interviews and interviewers”. Public Opinion Quarterly, 4: 258-260. Sobre el papel de los entrevistadores durante la entrevista. • D. Katz (1942): “Do interviewers bias poli results?”. Public Opinion Quarterly, 6: 248-268. Comprueba el efecto diferencial del estatus de los entrevistadores. Los llamados de “cuello blanco” registran una mayor proporción de actitudes y opi niones conservadoras que los de “cuello azul” o de clase trabajadora. • D. Williams (1942): “Basic instructions for interviewers”; Public Opinion Quar terly, 6: 634-641. Detalla las instrucciones seguidas por los entrevistadores que trabajan para The National Opinion Research Center (NORC). • M. T. Orne (1969): “Demand characteristics and the concept of quasi-controls”, en R. Rosenthal y R. L. Rosnow, Artifacts in behavioral research. Aca demic Press. Nueva York. Analiza cómo las características de la demanda afec tan a la conducta de los entrevistadores y los entrevistados. Ésta es la época de mayor expansión de la encuesta como estrategia metodológica. Coincide con los años de hegemonía del funcionalismo en la sociología norteamericana. Wells y Picou (1981) ponen cifras a dicha expansión: el 48,2% de los artículos publicados en la revista The American Sociological Review, de 1936 a 1949, utilizan la encuesta. En tre 1950 y 1964 el porcentaje asciende al 70,5%. Entre 1965 y 1978, hasta el 80,3%. Los métodos de interpretación descienden, por el contrario, del 50,4 al 27 y 17,1%, respecti vamente. En la revista American Political Science Review; Wahlke (1979) contabiliza que la mitad de los 180 artículos sobre comportamiento político se basan en datos de encuesta. Un 20% complementa la encuesta con otras estrategias de investigación. Asimismo, se suceden las publicaciones que tratan de los “errores” de la encues ta y, en general, de la calidad de sus datos. Cronológicamente, desde sus inicios hasta el momento presente, una selección abreviada de dichas publicaciones, de acuerdo con su impacto en la literatura de encuesta, incluye las siguientes: • J. L. Gillin (1915): “The social survey and its further development”. Journal o f the American Statistical Association, 14: 603-610. Alerta de los peligros de la fal ta de control de la calidad de la encuesta. • W. E. Deming (1944): “On errors in surveys”. American Sociological Review, 9: 359-369. Lista trece factores que pueden afectar a la calidad de la encuesta. In cluye los errores de muestreo, los debidos a la actuación del entrevistador, al pro cedimiento seguido en la recogida de datos, al diseño del cuestionario, a la no respuesta, a la codificación y procesamiento de la información, además de los errores de interpretación.
• H. J. Parry y H. M. Crossley (1950): “Validity of responses to survey questions”. Public Opinion Quartely, 14: 61-80. Sobre la validez de la medición mediante en cuesta. • M. H. Hansen, W. N. Hurwitz y W. G. Madow (1953): Sample survey methods, vol II. Wiley. Nueva York. Diferencia los errores variables de los sesgos siste máticos, y propone el concepto de error total de encuesta. • C. F. Cannell y*F J. Fowler (1963): “Comparison of a self enumerative procedure and a personal interview: a validity study”. Public Opinion Quartely, 27: 250-264. Comprueba la validez de la entrevista personal frente al procedimiento “autoenumerativo”. • S. Sudman y N. Bradburn (1974): Response efffects in surveys: a review and synthesis. Aldine Publishing Co. Chicago. Un texto clave sobre los efectos de res puesta, en el que se proponen pautas o actuaciones en su resolución. • H. Schuman y S. Presser (1981): Questions and answers in attitudes surveys. Aca demic Press. Nueva York. A partir de investigación propia (experimentos), complementada por la llevada a cabo por otros investigadores, analizan los efec tos debidos a la forma de la pregunta, su redacción y contexto en los resultados de encuesta. • R. M. Groves (1989): Survey errors and survey costs. John Wiley. Nueva York. Un clásico, en la actualidad, que ofrece una revisión comprehensiva de los errores de encuesta y sus causas, relacionándolos con los costes de la investigación. Reconoce que el “coste” es un componente esencial de la calidad de los datos. • L. E. Lyberg y colaboradores (1997): Survey measurement and process control. John Wiley and Sons. Nueva York. Una compilación de artículos sobre las di versas fuentes de error de medición y sus efectos en la calidad de la encuesta. • P. P. Biemer y L. E. Lyberg (2003): Introduction to survey quality. John Wiley and Sons. Nueva Jersey. Sintetiza las distintas fuentes de error de la encuesta, in sistiendo en su visión conjunta. En los últimos años la literatura sobre metodología de encuesta ha crecido enor memente, como puede verse en la bibliografía adjunta al final del libro. Aunque algo extensa y limitada al mundo anglosajón e hispano, no recoge ni siquiera toda la pro ducción habida hasta el presente. En los capítulos siguientes se irá, no obstante, in formando de estudios notorios específicos a los distintos aspectos de la encuesta, en ca da una de sus fases, y podrá mejor comprobarse cuál es el estado actual de la investigación sobre la encuesta. Además de la decisiva aportación de las nuevas tec nologías en su desarrollo y expansión. Para concluir, se hace una sucinta referencia a los orígenes de la encuesta en España. Se destaca la siguiente relación de fechas de estudios clave, aunque pocos cumplen el rigor metodológico que en la actualidad se exige a la encuesta. • La gran encuesta, a escala nacional, de 1901 a 1902, sobre temas antropológicos y sociales, promovida por la Sección de Ciencias Morales y Políticas del Ateneo
de Madrid. Trata de las costumbres populares y de los tres hechos más carac terísticos de la vida: nacimiento, matrimonio y defunción. R. Salina fue el pro motor de la encuesta, pero contó con la colaboración de Puyol, Bernardo de Quirós, García Herreros, Pedregal y Camarón. Fueron devueltos al Ateneo 289 cuestionarios debidamente cumplimentados, distribuidos entre las distintas provincias españolas. Con anterioridad, y desde 1882, las distintas sociedades antropológicas es pañolas habían editado cuestionarios, de ámbito local, que ayudasen a la reco gida de datos (Lisón, 1968). En 1895, J. Costa dirigió en el Ateneo La encuesta sobre tutela social y, en 1901, promovió, también en el Ateneo, La encuesta so bre oligarquía y caciquismo como forma actual de gobierno en España. Esta úl tima encuesta contó con la colaboración de Pardo Bazán, G. Azcárate, Ramón y Cajal, Unamuno, Pi y Margall. En 1904 se crea el Instituto de Reformas Sociales. Desde él se promueven varios estudios “reformistas” sobre la sociedad española. Destaca la investigación relativa al trabajo en las minas, de 1910, o la primera encuesta a escolares, de Eu genio d’Ors, de 1921. La encuesta a estudiantes universitarios de Madrid realizada por Manuel Fra ga Iribarne y Tena Artigas en 1949. Sus resultados se publican en 1953, en la Re vista de Educación y la Revista Internacional de Sociología. La encuesta a estudiantes universitarios españoles de José Luis Pinillos, de 1955. La primera que incluye preguntas de índole política. La encuesta a estudiantes de la Universidad de Valencia, de Francisco Murillo Ferrol y José Jiménez Blanco, de 1956. La encuesta sobre la familia española, de Enrique Gómez Arboleya y Salustiano del Campo, de 1957. La muestra la integran 127 estudiantes en Madrid y 112 en Salamanca. En 1959 se publica con el título Para una sociología de la familia es pañola. La encuesta sobre la profesión médica en España, de José Mariano López Cepero, Amando de Miguel, Luis González Seara y José Castillo (con el asesoramiento de Juan J. Linz). La muestra la componen 500 médicos, una mues tra de élites y un panel de estudiantes de Medicina. La encuesta a empresarios de Juan Linz (con la colaboración de Amando de Miguel), de 1959. Financiada por la Escuela de Organización Industrial de Ma drid. La muestra la forman 460 empresarios. Algunos de los resultados prin cipales del estudio se publican en 1966 con el título Los empresarios ante el po der público. La primera encuesta de juventud, de 1960 (aunque el período de investigación se extiende de 1958 a 1965). Dirigida por José Mariano López-Cepero, un co laborador de Enrique Gómez Arboleya. Contó con un amplio equipo investi gador, entre quienes se encuentra el propio Gómez Arboleya (que se incorpo ra tardíamente), José Bugeda, José Castillo, Luis González Seara, Juan J. Linz y Amando de Miguel. En el más reciente informe sobre juventud (A. de Miguel,
2000), se detalla la relación de todos los participantes en la investigación, sus avatares y los resultados principales del estudio. Esta encuesta, junto a las realizadas por una parte de su equipo investigador (las encuestas a médicos y empresarios antes citadas), representan “el punto de arranque fundamental del análisis ‘empírico’ de la realidad social española, con nuevos métodos importados en esa época fundamentalmente de Estados Uni dos, Francia y "Gran Bretaña. Aunque las tres encuestas se llevan a cabo desde Madrid” (J. de Miguel, 1999:188). • La encuesta a amas de casa, de Juan José Castillo, de 1962, relativa a hábitos de consumo. En 1963 se crea, a instancia de Manuel Fraga Iribarne, el Instituto de la Opinión Pública (que en 1976 se transforma en el actual Centro de Investigaciones Sociológi cas). Un centro oficial de investigación sociológica empírica, con clara hegemonía de la investigación mediante encuesta. Dispone de un banco de datos de libre acceso a to da persona interesada en alguna de sus encuestas. La Revista Española de la Opinión Pública se convierte en un medio de difusión de referencia de la investigación en Es paña. Después se transformaría en la Revista Española de Investigaciones Sociológicas (REIS). En la esfera privada comienzan a aparecer institutos de investigación de mercados y de sociología aplicada. En 1958 se crea el Instituto ECO, vinculado a Jesús Ibáñez. En 1965 surge DATA, unido a la figura de Amando de Miguel y Juan J. Linz. Bajo la dirección de Amando de Miguel se realiza el primer informe FOESSA, en 1966, y el segundo, en 1970. Ambos informes son calificados por Lamo de Espinosa (1992: 127-128), como “la prueba de madurez de la sociología española”. En concreto, el se gundo Informe FOESSA (1970) “se convierte en el mejor de los estudios sociológicos globales y, sin duda, el estudio sociológico sobre la estructura social española más avan zado para la época” (J. de Miguel, 1999:195). Si bien, padece de problemas de censura al eliminarse, en su publicación, el capítulo quinto sobre “vida política y asociativa”, capítulo que ahora puede leerse en una reciente publicación de Amando de Miguel (2003) sobre el final del franquismo, en el que incluye fragmentos de su diario personal sobre su paso por la cárcel en los últimos años de la dictadura. La serie de informes FOESSA prosigue en años posteriores, pero bajo la dirección de otros investigadores y sin una periodicidad concreta. En el tercero, la encuesta se realiza en 1973, aunque el informe se publica en 1976. El cuarto, entre 1981-1983, di rigido por Juan Linz. El quinto, de mayo a junio de 1995, bajo la dirección conjunta de Miguel Juárez. Con la instauración de la democracia, la encuesta paulatinamente va adquiriendo un mayor protagonismo en la investigación social empírica en España. En 1979, año de elecciones, en España se gastaron 2!000 millones de pesetas en encuestas de opinión (según estimaciones de López Pintor, 1982). Veinte años después, la facturación de es tudios cuantitativos asciende a 18.953 millones de pesetas. En el año 2000 a 22.882 mi llones (Alós, 2001).
La encuesta se presenta como la estrategia de investigación caracterizada por la aplicación de un procedimiento estandarizado para la obtención de información (oral y/o escrita), de una muestra amplia de sujetos. La muestra debe ser representativa de la población de interés. La información se limita a la delineada por las preguntas que componen el cuestionario precodificado diseñado al efecto. Entre sus características definitorias destacan: a) Su adecuación al estudio de un amplio abanico de cuestiones: aspectos objeti vos (de hechos) y subjetivos, no directamente observables (actitudes, valo res, opiniones), del presente, pasado y futuro. b) La información se obtiene de las respuestas verbales (oral o escritas) pronun ciadas por los encuestados (observación “indirecta”). Por esta razón, cabe la po sibilidad de que la información recabada no sea un fiel reflejo de la realidad que se analice. De ahí la exigencia de comprobar “siempre” la veracidad de los da tos, antes de su interpretación. c) Para que las respuestas puedan compararse, ha de seguirse un procedimiento estandarizado en la recogida y en el análisis de los datos. La estandarización se justifica por la necesidad de proceder a una medición “científica” de los fenó menos sociales. Ello exige que las diferencias en las respuestas se deban a di vergencias entre los encuestados y no a una aplicación diferencial de la encuesta, en cualquiera de sus fases. Han de formularse las mismas preguntas, en el mismo orden, a cada uno de los encuestados. Asimismo, cuando medie la intervención de entrevistadores en la recogida de información, ha de evitarse que su actuación sea desigual con los entrevistados. La estandarización restringe los errores de medición que, como después se verá, afectan directamente a la calidad de la encuesta. d) Las respuestas se agrupan y cuantifican para, con posterioridad, examinar (mediante técnicas estadísticas de análisis) las relaciones entre ellas. El interés del investigador va más allá del individuo del que obtiene la in formación. Se extiende a la población a la que éste pertenece. Por ello es ne cesario que la muestra observada sea “representativa” de dicha población. En el tercer capítulo se insiste en la exigencia de seguir un riguroso procedi miento aleatorio de selección de la muestra. Incide, directamente, en la validez externa (o posibilidad de generalización de los resultados de la encuesta) y en la validez de conclusión estadística (o significatividad estadística de los resul tados). Ambas están afectadas por el tamaño de la muestra y por el procedi miento seguido en la elección de las unidades que la componen. Al protagonismo de la encuesta en la investigación social (cuantitativa) contribuye las muchas posibilidades que ofrece al investigador. Comparada con otras estrategias de investigación, la encuesta permite:
a) La obtención de información variada de un conjunto amplio de personas, ubicadas en distintas áreas geográficas, en un plazo de tiempo relativamente bre ve. Depende del método de encuesta aplicado (mediante entrevista perso nal, telefónica, autoadministrada o una combinación de varios), como se verá en el capítulo 2. Aunque su coste sea elevado, generalmente es inferior al necesario en la materialización de otras estrategias de investigación para la con secución del mismo volumen de información. b) La comparación de datos obtenidos en encuestas realizadas en fechas, países o áreas geográficas diferentes. Siempre que las encuestas sean “comparables”, en su diseño (muestra, cuestionario) y aplicación. Esta posibilidad de la encuesta, propiciada por la estandarización que la de fine, amplía su utilidad en la investigación social. Parafraseando a López Pin tor (1989: 360), la utilidad de la encuesta aumenta “cuanto mayor sea la posi bilidad de poder comparar los datos (obtenidos) con otros similares y anteriores en el tiempo o procedentes simultáneamente de otras poblaciones”. La consulta de bancos de datos de encuesta es de gran utilidad para la realización de estu dios comparativos y de tendencias (longitudinales). c) La generalización de sus resultados, dentro de los límites marcados en el dise ño y en cada fase de la ejecución de la investigación. d) La evaluación de la calidad de sus resultados, del cumplimiento de los criterios de validez y de fiabilidad. Dependerá de la magnitud y variedad de los errores que se detecten en su ejecución. Agrupados en los llamados errores de no observación (de no cobertura, de muestreo y de no respuesta) y de observación o medición, como se verá en el apartado 1.5. Pese a sus ventajas, la encuesta se enfrenta a una serie de obstáculos que impiden autosuficiencia como estrategia de investigación: a) Al obtener la información de declaraciones verbales, su empleo no se reco mienda en poblaciones con dificultades para la comunicación verbal (niños pe queños, personas analfabetas o con escasos recursos lingüísticos). b) La información que se recoge está condicionada por la formulación de las preguntas y la veracidad de las respuestas dadas por los encuestados. c) La mediación del entrevistador (efr-encuestas mediante entrevista cara a cara y telefónica) puede provocar efectos de carácter reactivo en las respuestas de los entrevistados. Los problemas de reactividad pueden, no obstante, reducir se con un buen diseño del cuestionario, junto con una adecuada selección y for mación de los entrevistadores (capítulo 5). d) Al predominar, en la investigación social usual, las encuestas transversales (la recogida de información se produce en un único momento en el tiempo) sobre las encuestas panel (o encuestación repetida en una misma muestra en tiempos diferentes), y carecer de un control experimental a priori, pueden confundirse simples correlaciones entre variables con verdaderas relaciones causales. Si bien
esta inexactitud puede, en parte, reducirse mediante el uso de técnicas analíticas multivariables (control a posteriori). e) La realización de una encuesta precisa de la organización de un trabajo de cam po (para la recogida de información) complejo y costoso. De manera especial, cuando se abarcan segmentos amplios y espaciados de población mediante en trevista personal o cara a cara. El cuadro 1.1 resume las ventajas e inconvenientes principales de la encuesta como estrategia de investigación social. CUADRO 1.1. Ventajas e inconvenientes de la encuesta
Ventajas
Inconvenientes
• Permite abarcar un amplio abanico de cuestiones (objetivas y/o subjetivas) en un mismo estudio. • Facilita la comparación de resultados, al basarse en la estandarización y cuantificación de las respuestas. • Los resultados del estudio pueden gene ralizarse dentro de los límites marcados en el diseño y la ejecución de la investi gación. • Posibilita la obtención de una informa ción “significativa”, cuando no acontezcan graves errores en su realización. • Ventaja económica: puede conseguirse un volumen importante de información a un relativo mínimo coste económico y temporal.
• No recomendable en poblaciones con di ficultades para la comunicación verbal. • La información se restringe a la propor cionada por el individuo (a preguntas ge neralmente cerradas, con opciones de res puesta previamente fijadas). • La mediación del entrevistador puede provocar efectos reactivos en las res puestas. • La carencia de referencias contextúales y vitales de los encuestados limita la inter pretación de los resultados. • Acusa imprecisión para el estudio de la causalidad. • El desarrollo de una encuesta amplia re sulta complejo y costoso (principalmente en encuestas cara a cara).
1.3. Articulación de la encuesta con otras estrategias de investigación Algunos de los límites de la encuesta pueden solventarse con el uso complemen tario de otras estrategias de investigación. En 1955 Vidich y Shapiro defienden la ne cesidad de integrar la encuesta con el trabajo de campo cualitativo (observación par ticipante, entrevistas informales y uso de datos disponibles). La encuesta contribuye a la generalización de los hallazgos del trabajo de campo. “Sin los datos de encuesta, el observador sólo puede realizar conjeturas sobre su área de ignorancia” (Vidich y Shapiro, 1955: 31).
Años más tarde, Sieber (1973) destaca los beneficios mutuos de dicha integración, tanto en las fases exploratorias de la investigación (la elaboración del marco teórico del estudio, el diseño de la muestra y del cuestionario), como en las de verificación (en la validación e interpretación de los resultados de la encuesta). De las contribuciones del trabajo de campo a la investigación mediante encuesta resaltan las siguientes: a) La estructura teórica que guía el análisis de encuesta puede derivarse, total o ple namente, del trabajo de campo cualitativo. Ello exige que éste preceda (en el diseño de la investigación) a la encuesta. b) Los resultados de la encuesta pueden ser validados mediante el recurso a ob servaciones y entrevistas informales. De manera especial, cuando los resultados que se obtengan de la encuesta sean inesperados o sorprendentes; o cuando la encuesta consiga un bajo porcentaje de respuesta. Para que el trabajo de campo cumpla la función de aclaración de los re sultados de la encuesta, ésta ha de precederle en el tiempo. c) Las relaciones estadísticas, obtenidas con la encuesta, pueden interpretarse me diante referencias a observaciones y entrevistas informales. d) El trabajo de campo también ayuda a la identificación de los sujetos más ade cuados para ser encuestados. A veces, existen sujetos especiales cuya existencia se descubre gracias a que previamente se ha realizado un trabajo de campo exploratorio. Ello posibilita su inclusión en el diseño de la muestra a ser encuestada. e) El trabajo de campo contribuye, igualmente, a la elaboración del cuestionario: • En la formulación de los ítems (o preguntas) que forman el cuestionario. • Clarificando aquellas preguntas que hayan quedado confusas. En España, Ibáñez (1989) se suma a quienes defienden que ha de hacerse -lo que él llama- “investigación estructural” (normalmente*algún grupo de discusión) como fase previa a la realización de una encuesta. El objetivo es evitar que la encuesta se con vierta en la opinión de quien redacta el cuestionario. La indagación cualitativa previa a la encuesta proporciona información, de gran ayuda, para el diseño del cuestionario: qué preguntas incluir y qué lenguaje emplear en su redacción para facilitar la comunicación con la población de estudio. Fuller y co laboradores (1993) añaden otras dos contribuciones del grupo de discusión al diseño del cuestionario: a) Ayuda a la identificación de los conceptos teóricos relevantes. b) Colabora en la formulación de hipótesis. Pero, también ha de destacarse la gran utilidad de la indagación cualitativa en la interpretación y validación de los resultados de encuesta. Desde su experiencia en la
investigación social comparada, Allardt (1990) defiende que por medio de datos cuantitativos el investigador es capaz de explorar los fenómenos estudiados. Si bien, para que los resultados obtenidos sean más interpretables, es preciso que se efectúen estudios cualitativos, mediante los cuales pueda profundizarse en el tema de estudio. En el mismo sentido se pronunció, con anterioridad, Walker (1988: 22), para quien “la investigación cualitativa más generalmente puede ayudar a interpretar, ilustrar y cualificar las relaciones determinadas estadísticamente”. Y ésta viene sien do cada vez más extendida en la investigación sociológica contemporánea en los dis tintos ámbitos de conocimiento. La comprensión de las relaciones estadísticas entre va riables precisa de información más detallada de las experiencias vitales de las personas y de su contexto sociofamiliar. Información no siempre obtenida con la aplicación ex clusiva de la encuesta. A la inversa, la encuesta favorece -siguiendo a Sieber (1973)- al trabajo de campo cualitativo: a) Identificando los casos relevantes e irrelevantes para ser posteriormente ana lizados mediante indagación cualitativa. b) Demostrando la generalidad de las observaciones de campo. c) Verificando las interpretaciones de campo. d) Aclarando las observaciones “mal interpretadas” o “inexplicables”. Por ejem plo, proporcionando información de informantes o individuos que fueron, previamente, pasados por alto. Asimismo, el uso de datos disponibles también puede contribuir a la mejora de la encuesta. Tanto en las fases previas (en la elaboración del marco teórico y en la operacionalización del problema de estudio), como en las posteriores (en la interpretación de sus resultados). Además, son imprescindibles en los estudios comparativos, tanto transversales como longitudinales. Pese a los grandes beneficios de la articulación de la encuesta con otras estrategias de investigación, ha de insistirse en la exigencia de que: a) Mediante las diversas estrategias se estén midiendo, realmente, los mismos con ceptos teóricos, si se quiere comparar sus resultados. b) Se practiquen de forma independiente unas de otras. Cuando la finalidad de la articulación metodológica es comprobar la validez de los resultados, la clave es tá en garantizar la independencia en todo el proceso. Para ello es de gran utilidad seguir alguna de las actuaciones recomendadas por Brewer y Hunter (1989): • Realizar la recogida de datos escalonadamente. De manera que la información que sea más vulnerable a la influencia del investigador, o de los sujetos analizados, sea recabada primero.
En general, cuando se conjugan estrategias de investigación que provo can un grado diferente de reactividad, en los sujetos observados, se obtienen mejores resultados, si las estrategias que generan mayor reactividad (caso de la encuesta mediante entrevista cara a cara) se aplican con anterioridad a las “no reactivas” (como el uso de fuentes documentales y estadísticas). • Dividir la muestra en submuestras, o extraer varias muestras, y en cada una de ellas aplicar una técnica diferente de recogida de información. De esta for ma puede evitarse el efecto directo de un método sobre otro, al no exponerse a los mismos sujetos a más de un método. Para que no acontezcan sesgos derivados del conocimiento, por parte de los integrantes de una de las muestras, de las experiencias de investigación de las otras muestras (si pueden comunicarse entre ellos), conviene aplicar cada técnica de recogida de información de manera escalonada. O bien, pro ceder de forma rápida y simultánea en las distintas muestras. El requisito de la independencia no es, por el contrario, imprescindible, cuando la finalidad de la articulación metodológica es exploratoria: una primera aproximación a fenómenos poco conocidos, con el propósito de identificar variables relevantes y, a partir de ellas, extraer hipótesis a comprobar en indagaciones empíricas posteriores. El cuadro 1.2 resume ventajas e inconvenientes de la articulación de la encuesta con otras estrategias de investigación.
1.4. Fases de la encuesta Todo proceso de investigación comienza con una'fase inicial de formulación del problema de investigación. “No importa en qué problema quieras trabajar y no importa qué método eventualmente vayas a utilizar, tu trabajo empírico deberá comenzar con una consideración cuidadosa del problema de investigación” (Simón, 1978: 98). A veces, es la propia entidad o institución que financia la investigación quien pro pone el problema o tema de estudio. En otras ocasiones, es el propio investigador quien lo sugiere, en respuesta a sus inquietudes intelectuales o a intereses atribuidos a quienes se espera que financien la encuesta. Sea como fuere, la idea o problema de investigación se presenta, al principio, vaga y genérica. El investigador deberá, después, precisarla y configurarla en un diseño de la investigación. Para lo cual ten drá que adentrarse en el campo concreto de conocimiento donde se ubique el pro blema en cuestión. A tal fin, una actuación exigida es la revisión bibliográfica. Ésta ha de ser ex haustiva, refiriéndose no sólo al tema concreto de estudio, sino también a otros con él relacionados, que puedan orientar en su indagación. Esta revisión de temas relacio nados adquiere mayor relevancia, cuando apenas se encuentre bibliografía (teórica y metodológica) específica del tema en cuestión. Ya sea por su carácter novedoso, ya por su escasa repercusión en la trayectoria investigadora precedente.
Ventajas
Inconvenientes
• Al cubrir más dimensiones de la reali dad social, se consigue una información más profunda y diversificada. • Mejora la configuración del marco teóri co de la investigación y su operacionalización (la identificación de conceptos teó ricos y su traducción en hipótesis). • Enriquece el diseño del cuestionario: qué preguntas incluir y cómo redactarlas. • Ayuda a la identificación de sujetos de in terés para ser encuestados (diseño de la muestra). • Amplía la interpretación y validación de los datos de encuesta (cuando se llega a los mismos resultados).
• Supone un mayor coste económico y tem poral que obtener la información por una única vía. • Mayor dificultad para repetir la investi gación. • Precisa de un equipo investigador con formación adecuada en las distintas me todologías. • La aplicación de una técnica de recogida de información anterior puede sesgar los datos que se recaben por otras técnicas posteriores(1). • Problemas de comparabilidad de los re sultados, al estar afectados por diferentes fuentes de error (si éstas no han sido de bidamente controladas). • La incompatibilidad metodológica de al gunos métodos®.
(1) Bien porque la experiencia alcanzada con el primer método puede llevar al investigador a utilizar el se gundo de forma diferente, e inclusive mejor; bien debido a la influencia en los sujetos (a la que ya se ha hecho mención). (2) La principal objeción a la combinación metodológica con frecuencia se expresa en términos de “per tinencia epistemológica”. Autores como Blaikie (1991) consideran a ésta la barrera fundamental pa ra integrar formas de conocimiento que él califica “incompatibles”.
El propósito de dicha revisión bibliográfica Dankhe (1989) lo resume en uno fundamental: obtener información para, a partir de ella, analizar y discernir si la teo ría existente y la investigación previa sugieren una respuesta (aunque sea parcial) a las preguntas de investigación, o una dirección a seguir en su estudio. Más concretamente, la revisión bibliográfica contribuye a:
a) La estructuración de la idea originaria del proyecto de investigación. Lo contextualiza en una determinada perspectiva teórica y metodológica. b) Inspirar cómo diseñar la encuesta, considerando la experiencia de otras en cuestas similares. Se quiere: • Prevenir posibles errores cometidos en estudios anteriores.
• No ser redundantes. Bien planteando otros interrogantes para cubrir as pectos menos observados; bien tratando el mismo tema, pero dándole un en foque diferente. Excepto que se quiera realizar un estudio comparativo. Éste precisa de la replicación exacta del estudio anterior, con el cual se pretende comparar los resultados. En todo caso, con la encuesta se desea avanzar en el conocimiento del problema de investigación. • Extraer ideas para el diseño de la muestra y del cuestionario. En el capítulo 4 se insiste en la importancia de revisar encuestas que hayan abordado el te ma de estudio, antes de proceder a redactar las preguntas del cuestionario. Además de la exigida revisión bibliográfica, la concreción y estructuración del pro blema de investigación requiere el complemento de indagaciones exploratorias. Pue de consistir en: a) Discutir el tema con amigos, colaboradores o con expertos en dicho tema. Éstos pueden aportar ideas de qué aspectos tratar y cómo llevar a cabo la in vestigación. b) Entrevistas a algunos de sus protagonistas (aquellos implicados en el problema a investigar). De ellos se busca recabar información que ayude al diseño de la encuesta. Pueden incluso aportar datos discordantes con preconcepciones del investigador. Los investigadores pueden encontrar que algunas consideraciones que pensaban eran importantes parecen ser irrelevantes a la gente con la que está hablando (Sheats ley, 1983: 203).
Ya se insistió en el apartado 1.3 en la gran aportación de la metodología cualitativa (entrevistas en profundidad, grupos de discusión, observación participante, uso de do cumentos) en las fases previas de la encuesta. También, en las posteriores. De mane ra especial, en la configuración del marco teórico, el diseño de la muestra (la identifi cación de los sujetos más adecuados para ser encuestados) y del cuestionario (la determinación de los conceptos teóricos y los indicadores más relevantes en su me dición, y qué presencia tendrán en el cuestionario). Con la indagación exploratoria se busca la familiarización con el problema de in vestigación y la metodología a aplicar en su análisis. De lo exhaustivo que se sea en es ta fase inicial de la investigación depende el buen resultado de la encuesta. Como se irá viendo en los distintos capítulos del libro, muchos de los errores de encuesta pue den obviarse dedicando más tiempo y recursos a esta fase exploratoria inicial, de la que resulta la configuración del marco teórico de la investigación. A veces se partirá de una teoría. Otras veces, se decidirá imbricar el problema de estudio en varias perspectivas teóricas para, de este modo, poder cubrir sus aspectos varios. Máxime cuanto más complejo sea el problema de investigación. Pero, en más ocasiones de las deseables, el marco teórico de la encuesta se fundamenta en genera
lizaciones empíricas. Es decir, en proposiciones que han sido comprobadas en inda gaciones precedentes, si bien no han logrado cristalizar en una perspectiva teórica de terminada. En cualquier caso, el marco teórico contribuye a: a) Proporcionar un marco de referencia en la interpretación de los resultados de la investigación. b) Concretar los objetivos de la encuesta. Incluye los generales (que expresan la fi nalidad principal de la encuesta, lo que se pretende analizar) y los específicos (más concretos, relacionados con cada dimensión del problema de estudio). Es extremadamente importante precisar qué se quiere con la encuesta. Los obje tivos han de ser claros, no ambiguos. De esta forma se evitan errores de espe cificación. Cuanto más claros estén los objetivos del estudio, más fácil será la tra ducción de conceptos a preguntas concretas y pertinentes en el cuestionario. Además, téngase presente que la adecuación del cuestionario suele medirse en relación con los objetivos de la investigación, junto con las características de la población que se analiza. c) Formular las hipótesis: realizar previsiones a partir de descubrimientos aún no verificados (Lazarsfeld, 1973a). Las hipótesis representan respuestas probables que el investigador avanza a las preguntas iniciales de la investigación. Suelen formularse como proposi ciones en las que se afirma o niega la existencia de relación (esperada), al me nos entre dos variables, en una situación determinada. Generalmente se recomienda extraer más de una hipótesis para poder abarcar los aspectos varios del objeto de estudio (incluidos en el marco teórico). Además, han de ser concretas y estar relacionadas con los objetivos de la investigación. Las hipótesis contienen conceptos que han de operacionalizarse, traducir se en preguntas concretas en un cuestionario (como se verá en el capítulo 4). También hacen referencia, aunque genérica, a las unidades de observación, contextualizándolas espacial y temporalmente (capítulo 3). Las unidades pueden ser individuales o agregados (hogares, empresas, instituciones). En la encues ta, lo más habitual es el individuo. De él se extrae información sobre sus ca racterísticas personales y de su entorno sociocultural. La elección de una población u otra puede tener implicaciones significativas en el contenido de la encuesta y en sus costes (económicos y temporales). Por esta razón, Hakim (1994) recomienda que la población de estudio se establezca en los objetivos de la investigación, porque ésta determina la información a extraer y la naturaleza de los resultados del estudio. La delimitación de la población (jóvenes, amas de casa, jubilados, profesores universitarios) afecta a todo el diseño de la encuesta. Desde la elección del método de encuesta a aplicar, el diseño de la muestra y del cuestionario, hasta la administración del cuestionario. Los días y horas más adecuados para la realización del trabajo de cam po. Especialmente, cuando la encuesta es mediante entrevista personal o telefónica.
La elección del método de encuesta (mediante entrevista personal, telefónica, por correo u otra forma autoadministrada) está afectada por los objetivos de la in vestigación y la población a estudiar. También, por los recursos económicos y el plazo de tiempo que se disponga para su ejecución. Además de la continuidad que quiera dar se a la encuesta. Éstos son los tres elementos clave que marcan cualquier proceso de investigación: a) Los objetivos del estudio. b) Los recursos económicos, humanos, materiales, que la hagan factible. c) El tiempo concedido para su realización. En la encuesta la conjunción de estos tres elementos determina el tamaño de la muestra y el procedimiento a seguir en su selección (capítulo 3). Asimismo, en la elec ción del método de encuesta (capítulo 2), el diseño del cuestionario (capítulo 4), la eje cución y supervisión del trabajo de campo (capítulo 5) y en el análisis de la informa ción (capítulo 6), como refleja la figura 1.1, que resume las fases esenciales de la encuesta. Groves (1989) analiza el coste como una restricción del diseño de la encuesta. Pe ro, a su vez, considera su efectividad como un componente de la calMad del diseño. En la figura 1.1 puede, asimismo, verse que la elección del método de encuesta se ubica entre los factores que determinan la encuesta. En función de qué método de en cuesta se elija, se diseña la muestra y se elabora el cuestionario. De la muestra se exige que sea representativa de la población de interés. Del cues tionario, que se adecúe a los objetivos de investigación, a las peculiaridades de la po blación a encuestar (nivel educativo, conocimiento del tema, interés) y a los concep tos a medir. Éstos han de traducirse en preguntas apropiadas, que sean fáciles de comprender por las personas a quienes van dirigidas. Una vez confeccionado, el cuestionario ha de ser chequeado o pretestado, antes de pasarse a la muestra seleccionada para la encuesta. Se puede pasar a expertos para que evalúen en qué medida el cuestionario se ajusta a los objetivos de investigación y pue de considerarse un instrumento “válido” y “fiable” en la medición del problema de es tudio. Aunque la opinión “especializada” puede ser de gran ayuda, es imprescindible pretestar el cuestionario en la población a la que está dirigido (amas de casa, jubilados, estudiantes, profesores universitarios). No es necesario que la muestra sea elevada. Nor malmente, los pretests se realizan con menos de 100 casos. Tampoco se requiere que és tos se elijan siguiendo procedimientos aleatorios, al no estar dirigidos a la inferencia estadística y generalización de los hallazgos de la indagación. Sólo se precisa que com partan las mismas características de la población de estudio. En el pretest se comprueba la adecuación del cuestionario: la redacción de las pre guntas (si éstas son fácilmente comprendidas y provocan las respuestas esperadas), su disposición conjunta en el cuestionario (si la ubicación de las preguntas puede ser cau sa de alguno de los errores de respuesta), las instrucciones que en él se den o el formato de las preguntas filtro. La finalidad principal es identificar cualquier problema que pue-
Figura 1.1. Fases esenciales de la encuesta.
da afectar al correcto desarrollo de la encuesta. Ya referido a la administración del cuestionario, ya a las peculiaridades de la población que va a responderlo (capítulo 4). Tras su realización, el investigador puede volver a las fases anteriores en el diseño de la encuesta, a su revisión (objetivos, muestra, cuestionario), teniendo presente los re sultados del pretest o precomprobación del cuestionario. Además, proporciona infor mación para las fases posteriores (administración del cuestionario, codificación, grabación y análisis de los datos). En concreto, del pretest puede extraerse información referida a: a) b) c) d) e) f) g) h) i)
La redacción del cuestionario. La idoneidad del marco muestral empleado en la investigación. La variabilidad de la población respecto al tema de estudio. La adecuación del método de encuesta elegido para la recogida de información. El porcentaje aproximado de no respuesta que se obtendrá en la encuesta. De especial relevancia en la encuesta por correo. La codificación de las preguntas abiertas del cuestionario. La preparación de los entrevistadores (en encuestas personales y telefónicas). El coste aproximado del trabajo de campo, en términos económicos y tempo rales (período de tiempo que se precisa para su realización). El plan de análisis.
Concluida la redacción final del cuestionario, procede su administración a la muestra que se ha diseñado para la encuesta. Esta fase de recogida de información, co nocida como trabajo de campo, es la más delicada y costosa en el desarrollo de la en cuesta. Su coste aumenta dependiendo de la complejidad de la encuesta y de la am plitud y peculiaridades de la muestra a la que se pasa el cuestionario. De mayor relevancia en encuestas cara a cara (mediante entrevista personal). Cuando media la presencia de entrevistadores, previamente ha de precederse a su selección y formación para la encuesta en cuestión. En el capítulo 5 se analiza la in fluencia en la calidad de la encuesta de la actuación de los entrevistadores, de sus ha bilidades para localizar, motivar y registrar las respuestas de los encuestados. Además, se exponen distintas estrategias para reducir la no respuesta, de gran relevancia en la calidad de los datos de encuesta. El correcto cumplimiento del trabajo de campo ha de ser supervisado, bien in situ (encuestas telefónicas), bien después de rellenarse los cuestionarios. Con ello se quiere evitar errores que afecten a la calidad de la información recabada. A la supervisión le sigue la fase de edición y de procesamiento de los datos. Se pro cede al cierre de las preguntas abiertas (si las hubiere), al chequeo y la depuración de los cuestionarios y a su grabación, salvo que se haya empleado un modo informatizado en la recogida de información. El capítulo 2 trata de los distintos métodos de encuesta, destacándose las diferencias entre ellos. Especial referencia se hace a los nuevos métodos informatizados de encuesta. Con la información ya grabada y depurada se procede a su análisis estadístico. Pri mero exploratorio, mediante gráficos y estadísticos univariables. Le sigue el análisis bi-
variable, generalmente a través de tablas de contingencia o del cruce de los atributos de dos o más variables. A veces se incluyen terceras y cuartas variables, a modo de va riables de control. Es deseable que la fase analítica concluya con la aplicación de alguno de los modelos de análisis multivariable, que permita un estudio de las interrelaciones conjuntas entre la serie de variables. En el capítulo 4 se insiste en la importancia de prever qué análisis estadísticos pien san realizarse antes de proceder a redactar las preguntas. Esta previsión facilitará bas tante las posibilidades analíticas de los datos de encuesta. De ellos se exige que sean “significativos” desde la vertiente estadística, pero también desde la lógica sustantiva. Han de ser interpretables y tener un significado lógico, que responda a los objetivos e hipótesis principales de la investigación. La encuesta concluye con la redacción del informe. Este cumple la función de pre sentación, de comunicación, de la investigación materializada. De él se exige que sea una exposición pormenorizada del estudio, en cada una de sus fases, y del alcance de sus resultados. Su redacción ha de ser objetiva, transparente y lo más fidedigna posi ble respecto a los contenidos de la investigación: El informe tiene que dar cuenta del cómo, cuándo y con qué resultados se han cum plido los objetivos del proyecto. Un informe debe explicar los procesos seguidos, las di vergencias o cambios en lo proyectado (si los hubiere) y la confirmación o refiitadón de las hipótesis de partida que dieron lugar al proyecto de investigación (Alvira, 1995:246-247).
Representa, en suma, la síntesis, la culminación del ejercicio investigador, en forma de documento para su lectura y evaluación. Documento del que se exige que sea “honesto” sobre los hallazgos del estudio y que ofrezca el suficiente detalle que haga posible su replicación. La especificación de los “límites” de la investigación se estima crucial para la interpretación de la información aportada y para su credibilidad. La documentación debería ser tan detallada que un equipo de investigación debería ser capaz de replicar un estudio basado en la documentación oficial (Biemer y Lyberg, 2003: 364).
1.5. Errores en la aplicación de la encuesta La calidad de la encuesta y sus posibilidades de inferencia dependen de su diseño y de cómo éste se ejecute en cada una de sus fases. En el apartado 1.1 se reseñó el in terés creciente, por parte de los metodólogos de encuesta, en la detección y trata miento de los errores que en ella pueden darse y que deterioran su calidad. El cuadro 1.3 ofrece una tipología de los distintos errores que pueden surgir en una en cuesta. Éstos se agrupan atendiendo a si se deben a “no observación” o si se trata de errores de “observación” o de medición. A continuación se detalla en qué consiste cada tipo de error.
Capítulo 1: La encuesta como estrategia de investigación social
41
CUADRO 1.3. Errores en el desarrollo de una encuesta
Errores de “no observación”. No representatividad de la población en la muestra final mente observada, por errores de: 1. No cobertura • 2. Muestreo 3. No respuesta
Errores de “observación”o medición. Desviaciones de las respuestas obtenidas de los va lores “verdaderos”, debido a: 1. El método de encuesta. 2. El diseño del cuestionario. 3. La intervención del entrevistador. 4. La actitud del encuestado. 5. El tratamiento de la información.
1.5.1. Errores de “no observación” Propiciados por la no obtención de información de toda la variedad de unidades que componen la población objeto de estudio. Ello afecta a la representatividad de la muestra finalmente observada; es decir, de las unidades de las que se extrae la infor mación. Esta carencia de representatividad de la muestra puede deberse a tres tipos de errores: de no cobertura, de muestreo y de no respuesta. Error de no cobertura Se refiere a la idoneidad del marco muestral (o listado que incluye a las unidades de la población) utilizado para la selección aleatoria de las unidades muéstrales, si cu bre a todos los integrantes de la población de interés. La no cobertura surge por la utilización de listados con erróneas inclusiones u omi siones de las unidades de la población. Debido bien a su no actualización (el registrar datos no recientes), bien a la existencia de duplicidades (en especial, cuando el mar co muestral es una combinación de una serie de listados), bien a su no correspondencia con el objeto de estudio. Por ejemplo, en una investigación sobre las condiciones de vida de la población mayor en España, el emplear para la extracción de la muestra los listados de usuarios de centros de día y de residencias, públicas y privadas, supondría la existencia de errores de
no cobertura cuando se pretendiese analizar al conjunto de la población española mayor de 65 años. No cuando el estudio se limitase a la población atendida en dichos centros. La influencia del error de no cobertura (el no haber dado a todos los integrantes de la población la oportunidad de participar en la investigación) en la calidad de la en cuesta depende de: a) La proporción de población no cubierta en el marco muestral. b) Las diferencias entre las características de la población cubierta y la no cubierta. En la medida en que los “no incluidos” en el marco muestral presenten característi cas diferentes de los incluidos, las estimaciones de la encuesta estarán sesgadas. Error de muestreo Normalmente éste es el error más medido en la investigación mediante encuesta. Es el aspecto de la calidad de la encuesta examinado a través de estadísticos inferenciales aplicados a resultados de encuesta muestral de los que se obtienen conclusiones sobre diferencias significativas en la población (Dillman, 1991: 227).
Toda encuesta presenta error muestral porque únicamente se extrae información de una parte de la población. A su vez, ésta tan sólo representa una de todas las posibles muestras que pueden extraerse de la misma población. Por lo que siempre habrá algu na divergencia entre los valores obtenidos de la muestra (estimaciones muéstrales) y los correspondientes valores poblacionales (parámetros poblacionales). Su magnitud depende del tamaño de la muestra y de su representatividad. Si todos los integrantes de la población han tenido igual probabilidad de ser seleccionados pa ra la muestra. En el capítulo 3 se analizan los efectos diferenciales, en el error muestral, debidos al tamaño de la muestra, el procedimiento seguido en la elección de las uni dades muéstrales, la heterogeneidad de la población y el nivel de confianza adoptado en la inferencia de las estimaciones muéstrales. Error de “no respuesta” Lamentablemente, este tipo de error también está presente en la generalidad de las encuestas, aunque en distinta magnitud. Se debe a que no se ha recabado in formación de todas las unidades que componen la muestra inicial del estudio. Bien por su no localización, bien por su negativa a participar en la encuesta, en su totalidad o parcialmente (no se responde a algunas de las preguntas del cuestionario). A esto úl timo se llama no respuesta de ítem. Se diferencia entre: a) No respuesta total o de unidad. Supone la exclusión de la unidad de la muestra original en toda la encuesta. No se ha podido establecer contacto con la misma o ésta ha rehusado a participar en la investigación.
b) No respuesta de ítem. La unidad muestral sí participa en la encuesta, pero omite contestar a algunas de las preguntas del cuestionario. Puede deberse a su desconocimiento sobre el tema que se le pregunta, a la complejidad de la pre gunta, al temor o inhibición que le produce dar una respuesta a determinadas cuestiones o, simplemente, porque quiere acabar de rellenar el cuestionario lo más pronto posible y no quiere dedicar tiempo a meditar algunas de las pre guntas del cuéstionario. El efecto de la no respuesta en la calidad de la encuesta depende, igualmente, de la magnitud que represente en la muestra inicial. También, de las características di ferenciales entre quienes responden y aquellos que no lo hacen. De manera especial, cuando sus diferencias están directamente relacionadas con el problema de investi gación. La no respuesta de ítem sí es proporcionada en la generalidad de las encuestas (los “no sabe/no contestan”). No sucede así con la no respuesta total (o de unidad). Son es casas las encuestas que informan de la proporción y las características de las unidades de la muestra no contactados o que se negaron a participar en el estudio. Esta infor mación es imprescindible en el análisis de la calidad de la encuesta. Afecta a la “re presentatividad” de los datos en ella aportados. En el capítulo 5 se exponen algunas de las actuaciones habituales en su reducción y control. 1.5.2. Errores de observación o de medición Conciernen a la adecuación de la información que se ha recabado en la encuesta, a su correspondencia con los valores “verdaderos” en la población. Algunos autores -como Bradburn, (1983)- emplean el término “errores de respuesta” en referencia a es ta variedad de errores de encuesta. Otros -Groves (1989), por ejemplo- prefieren, en cambio, reservar dicho término para aludir a errores asociados con el encuestado, con el cuestionario o con la actuación del entrevistador. En general, los errores de observa ción pueden deberse al método de encuesta aplicado, al diseño del cuestionario, la in tervención del entrevistador, la actitud del encuestado y el tratamiento de la información. Método de encuesta Su pertinencia en la consecución de los objetivos de la investigación. En el capítulo 2 se verá que, ante un mismo problema de investigación, la aplicación de uno u otro método afecta a los resultados de la encuesta. Tanto en su cantidad como en su calidad. No se consigue la mima cantidad y calidad de información cuando el cuestionario se responde, precipitadamente, a la salida del metro o por teléfono (mientras se está rea lizando alguna tarea doméstica o de otro orden), que cuando se cumplimenta (por él mismo o con ayuda de un entrevistador) tranquilamente en el domicilio del encuestado, por ejemplo.
Cada método de encuesta presenta unas ventajas y unos inconvenientes. El in vestigador deberá valorarlos en su decisión de cuál utilizar, consciente de los errores a los que son más vulnerables. Cuestionario Sudman y Bradburn (1974) destacan el diseño del cuestionario como la principal fuente de error en las estimaciones de encuesta. Fowler y Mangione (1990) lo consi deran una vía clave en la minimización de los efectos debido a la entrevista. El formato de la pregunta y de sus opciones de respuesta (en preguntas cerradas), así como su ubicación en el cuestionario, pueden afectar a la respuesta, a su validez. Puede haber errores de especificación, debidos a la no correspondencia de la pregun ta con el concepto que trata de medir. Pero, también, pueden darse otros tipos de erro res, como el llamado de aquiescencia o tendencia al acuerdo indistintamente del con tenido de la pregunta. Esta variedad de error y otros debidos al diseño del cuestionario se analizan en el capítulo 4 donde, además, se dan propuestas para su corrección. Entrevistador La intervención del entrevistador (cuando la encuesta no es autoadministrada), en la captación de información, puede tener efectos no deseados en la calidad de las res puestas. No sólo afecta su forma de administrar el cuestionario: cómo formula las pre guntas, registra las respuestas, sus reacciones ante dificultades que tenga el encuestado para responder (aclaraciones), o su reacción a respuestas que éste pronuncie, y si le concede tiempo suficiente para contestar las preguntas. También, puede influir en la respuesta sus propias características personales, como se verá en el capítulo 5. La introducción de mejoras en el diseño del cuestionario y la estandarización de la actuación del entrevistador se avanzan como posibles remedios para limitar los erro res debidos al entrevistador. Encuestado La actitud del encuestado que, deliberadamente o no, proporciona información in correcta. La falta de veracidad en su respuesta puede deberse a la imagen que de él mis mo quiera proyectar, en busca de aprobación social. El capítulo 4 incluye el sesgo llamado de deseabilidad social y propuestas para evitarlo. Como son el motivar al encuestado a res ponder con sinceridad, el aleatorizar las respuestas, o el crear las condiciones para que to das las respuestas se perciban como igualmente aceptables. Además, se explicitan varias recomendaciones para la formulación de las preguntas y su disposición en el cuestiona rio, que ayudan a una mejor captación de lo “latente” y no sólo de lo “manifiesto”. La falta de veracidad en la respuesta puede, asimismo, resultar de la incapacidad involuntaria del encuestado para proporcionar información “correcta”. Como con secuencia de una mala redacción de la pregunta (confusa, ambigua), que favorece su
errónea comprensión; de su desconocimiento del tema sobre el que se le pregunta; su precipitación en la respuesta; o la presencia de errores de memoria, también tratados en el capítulo 4. En él se proponen algunas actuaciones referidas al diseño y la admi nistración del cuestionario, que contribuyen a reducir su incidencia en la encuesta. Tratamiento de la información Comprende la edición, la codificación de preguntas abiertas, la grabación de los da tos en el ordenador, la ponderación y la imputación de respuestas, la tabulación de los datos y su modelado estadístico. Errores que resultan de actuaciones incorrectas por parte de los procesadores y los analistas de datos. El personal que codifica las respuestas puede desviarse de los criterios fijados. Tam bién pueden cometerse errores en la grabación de los datos, en el cálculo de los coe ficientes de ponderación (que compensan estadísticamente los errores de no obser vación: de muestreo, de no cobertura, de no respuesta), en la tabulación y demás análisis estadísticos, tratados en el capítulo 6. Todo ello incide en la calidad de la en cuesta, en la existencia de errores en las respuestas, con la consiguiente imagen dis torsionada de la realidad social que se analiza. En palabras de uno de los autores que más han contribuido al análisis de los errores de encuesta: Las omisiones más importantes son aquellas que surgen de las respuestas a las pre guntas de encuesta que han sido obtenidas por los entrevistadores: la codificación, la edi ción, la imputación y otras actividades del procesamiento de datos que siguen a la fase de recogida de datos (Groves, 1989:12).
Hasta aquí la reseña de los principales errores que repercuten, negativamente, en la calidad de la encuesta. En los capítulos que siguen se irá desgranando y analizando cada uno de ellos. Para ayudar en su comprensión, cada variedad de error se incluye en el momento del desarrollo de la encuesta en que puede aparecer, como resultado de incorrecciones en su diseño y/o en su ejecución. Aunque se comparte una visión con junta de la encuesta, de las interrelaciones entre sus distintas fases y entre los errores consiguientes. Una mala decisión inicial puede tener una repercusión negativa inme diata en la calidad de la encuesta. También afecta a actuaciones posteriores. Por esta razón se precisa analizar con precisión las repercusiones de decisiones incorrectas que afectan al error total de encuesta.
LECTURAS COMPLEMENTARIAS Bericat, E. (1998): La integración de los métodos cuantitativos y cualitativos en la in vestigación social Ariel Sociología. Madrid. Biemer, P. P. y Lyberg, L. E. (2003): Introduction to survey quality. John Wiley and Sons. Nueva Jersey.
El error de no cobertura afecta a la “representatividad” de la muestra. Las esti maciones muéstrales únicamente serán inferibles a la población incluida en el marco muestral. En la medida en que ésta coincida con la población de interés, su repercusión en la calidad de los datos de encuesta será menor. De ahí que se insista en la reco mendación, ya destacada por Fowler (1988: 22), de Cuando se informen resultados, el investigador debe decir a los lectores a quién se dio y a quién no se dio una oportunidad de ser seleccionado, cómo aquellos omitidos di ferían de los otros y si había o no algunas personas muestreadas para quienes las oportunidades de selección no eran conocidas.
Los remedios ante el error de no cobertura inevitablemente exigen tener infor mación sobre el marco de muestreo, en qué medida incluye al conjunto de la población de interés. Para ello se precisa disponer de datos de la población de estudio en su con junto, aparte de la proporcionada en el marco muestral. En concreto, las actuaciones comunes son: a) En la definición de la población de estudio, restringirse a aquella incluida en el marco muestral. Porque el error de no cobertura desaparece cuando ambas po blaciones coinciden. Por ejemplo, si en un estudio sobre delincuencia se piensa únicamente utilizar el lis tado de personas recluidas en centros penitenciarios, como marco muestral, limitar el ám bito de la encuesta a la población reclusa, en la actualidad y/o en fechas precedentes. De pende de los objetivos de la encuesta. En el caso de que así se procediese, no habría error de no cobertura en la medida en que el listado cumpliese los requisitos anteriormente se ñalados de comprehensividad, actualización, omisiones e inclusiones erróneas y dupli cidades. En cambio, sí habría error de no cobertura, y de gran magnitud, si únicamente se utilizase, como marco muestral, el listado de población reclusa y se quisiese genera lizar los resultados de la encuesta al conjunto de la población delincuente. No sólo no describiría a la población delincuente “no oficial”, la aún no censada. Ni siquiera al con junto de la población delincuente oficial. Se excluye a aquellos que, aun habiendo sido detenidos por agentes de control social (policía, guardia civil), no han sido juzgados por tribunales de justicia. Y, si lo han sido, no se les ha aplicado la pena máxima de reclusión en un centro penitenciario. b) Conocer los criterios seguidos en la elaboración del marco muestral, en la cla sificación de las unidades de la población, y la periodicidad en su actualización. El acceso a esta información contribuye a calibrar la incidencia del marco muestral en el error de no cobertura. Por ejemplo, en datos referidos a la población inmigrante, averiguar qué población incluye dicho marco: si se restringe, exclusivamente, a la población con permiso de re sidencia o, también, abarca a la no regularizada; si los oriundos de otros países de la Unión Europea están incluidos (debido al acuerdo de libertad de fronteras entre los paí-
ses miembros); si incorpora a aquellos que acaban de obtener la nacionalidad españo la, etc. En suma, habría que definir qué se considera inmigrante. Además, adviértase que en el estudio de la población inmigrante, la actualización del marco es un requisito prio ritario, al encontrarse esta población más expuesta a cambios en su situación, por la pro pia “transitoriedad” que caracteriza a la experiencia migratoria.
c) Utilizar “conjuntamente” varios marcos de muestreo, cuando se prevea que un único marco no cubre a toda la población de interés. Por ejemplo, si se quiere analizar a la población delincuente oficial, utilizar datos pro cedentes de la Dirección General de la Policía, de los Tribunales de Justicia y de la Di rección General de Instituciones Penitenciarias. Cuando se utilicen varios marcos de muestreo combinadamente, es exigi da la eliminación de duplicidades, además de los chequeos por inclusiones erróneas. La supresión de duplicidades (unidades de población repetidas) se agi liza bastante si los marcos muéstrales están en soporte magnético. Mediante un programa informático se “casan” los datos incluidos en los distintos marcos: nombre, dirección, teléfono, DNI y demás referidos a las unidades de población que incluye cada marco muestral. d) Identificar las “omisiones” del marco muestral y utilizarlas como variables de cuota en el diseño de la muestra. Para ello se precisa información complemen taria, que ayude a calibrar la cobertura del marco. Por ejemplo, para comprobar en qué medida los directorios de los colegios profe sionales de sociólogos “cubren” al conjunto de licenciados y doctores en sociología, pue de accederse a los registros de las distintas facultades de sociología en España, en un pe ríodo de tiempo concreto. De la comparación de los distintos listados, podría conocerse la proporción de licenciados que están colegiados. Pero, si además se desea acceder a más información referida a las características diferenciales entre los sociólogos colegiados y aquellos no colegiados, podría extraerse (mediante alguno de los procedimientos alea torios descritos en el apartado 3.4) una muestra de cada marco muestral. A ambas muestras se les pasaría el mismo cuestionario, ya mediante entrevista (personal o tele fónica) o por correo. Recuérdese que en encuestas a poblaciones especializadas (como es el colectivo de licenciados en sociología), la encuesta por correo da mejores resulta dos que cuando ésta se dirige a la población en general. Asimismo, supondría un aba ratamiento en los costes económicos de la investigación. Aunque no en los temporales, al precisar de un mayor plazo de tiempo para la ejecución del trabajo de campo que los otros métodos de encuesta. Las respuestas en ambas muestras se compararían, para comprobar si los sociólogos colegiados difieren de los no colegiados. Esta información es clave, si quiere estimarse la incidencia del error de no cobertura en los resultados de la encuesta. En qué medida las estimaciones muéstrales obtenidas en la muestra extraída del directorio de sociólo gos colegiados logra representar al conjunto de los sociólogos españoles (si ésta cons tituyese la población de interés), y no exclusivamente a los colegiados.
En referencia a la encuesta telefónica, Keeter (1995) propone el uso de “ho gares transitorios”. Por ellos se entiende aquellos que han experimentado un cambio en su situación de usuario de telefonía fija: o acaban de incorporarse al directorio telefónico (si éste fuese el marco muestral) o han dejado de estar re gistrados. El acceso a esta población en parte permite conocer las características de los hogares “sin teléfono”. Aunque el 57% de los hogares sin teléfono por él analizados eran “transitorios”, el mismo autor reconoce que éstos no logran representar, plenamente, al conjunto de los hogares sin teléfono. De todas formas, cuando se quiera extraer información de la población no cubierta en encuestas telefónicas, puede optarse por aplicar, conjuntamente, otros métodos de encuesta (cara a cara e, inclusive, por correo). Por correo, si se dis pone de un marco muestral que incluya el nombre y la dirección completa del conjunto de la población. Permitiría conocer la cobertura telefónica y las ca racterísticas diferenciales de la población con y sin teléfono (estén o no regis trados en el listín telefónico) en las variables concretas que se analizan. Indu dablemente, ello supondría incrementos en los costes de la investigación. Aunque éstos podrían amortizarse, si la información referida a la población no cubierta por el marco muestral pudiese utilizarse en encuestas posteriores, pero próximas en el tiempo. e) Ajustes post-encuesta para compensar “en parte” los errores de no cobertura. Co mo en el error de no respuesta (subapartado 5.3.2), los efectos del error de no co bertura pueden reducirse mediante la ponderación. Para ello se precisa dispo ner de información complementaria “actualizada”, bien de otras encuestas que incluyan a los “no cubiertos”, bien de datos censales. En la medida en que las variables utilizadas en la ponderación estén relacionadas con el problema de investigación y diferencien a la población cubierta de la no cubierta, se conse guirá mejorar las estimaciones muéstrales. En caso contrario, no. Habitualmente, las variables más utilizadas en la ponderación son las pro porcionadas en los registros censales. Preferiblemente, las relativas a estatus so cial (educación, ocupación, ingresos), edad, género, hábitat, etnia. Si la elegida está relacionada con la variable de estudio, se habrá conseguido reducir la in cidencia del error de no cobertura y la obtención de mejores estimaciones muéstrales. Con la ponderación se persigue “equilibrar” la muestra, adecuarla a la población de estudio, “ponderando”, es decir, dando un mayor peso a las unidades de población “menos cubiertas” en el marco muestral Como indica Wert (2000: 208), en referencia a la encuesta telefónica, Si no se introduce un factor de equilibrio o una cuota ad hoc, dadas las diferencias de equipamiento telefónico que se dan en los distintos grupos de estatus, se podría es perar una diferencia resultante en la distribución por estatus de una muestra en encuestas telefónicas en la que la sobrerrepresentación de la clase alta y media-alta fuera de 2 a 3 puntos, la clase media estaría sobrerrepresentada en un punto y la clase media-baja y ba ja tendría una subrepresentación en la muestra telefónica de entre 3 y 4 puntos.
El coeficiente de ponderación resulta de la estimación del peso de la po blación cubierta en el marco respecto del conjunto de la población de interés, en la variable analizada. Se obtiene dividiendo el porcentaje de la población to tal entre el porcentaje de la población cubierta, en cada categoría de la variable elegida para la ponderación. Obviamente, la variable seleccionada debe dife renciar a la población cubierta de la no cubierta. Las estimaciones muéstrales se multiplicaría]! por los coeficientes de ponderación respectivos. De la ponderación se habla con más detenimiento en los subapartados 3.4.3 (en referencia a la ponderación de muestras estratificadas no proporcio nales) y 5.3.2 (como estrategia para la reducción del error de no respuesta). En este último subapartado se incluyen distintos métodos de ponderación. Estos son extensibles a los ajustes por no cobertura, sustituyendo la tasa de no respuesta por la de no cobertura, razón por la cual se recomienda su lectura. Aunque se insiste en que estos ajustes “post-encuesta” no logran eliminar los errores de no cobertura, únicamente compensan, y sólo en parte, su efecto en las estimacio nes muéstrales.
3.3. El tamaño de la muestra A la elección del marco muestral sigue la determinación de cuántas unidades de la población incluir en la muestra. En esta decisión interviene una conjunción de facto res varios, que cabe resumir en los seis siguientes: a) El tiempo y los recursos disponibles para la realización de la encuesta. b) La modalidad de muestreo seleccionada en orden a alcanzar los objetivos esenciales de la investigación. c) La diversidad de los análisis de datos previstos. d) La varianza o heterogeneidad poblacional. e) El margen de error máximo admisible para la estimación de los parámetros poblacionales. f) El nivel de confianza de las estimaciones muéstrales.
El tiempo y los recursos disponibles Sin duda, dos componentes esenciales en cualquier investigación son el tiempo y los recursos (económicos, materiales y humanos), concedidos al equipo investigador, para la materialización del estudio propuesto. En función de cuánta sea la dotación eco nómica y los plazos temporales para cada fase de la investigación, el tamaño final de la muestra se verá aumentado o mermado. Además, repercute directamente en el mé todo de encuesta finalmente elegido. Disponer de pocos recursos puede llevar a reducir el tamaño de la muestra, a elegir el método de encuesta más económico (la encuesta au-
tocumplimentada con preferencia a la encuesta cara a cara y telefónica, como se vio en el capítulo 2), y a rebajar la dificultad en la selección de las unidades de la muestra. En la encuesta telefónica, por ejemplo, la muestra puede ser más amplia (que en la encuesta cara a cara) y abarcar a distintos grupos de población, al ser su coste menor. Lo mis mo sucede en la encuesta por correo (capítulo 2). En encuestas a poblaciones específicas, como profesionales (profesores, sociólo gos, médicos, jueces) u organizaciones (universidades, hospitales, empresas), el mayor esfuerzo en su contactación y en el logro de su cooperación suele ir acompañado de una reducción en el tamaño de la muestra. Mayor que cuando la encuesta es a la población en general y si se trata de una encuesta cara a cara. No necesariamente cuando se re curre a la encuesta por correo, que suele alcanzar mayor éxito (medido en porcentaje y calidad de las respuestas) en poblaciones con un nivel cultural superior.
La modalidad de muestreo seleccionada La elección de uno o varios métodos de muestreo depende, igualmente, de la con junción de los tres determinantes clave de cualquier proceso de investigación: los ob jetivos, los recursos y el tiempo disponible para su ejecución. Además, cada método de muestreo conlleva unas exigencias específicas en tamaño y selección de la muestra. En general, los métodos no probabilísticos, no enfocados a la inferencia estadística, se aso cian a tamaños muéstrales inferiores a los exigidos en los métodos probabilísticos. Es tos últimos persiguen la consecución de muestras “representativas”, razón por la cual precisan de un mayor tamaño muestral, porque éste incide en un menor error muestral, que afecta a la signifícatividad estadística de las estimaciones muéstrales. En cada agrupación hay variaciones entre las diferentes modalidades de muestreo. Dentro de los muestreos probabilísticos, el aleatorio estratificado precisa de un mayor tamaño muestral que los otros modos. El error muestral es también menor. En los no probabilísticos, el muestreo por cuotas suele ir acompañado de tamaños muéstrales ma yores que el muestreo estratégico o el llamado bola de nieve. También, por las carac terísticas de las investigaciones en que suelen aplicarse, no tan enfocadas a la inferencia estadística.
La diversidad de los análisis de datos previstos Cuando se proyecta cualquier investigación, antes de diseñar la muestra y la es trategia a seguir en la obtención de información, hay que anticipar la variedad de aná lisis para la consecución de los objetivos de la investigación. Si el equipo de investi gación cree de interés la aplicación de alguna (o varias) técnicas estadísticas multivariables, deberá procurar que la muestra sea aleatoria e incluya un número ele vado de casos. Ello contribuye a la reducción de los errores de predicción y al aumento, consiguiente, del poder predictivo del modelo obtenido.
En el análisis multivariable, la repercusión del tamaño de la muestra en la signi ficatividad de las estimaciones muéstrales depende del número de variables incluidas en el análisis. En regresión múltiple, por ejemplo, cuando se aplican procedimientos secuenciales de estimación de parámetros poblacionales, se aconseja que al menos 40 ca sos por cada variable independiente o predictora (Tabachnick y Fidell, 1989; Cea D ’Ancona, 2002a/2004a). En caso contrario, habrá que eliminar variables independientes o proceder a su agrupación para garantizar la debida proporcionalidad de casos por va riables. Para análisis bivariables, como el habitual en el análisis de datos de encuesta, de tablas de contingencia (o cruces de variables), también se precisa de un tamaño muestral elevado. Especialmente, si las variables comprenden un número amplio de categorías y se quiere ver la incidencia de terceras y de cuartas variables en la relación entre dos variables. Cuanto más se segmente la muestra, mayor tamaño muestral se pre cisa para que las estimaciones muéstrales satisfagan los criterios de significatividad es tadística.
La varianza o heterogeneidad poblacional Si la muestra pretende ser una representación, a pequeña escala, de la población de estudio, en su tamaño también incidirá la varianza poblacional. Cuanto más hete rogénea sea una población, mayor será su varianza poblacional. En consecuencia, se precisará de un mayor tamaño muestral para que cada uno de sus diversos integran tes tengan representación en la muestra. En universos homogéneos, caracterizados por una baja varianza poblacional, se reducen, en cambio, las exigencias en el tamaño de la muestra. Se precisan menos casos para representar a la población. El conocimiento de la homogeneidad o heterogeneidad poblacional resulta, por tanto, primordial en la decisión del tamaño muestral. Si bien, no siempre resulta factible. Precisa de la existencia de algún estudio previo sobre esa misma población y que aún tenga vigencia. Esta información puede obtenerse de encuestas que se repi ten con una cierta periodicidad (los barómetros del Centro de Investigaciones So ciológicas, los eurobarómetros de la Unión Europea, la Encuesta de Población Acti va del INE), siempre que ambas poblaciones (la del estudio previo y aquella de la encuesta que se proyecta) coincidan. Quiere decir, que tengan proximidad temporal, abarquen la misma población y traten la misma temática. En caso contrario, las esti maciones de la varianza poblacional en las variables de interés no serán aplicables en el cálculo del tamaño muestral. También, puede utilizarse la información proporcio nada en el pretest del cuestionario (apartado 4.5) en la estimación de la varianza poblacional. El conocimiento de la varianza poblacional siempre supondrá una reducción del tamaño de la muestra porque, cuando se desconoce, se aplica el supuesto de máxima heterogeneidad del universo. Éste es el supuesto más desfavorable y de práctica ha bitual en la investigación social. El desconocimiento de la varianza poblacional supone tomar el producto de las probabilidades P (de aparición de un suceso) y Q (que indica
la no ocurrencia del suceso o evento; siendo su valor igual a “1 - P”) como equivalente a la varianza poblacional, en igual magnitud. Ambas probabilidades valdrían 0,50. Co mo puede verse en el cuadro 3.1, ello implica un mayor tamaño muestral (con el con siguiente incremento de los costes de la encuesta), que cuando se parte del conoci miento de los valores reales de dichas proporciones en la población, y éstos se alejan del valor 0,50. Como ilustración, en el cuadro 3.1 se incluyen tamaños muéstrales correspondientes a poblaciones infinitas (mayores de 100.000 unidades), al nivel de confianza más em pleado (2a-sigm a- o unidades z, de desviación típica, que supone una probabilidad de acierto en la estimación de los parámetros poblacionales del 95,5%), para distintos valores de P y Q (expresados en porcentajes) y limites de error establecidos. En él pue de observarse que el tamaño muestral aumenta, conforme los valores de P y Q se apro ximan al valor de 50 (que significa máxima heterogeneidad poblacional), indistinta mente del margen de error fijado. Por ejemplo, para un margen de error de ±2,5%, el tamaño de la muestra para una población de más de 100.000 unidades es de 576 unidades si P = 10 y Q = 90. Si P y Q fue sen, respectivamente, 30 y 70, la muestra aumentaría más del doble. Exactamente, a 1.344 unidades. Para el supuesto de máxima heterogeneidad ( PyQ igual a 50), el tamaño de la muestra sería de 1.600 unidades. Es decir, casi el triple del supuesto inicial de elevada homogeneidad poblacional (P =10 y Q = 90). Este incremento reduce, no obstante, las posibilidades de errar en la estimación de los parámetros poblacionales para las variables de estudio. Por esta razón se adopta este supuesto de máxima heterogeneidad, siempre que se desconozca el valor de la varianza poblacional en las variables que se analizan. Los tamaños muéstrales incluidos en el cuadro 3.1 se han obtenido aplicando la fór mula habitual para el cálculo del tamaño muestral en universos infinitos y a un nivel de confianza de 2a (que implica un 95,5% de probabilidad de acierto en la estimación de 4PQ parámetros poblacionales): n = E Donde E representa el error muestral o error típico. Las fórmulas del tamaño muestral se comentan al final de este apartado.
El margen de error máximo admisible En el cuadro 3.1 puede también observarse la correspondencia entre el error y el tamaño muestral. Los incrementos en el tamaño de la muestra repercuten en una mayor precisión en la estimación de los parámetros poblacionales, con la consi guiente reducción del error de muestreo. Por el contrario, en muestras pequeñas, el error aumenta, manteniéndose constante la varianza poblacional. La figura 3.1 representa, de forma gráfica, la relación negativa existente entre el error y el tamaño de la muestra. Para su elaboración se han tomado los valores que apa-
CUADRO 3.1. Tamaño muestral para poblaciones infinitas a un nivel de confianza
del 95,5% (2 o) Valores estimados de P y Q (%)
Límites de error (%) para ±2a 0,1 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 5,0
1/99
10/90
20/80
30/70
40/60
50/50
39.600 1.584 396 176 99 63 44 32 25 16
360.000 14.400 3.600 1.600 900 576 400 294 225 144
640.000 25.600 6.400 2.844 1.600 1.024 711 522 400 256
840.000 33.600 8.400 3.733 2.100 1.344 933 686 525 336
960.000 38.400 9.600 4.267 2.400 1.536 1.067 784 600 384
1. 000.000
40.000 10.000 4.444 2.500 1.600 1.111
816 625 400
Figura 3.1. Representación gráfica de la relación entre las variables error y tamaño muestral para P = Q = 50 y nivel de confianza del 95,5%.
recen en el cuadro 3.1, correspondientes a la situación más habitual en la práctica in vestigadora: desconocimiento del valor de la varianza poblacional (P = Q = 50). Co mo puede observarse, conforme aumenta el tamaño de la muestra, desciende el error muestral. Si el tamaño de la muestra se amplía, por ejemplo, de 816 a 2.500 unidades, el error disminuye del 3,5 al ±2%. También se advierte que a partir del 2% de error se disparan los aumentos en ta maño de la muestra para alcanzar una misma ganancia en reducción del error muestral. Pasar del 2 al 1% de error supone un incremento de 2.500 a 10.000 unidades en la muestra, con el consiguiente aumento de los costes de la encuesta (económicos y temporales). A cambio, sólo se logra una leve mejora en la precisión de la estimación de los parámetros poblacionales (una unidad porcentual). En consecuencia, el inves tigador deberá encontrar un punto intermedio entre el tamaño y el error muestral, an te la tendencia observada en muestras grandes a proporcionar mínimos incrementos en adecuación en la estimación de parámetros poblacionales. En los diseños muéstrales probabilísticos el error muestral interviene en el cálcu lo del tamaño de la muestra. El investigador fija a priori el error de las estimaciones de los datos de la encuesta proyectada, sopesando la precisión que desea con los costes que supondría la reducción del error muestral. Errores comprendidos entre ±2,5 y 2% son los más frecuentes en la investigación social. No es deseable errores supe riores a ±4%.
El nivel de confianza de la estimación
Un último elemento que interviene en la decisión del tamaño de la muestra -aun que igualmente sólo en diseños probabilísticos- es el nivel de confianza que el inves tigador concede a sus estimaciones de los parámetros poblacionales. Como su nombre indica, el nivel de confianza expresa el grado de “confianza” (o de “probabilidad”) de que las estimaciones muéstrales se ajusten a la realidad. Tres son los niveles de confianza comunes en la investigación social. Corresponden a áreas ba jo la curva normal acotadas por distintos valores de desviación típica (denominada sigma (o) en referencia a la desviación poblacional). De ellos el más habitual es 2o, que supone un 95,5% de probabilidad de acertar en la estimación muestral. La distribución normal se aplica en estadística inferencial para la estimación de la probabilidad de que un determinado evento acontezca. Representa una curva per fectamente simétrica, en forma de campana, que admite infinitos valores (unidades Z o unidades de desviación típica). El área total bajo la curva normal es 1 (dado que la probabilidad siempre es un valor positivo comprendido entre 0 y 1). En función de cuál sea el valor Z variará la probabilidad concedida al evento en cuestión. Si se toma una unidad de desviación típica, la probabilidad de acierto en la es mación es de 68,3% (véase figura 3.2). Con dos unidades de desviación, la probabili dad de acierto se incrementa hasta el 95,5%. La plena seguridad en la estimación (exac tamente un 99,7%) se adquiere si se fijan en tres las unidades de desviación típica. Pero
" -3 a
-2o
- lo ^ +1o +2o +3o L- 68,3% - 1 ---------- 95,5% ______ ------------------ 99,7% -----------------
Figura 3.2. Niveles de probabilidad en el área bajo la curva normal.
no es éste el nivel de confianza usual en la práctica investigadora, sino el 95,5% (equivalente a 2a). La pregunta inmediata es ¿por qué? La respuesta se encuentra en el cuadro 3.2. En él se ejemplifica cómo (para una misma varianza poblacional) varía el tamaño de la muestra, dependiendo del nivel de confianza adoptado. Incrementos mínimos en nivel de confianza (del 95,5% de probabilidad de acierto al 99,7%) su ponen aumentar la muestra a algo más del doble. Si para un error de ±2% y varianza P = Q = 50, el tamaño de la muestra es de 2.500 unidades, para un nivel de confianza CUADRO 3.2. Tamaño muestral para poblaciones infinitas a un nivel de confianza
del 95,5% (2o) y 99,7% (3o) Límites de error (%)
Nivel de confianza (%)
Valores estimados de P y Q (%) 10/90
20/80
30/70
40/60
50/50
99,7
3.600 8.100
6.400 14.400
8.400 18.900
9.600 21.600
10.000 22.500
±2,0
95,5 99,7
900 2.025
1.600 3.600
2.100 4.725
2.400 5.400
2.500 5.627
±2,5
95,5 99,7
576 1.296
1.024 2.304
1.344 3.024
1.536 3.456
1.600 3.600
±3,0
95,5 99,7
400 900
711 1.600
933 2.100
1.067 2.400
1.111 2.500
±4,0
95,5 99,7
225 506
400 900
525 1.181
600 1.350
625 1.406
±1,0
95,5
de 99,7%, la muestra pasaría a estar integrada por 5.627 unidades. La ganancia en pre cisión es ínfima, mientras que los costes de la encuesta (en tiempo y dinero) supondrían más del doble de los presupuestados para un nivel de confianza del 95,5%. Todos los aspectos referidos participan en el cálculo del tamaño de una muestra probabilística. La fórmula genérica para una muestra aleatoria (simple o sistemática) sería la siguiente, cuando el universo o población estuviese compuesto por más de 100.000 unidades: Z 2S 2 n = ----— E2
o
Z 2PQ n = ---E2
Donde: Z = valor de la variable aleatoria normal típica en el área bajo la curva nor mal. Representa las unidades de desviación típica correspondientes al nivel de confianza elegido (2a o 3o). El nivel de confianza que el in vestigador tiene en que sus estimaciones se ajusten a la realidad. 5 2 = varianza poblacional estimada. Equivale al producto de las proporciones p y Q , siendo Q = 1 - P (o 100 - p , en términos porcentuales). E = error máximo permitido que el investigador establece a priori. La pre cisión buscada en la estimación de los parámetros poblacionales. Si el universo estuviese integrado por 100.000 unidades o menos, se trataría de una población finita. En este caso, habría que introducir un factor de corrección, quedando las fórmulas transformadas de la siguiente manera: Z 2S 2N n --------------------- — E 2(N - 1) + Z 2S 2
„ o
n=
Z 2PQN ^ E 2(N -1 ) + Z 2PQ
siendo N el tamaño de la población. En muestras aleatorias estratificadas y por conglomerados se introducen otras variaciones que se comentarán cuando se describan ambas modalidades de muestreo (subapartados 3.4.3 y 3.4.4).
E je m p lo s d e c á lc u lo del
tam añ o d e
LA m u e s tr a
Se quiere conocer la opinión de los estudiantes universitarios españoles sobre la refor ma universitaria para la convergencia con Europa. Calcular el tamaño de la muestra para los supuestos siguientes:
a) Si la encuesta se realizase en el conjunto de las universidades españolas, para un error máximo de ±2,5%. Se carece de información previa sobre la varianza poblacional. Para un nivel de confianza del 95,5%, el tamaño de la muestra sería: Z 2PQ = 2---------------= 2 50x50 1.600 unidades .. . n = ----E2 2,5 x
Elevar el nivel de confianza al 99,7% supondría, como es usual, incrementar el ta maño de la muestra en más del doble. Exactamente a 3.600 unidades. Z 2PQ 2 50x50 ------= 3.600 unidades n=— — = 3-------E2 2,5 x
b) Si se parte de lapredicción (a partir de un sondeo efectuado con anterioridad) de que el 68% de los estudiantes son favorables a la reducción de los años delicenciatura, los tamaños muéstrales serían 1.393 y 3.133, respectivamente. Z 2PÓ 2 x 68 x 32 1.393 , ooounidades r¡ = — — = 2---------------= E 2,5
,1
Z 2PÓ 32 68 x 32 „ „„„ n«— 5--------------------------------------------------------- ;------------- 3.133 E2 2,5 x
unidades
El tamaño muestral preciso ha descendido, al tener información previa sobre la varianza poblacional en la variable que se analiza. Todo conocimiento sobre varianza poblacional va a conllevar un descenso en tamaño muestral porque su desconoci miento implica calcular el tamaño de la muestra para el supuesto más desfavorable: máxima heterogeneidad poblacional. Es decir, P = Q= 50. La mitad de la población comparte una opinión y la otra mitad la contraria. El descenso será tanto mayor, cuan to más homogénea sea la población. c) Si la encuesta se hiciese en una universidad en la que están matriculados 86.729 alumnos: Z 2PQN ------------ 5-----------------22 50 50 86.724 , n = — --------------= 5---------------- 1.571 unidades E 2(N 1) + Z 2PQ (2,5 X 86.723) + (22 x 50 x 50) x
x
x
-
Z 2PQN 2 a x 68 x 32 x 86.724 „ = 1.371 unidades E2(N 1) + Z 2PQ (2,52 x 86.723) + (22 x 68 x 32) -
d) Si la encuesta se circunscribiera a la facultad de Ciencias Políticas y Sociología, don de están matriculados 5.112 alumnos: Z 2PQN ------------ ------------------------------22 x 50 x 50 x 5.112 = 1.219 , unidades n = — --------------= E (N -1) + Z 2PQ (2,5 x 5.111) + (22 x 50 x 50)
Z 2PQN 22 *68x32x5.112 = „1.095 unidades E 2(N -1) + Z 2PQ (2,5 x 5.111) + (2¿ x 68 x 32) En el ejemplo puede constatarse que, cuanto más pequeña es la población de estu dio, mayor tamaño muestral se precisa, en proporción, para un mismo nivel de confianza y error típico (o precisión de la estimación).
3.4. La selección de las unidades de la muestra: métodos de muestreo probabilísticos y no probabilísticos La representatividad de la muestra no es sólo función de la magnitud de su tamaño (que afecta a los errores de estimación), también está determinada por el procedimiento seguido en la selección de las unidades que compondrán la muestra: si todos los miembros de la población tienen la misma probabilidad de ser elegidos para formar la muestra. Los procedimientos a seguir en la selección son varios, como puede verse en el cuadro 3.3. Un mismo diseño muestral puede incluir dos o más métodos de muestreo. Una clasificación básica entre los métodos diferencia entre métodos de muestreo probabilísticos y no probabilísticos. Depende de si la selección de las unidades de la muestra se efectúa me diante algún procedimiento aleatorio o se aplican otros criterios diferentes al azar. Los métodos de muestreo probabilísticos se fundamentan en la aleatorización como criterio para la selección de las unidades de la muestra. Ésta no depende del jui cio o determinismo humano, sino del “azar”. Ello posibilita que: a) Cada unidad de la población del marco muestral tenga la misma probabilidad (conocida a priori) de participar en la muestra. b) La elección de cada unidad sea independiente de las demás. c) El cálculo de la precisión de las estimaciones muéstrales (el error muestral) res pecto a los parámetros poblacionales pueda hacerse dentro de unos márgenes de probabilidad específicos. Sólo en las muestras probabilísticas puede cuantificarse la proporción del error total de encuesta que se debe a varianza de muestreo. Esto la adecúa a propósitos de inferencia estadística: estimación de parámetros y comprobación de hipótesis (pruebas de significatividad). En los métodos de muestreo no probabilísticos la elección de las unidades de la muestra se realiza, por el contrario, sin que medie el “azar”. La conveniencia, el juicio o determinismo humano, u otros criterios subjetivos, son los que intervienen en el pro ceso de selección. Ello da cabida a discrecionalidades por parte del equipo investiga dor y repercute en: a) La desigual probabilidad de las unidades de la población para formar parte de la muestra.
b) La dificultad para estimar el error muestral. No proporciona medidas de pre cisión de las estimaciones muéstrales. c) La introducción de sesgos en el proceso de elección de la muestra. Esto redunda en riesgos superiores de invalidez de los hallazgos de la investigación. En consecuencia, se adecúan a investigaciones no dirigidas a la inferencia esta dística: a) La indagación exploratoria (estudios piloto, el pretest del cuestionario). b) Estudios cualitativos, más interesados en profundizar en la información apor tada que en su representatividad estadística. c) Investigaciones sobre población “marginal” (prostitutas, drogadictos, homo sexuales, inmigrantes ilegales e, incluso, miembros menos “marginales” como parejas cohabitantes, por ejemplo), de las que no se dispone de un registro ex haustivo que abarque a toda la población y facilite su localización. Lo cual com plica la aplicación de diseños muéstrales probabilísticos. Pese a ello, el muestreo no probabilístico presenta dos ventajas notorias que le ha cen atractivo en la práctica investigadora. Una, no precisa de la existencia de un marco muestral, a diferencia de los métodos de muestreo probabilísticos. Dos, su eje cución resulta más sencilla y económica. El cuadro 3.3 incluye la variedad de métodos de muestreo. Aunque hay que precisar que no forman compartimentos estanco. Un mismo diseño muestral puede compagi nar diferentes variedades de muestreo en las distintas fases de su desarrollo. La elec ción de un método u otro depende de la confluencia de cuatro factores básicos: a) La dotación económica de la investigación. b) El período de tiempo programado para su ejecución. c) La existencia de un marco muestral válido que haga factible la selección mues tral aleatoria. d) El grado de precisión que el investigador quiere dar a la indagación. 3.4.1. Muestreo aleatorio simple Constituye el prototipo de muestreo, en referencia al cual se estiman las fórmulas básicas para el cálculo del tamaño y del error de la muestra. Es de fácil realización. Co mo muestreo probabilístico su ejecución exige la existencia de un marco muestral que cumpla las condiciones expuestas en el apartado 3.2. Ha de ser un marco nominativo, que proporcione información que ayude a contactar a las unidades de la población que hayan sido aleatoriamente elegidas (nombre, dirección, número de teléfono). Además, cada unidad de la población del marco ha de tener un número de identificación y que éste siga un orden consecutivo. En caso de que no figure anexo al marco, el investi-
Métodos de muestreo probabilístico 1. Muestreo aleatorio simple 2. Muestreo aleatorio sistemático 3. Muestreo aleatorio estratificado • Estratificación proporcional • Estratificación no proporcional: afijación simple, óptima y otras no pro porcionales 4. Muestreo aleatorio por conglomerados: monoetápico, bietápico y polietápico 5. Muestreo de áreas y rutas aleatorias 6. Métodos de selección de personas en una misma vivienda • • • •
No selección: primera persona que contesta Método de Kish de selección aleatoria Método de selección de cuota sistemática Método del cumpleaños
Métodos de muestreo no probabilístico 1. Muestreo por cuotas 2. Muestreo estratégico o de “juicio” 3. Muestreos circunstanciales: de “voluntarios”, “bola de nieve”
gador deberá asignárselo, antes de proceder a la extracción aleatoria de los inte grantes de la muestra. Ésta se hará de acuerdo a una serie de números que han sido se leccionados siguiendo algún procedimiento aleatorio. Una tabla de números aleatorios, mediante generación aleatoria de números mediante algún programa informático específico, u otro procedimiento que garantice que: a) Cada unidad de la población tenga la misma probabilidad de participar en la muestra. Esta probabilidad viene determinada por la fracción de muestreo. Se define como el cociente entre el tamaño de la muestra y la población total en el marco muestral. Es decir, n IN. b) La selección muestral sea totalmente aleatoria hasta alcanzar el tamaño muestral fijado. No obstante, se aconseja extraer un número mayor de unidades que las ini cialmente prefijadas en el tamaño de la muestra para agilizar la inevitable reali zación de “sustituciones” de integrantes originales de la muestra. Es totalmente improbable que todas las unidades de la población elegidas para formar la muestra acaben participando en la encuesta. Bien porque han dejado de ser uni
dades de la población de interés (jóvenes que han dejado de ser estudiantes uni versitarios o personas mayores que ya no asisten a centros de la tercera edad, por ejemplo), bien porque no se ha podido contactar con ellos, o bien porque han re chazado participar en la encuesta. Si las sustituciones han sido previstas con an telación, no se precisa de nuevo volver al marco muestral y repetir el procedi miento de selección aleatoria de la muestra para las sustituciones. La elección de las unidades de la muestra puede hacerse sin reemplazamiento (cuando cada unidad de la población puede ser elegida sólo una vez) o con reempla zamiento (si participa en elecciones sucesivas). Lo habitual es que el proceso de se lección se efectúe sin reemplazamiento. Cuando el marco muestral se halla en soporte magnético, se agiliza bastante el pro cedimiento de selección aleatoria de la muestra mediante algún programa informáti co. En este caso, es el programa de ordenador configurado el que ejecuta todas las ta reas correspondientes a: a) Numerar consecutivamente a cada uno de los integrantes del marco muestral. b) Generar la serie de números aleatorios. c) Seleccionar e imprimir la lista de las unidades finalmente elegidas para formar la muestra. Aquellas a las que correspondan los números que han surgido al azar. Si el uso del ordenador no resulta viable, se recurre al procedimiento tradicional: uti lizar una tabla de números aleatorios. Estas tablas comprenden múltiples combinaciones de números extraídos al azar (o por sorteo), de forma que cada dígito tiene igual pro babilidad de figurar en cualquier punto de la tabla. La actuación, en este caso, sería: a) Elegir aleatoriamente un punto de partida: una columna o una fila cualquiera de la tabla. Puede comenzarse por cualquier lugar y moverse en cualquier dirección (hacia arriba, hacia abajo, a la derecha o a la izquierda). La única condición que se exige es que la elección no responda a un conocimiento previo de la distribu ción de los números en la tabla. Ello introduciría sesgos en la muestra. b) El número de dígitos extraídos de la tabla ha de corresponder con el número de dígitos de la población contenida en el marco muestral. Por ejemplo, si el marco estuviese compuesto por 10.000 unidades (5 dígitos), habría que numerar a cada unidad de la población con 5 dígitos: desde el primero (00001) has ta el último (10.000), correlativamente. A continuación, se escogerían números con 5 dí gitos, desconsiderándose aquellas cifras que superen la última unidad poblacional nu merada en el listado (10.000). c) La unidad de la población del marco al que pertenezca el número extraído pa sará a formar parte de la muestra. Salvo que en el marco no se adjunte infor mación que permita su localización (dirección postal, teléfono).
ZJEMPLO DE MUESTREO ALEATORIO SIMPLE Supóngase que va a realizarse una encuesta a licenciados en Ciencias Políticas y So ciología. El equipo investigador elige tomar como marco de muestreo el directorio de “cole giados” (en el Ilustre Colegio Nacional de Doctores y Licenciados en Ciencias Políticas y So ciología). A fecha de la investigación hay registrados un total de 6.428 colegiados. Para un margen de error de ±2,5% y un nivel de confianza de 95,5% la muestra estaría integrada por 1.281 colegiados. Si se tomase el número de colegiado como número de identificación, no habría que asig nar a cada unidad de la población un número consecutivo. En caso contrario, sí. Para la ex tracción de las unidades de la muestra puede seguirse el sistema tradicional de una tabla de nú meros aleatorios o el sistema más rápido de generación informatizada de números de forma aleatoria. En cualquier caso los números elegibles han de ser inferiores o iguales al tamaño to tal de la población del marco. En este ejemplo, todo número igual o menor de 6.428. En una tabla, la extracción de números se comenzaría por una fila o columna de la tabla elegida al azar. En el cuadro 3.A figura un extracto de la tabla de números aleatorios adjunta en el Anexo. Del cuadro se deduce que la decisión tomada ha sido comenzar en la primera columna, escogiendo los cuatro primeros dígitos, continuar hacia abajo hasta el final de la co lumna, e ir alternando los cuatro primeros con los cuatro últimos dígitos. El procedimiento con tinúa hasta que, al menos, se alcanza el tamaño de la muestra fijado. Se decide extraer 120 colegiados más para posibles sustituciones de la muestra inicial. Descartando los números superiores a la cifra de 6.428 (número total de colegiados en el marco muestral), los sujetos seleccionados serían aquellos cuyo número de identificación (número de colegiado) se correspondiese con las cifras siguientes: 3.435, 631, 6.211, 4.753, 2.485, 5.516, 6.040, 2.820, 5.993, 3.648, 2.479,1.472, 5.565, 5.336, 4.992, 724, 4.489, 4.281, 4.105,1.726, así se proseguiría hasta completar al menos el tamaño muestral. La probabilidad de selección de cada unidad de la población en el marco muestral es n 1-281 0,199, al ser la fracción de muestreo = jj = 6~428 = CUADRO 3.A. Extracto de una tabla de números aleatorios 9675 4 3435 7 0631 8 6211 1 4753 4
1 7676 8 6040 3 7403 5 2820 0 9243
5565 9 5336 4 4992 7 0724 3 6787 9
4 4105 7 1726 5 7715 7 9931 0 0544
4736 1 4569 0 5042 3 8929 2 2341 0
3 4833 6 6334 6 7372 8 4767 1 2740
9861 4 2485 6 9688 7 9080 1 5516 5
7 5993 0 3648 1 2479 2 1472 7 7312
8446 0 4489 8 8062 1 4281 5 8366 6
6 2846 0 9351 6 6223 7 7408 3 6028
5984 4 9879 5 8608 5 3739 0 2842 0
1 4922 1 8644 7 8285 7 6766 7 0219
La exigencia de disponer de un listado de la población de interés y que cada unidad de la población del marco esté numerada consecutivamente hace desaconse jable este procedimiento de selección muestral en poblaciones de elevada magnitud. Por ejemplo, sería totalmente impracticable el manejar un listado con todos los hogares de un país, no cuando se trata de un municipio específico y pequeño. La selección alea toria de las unidades de la muestra se agiliza y es más practicable cuando el marco muestral está en sopdrte magnético y se sigue un procedimiento informático de ge neración de números aleatorios. El muestreo aleatorio simple se aplica, preferentemente, en poblaciones pequeñas o circunscritas a un espacio delimitado, no en poblaciones espacialmente desperdigadas, si la encuesta es mediante entrevista cara a cara. Encarecería bastante el trabajo de campo, tanto en tiempo como en dinero. No en los otros métodos de encuesta (telefónica y por correo), que se beneficiarían, por el contrario, de una muestra más heterogénea que en otros métodos de muestreo (como el aleatorio por conglomerados, por ejemplo). Enviar a un entrevistador a una barriada apartada u otro núcleo de población ais lada para hacer una o dos entrevistas y, después, desplazarse a otro lugar para realizar otra es impracticable, por el elevado coste que ello supone en tiempo (la razón de nú mero de entrevistas por día será menor) y dinero (desplazamiento, dietas). En cambio, la mayor dispersión de la muestra consiguiente a este método de muestreo no supondrá un coste añadido si la encuesta es telefónica o por correo. Apenas habría variaciones en los costes del trabajo de campo con una muestra dispersa y, por el contrario, se gana ría en representatividad. Cuanto más heterogénea y dispersa sea la muestra, más probable es la consecución de una muestra “representativa”: que toda la variedad que forma la población de estudio esté “representada” en la muestra. Las ventajas y los in convenientes principales del muestreo aleatorio simple se resumen en el cuadro 3.4. CUADRO 3.4. Ventajas e inconvenientes del muestreo aleatorio simple
Ventajas
Inconvenientes
• Facilidad de los cálculos estadísticos. • Elevada probabilidad de lograr equiparabilidad entre las características de la muestra y las correspondientes a la po blación. • Consecución de una muestra autoponderada (igual probabilidad de selección de cada unidad de la población del marco muestral).
• Requiere listar y enumerar consecutiva mente a las unidades de la población del marco muestral. • En muestras y poblaciones de considerable magnitud resulta un método de selección muestral monótono y arduo. Especial mente, cuando se emplean procedimientos manuales, no informatizados. • La dispersión alcanzada en la muestra repercute negativamente en los costes de la investigación en encuestas mediante entrevista personal.
3.4.2. Muestreo aleatorio sistemático Una variedad de muestreo probabilístico con frecuencia descrito como “muestreo aleatorio pseudosimple” (Sudman, 1983: 170). Pero, siempre y cuando el marco muestral esté aleatoriamente ordenado. Otros autores prefieren considerarlo “una for ma de muestreo por conglomerados” (Lohr, 2000: 43), aunque matizando “desde el punto de vista tecnológico”. Esta consideración responde a la imposibilidad de que dos unidades del marco muestral consecutivas sean extraídas para constituir la muestra. Ex cepto, lógicamente, que el coeficiente de elevación fuese “1”. Lo cual es bastante im probable. Pero, ¿en qué consiste el muestreo aleatorio sistemático? ¿Qué diferencias y similitudes tiene con otros métodos de muestreo? Como el muestreo aleatorio simple, el sistemático exige la existencia de un marco muestral nominativo, que incluya datos de identificación que posibiliten la contactación de las unidades de población que aleatoriamente han sido elegidas para integrar la muestra. Aunque no precisa que éste sea un listado, ni que esté numerado. Pueden ser fichas de alumnos, papeletas, expedientes de pacientes, incluso la propia presencia fí sica de unidades de la población (por ejemplo, personas que salen de una discoteca, ba jan de un avión o entran en un centro comercial). Del muestreo aleatorio simple difiere en el procedimiento seguido en la extracción de la muestra. Sólo la primera unidad de la muestra se elige al azar. Mediante una ta bla de números aleatorios, por sorteo, pidiendo a alguien que diga al azar un número o cualquier otro procedimiento que garantice la igual probabilidad de selección de los números incluidos en el coeficiente de elevación. Una vez calculado el tamaño de la muestra, para unos niveles de probabilidad y de error determinados, se procede a la estimación del coeficiente de elevación. Se divide el tamaño de la población en el marco muestral entre el tamaño de la muestra (N I n). De esta forma se secciona el marco en distintas agrupaciones, dependiendo del tamaño muestral, para que todas sus unidades tengan igual probabilidad de ser seleccionadas, desde el inicio hasta el final del marco muestral. El coeficiente de elevación expresa el número de veces que la muestra se halla contenida en la población del marco muestral. El número aleatoriamente elegido, con la única condición de que sea inferior al coeficiente de elevación, determina la elección de los siguientes. A él se va sumando, sucesivamente, el coeficiente de elevación hasta completar el tamaño de la muestra. Para agilizar el trabajo de campo, se recomienda extraer un “excedente” de uni dades muéstrales para las sustituciones (de aquellos a quienes no ha podido contactarse o han rechazado participar en la encuesta). Este excedente se consideraría previo a la extracción de la muestra, en la estimación del coeficiente de elevación. Ello evitaría te ner que “volver” al marco muestral para buscar sustitutos a los no respondientes, I^n caso contrario, habría que repetir, de nuevo, el proceso para la selección de los susti tutos, garantizando su elección aleatoria. Es decir, habrá que calcular un nuevo coe ficiente de elevación. A ser posible, considerando sólo las unidades de la población en el marco no seleccionadas en la fase inicial de extracción de la muestra (muestreo alea torio sin reemplazamiento). Éstos se dividirán entre el número total de unidades que
aún se precisan para completar la muestra. En consecuencia, la nueva selección siste mática de unidades muéstrales para “sustituir” a los no respondientes se restringirá a aquellos que queden para ser elegidos. Por esta razón, habría que eliminar del marco muestral a los ya contactados, antes de repetir el proceso de selección.
IJEMPLO DE MUESTREO ALEATORIO SISTEMATICO Si la selección de licenciados en Ciencias Políticas y Sociología colegiados, del ejemplo anterior, se hiciese de forma aleatoria sistemática, en principio la actuación sería la si guiente: a) Se calcula el intervalo de selección, determinado por el coeficiente de elevación = N = 6.428 =5,018. El marco quedaría seccionado en 1.281 conglomerados de — n i .¿oí 5 unidades (por el efecto del redondeo quedarían 23 unidades). b) Mediante un procedimiento aleatorio se elige un número igual o inferior a “5”. Por ejem plo, el “4”. La unidad de la población en el marco a la que corresponda dicho núme ro constituirá la primera unidad elegida para formar la muestra. c) La extracción de las 1.280 unidades de la muestra restantes se hará sumando “sis temáticamente” el coeficiente de elevación a los números elegidos a partir del primer número extraído al azar. Al 4 le seguiría el 9,14, 19, 24, 29, 34, 39, hasta completar las 1.281 unidades de la muestra. En consecuencia, se estaría eligiendo 1 unidad ca da 5, a partir del arranque aleatorio marcado por el número 4. O sea, todos los nú meros terminados en 4 y en 9. Para que la muestra extraída se asemeje a una muestra aleatoria simple es condi ción que la disposición de las unidades de población en el marco muestral sea “alea toria”. Es decir, que su orden no siga un criterio que pueda estar relacionado con el problema de investigación. Por ejemplo, en un listado de alumnos se descartaría su ordenamiento por califi cación media en el expediente académico porque no es aleatoria. Sí se aceptaría, por el contrario, su ordenación alfabética, por el primer apellido, u otro criterio como los úl timos dígitos de su DN1 (Documento Nacional de Identificación). Cualquiera de estos últimos criterios permite eliminar la introducción de sesgos debidos a la periodicidad constante marcada por el coeficiente de elevación. Las ventajas y los inconvenientes principales del muestreo aleatorio sistemático se resumen en el cuadro 3.5.
Ventajas
Inconvenientes
• Fácil aplicación. No precisa del uso con tinuo de una tabla de números aleatorios u otro procedimiento de asignación alea toria. • No exige que el marco muestral sea un lis tado. El marco puede adoptar formas va rias: fichas, papeletas, expedientes, inclu so la presencia física de unidades de la población.
• Necesita del recuento constante de las unidades de la población. • Antes de la selección muestral, hay que desordenar el marco muestral (si éste se encuentra ordenado de acuerdo con algún criterio que favorezca la mayor repre sentación de determinados segmentos de la población en la muestra).
3.4.3. Muestreo aleatorio estratificado Un método de muestreo probabilístico muy aplicado cuando se dispone de infor mación sobre características de la población de interés. Consiste en la clasificación de la población del marco muestral en grupos o “estratos” mutuamente excluyentes (que son internamente homogéneos y diferentes de los otros grupos), con respecto a las características registradas en el marco muestral. Con ello se persiguen tres metas principales: a) Garantizar la presencia en la muestra de determinados grupos de población que, por su menor representación en la población, tienen escasa probabilidad de ser elegidos para formar la muestra por otros procedimientos aleatorios (simple, sis temático u otros). Y, en cambio, su estudio es de interés. Por ejemplo, en una encuesta sobre la calidad de la enseñanza universitaria, si no se clasifica previamente a la población por universidades, facultades y/o curso académico, en función del ámbito de estudio, no se asegura que los grupos de población menos nu merosos (alumnos de universidades, de facultades o de cursos con un menor número de alumnos, como son los de doctorado) tengan suficiente presencia en la muestra, que po sibilite su análisis separado. Y es objetivo de la encuesta el captar el estado de opinión de los distintos grupos de población afectados, no limitándose a aquellos que, por contar con un mayor volumen de población, tienen más probabilidad de ser elegidos en la muestra. b) Poder aplicar diferentes métodos aleatorios para la selección de la muestra e, in clusive, métodos de encuesta, en los distintos grupos de población, dependien do de la dificultad para su contactación.
c) La consecución de estimaciones de parámetros poblacionales más precisas en los distintos grupos de población, al reducirse su variabilidad. Siempre que se consigan grupos (o estratos) internamente muy homogéneos y diferentes de los otros grupos, en variables clave en la explicación del problema de investigación. De no ser así, se obtendrán estimaciones de similar precisión a la alcanzada sin proceder a la estratificación. La efectividad de la estratificación (medida en re ducción del error muestral) depende de cómo afecte la variable elegida para la estratificación al fenómeno que se estudia. Y, cuando se utilice más de una va riable para la estratificación, es mejor que sean variables poco correlacionadas entre sí para conseguir grupos heterogéneos unos respecto de otros. Es condición que los estratos se formen de acuerdo con variables que se prevé afec ten a la varianza de las variables cuya variabilidad quiere analizarse. Por ejemplo, por curso académico, si se espera que la opinión sobre la calidad de la enseñanza univer sitaria varía en función de los años cursados en la universidad. La estratificación por conveniencia de variables no relacionadas con el problema de investigación no con tribuye, por el contrario, a la obtención de estimaciones de parámetros poblacionales más precisas porque su error muestral sea pequeño. Como la elección de las variables de estratificación está condicionada a aquellas in cluidas en el marco muestral, las de uso más común son las variables sexo y edad. Es tas son las más presentes en la mayoría de los marcos muéstrales. A ellas se suman otras variables sociodemográficas (como ocupación o estudios), cuando están presentes en el marco muestral. En estudios de ámbito nacional e internacional, primero se pro cede a la estratificación por ubicación geográfica: ámbito territorial (país, comunidad autónoma, provincia, municipio), tipo de hábitat (urbano, semiurbano, rural) o tamaño de hábitat (número de habitantes). Después, se realizan otras estratificaciones, en fun ción de los objetivos de la encuesta y de la información proporcionada en los marcos muéstrales que se utilicen para la extracción de la muestra. De acuerdo con Lynn y Lievesley (1991), para la mayoría de los objetivos de in vestigación no se precisa diferenciar tres o cuatro estadios o fases de estratificación. Tam poco se requiere la adopción de las mismas variables de estratificación para todas las muestras. Puede alcanzarse una mayor eficacia siguiendo un esquema de estratificación distinto para las variables incluidas en los diversos estadios de estratificación. De haber distintas fases en la estratificación, el orden de las variables dependerá de su relevancia en la explicación del problema de investigación. Como la primera variable de estratifi cación es la que más discrimina, en la primera fase de la estratificación ha de elegirse la variable de mayor relevancia. En la segunda fase, la segunda más importante y, así, con secutivamente, debido al poder decreciente de la estratificación. Las variables elegidas han de ser categóricas. En caso contrario, habrá que proceder a su categorización. Una vez clasificada la población en estratos, se afija la muestra en cada estrato. Por afijación se entiende la distribución del tamaño muestral global entre los estratos di ferenciados. Existen distintas formas de realizar dicha distribución. Éstas se agrupan en dos amplias modalidades de estratificación: proporcional y no proporcional.
Estratificación proporcional Como su nombre indica, la afijación o distribución de la muestra se hace “pro porcional” al peso relativo del estrato en el conjunto de la población. De modo que, a aquellos estratos que reúnan un mayor número de unidades de población les co rresponderá un tamaño muestral superior al de aquellos que representen un porcen taje inferior. Por lo que la distribución de la muestra entre los estratos guarda co rrespondencia con el peso o representación de éstos en la población de estudio. Éste es el criterio de afijación más aplicado en la investigación mediante encues ta. Para su cálculo se multiplica la proporción que representa el estrato en la población por el tamaño de la muestra a afijar.
Estratificación no proporcional La que se hace, cuando la representación de los estratos en la muestra global no es proporcional a su peso en el conjunto de la población. Por el contrario, se ha dado una probabilidad desigual de selección en cada estrato. Bien porque se quiere analizar, con un mayor detalle, unos estratos concretos a los que proporcionalmente les correspondía un tamaño muestral inferior, bien para propiciar la representatividad de estimaciones muéstrales en todos los estratos, o bien porque se considera la variabilidad en cada es trato, aparte de su peso en el conjunto de la población, entre otras causas. Las prin cipales opciones de estratificación no proporcional son: • Afijación simple. Consiste en asignar el mismo tamaño muestral a cada estrato, indistintamente del peso que tenga en la población de estudio. La finalidad es que todos los estratos tengan la misma representación en la muestra, que po sibilite la consecución de estimaciones muéstrales igualmente significativas en cada uno de los estratos. Esta equidistribución del tamaño de la muestra conlleva, no obstante, un in conveniente importante: favorece a los estratos de menor volumen de población en menoscabo de aquellos de mayor magnitud. Se les adjudica un tamaño muestral superior al que les correspondería por su volumen de población. Para análisis por separado de cada estrato, esta mayor asignación de tamaño mues tral contribuye al logro de estimaciones muéstrales estadísticamente significa tivas en estratos que, por su menor presencia en la población, no la tendrían, si la muestra hubiese sido distribuida de forma proporcional a su peso real en la po blación. Pero, para el análisis conjunto de los estratos, habría que proceder a la previa ponderación de la muestra, para devolverla su debida proporcionalidad, como después se verá. En todos los estratos se ha administrado el mismo número de cuestionarios, cuando a unos les hubiese correspondido más y a otros menos, en función de su peso en la población.
Para la afijación simple se divide el tamaño total de la muestra entre el nú mero de estratos. La cantidad obtenida expresará las unidades a observar en ca da estrato. Afijación óptima. En la distribución de la muestra se considera, además del pe so relativo dej estrato en la población, su variabilidad (o heterogeneidad) res pecto a la variable utilizada para la estratificación. De modo que, a los estratos de mayor peso poblacional y heterogeneidad les corresponderá un tamaño muestral superior al de aquellos más homogéneos y de menor volumen de población. Por ejemplo, la consideración de las zonas rurales como más ho mogéneas que las urbanas lleva al INE (Instituto Nacional de Estadística) a “car gar” la muestra en estas últimas, como indica Rodríguez Osuna (1991: 28). Su realización precisa del conocimiento previo de la varianza poblacio nal, respecto de las variables empleadas para la estratificación, en cada estrato. Esta información es difícil de conocer (los marcos muéstrales no la proporcio nan). A menos que se haya analizado, con anterioridad, a la misma población (en un estudio piloto ex profeso o en investigaciones periódicas). Esto explica su es casa práctica, pese a su consideración de “óptima”. Sobre todo, cuando los es tratos presentan distinta varianza. En caso contrario, se obtendría una distri bución de la muestra similar a la proporcional. Para su cálculo se multiplica, en cada estrato, la proporción (o el porcentaje) que representa el estrato en el conjunto de la población por la varianza (o la des viación típica) correspondiente. Después, se suman todos los productos y se cal cula la proporción que representa cada producto en el total. A continuación, ca da una de estas proporciones se multiplica por la muestra a afijar. De este producto resulta el número de unidades de la población a observar en cada estrato. Otra variedad de afijación no proporcional es aquella que se aplica cuando, por algún motivo, se quiere realizar un número determinado de entrevistas en un es trato concreto y el resto se afija “proporcionalmente” en los otros estratos. Aun que el tamaño muestral restante se distribuya en los demás estratos de acuerdo a su proporcionalidad, la distribución del conjunto de la muestra en los estratos ha alterado su debida proporcionalidad en el conjunto de la población (como se verá en el ejemplo de la ponderación).
ZJEMPLO DE MUESTREO ALEATORIO ESTRATIFICADO En la Facultad de Ciencias Políticas y Sociología de la Universidad Complutense de Ma drid se quiere realizar una encuesta para conocer el grado de satisfacción de los alumnos por la enseñanza impartida. Para garantizar que en la muestra estén representados alumnos de los distintos cursos académicos, incluidos los alumnos de doctorado, se decide estratificar la
población por curso. En un estudio previo se obtuvo que el 57% de los 5.014 alumnos ma triculados estaban satisfechos por la enseñanza recibida. Si bien, el grado de satisfacción se reducía al 41% entre los alumnos de primer curso y aumentaba hasta el 72% entre los de quinto curso. Para un error máximo de ±2% y un nivel de confianza del 95,5%, se obtiene un tamaño muestral de 1.646 alumnos a entrevistar. Su distribución en los estratos, de acuer do con los tres criterios principales de afijación (simple, proporcional y óptima) se da en el cua dro 3.B. Z zPQN —^ r = —5-----------------22 x 57 x 43 5x----------------5.014 „ .. . n ----- 5-------------1.646 unidades E2(N - 1) + Z PQ (2 x 5.013) + (2 x 57 x 43) CUADRO 3.B. Distribución de la muestra en estratos Curso
Población
Varianza
Primero Segundo Tercero Cuarto Quinto Doctorado
903 792 891 769 1.316 343
Total
5.014
Afijación Simple
Proporcional
Óptima
2.419 2.499 2.139 2.275 2.016 2.449
274 274 274 274 274 274
296 260 293 252 433 112
318 288 278 253 387 122
2.451
1.644
1.646
1.646
-| fr/jQ
Afijación simple: — ----- 274,33 unidades en cada estrato Afijación proporcional:
0,180 0,158 0,178 0,153 0,263 0,068
x x x x x x
1.646 = 296,28 1.646 = 260,07 1.646 = 292,99 1.646 = 251,84 1.646 = 432,90 1.646= 111,93
Si se considera la proporción que representa cada estrato, en el conjunto de la po blación, la encuesta se hará a más alumnos matriculados en quinto curso (a 433 alumnos elegidos aleatoriamente) y a menos de doctorado (112 alumnos). Estos últimos representan tan sólo el 6 ,8% de los alumnos inscritos en dicha facultad, mientras que el 26,3% son de quinto curso.
(A) Porcentaje Población
(B) Varianza
(A) x (B)
(C)
(D) Proporción (C)
18,0 15,8 17,8 15,3 26,3 6,8
2.419 2.499 2.139 2.275 2.016 2.449
43.542,0 39.484,2 38.074,2 34.807,5 53.020,8 16.653,2
0,193 0,175 0,169 0,154 0,235 0,074
317,68 288,05 278,17 253,48 386,81 121,80
100,0
2.451
225.581,9
1,000
1.645,99
(E)
Afijación óptima (D) x 1.646
De acuerdo con la afijación óptima, también habría que encuestar a más alumnos de quin to curso, aunque en menor cuantía que si la afijación es proporcional. Exactamente, a 387 alumnos, que serán elegidos aleatoriamente de entre los matriculados en dicho curso aca démico. Ello se debe a que es el estrato de mayor volumen de alumnos matriculados en la facultad (el 26,3% de los 5.014 alumnos inscritos). Aunque su presencia en la muestra se re duce, respecto a la estratificación proporcional (de 433 pasa a 387 unidades muéstrales), por ser el estrato de mayor homogeneidad de los diferenciados atendiendo a la variable de cla sificación elegida: curso académico. Es decir, el de menor varianza poblacional (2.016). Por el contrario, aumenta la presencia en la muestra de los estratos más heterogéneos. Éstos ob tienen una mayor presencia en la muestra que los estratos más homogéneos. Tanto más, cuanto mayor es la conjunción de heterogeneidad y proporción que representa en el conjunto de los alumnos de dicha facultad. De todas formas, compárense las cifras obtenidas con los tres tipos de afijación expuestas en el cuadro 3.B. Cuando se realiza una estratificación no proporcional y se quieren estimaciones pa ra el conjunto de la población (no para los estratos por separado), previamente ha de procederse a la ponderación de la muestra. Quiere esto decir, que ha de devolverse a la muestra final su debida proporcionalidad en el conjunto de la población', que su pre sencia sea acorde con su peso en la población total. Por el contrario, no se precisa de la ponderación, cuando sólo se realizan análisis individuales (de cada estrato por se parado) o comparativo (de unos estratos respecto de otros). Por ponderación comúnmente se entiende el proceso de asignación de “pesos” a cada estrato de manera que logre compensar la desigual probabilidad de selección que, con la estratificación no proporcional, se ha dado a cada unidad de la población que compone el estrato. Mediante ella se quieren corregir las discrepancias entre la mues tra y la población. Para ello se divide el porcentaje o proporción que representa el es trato en la población (de acuerdo con los datos censales tomados de referencia) entre el porcentaje o proporción que representa en la muestra, obteniéndose los “pesos” o coeficientes de ponderación. Éstos se multiplicarán por cada estimación muestral de los
estratos correspondientes para la obtención de estimaciones en la muestra en su con junto. Para ello se sumarán los productos del coeficiente de ponderación por la esti mación muestral en cada estrato, dividiéndose la suma total de los productos por el ta maño total de la muestra. En los ficheros de datos de la mayoría de los paquetes estadísticos se fijan los pesos a asignar a cada estrato o subconjunto de la población. El programa automáticamente cumplimentará la ponderación, antes de proceder a la tabulación conjunta y posterior análisis de la información obtenida. En la muestra “real”, no en la ponderada, será en la que después se calculen los errores de muestreo y la consiguiente precisión de las estimaciones muéstrales, como se verá en el apartado 3.5.
E je m plo d e p o n d e r a c ió n e n u n m u e s t r e o ESTRATIFICADO NO PROPORCIONAL Para ilustrar el cálculo de los coeficientes de ponderación, se plantea el supuesto de una estratificación no proporcional consistente en afijar una porción determinada de la muestra total en un estrato concreto. El resto de la muestra se asignaría de forma proporcional entre los demás estratos. En el ejemplo anterior se decide incrementar la presencia en la muestra de los alumnos de doctorado para tener una base muestral mayor que contribuya a la sig nificatividad de las estimaciones muéstrales. En vez de seleccionar a 112 estudiantes de doc torado, como habría que hacer siguiendo la afijación proporcional, se opta por incrementar las unidades de la muestra en este estrato a 200. Las 1.446 unidades de la muestra restantes se distribuirán entre los cinco estratos que quedan de forma proporcional a su peso en el con junto de la población, excluyendo a los alumnos de doctorado. Ello supondrá una disminución del número de entrevistas a realizar en estos cinco estratos, al haberse aumentado la pre sencia en el total de la muestra de los alumnos de doctorado, como puede verse en el cua dro 3.C. Para análisis segmentados de los alumnos de cada curso académico no se precisa de la ponderación. Sí para dar estimaciones muéstrales para la población en su conjunto. Exige “equilibrar” la muestra, devolverle su debida proporcionalidad, de acuerdo con la proporción “real” que representa cada estrato diferenciado en el conjunto de la población, an tes de proceder al análisis conjunto de la muestra. Los coeficientes de ponderación se calculan dividiendo el porcentaje que representa cada estrato en la población entre el por centaje que representa en la muestra extraída de forma no proporcional (al haberse asignado un mayor número de entrevistas en el sexto estrato que las debidas por su peso “real” en la población total). Como en el último estrato las unidades de la muestra son 200, en vez de 112 que le hubiese correspondido por representar sólo el 6,84% de los alumnos matriculados en dicha facultad, el coeficiente de ponderación es inferior a “1”. Exactamente, 0,563 porque el número de unidades de la muestra, en dicho estrato, se ha casi duplicado. Lo que ha supuesto una reducción de la presencia en la muestra final de los cinco estratos restantes. Por esta ra-
CUADRO 3.C. Cálculo de los coeficientes de ponderación en una muestra estratificada no proporcionalmente (B) Coeficiente (A) Afijación Afijación no Porcentaje Porcentaje proporcional proporcional* muestra no ponderación (A/B) población proporcional
Curso
Población
Primero Segundo Tercero Cuarto Quinto Doctorado
903 792 891 769 1.316 343
18,01 15,80 17,77 15,34 26,25 6,84
296 260 293 252 433 112
280 245 276 238 407 200
17,01 14,88 16,77 14,46 24,73 12,15
Total
5.014
100,01
1.646
1.646
100,00
1,059 1,062 1,060 1,061 1,061 0,563
* Afijación no proporcional consistente en extraer 200 unidades de la muestra entre los alumnos de doctora do. Las 1.446 unidades de la muestra restantes se distribuyen de forma proporcional entre los cinco estra tos. Para ello se calcula, de nuevo, la proporción que representa cada uno de los cinco estratos restantes en el conjunto de los alumnos, excluidos los de doctorado. Es decir, entre los 4.671 alumnos de los cinco cur sos de licenciatura. La proporción así obtenida (por ejemplo, 903/4.671 = 0,1933 y 792/4.671 = 0,1696, etc.) se multiplica por la muestra que queda por afijaren estos cinco estratos: 1.446. Por ejemplo, 0,1933 x 1.446 = 280 y 0,1696 x 1.446 = 245. En su conjunto es una afijación no proporcional porque se ha alterado el pe so real de cada estrato en la población total de interés. Los alumnos de doctorado tienen más representación en la muestra que la correspondiente a su peso en el conjunto de la población y ello ha supuesto una re ducción de la muestra en los cinco estratos restantes.
zón sus coeficientes de ponderación son mayores de “1”. Tanto más, cuantas menos unidades de la muestra se les ha asignado en relación con aquellas que debería habérseles asignado mediante una estratificación proporcional. Los coeficientes de ponderación también deberían calcularse con otros modos de es tratificación no proporcional: la afijación simple y la óptima. El proceso habría sido el mismo. La división entre el porcentaje de la población real entre el porcentaje de la muestra. Los coeficientes de ponderación obtenidos se introducen en el paquete estadístico al uso para que, antes del cálculo de las estimaciones muéstrales en el conjunto de la población, se sumen los distintos productos de los coeficientes de ponderación por las estimaciones muéstrales en cada estrato y, después, se dividan por el tamaño total de la muestra. De es ta forma se obtienen estimaciones “equilibradas” para el conjunto de la muestra. Una vez delimitadas cuántas unidades de población extraer en cada estrato para formar la muestra, se procede a su elección por alguno de los procedimientos aleato rios que garantice la igual probabilidad de todos los integrantes del estrato para integrar la muestra. A diferencia del muestreo por cuotas, en el estratificado la selección de las unidades finales de la muestra se hace siguiendo procedimientos aleatorios (muestreo simple, sistemático, rutas aleatorias y otros incluidos en el subapartado 3.4.6), y no cri-
teños subjetivos. Ésta es la diferencia principal entre ambos métodos de muestreo, co mo se verá en el subapartado 3.4.7. Por último, el cuadro 3.6 resume las ventajas y los inconvenientes más destacados en el muestreo aleatorio estratificado. De las mencionadas, destacan sus beneficios en precisión de las estimaciones muéstrales y para la organización del trabajo de campo. La creación de estratos o grupos de población de acuerdo con una característica, o con junción de ellas (preferiblemente relacionadas con el problema de investigación), no sólo permite garantizar la presencia en la muestra de los distintos grupos de población, cuya variabilidad trata de analizarse. También, posibilita la aplicación de distintos mar cos muéstrales en cada estrato, de diferentes métodos de muestreo e, incluso, de en cuesta, en consonancia con la dificultad en su contactación. Para cada estrato se extrae una muestra diferente. Las estimaciones globales para el conjunto de la población se obtienen de la conjunción de la extraída en cada estrato, tras haber sido “ponderada”, sólo cuando se ha procedido a una estratificación no pro porcional. Es condición que los estratos no se solapen, que comprendan al conjunto de la población de interés y que las unidades que constituyen el estrato sean muy ho mogéneas, respecto de la variable de estudio. De esta forma, la variabilidad dentro del estrato se reduce, obteniéndose estimaciones de parámetros poblacionales más precisas. CUADRO 3.6. Ventajas e inconvenientes del muestreo aleatorio estratificado Ventajas
Inconvenientes
• Obtención de estimaciones muéstrales más precisas, al reducirse el error muestral. • Garantiza la presencia, en la muestra, de distintos grupos de población en variables clave para el problema de investigación. • Pueden utilizarse distintos marcos mués trales, métodos de muestreo y de encuesta en cada estrato, en función de la informa ción disponible y de la dificultad de acceso a los distintos grupos de población. • Facilita la organización del trabajo de campo.
• Requiere más información del marco muestral que el muestreo aleatorio simple (para identificar a la población de cada estrato). Lo cual puede resultar costoso. • Supone cálculos estadísticos de cierta complejidad.
3.4.4. Muestreo aleatorio por conglomerados Un método de muestreo probabilístico de gran aplicación en la encuesta personal a poblaciones espacialmente dispersas, debido a su menor coste, es el muestreo alea torio por conglomerados. Como en el muestreo aleatorio estratificado, en el de con
glomerados también se procede a la selección aleatoria de conjuntos de población. Pe ro ahora se les llama “conglomerados”, en vez de “estratos”. Los conglomerados pueden ser demarcaciones territoriales de la población de interés (país, comunidad au tónoma, municipio, distrito, áreas censales, viviendas). También, organizaciones o ins tituciones (colegios, hospitales, tribunales, centros penitenciarios), e incluso conglo merados artificiales como, por ejemplo, las urnas electorales. Se trata de extraer, mediante algún procedimiento aleatorio, una muestra de conglomerados y, en los elegidos, seleccionar, igualmente al azar, las unidades que compondrán la muestra. Al igual que el muestreo estratificado, el de conglomerados implica la agrupación de las unidades de la población (ahora en conglomerados) como fase previa a la extracción de la muestra. Si bien, difiere del muestreo estratificado en varios aspectos importantes: a) En el muestreo estratificado la unidad de muestreo es unitaria (el individuo). En el muestreo por conglomerados, el conglomerado (o conjunto de individuos). b) En el muestreo estratificado se procede a la extracción muestral en todos los gru pos o estratos formados de acuerdo con las variables (o conjunción de variables) de estratificación. En el muestreo por conglomerados se extrae una muestra aleatoria de conglomerados. Los integrantes de los conglomerados elegidos constituirán la muestra. c) En el muestreo estratificado se busca la homogeneidad dentro del estrato y la he terogeneidad entre los estratos. Los grupos se forman para crear grupos de po blación internamente homogéneos respecto de la(s) variable(s) de interés. Lo que contribuye a la precisión de las estimaciones muéstrales. En el muestreo por conglomerados es a la inversa. El error muestral disminuye, conforme au menta la heterogeneidad dentro del conglomerado. Como sólo se seleccionan algunos de los conglomerados existentes, se busca que los elegidos sean inter namente heterogéneos. Es decir, que constituyan una adecuada representación de la variedad de los componentes de la población. Pero, como esto no siempre es posible, al tratarse generalmente de divisiones naturales de la población, el muestreo por conglomerados resulta en pérdida de precisión de las estimacio nes muéstrales. Tanto más, cuanto menos heterogéneas sean las unidades que compongan el conglomerado. Pese a ello, se opta por la conglomeración principalmente para abaratar los costes de la encuesta. En encuestas a hogares mediante entrevista cara a cara, por ejemplo, los costes del trabajo de campo en tiempo y dinero (dietas a los entrevistadores, costes de desplazamiento y demás) se desorbitan, conforme aumenta la dispersión espacial de las unidades de la población a ser entrevistadas. Con la conglomeración se busca re ducir los desplazamientos de los entrevistadores, haciendo un mayor número de en trevistas en un mismo espacio territorial delimitado. Por ejemplo, si en un bloque de viviendas (la unidad de muestreo primaria o con glomerado) se entrevista a 10 familias (la unidad de muestreo secundaria), en vez de a
una sola familia y las nueve restantes se eligen de otros bloques de viviendas (porque se ha procedido a un muestreo aleatorio simple o sistemático), sin duda se ahorra en tiem po y dinero en la ejecución del trabajo de campo. Pero, a cambio de incrementar el error muestral, al ser más probable la homogeneidad entre las 10 familias aleatoriamente ex traídas de un mismo bloque que de 10 bloques diferentes. Lo mismo sucedería si hubiese que entrevistar “cara a cara” a médicos de centros de salud. Es más barato extraer una pequeña muestra aleatoria de centros de salud y, en los centros seleccionados, entrevistar a un mayor número de médicos, que enviar a un entrevistador a centros de salud dis persos para sólo realizar una o dos entrevistas. El ahorro en costes económicos y temporales en la ejecución del trabajo de cam po en la encuesta cara a cara, junto con la dificultad de elaborar una lista exhaustiva de todos los integrantes de la población de estudio, son las dos principales razones para la aplicación de un muestreo aleatorio por conglomerados. Para la selección de los con glomerados pueden seguirse las recomendaciones destacadas por Sudman (1976): a) Los conglomerados han de estar bien definidos y delimitados. Cada unidad de la población sólo puede pertenecer a un único conglomerado. b) El número de elementos que componen el conglomerado ha de ser conocido pre viamente, aunque sea de manera aproximada. c) Los conglomerados elegidos han de ser pocos, si realmente se quiere reducir los costes de la investigación. Pero adviértase que esto es cuando se prima la “ren tabilidad”. Si se busca, por el contrario, reducir el error muestral, habrá que au mentar el número de conglomerados, reduciendo el número de unidades de la muestra a seleccionar en cada uno de ellos. d) Los conglomerados deberían escogerse de manera que se consiga reducir el au mento en error muestral consiguiente a la conglomeración. e) Los conglomerados no tienen por qué estar idénticamente definidos en todos los lugares. Cuando se muestrean individuos u hogares en áreas urbanas o semiurbanas, los conglomerados suelen ser bloques o conjunto de bloques. En cambio, en áreas rurales, los conglomerados suelen ser segmentos geográficos limitados por carreteras y fronteras naturales (como ríos y lagos). El muestreo aleatorio por conglomerados puede ser singular o monoetápico (si to das las unidades de población en los conglomerados elegidos integran la muestra), bietápico o polietápico. Bietápico, cuando la selección muestral prosigue dentro de cada conglomerado, en una segunda fase. Quiere esto decir que, en cada uno de los con glomerados elegidos aleatoriamente se procede a la extracción aleatoria de una nue va muestra. Si el proceso de selección concluye aquí, se está ante un muestreo por con glomerados de dos etapas o fases. Pero, si la selección aleatoria de las unidades últimas de la muestra prosigue, se está ante un muestreo por conglomerados polietápico de tres, cuatro e, inclusive, más fases. Estos últimos no son diseños muéstrales infre cuentes. Precisamente, como subrayan Lynn y Lievesley (1991), lo usual es que el nú mero de fases o etapas comprendidas en el muestreo polietápico sean tres o cuatro.
En el muestreo por conglomerados polietápico o polifásico, la unidad de muestreo final no son los conglomerados, sino subdivisiones de éstos. No se toma a cada uno de los integrantes de los conglomerados elegidos mediante algún procedimiento aleato rio,, sino subdivisiones de éstos. Únicamente se toma una parte de los conglomerados, también seleccionados de forma aleatoria. Ello supone muestrear (como su nombre in dica) en varias fases o niveles. Implica varios procedimientos de selección muestral, in cluyendo la estratificfación.
Por ejemplo, si se quisiese encuestar a médicos de centros de salud, se podría proceder, primero, a seccionar los distintos municipios que constituyen el ámbito de la encuesta en áreas sanitarias. La primera fase de muestreo consistiría en la selección alea toria de áreas sanitarias. La segunda fase, la selección aleatoria de centros de salud en las áreas sanitarias que hayan sido seleccionadas. Cuando se entrevista a todos los mé dicos de los centros elegidos, se está ante un muestreo de conglomerados de dos fases (bietápico). Si, por el contrarío, se procede a la selección aleatoria de médicos, en cada centro de salud de los elegidos, la muestra por conglomerados tendrá tres fases (trietápico). Los centros de salud constituyen los conglomerados y los médicos las unidades de observación.
ZJEMPLO DE MUESTREO ALEATORIO POR CONGLOMERADOS Se desea encuestar cara a cara a 1.300 profesores universitarios españoles, con el pro pósito de conocer su opinión sobre los nuevos planes de estudio. Como la encuesta es de ám bito nacional, la selección de la muestra siguiendo el procedimiento aleatorio simple eleva ría considerablemente los costes de la investigación. A la dificultad de encontrar un marco muestral que incluyera a todos los profesores universitarios españoles (tanto de universidades públicas como privadas), se sumaría el aumento de los costes por desplazamiento de los en trevistadores a puntos dispersos del país. Lo más fácil será acceder a un listado que incluya al conjunto de las universidades es pañolas (públicas y privadas) para, a continuación, proceder a la extracción muestral polietápica por conglomerados. Ésta podría consistir en: a) Listar todas las universidades españolas, tanto públicas como privadas. Este listado constituirá el marco inicial para la extracción de la muestra. En la selección de la muestra nacional de universidades podría estratificarse por tipo de universidad (pública y privada y, dentro de esta última, diferenciándose por con fesionales y no confesionales) y por ubicación geográfica (Comunidad Autónoma). Ello asegura la representación de las unidades de muestreo primarias (las universidades) en conformidad con las variables de estratificación elegidas: dispersión geográfica y tipo de universidad.
También conviene -para alcanzar una mayor precisión- que las unidades pri marias de muestreo elegidas sean bastante heterogéneas respecto a las caracte rísticas que se analizan. De esta forma se facilita que la variedad del universo de es tudio quede reflejada en la muestra. Asimismo, se recomienda que -como regla- no proceda más del 7% de la muestra total de una sola unidad de muestreo primaria (Lynn y Lievesley, 1991). In teresa que las unidades de muestreo primarias sean bastante heterogéneas respecto al problema de investigación. La heterogeneidad es más probable que se dé cuanto más ampliamente se definan las unidades primarias. b) Elegir {de las universidades seleccionadas) una muestra de facultades mediante alguno de los procedimientos de selección aleatoria (simple, sistemática, estrati ficada). c) Para cada una de las facultades escogidas, extraer una muestra aleatoria de pro fesores. A tal fin se acude a un nuevo marco de muestreo: el listado de los profe sores pertenecientes a las facultades que han resultado elegidas. Éstos podrían, a su vez, muestrearse conforme a los criterios de categoría profesional (catedrático, titular, profesor asociado, ayudante), dedicación (a tiempo completo o parcial), y an tigüedad docente, aplicando un muestreo aleatorio estratificado o por cuotas. Si se opta por el estratificado, la elección de los profesores cuyas características se ajus ten a los estratos diferenciados será totalmente aleatoria (muestreo simple, siste mático). En cambio, si se decide el de cuotas, la elección de los profesores será ar bitraria, con la única condición de que compartan las características fijadas en las cuotas. Pero también podría extraerse una muestra aleatoria de departamentos y en trevistar a todos los profesores que lo integran. Esto último supondría reducir el nú mero de departamentos elegidos. O podría optarse por una selección aleatoria de pro fesores en cada departamento. Lo cual permitiría ampliar el número de departamentos en la muestra y conseguir que ésta fuese más heterogénea, con la consiguiente re ducción en el error de muestreo. Es más probable encontrar más heterogeneidad en tre profesores de departamentos y de facultades diferentes que entre aquellos de un mismo departamento y facultad. El diseño muestral que resulte de la conjunción de estas fases se corresponderá con la precisión que el investigador quiera dar a las estimaciones muéstrales. Esto tiene una re percusión directa en los costes de la investigación. Por ejemplo, en la elección del número de facultades y de profesores a entrevistar en cada facultad las opciones posibles son diversas. Dependerá del presupuesto destinado a la realización del trabajo de campo y de la heterogeneidad de los conglomerados, princi palmente. El investigador tendrá que decidir si aumentar el número de facultades, dismi nuyendo el número de profesores a entrevistar en cada una de ellas, o proceder a la inversa (reducir el número de facultades, incrementando el número de profesores a encuestar). La primera opción supone aumentar -para un mismo tamaño muestral (1.300 unidades)- los costes (en tiempo y dinero) de la investigación. A continuación se exponen algunas de las opciones posibles:
Número de facultades
Número de profesores
5 10 15 20 30 40
260 130 87 65 43 33
Si fuesen 5 las facultades elegidas (entrevistándose a 260 profesores, en cada una de ellas), los costes del trabajo de campo serían inferiores, pero también sería mayor el error muestral que cuando se eligiesen 40 facultades y, en cada una de ellas, se entrevistase a 33 profesores. En general, se recomienda aumentar el número de conglomerados (en este caso de fa cultades) con preferencia a elevar el número de individuos a observar en cada uno de ellos (los profesores). La razón está en la probable homogeneidad de los conglomerados ele gidos, aunque se haya hecho de forma aleatoria. Cuando éstos son bastante homogéneos, no se precisa añadir más elementos del conglomerado a la muestra porque se obtendría una información redundante, al ser simila res las características de las unidades que forman el conglomerado. En este caso (cuando los conglomerados son homogéneos), se aconseja ampliar el número de conglomerados pa ra, de esta forma, abarcar una mayor variedad de la población de interés. Por el contrario, si los conglomerados fuesen heterogéneos, la mejor opción (entendida como reducción del error muestral) sería la opuesta: reducir el número de conglomerados, aumentando las unidades a observar en cada uno de ellos. En suma, la varianza (homogeneidad o heterogeneidad) del conglomerado afecta al número de conglomerados a elegir. La probabilidad de selección de cada uno de los integrantes de los conglomerados se rá igual al número de unidades a elegir de cada conglomerado dividido por el número de uni dades contenidas en el conglomerado. En encuestas nacionales a la población en general, lo usual es aplicar un muestreo por conglomerados polietápico, que incluye la previa estratificación de la población de estudio. Primero, la población se estratifica por región y tamaño de hábitat. En Es paña, para la estratificación por región se aplica la actual división política adminis trativa del país en comunidades autónomas. Normalmente, la asignación del tamaño de la muestra se hace proporcionalmente, de acuerdo con su peso en el conjunto de la población. Después, se procede a la extracción aleatoria de los municipios o pun tos de muestreo, con probabilidad proporcional al peso de la población de cada mu nicipio. Para la selección de los puntos de muestreo lo común es utilizar datos agre gados (frecuencias absolutas acumuladas de la población en cada estrato diferenciado por su tamaño poblacional) y la tabla de números aleatorios, como se ilustra en el ejemplo a continuación.
En los municipios elegidos se procede a la selección aleatoria de áreas o secciones estadísticas (como pueden ser las secciones censales en los municipios extraídos para la muestra) dentro de los municipios. En las áreas seleccionadas se elegirán, me diante algún procedimiento aleatorio, las viviendas u hogares (habitualmente aplicando el muestreo por rutas aleatorias) y los individuos (las unidades últimas de muestreo) en ellas. La selección de los individuos se hará siguiendo el muestreo por cuotas u otro de los mencionados en el subapartado 3.4.6, ya de forma aislada, ya combinada. En las encuestas a la población en general, el nivel de agregación habitual suelen ser las viviendas o los hogares. La unidad familiar o del hogar se presenta como un con glomerado. En él habrá que proceder a la selección aleatoria de uno o varios de sus in tegrantes. Generalmente se desaconseja la realización de más de una entrevista en un mismo hogar o vivienda porque se prevé una mayor homogeneidad entre sus inte grantes que entre aquellos elegidos de hogares diferentes. Y, como ya se ha dicho de forma reiterada, en la consecución de una muestra “representativa” se prima la he terogeneidad, como estrategia para reducir el error muestral. El Centro de Investigaciones Sociológicas (CIS), según información proporcionada por uno de sus anteriores responsables del diseño de las muestras para encuestas personales, Rodríguez Osuna (1991: 40), utiliza las secciones censales (unidades de se gunda etapa) para seleccionar las unidades de la muestra. Normalmente, en torno a 10 entrevistas por sección, porque se prefiere seleccionar un número elevado de seccio nes. Las entrevistas se realizan sólo en las secciones censales elegidas y únicamente en las viviendas. El éxito de la encuesta radicará en la rigurosa aplicación de la aleatoriedad y en evitar el recurso fácil a la sustitución de los no contactados. De nuevo, se insiste en la necesidad de hacer, al menos, hasta tres revisitas previo a la sustitución. El Instituto Nacional de Estadística (INE), al tener acceso a la información completa por los Censos de Población, utiliza, en cambio, los listados sobre la composición de las sec ciones censales (viviendas, hogares, individuos), en sus encuestas a hogares.
E je m p lo d e s e le c c ió n aleato ria DE PUNIOS DE MUESTREO Para ilustrar el procedimiento habitual seguido en la selección de los puntos de muestreo (municipios), en encuestas a la población en general, a nivel provincial, autonómico, nacio nal e internacional, se plantea el siguiente supuesto: una encuesta a la población de 65 y más años en la Comunidad Autónoma de Madrid, para conocer sus condiciones de vida. El ám bito de la encuesta se restringe a la población mayor que reside en hogares propios o ajenos. Se excluye a la población en residencias para la tercera edad u otros centros asistenciales. La encuesta se hará mediante entrevista personal en domicilios. De acuerdo con el recien te Censo de Población y Vivienda de 2001, en la Comunidad de Madrid residen, a dicha fe
cha, 771.683 personas de 65 y más años. Para un error muestral máximo de ±2%, un nivel de confianza del 95,5% y el supuesto de máxima heterogeneidad poblacional ( P=Q = 50), al no disponer de información previa de la varianza poblacional en la variable de estudio, se fija el tamaño muestral en el conjunto de la Comunidad de Madrid en 1.600 unidades muéstrales. Éstas se extraerán de forma proporcional al peso de los municipios elegidos en el conjunto de la población de Madrid. Los municipios de la Comunidad de Madrid se estratifican por tamaño de hábitat para pro ceder a la afijación proporcional de la muestra, en función de su tamaño y el número de en trevistas a afijar. Para la formación de los estratos, según tipo de hábitat, se decide segmentar la población en cinco estratos. Como el municipio de Madrid agrupa al 72,42% de la pobla ción de 65 y más años, podría plantearse una estratificación no proporcional, reduciendo el número de entrevistas a hacer en dicho municipio para incrementar el tamaño de la muestra en los otros estratos. Pero, como en el caso más desfavorable, el primer estrato diferencia do (de menos de 1.000 habitantes), supone un tamaño muestral de 130 por afijación pro porcional, se acaba haciendo una estratificación proporcional. CUADRO 3.D. Determinación del número de puntos de muestreo de acuerdo con la estratificación proporcional, según la distribución de la población de 65 y más años residente en la Comunidad de Madrid Tamaño del municipio por población de 65 y más años residente
Número de municipios
Población total de 65 y más años
Proporción que representa
Afijación proporcional
Número de puntos de muestreo
Menos de 1.000 hab. De 1.000 a 5.000 De 5.001 a 10.000 De 10.001 a 50.000 Más de 50.000
145 21 7 5 1
40.057 47.501 45.241 80.022 558.862
0,0519 0,0616 0,0586 0,1037 0,7242
130 154 147 259 1.810
8 6 3 2 1
Total
179
771.683
1,0000
2.500
20
El número de puntos de muestreo se determina considerando el número de municipios en cada estrato y su población. Obviamente, en el quinto estrato sólo hay un municipio, que es Madrid. Por consiguiente, no habría que proceder a la selección aleatoria de municipios en dicho estrato. Pero sí en los cuatro restantes. Para ilustrar el proceso seguido en la elec ción de los municipios se toma el cuarto estrato (aquel que agrupa a los municipios de 10.001 a 50.000 habitantes de 65 y más años), por ser el siguiente que reúne un menor número de municipios. En los demás estratos, el procedimiento a seguir sería el mismo. Primero, se lis tan los municipios incluidos en el estrato. Segundo, se calcula la frecuencia absoluta acu mulada de su población, sumando la habida en los estratos precedentes. Después, se se leccionan números aleatorios. Tantos como puntos de muestreo se tengan que elegir. En el cuarto estrato son sólo dos. De la lista de números aleatorios del Anexo, se extraen los dos primeros de la primera co lumna, que cumplen la condición de ser igual o inferior a 80.022. Cantidad que representa a la población total agrupada en dicho estrato. En el cuadro 3.E puede verse que, de acuerdo
con las frecuencias absolutas acumuladas, los dos municipios elegidos (las unidades de mues treo de segunda etapa) son aquellos que primero incluyen al número aleatorio seleccionado: Móstoles y Alcorcón. CUADRO 3.E. Elección aleatoria de los municipios (o puntos de muestreo) en el cuarto estrato De 10.001 a 50.000 habitantes
Población de 65 y más años
Frecuencia absoluta acumulada
Número aleatorio
Móstoles Getafe Alcalá de Henares Alcorcón Leganés
14.863 15.617 15.921 15.929 17.692
14.863 30.480 46.401 62.330 80.022
06318
Total
80.022
47534
El número de entrevistas a realizar en cada municipio será proporcional a su peso. Asi mismo, partiendo de la hipótesis de que las condiciones de vida pueden estar afectadas por la edad de la persona, se decide la distribución proporcional de la muestra en cada munici pio por cuotas de género y edad. La distribución de las entrevistas en los municipios de Ma drid, Móstoles y Alcorcón se da en el cuadro 3.F. CUADRO 3.F. Distribución proporcional de la muestra en los municipios del cuarto y quinto estrato por cuotas de género y edad Mujeres
Municipios
Población total de 65 y más años
Varones 65-69
70-80
Más de 80
65-69
70-80
Más de 80
Móstoles Alcorcón
14.863 15.929
2.350 2.890
2.856 2.932
1.016 1.074
2.533 2.994
3.946 3.785
2.162 2.254
Total
30.792
5.240
5.788
2.090
5.527
7.731
4.416
Madrid
558.862
73.878
107.118
39.048
94.640
157.775
86.403
Unidades muéstrales Móstoles Alcorcón
125 134
20 24
24 25
9 9
21 25
33 32
18 19
Total
259
44
49
18
46
65
37
Madrid
1.810
239
347
126
307
511
280
Si la encuesta se realiza en las viviendas donde residen las unidades de la población a encuestar (personas de 65 y más años), pueden seleccionarse aleatoriamente los hogares a partir de la elección, también aleatoria, de secciones censales (las unidades de muestreo de segunda etapa) por distrito. Alcorcón, por ejemplo, administrativamente se halla seccio nado en cuatro distritos con las siguientes secciones censales: 17, en el distrito 1; 34, en el distrito 2; 29, en el distrito 3; y 28, en el distrito 4. Madrid cuenta con 21 distritos y las sec ciones censales van desde 27, en el distrito 21, hasta 217, en el distrito 10. Debería concretarse el número de entrevistas a realizar en cada sección. En encuestas a la población general, el CIS, como antes se indicó, fija en un número alrededor de 10 las entrevistas a hacer por sección. Ello propicia una mayor heterogeneidad en la muestra conjunta. En el supuesto aquí ilustrado, al tratarse de una población más restringida (de 65 y más años), podría elevarse el número de entrevistas a hacer por sección. Por ejemplo, a 15, e inclusive 20, dependiendo de lo que se prime: ahorro de costes en el trabajo de campo o mayor precisión de las estimaciones de los parámetros poblacionales. Ésta se al canza cuanto más heterogénea sea la muestra. Es decir, cuanto menos concentrada esté en unos conglomerados concretos. La elección de los individuos (unidades muéstrales de tercera etapa) se haría mediante la realización de muestreos de áreas y de rutas aleatorias en cada sección que resulte ele gida (como se indica en el subapartado 3.4.5). Su aplicación requiere el conocimiento preciso de las secciones censales seleccionadas. Elegida la vivienda, se procedería a la elección, tam bién aleatoria, de la persona dentro de la vivienda, siguiendo alguno de los procedimientos aleatorios incluidos en el subapartado 3.4.6, a cuya lectura se remite. El cuadro 3.7 resume las ventajas y los inconvenientes principales del muestreo alea torio por conglomerados. Se insiste en su aplicabilidad en: a) Encuestas personales de ámbito nacional e internacional, que supongan una con siderable dispersión de la muestra. b) Cuando exista dificultad para la obtención de un marco muestral exhaustivo, que incluya a todos los componentes de la población de estudio. Lo cual imposi bilitaría la práctica de otro método de muestreo probabilístico, que sí podría aplicarse en conglomerados concretos (con un muestreo por conglomerados polietápicó). c) Se quiera reducir los costes económicos y la duración del trabajo de campo en la encuesta personal, especialmente.
3.4.5. Muestreo de áreas y rutas aleatorias El muestreo de áreas comúnmente se aplica para la selección aleatoria de vivien das, cuando las unidades de muestreo son personas y familias. Pero también se aplica para la selección aleatoria de granjas, cosechas (en encuestas agrícolas), empresas u otras edificaciones distintas a las viviendas. Su realización exige la existencia de mapas
Ventajas
Inconvenientes
• Simplifica la elaboración del marco mues tral. No exige un listado de todas las uni dades de la población de interés. Sólo de los conglomerados aleatoriamente elegi dos. • Al concentrarse el trabajo de campo en un número limitado de puntos de mues treo, se reducen los costes económicos y temporales de la encuesta personal.
• Mayor error muestral y la consiguiente menor precisión de las estimaciones de los parámetros poblacionales, al haber más homogeneidad que heterogeneidad en los conglomerados*. • Requiere cálculos estadísticos complejos en la estimación del error muestral, prin cipalmente. También de pesos para com pensar distintas probabilidades de selec ción y de errores de no cobertura. • Para muestreos por conglomerados polietápicos se requieren marcos muéstrales específicos para cada etapa en la selección de la muestra.
* El error muestral puede reducirse aumentando el número de conglomerados. Además, los conglomerados grandes suelen ser más heterogéneos que los pequeños.
que cubran el área del ámbito espacial de la encuesta. Éstos actúan como marcos de muestreo. La zona geográfica de interés (país, comunidad autónoma, provincia, munici pio) se divide en áreas, que constituyen unidades de muestreo primarias. Después, se procede a la selección aleatoria de áreas. En las elegidas se crean nuevos mapas, que ayuden en la elección aleatoria de subáreas, hasta concluir en la extracción, igualmente aleatoria, de las unidades últimas de muestreo. En la selección de viviendas, los mapas han de especificar claramente los límites de las áreas de la población de estudio. Se excluirá, por tanto, toda área que no conten ga edificios de viviendas (parques, colegios, iglesias, estaciones ferroviarias, de auto buses, hospitales, centros de internamiento). Si bien, Kish (1965/1995) advierte que es tos lugares pueden contener viviendas de las personas que están a su cuidado; es decir, trabajadores que pueden pertenecer a la población de interés en la encuesta. A continuación, el área se divide en bloques porque contienen viviendas y tienen límites claramente identificados. Los bloques se estratifican de acuerdo con su similaridad para que en la muestra estén representados los diversos vecindarios del mu nicipio. Se parte del supuesto de que los habitantes de un mismo vecindario compar ten un perfil sociodemográfico similar. Además, permite utilizar diferentes grados de conglomeración en distintos estratos. De modo que, “en estratos con elevados costes por bloque de la muestra, podamos seleccionar menos bloques, con submuestras más grandes por bloque de la muestra” (Kish, 1965: 306). Los bloques se numeran y se
les asignan medidas de tamaño, en función de las viviendas que incluyan, según la in formación disponible. En caso contrario, puede asignársele un número aproximado, en consonancia con el tamaño promedio de las viviendas en los vecindarios en los que se procederá a la elección aleatoria de viviendas. A este respecto, el procedimiento más sencillo consiste en la selección sistemática de los bloques de la muestra, con el intervalo de selección aplicado a una lista de nú meros de bloque. Este proceso de extracción muestral es, en palabras de Kish (1965: 308-309), “más fácil y adecuado” en la mayoría de los casos. Por el contrario, la se lección “a pares” de bloques precisa más cuidado. En las encuestas personales en domicilios en las que se utilizan las secciones censales como unidades de segunda etapa (en un muestreo por conglomerados polietápico), co mo hace el CIS, la selección aleatoria de viviendas en las secciones elegidas se hace -co mo indica Rodríguez Osuna (1991)- de dos formas principales. Una consiste en el es tudio detallado, previo a la selección, de las secciones. El coordinador de la zona calcula, de forma aproximada, el número de viviendas y las refleja en un croquis. A par tir de él, se fija la ruta y la frecuencia de selección de los entrevistados: uno cada 100 Viviendas, por ejemplo. Después, se extrae un número aleatorio, que es el que marca la ruta a seguir para la elección aleatoria de la vivienda. El segundo procedimiento al que se hace referencia es el específicamente conocido como método de rutas aleatorias. Persigue la selección aleatoria de viviendas procu rando mantener el principio de “equiprobabilidad”, presente en todo muestreo alea torio. Se denomina muestreo de rutas porque se establece la “ruta” o itinerario que el en trevistador ha de seguir en la selección de las unidades muéstrales. Las rutas se eligen de forma “aleatoria”, sobre un mapa del municipio concreto donde han de realizarse las entrevistas. En el mapa se indican múltiples puntos de partida o de inicio de rutas posibles. Normalmente, el punto de partida corresponde a un edificio determinado por una dirección (por ejemplo, la calle Serrano n.° 22). Pero, en entidades de población pequeñas (núcleos rurales), el punto de inicio de la ruta suele corresponder a edificios centrales, como el ayuntamiento, la iglesia o la plaza del pueblo. La longitud de la ru ta está en función del número de entrevistas a realizar en el área demarcada. Su ori gen es la dirección o punto de partida de la ruta. Su final, la última vivienda en la que se completa el número de entrevistas a hacer en dicha área. Una vez que se ha elegido aleatoriamente el comienzo de la ruta, el entrevistador deberá tomar una dirección u otra, siguiendo las normas fijadas por el equipo inves tigador. En estas normas se indican: a) Los giros que han de realizarse: a la izquierda o a la derecha. b) Los edificios a entrar: como los terminados en una cifra específica (por ejemplo, los acabados en 2). c) Si el edificio comprende más de una vivienda, se especifica la elección de la es calera (si hay más de una), de la planta, de la vivienda en la planta (siguiendo una tabla de números aleatorios específica) y, por último, de la persona a en
trevistar en cada vivienda (de acuerdo con las cuotas fijadas u otro de los procedimientos indicados en el subapartado 3.4.6 para la selección de personas en un mismo hogar o vivienda). En las hojas de ruta el entrevistador registra las actuaciones seguidas hasta la lo calización de los sujetos de la muestra, así como cualquier incidencia de utilidad para la supervisión del trabajo de campo. Normalmente incluye el número de entrevista, la dirección seguida (giro, calle o plaza, número), la selección de la vivienda (número to tal de plantas en el edificio, la planta elegida, número total de puertas en la planta, la puerta elegida). Si la entrevista se llevó a efecto, la hora de realización, el sexo y la edad del entrevistado. En caso contrario, se anota el motivo de su no realización (no res puesta por no contacto o por rechazo).
IJEMPLO DE MUESTREO DE RUTAS ALEATORIAS Como ilustración de un muestreo de rutas aleatorias se extractan criterios seguidos por el Centro de Estudios de Mercado Socioeconómicos y de Opinión, S. A. (Emopública), in cluidos en un Manual del Entrevistador elaborado por dicho centro. Dirección de partida La dirección de partida corresponderá a un edificio, que vendrá determinado por una di rección (por ejemplo, calle Capitán Haya n.° 65). En entidades pequeñas de población es un edificio concreto (por ejemplo, el Ayuntamiento). En la localización de la dirección de partida pueden producirse las siguientes situaciones: 1. Que el número designado como punto de partida no exista en la calle. En este caso, se tomará, como punto de partida, el edificio cuya numeración corresponda al primer número correlativo inferior que se encuentre (siendo éste par o impar, según el número dado como punto de partida). 2. Que el número designado se encuentre repetido. Pueden darse tres casos: • Números bis: se considera el número primitivo. • Números repetidos: el punto de partida será aquel número que ocupe el primer lu gar, teniendo en cuenta el orden creciente de la numeración de la calle. • Numeración doble (antigua y moderna): siempre se considera la más moderna. 3. Que termine la numeración de la calle antes de llegar al número dado como punto de partida. En este caso se tomará el edificio, dentro de la misma calle y acera, cuya nu meración sea la más elevada.
Normalmente dos, que son previamente definidos por el departamento de campo, y que se utilizan para seleccionar los edificios en los que hacer las entrevistas a lo largo de la ru ta. Por ejemplo, todo edificio cuya numeración sea 3, 7 o su terminación coincida con dichos >"'>meros. Seguimiento de la ruta Para iniciar la ruta el entrevistador deberá colocarse de espaldas al punto de partida y co menzará a caminar hacia la derecha hasta encontrarse con la primera bocacalle, por la cual girará a la derecha (primer giro). Seguirá la ruta recorriendo la manzana correspondiente has ta encontrarse con la segunda bocacalle. En ella girará a la izquierda (segundo giro) y, así, sucesivamente (derecha-izquierda) hasta completar el número de entrevistas a realizar en la zona (véase la figura 3.A).
□ □ □ □
□ □ □ t□ □ □ f□ □ □ | □ □ □ □ □ □
Punto de partida ->■Seguimiento de la ruta Figura 3.A. Croquis para el seguimiento de la ruta.
La ruta puede transcurrir, a lo largo de su itinerario, por ambas aceras, según esté situada én ellas la numeración de las calles por las cuales va pasando. Algunas situaciones que pue den dar a confusión en la ejecución del itinerario son las siguientes: 1. Que la calle por la que se avanza se bifurque. La bifurcación siempre se considera gi ro y éste se efectuará a la derecha o a la izquierda, según corresponda. 2. Que en la ruta se encuentre una plaza. Al desembocar en ella, se procederá en fun ción del orden de giro que corresponda efectuar. Por ejemplo, si es a la derecha, se correrá el tramo de la plaza correspondiente hasta llegar a la primera bocacalle por la cual se saldrá de la plaza girando también a la derecha. Del mismo modo se procederá, pero a la izquierda, en caso de que haya que girar a la izquierda. Como norma general, en la plaza sólo se realizarán dos giros: el que corresponda al de sembocar en ella y el que se realice para salir de la plaza.
3. En caso de encontrarse, siguiendo la ruta, con un descampado, una valla prolonga da o algún obstáculo que impida realizar el giro, éste se hará en el sentido comple tamente opuesto al que se tenía que hacer. Después, se proseguirá la ruta respetando el orden de giros (derecha e izquierda), a partir del último efectuado. Dicha operación se llama “inversión de ruta”. 4. Si se trata de un callejón pueden darse dos situaciones. Una, que el callejón tenga sa lida a otra calle (figura 3.B). En este caso el callejón se recorrerá considerándolo co mo una bocacalle más en la ruta, y teniendo en cuenta el giro realizado a su entrada, exclusivamente. Dos, callejón sin salida a otra calle (figura 3.C). Si es así, éste se re correrá sin afectar en absoluto al orden de giros.
Sistema de zona Se emplea cuando las viviendas no forman calles con una disposición más o menos re gular. Es decir, cuando no es posible seguir la ruta convencional. 1. Si el punto de partida se encuentra en el interior del grupo de población/viviendas (fi gura 3.D). El entrevistador se situará en el edificio determinado como punto de par tida (por ejemplo, el Ayuntamiento). Comenzando en este punto se hará un recorrido envolvente (en espiral), alrededor de dicho punto de origen y en el sentido de la agu ja del reloj. De “dentro” a “fuera”, comenzando por la primera vivienda/edificio de la de recha. 2. Si el punto de partida se encuentra en un lugar situado en el exterior del núcleo de po blación/viviendas (figura 3.E). Se procederá del mismo modo, pero el recorrido de la espiral será ahora de “fuera” a “dentro”.
La aplicación del “sistema de zona”, cuando se haya tenido que hacer, se reflejará igual mente en la hoja de ruta. Sustitución de edificios Sólo cuando el entrevistador haya agotado todas las posibilidades para evitar su apli cación. Se trata de evitar alteraciones en la muestra que afecten a su representatividad. Co mo norma general, un edificio se sustituirá siempre por el siguiente edificio siguiendo la ru ta en la misma acera, aunque la numeración del mismo no corresponda con los valores de X a aplicar. Ejemplo, valores de X = 3 y 7. Sustitución
La sustitución del edificio se hará cuando coincidan algunos de los casos siguientes: 1. No sea un bloque de viviendas: instituciones (organismos oficiales, colegios, hospi tales), hoteles, oficinas, comercios, fábricas y similares. 2 . Que sea una vivienda unifamiliar en la cual la totalidad de los miembros que la componen se encuentren ausentes, rehúsen colaborar o que se encuentre deshabitada. 3. Un edificio de varias viviendas en el que, por diversos motivos (viviendas deshabitadas, hogares que rehúsan participar en la encuesta) no se haya podido hacer la entrevista en ninguna de las viviendas del edificio. Selección de plantas en el edificio Si éste tiene más de una planta. Para que sea aleatoria, la selección de las plantas se ha ce utilizando una tabla de números aleatorios (o selector), como la incluida en el cuadro 3.G.
Número de la entrevista a realizar
i
Número de plantas / puertas
1
2 3 4* 5 6 7 8 9 10
1 1 1 3 4 3 6 6 2 2 5
2 1 2 1 3 5 4 4 4 8 8
3 1 1 3 2 1 3 6 8 8 8
4 1 2 1 1 5 5 3 2 5 5
5* 1 1 2 3* 5 2 3 6 1 9
6 1 2 2 3 4 1 1 7 9 7
7 1 2 3 2 3 3 5 2 4 5
8 1 1 2 2 5 4 4 5 2 1
9 1 1 1 1 2 2 6 5 6 3
10 1 2 2 4 1 1 1 1 9 6
11 12 13 14 15 1 1 1 1 1 1 2 2 1 2 2 2 3 2 3 1 4 4 1 3 4 1 2 1 3 3 5 4 3 6 5 7 7 2 5 3 8 7 6 2 6 7 4 3 3 4 7 2 6 9
Planta o puerta seleccionada
Por ejemplo, Entrevista a realizar: quinta
5
Plantas en el edificio: cuatro
4
Planta seleccionada: tercera
3
Cruzando en la tabla el número de orden de la entrevista a realizar con el número de plan tas del edificio o módulo seleccionado, se obtiene la planta seleccionada aleatoriamente den tro del edificio. Por “módulo” se entiende la agrupación de plantas dentro de un mismo edi ficio, cuando éste sobrepase cinco alturas. • Es frecuente que en los edificios que tengan más de 5 plantas se realicen tantas en trevistas como módulos contenga el edificio. Para lo cual, se divide el número de plan tas habitadas que tiene el edificio en módulos de 5 plantas. Si el número de plantas no fuese múltiplo de 5, las últimas plantas restantes se considerarán, a efectos de se lección, como un módulo más. Cada módulo se considera, e efectos de selección alea toria de planta, un edificio “independiente”. En la hoja de ruta se anotará si el edificio contenía más de 5 plantas y qué plantas y puertas se seleccionaron.
• Si el edificio tuviese 2 o más escaleras, se procederá como si se tratase de un edifi cio con varios módulos. Se ordenarán las escaleras y se procederá a seleccionar las plantas correspondientes dentro de cada módulo. Sustitución de plantas Se llevará a cabo en la planta inmediatamente superior y así, sucesivamente, en el ca so que fueran necesarias nuevas sustituciones. Si se llegase a la última planta del edificio o módulo (o ésta hubiera correspondido inicialmente en la selección), la sustitución se hará en la primera planta del edificio o módulo. Si fuese necesario, se continuará el ciclo de sustitu ción hasta llegar de nuevo a la planta inicialmente seleccionada. En caso de no haber podido realizar ninguna entrevista, se procederá a la sustitución por el siguiente edificio siguiendo la ruta. En él se procederá a seleccionar, de nuevo, planta y puerta. Selección de viviendas Si en la planta elegida hubiese más de una vivienda, habrá que proceder a la selección aleatoria de una vivienda. Para ello se utilizará el mismo selector que para la selección de planta: se cruzará el número de orden de la entrevista a realizar con el número de puertas (o viviendas) que tiene la planta seleccionada. Previamente, habrá que ordenar las puertas en las plantas. • Si éstas estuviesen ya numeradas, se repetiría dicha numeración. • Si la ordenación fuese alfabética, se traduciría en su equivalente numérico (por ejemplo, la letra A con el número 1; B, con el 2; y así sucesivamente). • Si las puertas no tuviesen ningún tipo de numeración, habría que ordenarlas de iz quierda a derecha, siempre en función del punto por el cual se ha llegado a la planta, teniendo como punto de referencia la escalera. Sustitución de viviendas Se hará cuando la vivienda seleccionada sea una oficina, pensión o similar. Es decir, no sea una vivienda familiar. También, cuando se encuentre deshabitada o sus inquilinos rehúsen a participar en la encuesta. • Si la vivienda fuese unifamiliar, la sustitución se realizará, lógicamente, en la si guiente vivienda (o edificio), siguiendo la ruta. • En edificios o módulos de varias plantas, con una única vivienda por planta, la susti tución se hará en la vivienda de la planta inmediatamente superior. • En edificios con varias plantas o módulos y más de una vivienda por planta, la susti tución se hará en la puerta inmediata de la derecha a la izquierda, según proceda en función de la ordenación que se haya dado a las mismas para su selección.
Cualquier sustitución que se haga a lo largo de una ruta deberá reflejarse, con todo de talle, en la hoja de ruta. Para la selección de las personas en la vivienda se aplicará alguno de los procedimientos enunciados en el subapartado 3.4.6. En todo caso, se ajustará a las características de la per sona a entrevistar, delimitadas en el diseño de la muestra. Éstas se adjuntan en el Manual del Entrevistador. La selección muestral por rutas aleatorias, aunque trate de garantizar el principio de equiprobabilidad en la elección de las viviendas, no garantiza que todas las unidades de la población tengan la misma probabilidad de ser elegida. Y ello a pesar de que la ruta se haya designado de forma aleatoria. Este handicap, que puede traducirse en una sobrerrepresentación, en la muestra final, de aquellas personas que están más fre cuentemente en casa (amas de casa, jubilados, personas en paro, estudiantes), podrá obviarse en la medida en que no se proceda a la rápida “sustitución” de los no res pondientes (por no contacto o rechazo). Se reitera en la recomendación de, al menos, tres revisitas, en la vivienda aleatoriamente elegida, en caso de no contacto. Estas y otras actuaciones se especifican en el apartado 5.3, dedicado al error de no respuesta en la encuesta. 3.4.6. Métodos de selección de individuos en una misma vivienda Cuando la unidad de análisis es la vivienda y todos sus integrantes, que se ajusten a la población de estudio, se consideran “válidos”, el proceso de selección muestral se da por concluido. También, cuando hay que entrevistar a una persona concreta. Por ejemplo, al cabeza de familia o a amas de casa. Pero, cuando hay que elegir a uno o va rios de los integrantes que forman el hogar, en encuestas cara a cara y telefónicas exis ten varios procedimientos alternativos de selección de entrevistados. En su mayoría buscan garantizar la “aleatoriedad” en la selección del entrevistado. Los más populares son el método de “no selección”, el método de Kish de selección aleatoria, el método de selección de cuota sistemática y el del cumpleaños. A continuación se concretan sus ca racterísticas diferenciales. Método de “no selección” De los métodos propuestos éste es el peor, por los sesgos que puede introducir en la muestra: las personas finalmente entrevistadas. No puede considerarse un método probabilístico, aunque resulta poco intrusivo y de fácil realización. Consiste en en trevistar a la primera persona que abra la puerta (encuesta cara a cara) o conteste al te léfono (encuesta telefónica). La única condición que se impone es que cumpla las ca racterísticas de la población de estudio. Por ejemplo, persona de 18 años y más.
En su contra está la mayor probabilidad de selección que concede a las personas que están en casa y contestan al teléfono o abren la puerta. Según estimaciones de Dillman (1978), referidas a la encuesta telefónica, dos de cada tres veces que se llama al te léfono es una mujer quien responde. Los hombres, sólo una de cada tres veces. In clusive en las horas habituales del trabajo de campo y de mayor captación de varones en los hogares. Quiere esto decirque este método propicia un desequilibrio en la muestra, a favor de las personas más probables a contestar al teléfono o abrir la puerta. Para evitarlo habría que emplear un método que equilibre la muestra, al menos en características sociodemográficas básicas, como son las variables género y edad, en igual proporción a su presencia en la población de estudio. Aplicando un método de selección sistemático por género, consistente en ir alter nando varones y mujeres, podría corregirse el sesgo en la muestra por género, aunque no por edad, dada la mayor probabilidad a responder (al teléfono y a la puerta) de per sonas de menos edad. Por lo que habría que arbitrar un método que al menos ajustara la muestra a la población en estas dos características sociodemográficas básicas y que fuese “probabilístico”. Método de Kish de selección aleatoria En 1949 Leslie Kish (en “A procedure for objective respondent selection within the household”. Journal ofthe American Statistical Association, 44: 380-387) propone un procedimiento “aleatorio” de selección de personas en un hogar. A él Lavrakas (1993:108) se refiere como “el método de selección del respondiente más riguroso que es aceptado para entrevistas en persona”. Su uso preferente es en encuestas ca ra a cara en domicilios, aunque puede aplicarse tanto en encuestas personales co mo en telefónicas. Si bien, en encuestas telefónicas puede llegar a ser incluso más in trusivo que en la personal, con el consiguiente aumento de la no respuesta por rechazo. Una vez que el entrevistador se ha presentado, ha de solicitar, a la persona que res ponda al teléfono o abra la puerta, que enumere a los individuos en el hogar que sa tisfagan el criterio de edad de la población de estudio. Por ejemplo, personas de 18 a 55 años. Pero no sólo se excluye a aquellas personas que no cumplan dicho criterio, también a aquellos que presenten alguna incapacidad que les inhabilite para la reali zación de la entrevista (como alguna enfermedad mental o dificultad para la comu nicación verbal normal), además de los ausentes en el domicilio por un largo período de tiempo (por cuestiones laborales, educativas o de otro orden). Las personas que se ajustan a la población de estudio se ordenan por su relación de parentesco con el cabeza de familia (cabeza de familia, esposa, padre del cabeza de familia, madre, hijo, hija, tía de la esposa u otro familiar en el hogar). Después, se pre gunta por la edad de cada persona listada para ordenarlos de acuerdo con su género y edad. El varón de más edad será el número 1, el siguiente varón de más edad el nú
mero 2, y así, de más a menos edad, hasta incluir a todos los elegibles varones. Se si gue la ordenación de las mujeres en la misma disposición, en orden de edad decre ciente. Primero la mujer de más edad y, por último, la de menor edad. Para garantizar la selección aleatoria de respondientes, entre los elegibles, se apli ca una tabla de números aleatorios. Esta tabla se imprime, junto con el cuestionario, en su portada o adverso, y su composición se alterna, de forma aleatoria, en los distintos cuestionarios. Existen ocho versiones de la tabla de selección de entrevistados de Kish, cuya aplicación aleatoria alternativa se facilita bastante en las encuestas informatizadas
(CAPI, CATI).
Si la persona que resulta elegida no está en el domicilio, en ese momento, debe preguntarse cuándo podrá localizarse e intentar concertar una cita con ella. Lo que no debe hacerse es sustituirla por otro miembro del hogar que sí esté en ese momento y quiera ser entrevistado. Las negativas, de producirse, bien por la imposibilidad de con tactar con la persona que haya resultado elegida aleatoriamente en el período de tiem po asignado al trabajo de campo, bien por el rechazo manifiesto de ésta a ser entre vistada, deberán considerarse “entrevistas negativas” y, en consecuencia, proseguir con el proceso de selección en otra vivienda también elegida al azar.
E je m p lo d e l m é t o d o d e k is h d e s e le c c ió n a lea t o r ia DE ENTREVISTADOS EN UNA MISMA VIVIENDA Después de una breve presentación de la encuesta, el entrevistador solicita, a la persona con la que primero establece contacto en la vivienda, que liste a aquellos que residen en la vivienda en ese momento. Dicha solicitud la puede hacer, por ejemplo, en los términos si guientes: Para determinar a quién entrevistar, necesito listar a las personas de 16 y más años que ha bitualmente residen en esta vivienda. Sólo preciso conocer su edad y sexo, no sus nombres, y la relación de parentesco que tienen con usted. Comencemos por usted, ¿cuántos años tiene? ¿ Y las otras personas?
Con la información que dé el informante, el entrevistador completa los datos que figuran en el cuadro 3.H. Después, se aplica la tabla de selección, propuesta por Kish en 1949 (1965/1995), pa ra elegir al respondiente (cuadro 3.I). De acuerdo con ella, la persona seleccionada para ser entrevistada es la que ocupa el número 4 en la ordenación incluida en el cuadro 3.H. Es de cir, la esposa. Si no es ésta la persona con la que primero se ha establecido contacto, pre guntar al informante si se puede hablar con ella en ese momento o cuando estime mejor. In tentar concertar una cita con la persona seleccionada, un día y hora concreta para realizar la entrevista.
Relación con el cabeza de familia (1) Cabeza de familia Esposo/a Madre del cabeza de familia Hijo Hija Hija Sobrina
Sexo (2)
Edad (3)
Adulto número (4)
Varón Mujer Mujer Varón Mujer Mujer Mujer
59 56 82 18 21 19 17
1 4 3 2 5 6 7
CUADRO 3.1. Tabla de selección para elegir al encuestado Si el número de adultos en la vivienda es...
Entrevistar al adulto con el número
1 2 3 4 5 6 o más
1 2 2 3 4 4*
* El adulto con el número 4 es el elegido al haber listados 7 personas adultas.
El mérito principal del método de Kish es el propiciar la “equiprobabilidad” en la selección de los entrevistados en una misma vivienda. No obstante, presenta los límites o inconvenientes siguientes: a) Como en cualquier método de selección, si existe sólo una persona elegible en el hogar, esa persona automáticamente se convierte en el sujeto seleccionado (Lavrakas, 1998). En consecuencia, obtiene desiguales probabilidades de se lección para personas por tamaño del hogar. De modo que aquellas que viven solas tienen una mayor probabilidad de ser elegidas frente a aquellas que viven con 6,7 o más personas, por ejemplo. No garantiza, por tanto, la eliminación de di cho sesgo. Su aplicación lleva, en suma, a una pequeña subrepresentación de los más jóvenes entre los elegibles en hogares con un mayor número de personas que se ajustan a la población de estudio. No obstante, este método minimiza, de acuerdo con Lavrakas (1993), la no cobertura dentro de las unidades de mues treo, comparado con otros métodos menos rigurosos de selección.
b) Su aplicación exige que la persona que responde al teléfono o abre la puerta dé información referida a los otros integrantes del hogar. Esta solicitud pue de suscitar recelos en el respondiente, que puede considerarla “impertinen te ”, propiciando un aumento de la no respuesta por rechazo, antes de comenzar propiamente la entrevista. De la destreza y capacidad del entre vistador para transmitir la finalidad que se persigue con la información soli citada depende el éxito de la aplicación de este método de selección; que se reduzcan las “negativas” en un método en el que se coincide en calificar de “intrusivo”. Asimismo, está el problema de la veracidad de la información que se pro porcione de los otros miembros del hogar. En la comprobación de la veracidad sobre la composición del hogar llevada a cabo por Groves y Kahn (1979) se constató que en un 9% de los hogares se dio información discrepante sobre el número de adultos que residían en la vivienda. c) Añade minutos extra al proceso de selección de entrevistados. En mayor me dida, cuantas más personas habiten en la vivienda. La aplicación de este método de selección de personas en una misma vivienda se considera “algo complicada” y ha propiciado -como señalan Paisley y Parker (1965: 438)- “salidas ocasionales del procedimiento correcto en el campo”. En general, se de fiende la necesidad de que la selección de encuestados en un mismo hogar sea senci lla, rápida y no invasiva o “impertinente”. Su uso parece más desaconsejable en la en cuesta telefónica (véase Frey, 1989), porque exige más del entrevistador que la encuesta cara a cara, al perderse el contacto visual. En una entrevista en persona el informante del hogar puede ver lo que el entre vistador está haciendo. Cuando el método de Kish se utiliza por teléfono es pruden te que los entrevistadores hagan un breve comentario que avise al oyente de que exis te una pequeña pausa en el tiempo en que el ordenamiento se lleva a cabo (Lavrakas, 1993:110). Métodos de selección de cuota sistemática En 1964, Verling C. Troldahl y Roy E. Cárter (en “Random selection of respondent within households in surveys”. Journal o f Marketing Research, 1: 71-76) proponen un método de selección de entrevistados, especialmente dirigido a la encuesta telefónica, que pretende ser menos invasivo y más rápido que el ideado por Kish. Con posterio ridad, fue modificado por Bryant (1975). Para la selección aleatoria del encuestado, el entrevistador ha de hacer sólo dos pre guntas para conseguir la información precisa para su aplicación:
• ¿Cuántas personas de__X _ años o mayores viven en su casa incluyéndose Ud. ? • ¿Cuántos de ellos son varones?
Puede preguntarse, indistintamente, por varones o por mujeres. La edad la marca la población a estudiar en cada encuesta concreta. En la mayoría de los casos es la población de 18 años y más. También, puede ser de 16 y más años u otros grupos de edad. La persona a entrevistar se obtiene del cruce de la respuesta a ambas preguntas en una tabla de selección como la incluida en el cuadro 3.8. Se escoge una de las cuatro ma trices o versiones de selección. Las versiones se aplican en el siguiente orden: Io, 2o, 3o, 4o, 2o, 3o, 4o; I o, 2o, 3a, 4o; 2o, 3o, 4o, etc. Es decir, se emplean de forma alternativa para que en cada contacto se aplique una diferente y consecutiva a la anterior. Con ello se pretende garantizar que la selección de individuos sea aleatoria. CUADRO 3.8. Tabla para la selección aleatoria del entrevistado de Troldahl y Cárter Número total de varones en el hogar Versión 1 0 1 2 í;' 3 4 o más Versión 2 0 1 2 "v 3 4 o más Versión 3 : 0 1 2 3 4 o más Versión 4 0 1 2 3 4 o más
Número total de personas de X años en el hogar 1
2
3
4 o más
Mujer Varón
Mujer mayor edad Mujer menor edad Varón Varón Varón mayor edad Varón menor edad Varón menor edad
Mujer menor edad Mujer mayor edad Varón menor edad Varón mayor edad Varón mayor edad
Mujer Varón
Mujer menor edad Mujer menor edad Varón Mujer mayor edad Varón mayor edad Mujer Varón menor edad
Mujer mayor edad Varón Varón mayor edad Mujer o mujer mayor edad Varón mayor edad
Mujer Varón
Mujer menor edad Mujer mayor edad Mujer Varón Varón menor edad Varón mayor edad Varón mayor edad
Mujer mayor edad Mujer menor edad Varón mayor edad Varón menor edad Varón menor edad
Mujer Varón
Mujer mayor edad Mujer mayor edad Mujer Mujer menor edad Varón menor edad Mujer Varón mayor edad
Mujer menor edad Varón Mujer menor edad Mujer o mujer mayor edad Varón menor edad
Preguntando por el número de mujeres más que por el de varones, Czaja, Blair y Sebestik (1982) obtuvieron una mayor tasa de respuesta en la aplicación de este mé todo. Método que, al igual que con el método de Kish, en teoría y mezclando las ver siones de las matrices de selección, una encuesta concluirá con una muestra equilibrada (respecto a la población de interés), de mujeres y varones, de adultos más jóvenes y más mayores. Si bien, en la práctica Lavrakas (1993:114; 1998: 448) reconoce que “in cluso la combinación prescrita de versiones típicamente resulta en una ligera subrepresentación (submuestreo) de varones, a menos que se hagan ajustes a través del pe ríodo de encuesta”. Para que el método de selección sea menos intrusivo, Hagen y Collier (1982) proponen que, después de la presentación de la encuesta, el entrevistador pregunte por uno de los cuatro tipos de respondientes: la mujer más joven, la mujer mayor, el varón más joven, el varón mayor. De esta forma se evita la necesidad de deter minar el número de posibles elegibles en el hogar al principio del contacto del en trevistador. Por su parte, Lavrakas (1993) propone, para facilitar su práctica, que los entre vistadores meramente pidan hablar con un hombre o una mujer en hogares con una de tales personas, o pida hablar con el varón o la mujer más joven en hogares con más de una persona del mismo género. Aunque reconoce que se precisa llevar un recuento diario, para ajustar la proporción de los contactados y los que habría que seleccionar, y también que no se logra obtener una muestra de probabilidad en el hogar. En su contra está, igualmente, el ser un método intrusivo. Las dos preguntas que exige su realización pueden considerarse personales. Asimismo, muestra impre cisión en hogares que tienen más de tres varones o tres mujeres.
Método del cumpleaños Propuesto a principios de los años ochenta por Salmón y Nicholls (1983) y de am plia aplicación en encuestas telefónicas debido, según Lavrakas (1998: 448), a que es un “método de selección superior a los demás”. Aunque, en opinión de Biemer y Lyberg (2003:197), “estos métodos no producen muestras aleatorias y no deberían utilizarse en la investigación científica rigurosa”. Tras una presentación breve de la encuesta, el entrevistador pregunta por la persona, de los elegibles en el hogar (por pertenecer a la población de estudio), cu yo cumpleaños fue “el más reciente” o será “el próximo”. Por ejemplo, “Para esta en cuesta, ¿podría entrevistar a la persona de 16 años o más que vaya a cumplir años pró ximamente?”. En caso de no estar en casa en ese momento, se procura concertar una cita (día y hora) para la realización de la entrevista. Asimismo, en hogares uniper sonales, se entrevistará a su único integrante, siempre que pertenezca a la población de estudio. Al reducirse las preguntas y simplificarse el proceso de selección del entrevistado, su aplicación resulta más fácil y rápida a los entrevistadores respecto a los dos méto
dos precedentes. Además, es algo menos intrusivo, lo que favorece un menor error de no respuesta por rechazo. En su favor está, asimismo, el propiciar una muestra heterogénea, al concederse igual probabilidad de selección a cada miembro del hogar. Su aplicación reduce sesgos debidos a las variables género y edad. Además, siempre podrá entrevistarse a alguien en el hogar, porque siempre habrá alguien que haya cumplido años o los cumpla pró ximamente. En junio de 1982, O’Rourke y Blair (1983/2002) realizan un experimento como par te de una encuesta telefónica ómnibus, desde The Survey Research Laboratory de la Uni versidad de Illinois. La encuesta incluía preguntas sobre seguridad vial, educación su perior, atención médica y planificación familiar. Se comparó el método de selección de Kish con el método del “cumpleaños más reciente”, en relación al porcentaje de negativas y características demográficas de la muestra. También, para validar el método del cum pleaños. Se obtuvo un menor porcentaje de negativas (o rechazos), cuando se aplicó el método del cumpleaños que cuando la selección del entrevistado se hizo con el método de Kish: un 6,9% frente al 10,3% del método de Kish. El 83% de los entrevistadores es tuvo de acuerdo en que el método del cumpleaños resultó más fácil de aplicar. El 75% que fue mejor en términos de cooperación del respondiente. El 25% restante no en contró ninguna diferencia.
Estos cuatro son los métodos para seleccionar a personas dentro de una vivienda u hogar de práctica más habitual en la investigación mediante encuesta. Persiguen que la elección no se haga de forma arbitraria o subjetiva, sino que introduzca una cierta aleatoriedad en el proceso de selección. A ellos cabe sumar otros métodos, como el ba sado en “votantes probables”, aunque sea de escasa aplicación, salvo en encuestas elec torales (sobre todo en las postelectorales). En él se pregunta, a la primera persona con la que se contacta en la vivienda (de 18 años o más), si votó en las elecciones pasadas. Después, se le pregunta si piensa votar en las próximas elecciones. Si responde sí, se le entrevista. En caso contrario, no. A continuación, se intenta contactar con otra per sona que cumpla dichos criterios en el mismo hogar, o en otro que se elija, igualmente, de forma aleatoria. También, puede preguntarse por una persona que se ajuste a unas cuotas concre tas, de edad , género, etnia u otra característica que se considere relevante en relación con el problema de investigación.
3.4.7. Muestreo por cuotas Desarrollado en los años treinta del siglo xx por Gallup y Ropper, obteniendo un gran éxito en la predicción de los resultados de las elecciones presidenciales nortea mericanas de 1936, aunque falló en la predicción de las celebradas en 1948, como se di jo en el apartado 3.2. Kish (1965/1995: 563) niega a este método el carácter de “cien tífico”. En su opinión, “más parece ser una producción artística difícil de definir o
describir”. Por su parte, Lohr (2000:115) insiste en su adecuación “a la investigación comercial, pero no a otros tipos de encuesta”. Éstas y otras valoraciones negativas del método de muestreo por cuotas se asientan en su carácter de método de muestreo no probabilístico, que no concede a todas las unidades de la población la misma proba bilidad de ser incluidas en la muestra. No obstante, este método es, de los no proba bilísticos, el que proporciona mejores resultados. Se debe a que al menos “obliga” a in cluir en la muestra a unidades de la población, de acuerdo con su “proporcionalidad” en las variables de cuota establecidas para su selección. El muestreo por cuotas es uno de los más populares y de mayor aplicación en la investigación de mercados. Favorecido por su menor coste económico y temporal, en relación con los métodos de muestreo probabilísticos, junto a su fácil administración. De acuerdo con Groves (1989: 248), “el coste promedio de las entrevistas de mues tras de probabilidad es casi tres veces el coste promedio de los métodos muéstrales de cuotas”. Como el muestreo aleatorio estratificado, el de cuotas parte de la segmentación de la población de estudio en grupos, en función de variables sociodemográficas rela cionadas con los objetivos de la encuesta. Se busca la homogeneidad dentro de los gru pos diferenciados y, en cambio, la heterogeneidad de unos respecto de los otros grupos. Si bien, la selección de las unidades de la muestra no se realiza siguiendo un procedimiento aleatorio. Sólo se precisa que la persona elegida se ajuste a las “cuo tas” marcadas. Su ejecución supone la elaboración de una matriz de las características básicas de la población que se analiza (proporciones de población diferenciadas por sexo y edad, nivel de instrucción, clase social), a modo del muestreo estratificado proporcio nal. La información se obtiene de datos censales (Censo de Población, Padrón de Ha bitantes u otras fuentes estadísticas referidas a la población de estudio). El propósito es extraer una muestra que se ajuste a la distribución de las características funda mentales de la población. Por ejemplo, si el objetivo de la encuesta es comprobar la influencia del nivel educativo de las personas en sus actividades de ocio, la población de estudio deberá, al menos, estratificarse por nivel educativo. De esta forma se garantiza que en la muestra estén representados los distintos grupos de población, diferenciados por nivel educativo, pudiéndose realizar comparaciones entrelos distintos grupos de población. Junto con los objetivos principales de la encuesta, en la elección de las variables de cuota intervienen otros factores. Destacan dos. Uno es la precisión que el investigador busca en su indagación. Otro, la accesibilidad de las variables elegidas. Ésta dependerá de la facilidad de su obtención en el marco muestral elegido, además de su practicabilidad. Es decir, si el entrevistador puede acceder fácilmente a los grupos de población definidos por las variables escogidas. Las cuotas más habituales son las determinadas por la conjunción de las variables género y edad, junto con las referidas al componente
espacial (país, región, comunidad autónoma, municipio, distrito), aunque no estén re lacionadas con el problema de investigación. Por ejemplo, en el estudio de las actitudes ante la inmigración, la variable género apenas es relevante en la explicación de las actitudes diferenciales ante los inmigrantes. Cea D’Ancona (2004b) comprueba que las diferencias entre varones y mujeres apenas son perceptibles. No así las diferencias por edad, estatus social (nivel educativo, ocu pación, ingresos), práctica religiosa, ideología política y hábitat. Utilizar muchas variables de cuota haría, no obstante, el trabajo de campo poco practicable, dificultando en exceso su ejecución. Por esta razón, las cuotas suelen re ducirse a unas pocas variables de clasificación y que sean “accesibles”. Las variables género y edad están presentes en la generalidad de los marcos muéstrales empleados para la fijación de cuotas. A ello se suma la relativa facilidad (para el entrevistador) de localizar “visualmente” a personas que pertenezcan a los diferentes subgrupos for mados cruzando las variables género y edad. Lo mismo no puede decirse de otras va riables, como las referidas a estatus social. Aunque el estatus social de una persona pue da medirse, de forma objetiva, combinando las variables renta, ocupación y nivel de estudios, también operan factores subjetivos en la atribución de estatus (apariencia fí sica, forma de vestir, de hablar), como destacan Moser y Kalton (1989). Además, no se olvide que las unidades muéstrales se eligen si “parece” que se ajustan a las cuotas marcadas. Una vez confeccionada la matriz, sigue un proceso similar a la estratificación proporcional. Se calculan las proporciones relativas (las cuotas) para cada celdilla de la matriz, a partir de la proporción que representa cada categoría de las variables de cuo ta seleccionadas en la población de estudio. Se quiere equiparar la muestra a la po blación de interés lo más posible. Tras la delimitación de las cuotas, se proporciona a cada entrevistador su asignación correspondiente: el perfil y el número de personas a entrevistar en cada cuota. Éstos han de proceder a su localización.
ZJEMPLO DE ASIGNACIÓN DE CUOTAS En una encuesta a la población de 18 años y más, se decide establecer unas cuotas por sexo, edad y actividad. Se calcula, como en el muestreo estratificado proporcional, propor cionalmente a su peso en el conjunto de la población que se analiza. Después, se asigna a cada entrevistador un número total de entrevistas a realizar, acordes con las cuotas fijadas, como la incluida en el cuadro 3.J. El entrevistador deberá localizar a personas que se ajusten a cada casilla de la matriz dada.
Ocupado
Parado
Varones 18-29 30-44 45-64 65 y más
3 6 7 -
Mujeres 18-29 30-44 45-64 65 y más
2 3 5 -
1 2 1 -
Total
26
7
-
1 2 -
Jubilado
Ama de casa Estudiante
-
-
3
-
—
-
1 6
-
-
-
-
7
2 4 5 1
14
12
-
Total 6 7 10 6
-
7 9 11 8
5
65
2 -
Lo que diferencia al muestreo por cuotas, respecto del estratificado, es la libertad que se da al entrevistador para la elección de las unidades finales de la población a en trevistar. Aunque el azar intervenga en las fases iniciales del diseño muestral (en la elec ción de áreas o zonas geográficas, por ejemplo), la selección de los elementos concretos de la población es totalmente arbitraria. Es el propio entrevistador quien selecciona al entrevistado, en cualquier momento y lugar (en una calle comercial, a la salida del metro, en la parada del autobús, en un mercado, en un parque). La única condición que se le impone es que la persona se ajuste a las cuotas fijadas por el equipo investigador. Este margen de libertad que se concede al entrevistador representa la principal de bilidad de esta modalidad de muestreo: a) El entrevistador es libre de entrevistar a quien quiera o pueda. Esta libertad dada al entrevistador puede propiciar la introducción de sesgos importantes en el proceso de selección de la muestra, no siempre detectables por el equipo inves tigador. Así, por ejemplo, puede haber escogido a personas de su propio entorno sociofamiliar, a aquellas que haya estimado más propensas a participar en la in vestigación, o simplemente a las más accesibles. Generalmente, el muestreo por cuotas tiende a subrepresentar a las personas más difíciles de ser entrevistadas y éstas suelen presentar un perfil no coincidente con el de aquellos más accesibles. También es fácil que, dentro de una misma cuota, se escoja a unos indivi duos con preferencia a otros. Por ejemplo, si se controla por edad, es probable que se entreviste más a personas de edades intermedias en los intervalos dife renciados, y no a aquellas situadas en los límites del intervalo. Asimismo, el entrevistador puede ubicar a los sujetos en cuotas diferentes a las que realmente pertenecen, en aquellas donde se precisen casos (para com-
pletarlas). Esta última picaresca también resulta difícil de controlar. Todo lo cual nos lleva a la reflexión expresada por Kish (1965/1995: 562): No es suficientemente sencillo establecer que el muestreo de cuotas se utilizó en una encuesta y esperar que alguien tenga más que una idea muy general de cómo la mues tra se extrajo. b) El desconocimiento de las probabilidades de selección no permite evitar los erro res generados por ponderaciones incorrectas en el proceso de estimación; ni tampoco la estimación de los errores de muestreo. No tienen ninguna base probabilística para la inferencia estadística, no pudiéndose afirmar que las estimaciones de los parámetros poblacionales sean insesgadas. A diferencia del muestreo estratificado, no puede esperarse que la repetición de la muestra permita obtener resultados similares a los alcanzados en el estudio inicial, al no haber estado presente la aleatoriedad en todo el proceso de selección de la muestra. Todo lo cual repercute en el principal inconveniente de este tipo de muestreo: la muestra finalmente obtenida puede no ser representativa de la po blación que se analiza, aunque la muestra diseñada coincida con la distribución de la población en los controles de cuotas fijados. Puede ocurrir que la muestra represente muy bien a la población para ciertas va riables, y no la represente en absoluto en cuanto a opiniones (Azorín y Sánchez Cres po, 1986:21). En la primavera de 1985, Marsh y Scarbrough (1990/2002) llevaron a cabo un ex perimento en el marco de una encuesta sobre desempleo. Los respondientes se eligie ron en muestras aleatorias y de cuotas (edad y estatus de actividad) por los métodos con vencionales: 374 por cuotas y 284 aleatorios. En este estudio se concluyó que la discrecionalidad dada a los entrevistadores que siguen el muestreo por cuotas es la prin cipal fuente de sesgo de la muestra: • La muestra por cuotas se extrajo de una serie menos heterogénea de vecindarios que la muestra aleatoria: ocho tipos de vecindarios en la muestra aleatoria no apa recieron en la muestra por cuotas. El número promedio de entrevistas en cada ti po de vecindario fue mucho más alto en la muestra por cuotas que en la aleatoria. • Los entrevistadores de cuotas fueron selectivos en las zonas en las que trabajaron. Además, se esforzaron menos en conseguir que los seleccionados acabasen contestando a la encuesta. • El muestreo por cuotas está sesgado hacia personas que están con frecuencia en casa. Además, en apoyo a lo sostenido por Sudman (1976), el número de noches que los respondientes han estado fuera en la última semana no es una medida fia ble de accesibilidad. • Por último, el estudio confirmó la literatura previa, con respecto a la renta de los entrevistados: el muestreo por cuotas tiende a localizar a menos personas en los extremos de renta económica.
Para mejorar la calidad de los datos obtenidos habría, por tanto, que restringir el “criterio” del entrevistador en la selección de las unidades de la muestra. Por ejemplo, complementándolo con el muestreo de rutas aleatorias, en el que se fijasen itinerarios a seguir para contactar a los posibles entrevistados. Ha de limitarse, lo más posible, la arbitrariedad del entrevistador en la selección de las unidades muéstrales. Asimismo, habría que insistir en la importancia de las “revisitas” y que los entrevistadores se es fuercen en convencer a los contactados para que acaben respondiendo en la encues ta. Debe procurarse reducir, al máximo, el error de no respuesta, tanto por no contacto como por rechazo, por su gran incidencia en la calidad de los datos de encuesta, como se verá en el apartado 5.3. En el cuadro 3.9 se resumen las principales ventajas e inconvenientes del muestreo por cuotas. CUADRO 3.9. Ventajas e inconvenientes del muestreo por cuotas Ventajas
Inconvenientes
• Su ejecución resulta más económica, en tiempo y dinero, que la de muestreos pro babilísticos. • La selección de las unidades de la mues tra es sencilla y no precisa de un listado que incluya a las unidades de la población de estudio.
• Al no ser un muestreo probabilístico, no puede precisarse el error típico o muestral. • Carece de base probabilística para la in ferencia estadística y la libertad dada al entrevistador propicia la introducción de sesgos en la selección de las unidades de la muestra. • Límites en la representatividad de la muestra para las características no espe cificadas en los controles de cuotas. • Dificultad para el control del trabajo de campo de la encuesta.
3.4.8. La aplicación de otros métodos de muestreo no probabitísticos en la investigación mediante encuesta Aparte del muestreo por cuotas, existen otros métodos de muestreo no probabilísticos que pueden también aplicarse en la investigación mediante encuesta, aunque no con fines inferenciales. Porque no son probabilísticos, no interviene el azar en la se lección de las unidades de la muestra, y ni siquiera son “proporcionales” como el mues treo por cuotas. En este último se procura que la composición de la muestra manten ga la “proporcionalidad” habida en la población en variables que pueden ser “clave” en la investigación (variables de cuota). Por el contrario, los métodos de muestreo aquí
agrupados no persiguen esa proporcionalidad en la composición de la muestra respecto de la población de estudio, sino acceder a unidades concretas de la población que “pue den” o “quieren” dar información sobre el tema de estudio. La selección de la muestra se rige por criterios ajenos al azar: la tipicidad, la con veniencia o la pertinencia, la oportunidad y la disponibilidad o la accesibilidad. Las distintas modalidades cabe agruparlas en dos amplias categorías: los muestreos es tratégicos o de “juidio” y los circunstanciales. En este último se incluye el llamado muestreo bola de nieve, el de voluntarios y el ocasional. Veamos en qué difieren unos de otros. Muestreo estratégico o de “juicio” Llamado así porque el investigador sigue su propio “juicio” en la elección de las unidades de la población que compondrán la muestra. Su elección depende de la creencia de que pueden aportar información de “interés” o relevante para los ob jetivos de la encuesta. Han de ser informantes heterogéneos (que representen dis tintos puntos de vista sobre el problema de investigación) y “accesibles” (que quie ran hablar). Por ejemplo, en una encuesta a profesores universitarios se elige, deliberadamen te, a determinados profesores porque se piensa que son “representativos” de diferentes corrientes de pensamiento y pueden dar información “valiosa” para los objetivos de la investigación. Su éxito dependerá del grado en que los informantes elegidos ex profeso sean realmente “representativos” de la heterogeneidad de la población. Antes de su apli cación, conviene especificar las dimensiones de variabilidad en la población que se con sideran relevantes para los objetivos de la encuesta. En estudios de limitado presupuesto (como tesis doctorales u otras investigacio nes académicas de escasos recursos económicos), que quieran comprobar alguna teoría o profundizar en la medición de algunos conceptos teóricos, el recurso a este ti po de muestreo quizá sea el único factible. En muestras muy pequeñas, por ejemplo inferiores a 30 casos, el muestreo estratégico puede favorecer la consecución de in formación más relevante que la obtenida de una muestra del mismo tamaño extraída al azar de la población de estudio. Pero, siempre que se escoja a informantes que re presenten distintas vertientes del tema que se analice (que reflejen la opinión de aque llos a quienes se cree que representan) y que la finalidad del estudio no sea la re presentatividad “estadística”, sino de la “información”, la captación de la variedad opinática sobre el tema en cuestión. Como se verá en el apartado 3.5, en muestras aleatorias de muy pequeño tamaño, el error muestral se dispara, en su magnitud, limitando las posibilidades de inferencia, de generalización, de los resultados de la encuesta. También, la posibilidad de que la muestra logre representar a la heterogeneidad de la población. No así, cuando la muestra aumenta progresivamente de tamaño.
Muestreos circunstanciales Cuando es la “accesibilidad” el criterio fundamental en la selección de las unida des de la muestra. Por ejemplo, las encuestas realizadas a estudiantes universitarios que se ofrecen “voluntarios” a participar en un experimento. Pero, igualmente los sondeos realizados en un programa de televisión o de radio e, incluso, una encuesta por Inter net no cumplimentada por personas seleccionadas al azar, sino por aquellas que se ofre cen voluntariamente: deciden llamar al programa de televisión o de radio, para dar su opinión sobre el tema en cuestión, o deciden rellenar un cuestionario que está en la red, sin que se les haya solicitado a ellos de forma explícita. Estos sondeos pueden pro porcionar información de utilidad para conocer distintas opiniones sobre un tema con creto, pero no para medir su “representatividad” en el conjunto de la población de es tudio. Los “voluntarios” no suelen representar a toda la variedad de los integrantes de la población de interés. Más a unos segmentos específicos de la población que a otros. Lo mismo cabe decir de las encuestas autocumplimentadas por los huéspedes de un hotel, antes de dejar la habitación, para conocer su grado de satisfacción con la aten ción prestada. Como el cuestionario no suele ser rellenado por todos los huéspedes, en proporciones similares, sino más por aquellos que se sienten insatisfechos y quieren de jar constancia de su “queja”, la muestra no puede considerarse representativa de todos los huéspedes del hotel. No se puede, a partir de la información recabada, inferir el gra do de satisfacción con el servicio prestado. Excepto que el cuestionario hubiese sido cumplimentado por todos los huéspedes del hotel. Únicamente permite conocer mo tivos de queja, a efectos de mejorar la atención a los huéspedes. También incluye el muestreo de bola de nieve, de gran utilidad en encuestas a po blación marginal (como inmigrantes ilegales), no registrados en un marco fiable. En él, las unidades de la muestra van escogiéndose, de forma sucesiva, a partir de las refe rencias dadas por sujetos a los que ya se ha accedido. Su contactación se convierte en doblemente valiosa, porque contribuye a localizar a otras unidades de la población. Pa ra ello se les pregunta si conocen a otros en su misma situación. Como unos contri buyen a la localización de los otros y éstos, a su vez, a la de otros, la muestra va au mentando, de manera progresiva, como una “bola de nieve” hasta que el investigador decide cortar, generalmente cuando se llega a la “saturación teórica”. Es decir, cuan do la información comienza a ser redundante, no aportando ningún punto de vista ana lítico nuevo, por lo que se decide dar por concluida la recogida de información. A medida que se van viendo casos similares, una y otra vez, el investigador adquiere confianza empírica en que una categoría está saturada (Glaser y Strauss, 1967:61).
El cuadro 3.10 resume las ventajas y los inconvenientes de los muestreos no probabilísticos. Se insiste en su uso restringido en la investigación mediante encuesta, cuando no se persiga la representatividad “estadística”. Como, por ejemplo, en el pre test del cuestionario y en estudios en los cuales la carencia de recursos y de marcos
muéstrales “fiables” imposibilitan la práctica de alguno de los muestreos probabi lísimos.
CUADRO 3.10. Ventajas e inconvenientes de los muestreos no probabilísticos
Ventajas
Inconvenientes
• Simplicidad y economía del diseño mues tral. • Fáciles de ejecutar. • No precisan de un listado de la pobla ción de estudio.
• Imposibilidad de estimar el error típico o muestral. • Dificultad en la generalización de los re sultados de la investigación más allá de los casos analizados, por la introducción de sesgos en la elección de la muestra.
3.4.9. La especificidad de la encuesta telefónica En la encuesta telefónica la muestra puede extraerse de un directorio o listín tele fónico, siguiendo un procedimiento aleatorio, o mediante algún procedimiento de ge neración aleatoria de números de teléfono. Las distintas opciones se explican a con tinuación. La extracción “directa” aleatoria del listín telefónico Los números de teléfono se extraen de cada una de las guías o listines telefónicos que cubran la población de estudio (en los puntos de muestreo aleatoriamente selec cionados) de forma sistemática. Puede hacerse bien eligiendo al azar unas terminaciones numéricas concretas y extrayendo los números de teléfono que la incluyan, bien aplicando el método aleatorio sistemático, principalmente. Cualquiera de estos procedimientos posibilita la obtención de muestras probabilísticos. Sin embargo, se enfrentan al generalmente mayor error de no cobertura atribuido al uso de guías o listines telefónicos. Dependerá, como se dijo en el apartado 3.2, de la “co bertura” de la guía telefónica de la población de estudio. En qué medida abarque a la po blación de interés y a las diferencias entre los cubiertos y los no cubiertos por el marco muestral. Cuando se quieren estimar parámetros de la población en general, es cuando más error de no cobertura se detecta por las razones ya expuestas en el susodicho apartado. El marcado aleatorio de números de teléfono El método popularmente llamado RDD (Random-Digit-Dialing). Primero pro puesto por S. L. Cooper en 1964 (en “Random sampling by telephone: an improved
method”. Journal of Marketing Research, 1 (4): 45-48) y, con posterioridad, matizado por M. Mitofsky en 1970 (en “Sampling of telephone households”. B. S. News Memorand), hasta el punto de ser común su referencia como “método de MitofskyWaksberg”. Su finalidad principal es paliar parte del error de no cobertura del método anterior, dando, a todos los hogares con teléfono, la misma probabilidad de participar en la muestra, con independencia de que su número de teléfono esté registrado en la guía te lefónica. No obstante, su práctica muestra que este propósito básico no se satisface ple namente. Investigadores posteriores (Lavrakas, 1993; Couper y Hansen, 2002) mati zan que RDD en realidad no proporciona “igual” probabilidad de alcanzar a todos los hogares con teléfono en un área de muestreo. La razón dada es que algunos hogares tienen más de un número de teléfono, por lo que tienen una mayor probabilidad de ser seleccionados para integrar la muestra. Dependiendo del propósito de la encuesta ha brá, en consecuencia, que proceder a ajustes posmuestreo que corrijan la desigual pro babilidad de selección (es decir, ponderar la muestra), antes del análisis de los datos de encuesta. En RDD los números de teléfono no se extraen de guías o listines telefónicos, si no de la generación aleatoria de números, habitualmente mediante un algoritmo in tegrado en CATI. Los primeros dígitos corresponden al área que abarque la encues ta. Los cuatro o cinco últimos dígitos son los que se generan de manera aleatoria. Su aplicación supone: a) Delimitar el área geográfica de la población de estudio. En los puntos de mues treo seleccionados (siguiendo un muestreo estratificado o por conglomerados polietápico) habrá que concretar los números de teléfono a generar. b) Determinar el número de líneas por prefijo telefónico, para que los números de teléfono aleatorios se generen en la proporción en que cada prefijo existe dentro del área de muestreo. Para este propósito habrá que conocer el número de líneas de acceso telefónico residenciales operativas para cada prefijo en el área de muestreo. La muestra final estará, en consecuencia, estratificada por pre fijo telefónico. Para mejorar la eficacia del “pool” de muestreo RDD, Lavrakas (1993) re comienda tener, además, información referida a los rangos numéricos (de los nú meros de teléfono) que no operan o no incluyen líneas telefónicas de acceso a hogares. c) Aunque los números de teléfono, dentro de cada área, pueden generarse ma nualmente, mediante el uso de tablas de números aleatorios, lo común es hacerlo mediante un programa integrado en CATI. Es bastante más rápido y reduce la mediación del investigador y del entrevistador. Los cuatro últimos dígitos son los que se seleccionan de forma aleatoria. A cada zona le suelen corresponder 9.999 líneas telefónicas y los códigos de provincia (por ejemplo, 91 Madrid, 94 Bilbao, 952 Málaga, 983 Valladolid) y de zona, que pueden constar de tres (en provincias con prefijos telefónicos de dos
dígitos, como Madrid) o dos dígitos (en provincias con prefijos de tres dígitos, co mo Málaga), están ya delimitados en la estratificación de la muestra por áreas. Por ejemplo, habría que generar números de teléfono del 91-394-0000 al 91-394-0099, añadiendo, de forma aleatoria, cuatro dígitos a cada prefijo hasta completar la cantidad determinada, en el diseño de la muestra, en el estrato delimitado por el prefijo. En suma, son los últimos 9.999 dígitos los que se generan de forma aleatoria hasta cubrir las unidades de la muestra en la zona correspondiente (definidos por los códigos de provincia y de zona). Si un número aleatorio, en dicho conglomerado de nú meros de teléfono (o montones de 100 definidos por los códigos de área), corresponde a una vivienda residencial, el conglomerado se retiene en la muestra. En caso contrario, no. Al menos ha de haber un número de teléfono de un hogar que funcione. Después, se procede al marcado aleatorio del resto hasta cubrir el número de entrevistas fijadas para hacer en la zona, aunque no siempre llega a cubrirse. El inconveniente principal es el no saber adonde se llama. Precisa de varias llamadas de teléfono, a un mismo número, en diferentes días y momentos del día, para poder de terminar si el número de teléfono, generado al azar, es o no residencial. Sólo donde se pueden discriminar efectivamente los números particulares y otros de negocios es algo más práctica esta estrategia. En caso contrario (como sucede en Es paña, donde la asignación de números entre abonados particulares y abonados de ne gocios o comerciales no tiene códigos de discriminación), la productividad de este sis tema resulta altamente cuestionable (Wert, 2000: 209).
Esta crítica principal se suma a otras tres: a) Como se trata de un muestreo por etapas, en el que se selecciona un número de terminado de números de teléfono residenciales en cada grupo de 100 reteni dos para que la muestra sea autoponderada, habría -siguiendo la recomendación expresada por Brick y colaboradores (1995:219)- que “controlar la muestra ob tenida en cada conglomerado para asegurarse que un número específico de ho gares es entrevistado en cada conglomerado”. Puede darse que algunos con glomerados no reúnan el número suficiente de hogares para satisfacer este requisito. Sin duda, el disponer de información específica de las líneas por pre fijo de zonas en la muestra ayudará a obviar este inconveniente principal. b) Los números de teléfono que no corresponden a viviendas deben ser reempla zados. El reemplazamiento puede producirse en cualquier momento durante el período de recogida de datos, incluyendo el final del período de estudio. En ca so de que el reemplazamiento de los números de teléfono se efectúe al final del período de tiempo destinado al trabajo de campo, hay que tener presente que no se tendrá la misma oportunidad de ser llamados en distintos días de la se mana y momentos del día y su estatus residencial sería, en consecuencia, más di
fícil de establecer. Ello contribuye, de acuerdo con Tucker, Lepkowski y Pickarski (2002: 322), a complicar el cálculo de los porcentajes de respuesta por que “un pequeño residuo de números de estatus residencial sin resolver per manece al final del estudio”. c) Con la agrupación de la muestra en conglomerados de números de teléfono, ha brá un mayor error muestral, respecto al muestreo aleatorio simple y estratificado. Extracción aleatoria de números de teléfono asistido por directorios telefónicos (List Assisted Method) Una propuesta alternativa a RD D , que comienza a utilizarse a finales de los años ochenta y principios de los noventa del siglo xx, en especial por empresas de in vestigación de mercados. Pretende solventar la deficiencia más destacada en el método RDD: el “no saber adonde se llama”. Lo que se traduce en un gran número de lla madas improductivas a números de teléfono inactivos o no residenciales. Su apücación precisa de un marco de números de teléfono listados. Este puede con feccionarse de directorios de teléfono proporcionados por empresas comerciales o ela borados por el propio equipo investigador, a partir de estudios precedentes. Al ex traerse el número de teléfono de un listín telefónico se sabe “adonde se llama”. Los problemas de cobertura comúnmente atribuidos al uso de directorios telefó nicos, como marco muestral, se resuelven muestreando números de teléfono de mon tones de 100, que contengan, al menos, un número de teléfono listado en el directorio telefónico. Puede aplicarse un muestreo simple sistemático, estratificado (de acuerdo con la información proporcionada en el marco muestral), para mejorar la efectividad de la muestra, u otro método muestral que dé igual probabilidad de selección a las unidades de la población: los números de teléfono. Aquellos números de teléfono, en montones de 100, que no tengan ningún número de teléfono listado quedan, en consecuencia, ex cluidos de la muestra. En el estudio comparativo efectuado por Brick y colaboradores (1995), de este mé todo de selección muestral en relación con el de Mitofsky-Waksberg, se confirma que con el método asistido por directorios telefónicos se logra reducir la tasa de llamadas tele fónicas “improductivas”. El porcentaje de llamadas a números de teléfono que eran re sidenciales (hogares) superó al logrado con el método de Mitofsky-Waksberg. Además, se redujo el error de no cobertura. Sólo alrededor del 3 al 4% de todos los hogares re sidenciales quedaron excluidos de la muestra. Recuérdese que los hogares, incluidos en los montones de 100, en los que no existe algún número de teléfono registrado en el lis tín telefónico quedan excluidos para la selección de la muestra. Es decir, no se les da oportunidad para participar en la encuesta.
Otro procedimiento muy popular, practicado con anterioridad (Landon y Banks, 1977), es el que Wert (2000:209) llama Uplus one”. Consiste en añadir una unidad a ca da número de teléfono extraído del directorio. Con ello se busca que la muestra no so
lo incluya números de teléfono listados, sino también aquellos que no figuran expre sos. Es decir, la reducción del error de no cobertura común al uso de guías o de di rectorios telefónicos. También puede aplicarse otra variedad que consiste en añadir un número aleatorio al número de teléfono extraído del directorio telefónico. Ésta contribuye, igualmen te, a la inclusión de números de teléfono no listados en el directorio telefónico. En resumen, el uso de directorios o de guías telefónicas para la extracción de la mues tra (como marco de muestreo) permite saber “adonde se llama”, pero no siempre “cubre” a toda la población objeto de estudio. Su uso preferente dependerá de su “cobertura”, de la exhaustividad y actualización de dicho marco muestral. Lavrakas (1993:32) concreta que su uso como marco muestral no es recomendable cuando el porcentaje de hogares con te léfono no registrado en el directorio telefónico supere del 10 al 15%. En especial, cuan do se quieren estimaciones de parámetros para la población en general.
3.5. El error muestral, uno de los integrantes del error total de encuesta Cuando se diseña una muestra, el propósito fundamental es conseguir que la muestra extraída de la población de interés logre ser una representación, lo más ajustada posible, a la misma. Ello contribuye a la precisión de las estimaciones mués trales, a sus posibilidades de inferencia al conjunto de la población que es objeto de es tudio. Pero, por muy perfecta que sea la muestra, como únicamente se analiza una par te de la población (y esa muestra sólo representa una de todas las posibles muestras que pueden extraerse de una misma población), siempre habrá alguna divergencia entre los valores obtenidos en la muestra (las estimaciones muéstrales) y los valores corres pondientes en la población (los parámetros poblacionales). Esa disparidad se llama error muestral o error típico de muestreo. Ambos términos se utilizan indistintamen te en la literatura especializada. Por ellos se entiende el grado de inadecuación entre las estimaciones muéstrales y los correspondientes parámetros poblacionales. De los errores de encuesta (clasificados en el apartado 1.5), éste es el tradicional mente más medido. Se incluye dentro de los errores de no observación y su magnitud depende, principalmente, del tamaño de la muestra (no del tamaño de la población) y de su representatividad; es decir, si se ha dado a todos los integrantes de la población la misma probabilidad de ser seleccionados para constituir la muestra. Su valor sólo re fleja la variabilidad en las estimaciones debidas a diferencias entre muestras. Ha de evi tarse su interpretación errónea como una medida de resumen de todos los errores de estimación de una encuesta. Sólo representa uno de los componentes del error total de encuesta y, ni siquiera, refleja los otros errores de no observación (el error de no co bertura y de no respuesta). Como ya se dijo en el apartado 3.4, el error muestral sólo es estimable en muestras probabilísticas, aplicando la teoría de la probabilidad. En ellas el error típico mide la extensión en que las estimaciones muéstrales se distribuyen alrededor del parámetro poblacional. Concretamente, se especifica que, aproximadamente, el 68,3% de las es
timaciones muéstrales están comprendidas en el intervalo definido por ±1 vez el error típico del parámetro poblacional; el 95,5%, entre ±2 veces el error típico y, fi nalmente, el 99,7%, entre ±3 veces el error típico. O sea, el error típico o de muestreo se informa en términos de probabilidad. Mide la variabilidad en las estimaciones muéstrales, al haberse extraído información de una única muestra, de todas las posi bles, de las mismas características, que pueden extraerse de la población de estudio. De pende de la muestra seleccionada. Si ésta hubiese sido otra, las estimaciones de los pa rámetros poblacionales no hubiesen sido exactamente las mismas. Esas variaciones en las estimaciones es lo que expresa el error típico o de muestreo. En su cálculo inter vienen los siguientes elementos: el tamaño de la muestra, la varianza poblacional, el ni vel de confianza adoptado y el método de muestreo aplicado. El tamaño de la muestra No es la proporción de la población que constituye la muestra (la fracción de mues treo = n / N) lo que determina el error muestral (salvo cuando la fracción es elevada), sino el tamaño de la muestra. A medida que aumenta su tamaño, decrece el error mues tral (cualquiera que sea el valor de la varianza poblacional). Esta afirmación puede comprobarse en el cuadro 3.11. En él figuran los errores típicos correspondientes a de terminados tamaños muéstrales. Estos errores típicos disminuyen, conforme se in crementa el tamaño de la muestra, indistintamente de los valores presupuestos de P
CUADRO 3.11. Errores típicos para distintos tamaños muéstrales para un nivel de confianza, en la inferencia, del 95,5% Valores presupuestos de P y Q (%)
Número de unidades en la muestra
1/99
10/90
20/80
30/70
40/60
50/50
50 100 200 500 1.000 1.500 2.000 3.000 4.000 5.000 10.000 50.000
2,8 2,0 1,4 0,9 0,6 0,5 0,4 0,4 0,3 0,3 0,2 0,1
8,5 6,0 4,3 2,7 1,9 1,6 1,3 1,1 1,0 0,9 0,6 0,2
11,4 8,0 5,7 3,6 2,6 2,1 1,8 1,5 1,3 1,1 1,8 0,3
13,0 9,2 6,5 4,1 2,9 2,4 2,0 1,7 1,4 1,3 1,0 0,4
13,9 9,8 7,0 4,4 3,1 2,5 2,2 1,8 1,5 1,4 1,0 0,4
14,2 10,0 7,1 4,5 3,2 2,6 2,2 1,8 1,6 1,4 1,0 0,4
y Q. Incluso, véase que para reducir el error típico a la mitad, habría que cuadruplicar él tamaño de la muestra. Por ejemplo, una muestra compuesta de 500 unidades en la situación más desfa vorable (P = Q = 50) presenta un error típico de ± 4,5% (a un nivel de confianza del 95,5%). Para reducir dicho error a ±2,2%, habría que multiplicar el tamaño muestral por 4, obteniéndose una muestra de 2.000 unidades. Si el tamaño de la muestra se amplía de 1.000 a 4.000 unidades, el error también se reduce a la mitad (de ±3,2% a ±1,6%). Es to significa que, incrementando el tamaño de la muestra, tanto como lo permitan los re cursos (económicos, materiales, humanos) y los plazos temporales para la realización de la encuesta, podría reducirse el error muestral. Su reducción supondrá una mayor pre cisión de las estimaciones de los parámetros poblacionales a partir de la información ex traída de la muestra. La varianza poblacional La heterogeneidad de la población, respecto de la variable de estudio (aquella cu ya variabilidad se analiza), favorece el error muestral. Como ha podido constatarse en el cuadro 3.11, para un mismo tamaño muestral, conforme aumenta la varianza po blacional (heterogeneidad máxima cuando P = Q = 50), sube el error muestral, tanto más cuanto más heterogénea sea la población. Se debe a la mayor probabilidad de que en la muestra no estén representadas toda la variedad de unidades que componen la población. Su reducción exigirá incrementar el tamaño de la muestra para incluir a los distintos integrantes de la población. El nivel de confianza adoptado Como aumentar el nivel de confianza supone ampliar el tamaño de la muestra, ob viamente un mayor nivel de confianza conllevará la reducción del error muestral. Pe se a ello, hay que insistir en que, cuando se diseñe una muestra, se valoren conjunta mente distintos aspectos, buscando el equilibrio entre precisión y coste. Incrementos en el tamaño de la muestra conllevan una ampliación del nivel de con fianza en la estimación muestral (descendiendo el error). Pero esta mejora en precisión repercute en unos costes superiores de la investigación. Por esta razón, el nivel de con fianza más empleado es el ya referido de 95,5%. Expresa que hay un 95,5% de pro babilidad de que la estimación del parámetro poblacional esté comprendida en el in tervalo definido por dos veces el error típico. El método de muestreo aplicado El error muestral también se halla afectado por el procedimiento de selección de las unidades de la muestra. En general, el muestreo aleatorio estratificado es (de los di seños muéstrales probabilísticos) el que genera un menor error muestral. En cambio, él muestreo aleatorio por conglomerados es (de los probabilísticos) el que ocasiona un
mayor error de muestreo. Aunque la agrupación de la muestra en conglomerados pre senta la gran ventaja de reducir los costes (en tiempo y dinero) del trabajo de campo, a su vez repercute en una desventaja importante: incrementa el error típico de la mues tra, con la consiguiente disminución en precisión de las estimaciones de los paráme tros poblacionales. A estas afirmaciones genéricas cabe añadir -de acuerdo con Fowler (1988)- las pre cisiones siguientes: a) El muestreo aleatorio sistemático ocasiona errores de muestreo equivalentes a las muestras aleatorias simples, siempre y cuando no exista ninguna estratificación en la muestra. b) Las muestras aleatorias estratificadas presentan menores errores de muestreo que las muestras aleatorias simples del mismo tamaño. Pero, sólo si existe heteroge neidad entre los estratos. c) El muestreo aleatorio por conglomerados genera un mayor error típico, sobre to do cuanto mayor es el tamaño de los conglomerados en la última fase de muestreo. Resumiendo, el error muestral puede reducirse no sólo incrementando el tamaño de la muestra, sino también asegurando su representatividad. Para ello se precisa aplicar un procedimiento para la selección de las unidades de la muestra “aleatorio”, que dé a todas las unidades de la población (del marco muestral) la misma probabili dad de formar parte de la muestra. El muestreo aleatorio estratificado permite reducir el error muestral, porque se ajustan las probabilidades de selección en los distintos gru pos o estratos constituidos con los integrantes de la población. Pero, siempre y cuan do la estratificación se haya realizado de acuerdo a una variable clave en la investi gación (como se destacó en el subapartado 3.4.3). El cálculo del error muestral ha de hacerse en consonancia con el método de muestreo aplicado. Las fórmulas de uso más extendido para el cálculo del error típico o muestral son las correspondientes al muestreo aleatorio simple y sistemático, que se incluyen en el cuadro 3.12. En él se distingue entre error típico de la media de Y (o va riable cuya variabilidad se analiza) y de una proporción (P). A su vez se diferencia en tre universo finito e infinito (o de más de 100.000 unidades). El error típico de la estimación de la media ( Se- ) es, en consecuencia, una medida de dispersión de la distribución de muestreo de la media muestral. Se define como la raíz cuadrada de la varianza de la distribución de muestreo de la media muestral. Lo mismo es extensible a proporciones muéstrales. En este caso, las proporciones P y Q pueden expresarse tanto en términos porcentuales como en tantos por uno, obte niéndose los mismos resultados. Para poblaciones finitas (aquellas de 100.000 unidades o menos), se aplica el factor de corrección 1 -
. Normalmente se considera aceptable ignorar dicho factor de
corrección, cuando la fracción de muestreo (f = n / N) es menor de 0,1. Es decir, cuando menos del 10% de la población ha de ser muestreada. En poblaciones infini tas, la aplicación de este factor de corrección no es de utilidad, al ser la corrección prác ticamente 1. En ellas es el tamaño de la muestra, no el porcentaje de la población mues treada, lo que determina la precisión del estimador. Una muestra de 1.500 unidades tiene la misma precisión indistintamente de que la población esté formada por 100.000 unidades o por 1.000D00 e, inclusive, más.
CUADRO 3.12. Fórmulas del error típico para muestras aleatorias simples o sistemáticas
Error típico de la media
Error típico de una proporción
Población infinita
Población finita
(> 100.000 unidades)
(< 100.000 unidades)
" ñ - ñ
Se- - l*2x N - n « 'In N-1
c
PxQ n
¡PxQ N - n „ * N _1
El error típico de la estimación (Se), indistintamente de que sea de la media, de una proporción o de otro estadístico estimado en una muestra, permite el cálculo de los in tervalos de confianza. Estos constituyen la medida más popular de la precisión de las estimaciones muéstrales. Indican el intervalo de valores que comprende al parámetro poblacional a partir de la estimación muestral. Como en toda inferencia estadística, los intervalos de confianza se estiman para un nivel de confianza concreto. Si es 99,7%, el error se multiplicará por 3; si es 95,5%, por 2; y si fuese 95%, por 1,96. El intervalo de confianza es igual al valor estimado en la muestra menos (límite in ferior del intervalo) y más (límite superior del intervalo) el producto de Z por el error típico de estimación (Se). Es decir, Y ± (Z x S e ^ ) o P ± ( Z x Se(¡^). Cuanto mayor sea el error, menos precisa será la estimación del parámetro poblacional, al ser más am plio el intervalo de confianza. Toda estimación muestral es inferible a la población de la que procede la muestra, dentro de los límites marcados por el intervalo de confianza. Cuanto menor sea su amplitud, más se aproximará la estimación muestral al parámetro poblacional correspondiente. Los intervalos de confianza deberían informarse, junto con el estadístico muestral, para que el lector pueda apreciar la precisión de las esti maciones muéstrales. O, al menos, informarse de la magnitud exacta del error de es timación.
E je m p lo d e c á lc u lo del e r r o r típic o en m u e s t r a s ALEA TORIAS SIMPLES Y SISTEMÁTICAS A) En una encuesta por correo a 890 sociólogos de los 6.428 colegiados, se obtuvo que la edad media en la que consiguieron su primer puesto de trabajo fue los 27 años, con una desviación típica 2,8 años. Conociendo el error de la estimación, inferir el pa rámetro poblacional correspondiente a un nivel de confianza del 95,5%. La fracción de muestreo es 0,138 (f= n i N= 890 / 6.420 = 0,138). Razón por la cual se aplica el factor de corrección para población finita (N = 6.428), siendo la fór mula a aplicar: S 2 N - n / 2,82 6.428 - 890 00 y n x N -1 < 890 X 6.428-1 - ° ’087: A partir de este error muestral puede inferirse, con una probabilidad de acierto en la inferencia del 95,5%, que la edad media de inicio en la actividad laboral del conjunto de la población de sociólogos colegiados (el parámetro poblacional) será una edad comprendida entre 26,83 años y 27,17 años. Este intervalo de confianza resulta de restar y sumar a la edad media muestral (27 años) el producto del error (0,0871) por el valor Z correspondiente a un nivel de confianza del 95,5% (Z = 2): Y ± (Z x Se^) = 27 ± (2 x 0,0871). Al ser la amplitud del intervalo muy pequeña, el error es bajo y, por consiguiente, la precisión de la estimación muestral es muy elevada. B) En la misma encuesta se obtiene que el 43% de los sondeados dice estar satisfecho con la enseñanza que recibieron en la universidad. En este caso, el error muestral es de ±1,54%, habiendo una probabilidad del 95,5% de que el porcentaje de so ciólogos colegiados satisfechos con la enseñanza recibida sea un porcentaje com prendido entre 39,92% y 46,08%. El intervalo de confianza es ahora más amplio: P ± (Z x Se(/5)) = 43 ± (2 x 1,54). La estimación muestral es menos precisa, al haber mayor varianza poblacional. P xO N - n 43x57 6.428-890 „
V n * N - 1 "'V 890 X 6.428-1 ’ C) Si la encuesta se hubiese realizado a sociólogos españoles, independientemente de que estén o no colegiados, y se hubiese obtenido ese mismo porcentaje de satis fechos (43%), el error muestral para ese mismo tamaño de la muestra (890 unidades) habría sido mayor: ±1,659%. El intervalo de confianza, 43+ (2 x 1,659), va del 39,68 al 46,32%. Una amplitud muy ligeramente superior a la obtenida en el supuesto an terior. Prácticamente es similar. El error muestral se habría reducido, incrementan do el tamaño de la muestra.
En muestras aleatorias estratificadas proporcionales se introducen las siguientes mo dificaciones en el cálculo del error típico o muestral: 2 n¡ x S¡ /»!
Error típico de estimación de la media: Se¡-
xP¡ x Q • Error típico de estimación de una proporción: Se^Ppro^ = ^ M Donde P¡ = proporción de la muestra en el estrato i que posee el atributo en cues tión. 0 6 9 8
Donde: M = número de conglomerados en la población (780). m = número de conglomerados seleccionados en la muestra (20). S tf= varianza de los valores del conglomerado a favor de los nuevos planes de estudio (0,099). Como era de esperar, el error típico supera al alcanzado mediante la estratificación (0,0095) y, también, el muestreo aleatorio simple (0,0099).
En general, las estimaciones de los errores típicos para muestras aleatorias por con glomerados (en especial, en muestreos polietápicos, en los que difiere la unidad de muestreo primaria de la de observación) resultan bastante complejas. Si bien, en la ac tualidad existen varios programas estadísticos (SAS, Stata, Wesvar o Sudaan), que cal culan los errores típicos para cualquier variedad de diseño muestral. Estimaciones de error muestral, que deberían adecuarse al diseño de la muestra. Uno de los grandes errores cometidos por los investigadores que usan encuestas con siste en analizar una muestra por conglomerados como si fuese una muestra aleatoria sim ple. Por lo general, una confusión como ésta hace que los investigadores informen de erro res estándar mucho menores que lo debido; esto da la impresión de que los resultados de la encuesta son mucho más precisos de lo que realmente son (Lohr, 2000:132).
Asimismo, ha de insistirse en que el error de muestreo es sólo uno de los integrantes del error total de encuesta. Cada estimación de encuesta tendrá su correspondiente error de la media cuadrática (MSE: Mean Square Error). Por él se entiende: “la diferencia cuadrada promedio entre las estimaciones producidas por muchas repeticiones hipo téticas del proceso de encuesta y el valor del parámetro en la población” (Biemer y Ly berg, 2003: 53). En general, se define como la suma de todos los errores variables y to dos los sesgos al cuadrado. En concreto,
M SE - varianza + sesgos2 Por varianza se entiende la diferencia cuadrada promedio entre las estimaciones de encuesta, desde las replicaciones, y el valor promedio de las replicaciones. Indica errores variables (cuando los errores negativos en las observaciones tienden a cance lar a los positivos), qug con frecuencia se asume que son aleatorios. Sus valores difieren entre encuestados, entrevistadores, preguntas del cuestionario, codificadores y demás intervinientes en el proceso de encuesta. Los errores de muestreo, medición y de tra tamiento de la información están más expuestos a error variable. En cambio, los sesgos indican errores sistemáticos, que afectan a cualquier mues tra en un diseño de encuesta específico, con el mismo error constante. Quiere esto de cir, que influyen en todas las aplicaciones de un mismo diseño de encuesta. “Todas las posibles encuestas que utilizan el mismo diseño podrían sobreestimar los años medios de educación por persona en la población” (Groves, 1989: 8), por ejemplo. En ese sen tido, es un error “constante”, no aleatorio. Los errores negativos en las observaciones no serían contrarrestados por los positivos, porque unos son más prevalentes que los otros. De modo que, cuando las observaciones de la muestra se promedian, la suma de estos errores no es cero, a diferencia de los errores variables. En su resolución habría que modificar el diseño total de la encuesta. No sólo introducir cambios en algunos de sus actores (entrevistadores, codificadores, encuestados), ni incrementando el tama ño de la muestra, como sucede con los errores variables. Los intervalos de confianza que se elaboran en datos de encuesta (utilizando va rianza muestral sólo) no reflejan algunos de los sesgos de cobertura, no respuesta, medición o muestreo, que pueden plagar la encuesta (Groves, 1989:13).
En los próximos capítulos se concretarán los efectos de los otros errores de encuesta, ajenos al error de muestreo y de no cobertura aquí tratados. Cualquier actuación para la mejora de la encuesta irá encaminada -en consonancia con lo aquí dicho- a la re ducción preferente de los errores sistemáticos, por sus efectos más perjudiciales en la calidad de la encuesta en su conjunto. Además, téngase presente que los otros errores ajenos al de muestreo pueden llegar a contribuir más al error total de la encuesta que el error de muestreo (el más medido en la investigación mediante encuesta), como se verá en los capítulos que siguen.
LECTURAS COMPLEMENTARIAS Azorín, E y Sánchez Crespo, J. L. (1986): Métodos y aplicaciones del muestreo. Alian za. Madrid. Clairin, R. y Brion, P. (2001): Manual de muestreo. Hespérides. Madrid. De Vaus, D. (comp.) (2002): Social surveys. Sage. Londres.
Henry, G. T. (1990): Practical samplig. Sage. Newbury Park. Kish, L. (1965/1995): Survey samplig. John Wiley and Sons. Nueva York. Levy, P. S. y Lemeshow, P. S. (1991): Sampling o f populations: methods and applications. Wiley. Nueva York. Lohr, S. L. (2000): Muestreo: diseño y análisis. International Thomson Editores. México. Rodríguez Osuna, J. (1991): Métodos de muestreo. Centro de Investigaciones Sociológicas. Colección Cuaderno Metodológico, n.° 1. Madrid. Rodríguez Osuna, J. (1993): Métodos de muestreo. Casos prácticos. Centro de Inves tigaciones Sociológicas. Colección Cuaderno Metodológico, n.° 6. Madrid. Singh, S. (2003): Advanced sampling theory with applications. How Michael selected Am y. Kluwer Academic Publishers. Dordrecht, The Netherlands.
EJERCICIOS PROPUESTOS 1. Quiere conocerse la adaptación de los estudiantes extranjeros al sistema edu cativo español. Defina la población de estudio y concrete el marco muestral que utilizaría para el diseño de la muestra y su repercusión en los errores de en cuesta. ¿Habría variaciones dependiendo del método de encuesta que se elija? Justifique la respuesta. 2. En los informes FOESSA, en los informes sociológicos financiados por la Universidad Complutense, o en los publicados por el Instituto de la Juventud, se adjunta el detalle del diseño muestral de la encuesta que en ellos se analiza. Escoja uno o varios de éstos u otros informes y describa el diseño de la mues tra. Acompañe su descripción de reflexiones sobre posibles repercusiones de las decisiones adoptadas en los errores de encuesta. Proponga un diseño muestral alternativo. 3. Diseñe la muestra para una encuesta a estudiantes universitarios, con objeto de conocer su valoración de la enseñanza universitaria. Plantee diseños muéstra les alternativos en función del método de encuesta elegido y de la población de estudio. Justifique los distintos pasos hasta la selección de las unidades últimas de observación, junto con las posibles consecuencias de determinadas actua ciones en los errores de no cobertura y de muestreo. 4. Se quiere conocer la proporción de alumnos a favor de la reforma de los planes de estudio en una universidad que cuenta con 86.724 alumnos matriculados. Calcule: a) El tamaño muestral para un error máximo de ±3,5%. b) Afije la muestra, de varias formas posibles, atendiendo al ciclo donde se en cuentran cursando estudios. Describa los distintos procedimientos de afijación.
Ciclo universitario Primero Segundo Tercero
N. ° alumnos
Desviación típica
41.458 34.120 11.146
2,06 5,14 4,32
c) ¿Qué es ponderar? Pondere la muestra para la afijación simple. d) Si la muestra hubiese estado integrada por 978 alumnos, calcule el error muestral partiendo de que el 47% de los alumnos están a favor de la nueva ley universitaria. 5. Se desea conocer la situación laboral de la población residente en un municipio. La encuesta se hará a personas ocupadas de 16 y más años. Tomando los datos del último Censo de Población Activa se obtiene la siguiente clasificación:
Población activa ocupada Profesión Total
Varones
Mujeres
Profesionales y técnicos Personal directivo Empleados administrativos Comerciantes y vendedores Personal de servicios Agricultores Obreros
117.430 17.131 102.507 76.039 81.409 17.377 292.238
60.942 15.252 49.721 41.743 34.364 14.236 270.952
56.488 1.879 52.786 34.296 47.045 3.141 21.286
Total
704.131
487.210
216.921
a) b) c) d)
Determinar el tamaño muestral para un error máximo de ±2,5%. Distribuir la muestra proporcionalmente. Ponderar la muestra para la afijación simple. Ponderar la muestra si se hubiesen hecho 400 entrevistas a profesionales y técnicos. e) Calcular el error para las siguientes estimaciones de insatisfechos con su si tuación laboral: 39,4% profesionales y técnicos, 28,3% personal directivo, 73,8% empleados administrativos, 54,1% comerciantes y vendedores, 59,6% personal de servicios, 48,2% agricultores y 52,1% obreros.
4 EL DISEÑO DEL CUESTIONARIO
Un componente clave en cualquier proceso de medición es el instrumento que se uti lice para la recogida de información. En la encuesta es el cuestionario. Aunque éste también se aplica en otras estrategias de investigación, como en la experimentación o en el uso de fuentes documentales y estadísticas. En este último caso, para el vaciado de la información incluida en informes o expedientes. La fase correspondiente al diseño del cuestionario es trascendental en la planifi cación de una encuesta. Del acierto de su diseño depende la calidad de los datos que de ella se extraigan. En el apartado 1.5 se destacó al cuestionario como una de las fuen tes potenciales de errores de medición en la encuesta, junto con la actuación de los agentes que en ella intervienen: el encuestado (su voluntad o incapacidad para pro porcionar una información veraz) y el entrevistador (cuando la encuesta se realiza me diante entrevista). Además de los errores propiciados por el tratamiento que se haga de la información recabada mediante el cuestionario. El presente capítulo trata del cuestionario, de su influencia en los distintos errores de medición y de cómo éstos pueden reducirse con una mejora en su diseño, de la tra ducción de los conceptos teóricos clave en preguntas concretas en un cuestionario, de cómo proceder para su correcta formulación y disposición en el cuestionario. Como afirma Lohr (2000: 9), “la obtención de respuestas precisas es un reto en todo tipo de encuestas. En especial, las realizadas a personas”. Porque las personas no siempre di cen la verdad; no siempre comprenden las preguntas que se les hacen; pueden tener problemas de memoria y no acordarse acerca de lo que se les pregunta; y pueden dar respuestas distintas según cómo, cuándo y dónde se les interrogue. De la influencia del método de encuesta empleado ya se habló en el capítulo 2. Ahora se quiere indagar en los efectos atribuidos al cuestionario y cómo éste puede debilitar la presencia de los de más errores de medición.
4.1. De los conceptos teóricos a los indicadores empíricos: el error de especificación Antes de proceder a la redacción de las preguntas del cuestionario, una tarea prio ritaria para eliminar posibles errores de especificación es decidir qué conceptos son cla ve en la medición del problema de investigación y cómo van a operacionalizarse. Los errores de especificación se dan cuando el concepto implicado en la pregunta del cuestionario y aquel que debería medirse en la encuesta difieren. Disonancia que re sulta en estimaciones erróneas de los datos de encuesta. Ésta no consigue una adecuada medición del objeto de estudio. El “objeto de interés” es, de acuerdo con Becker (1998:122), el comienzo de la conceptualización. Ver en lo que se está interesado y sobre lo que no se quiere saber. Pe ro, ¿qué se entiende por conceptol Los conceptos pueden definirse como “símbolos lingüísticos que categorizan a los fenómenos” (Phillips, 1985: 77). Pueden derivarse de reflexiones teóricas, de gene ralizaciones empíricas (a partir de resultados de investigaciones) o de reflexiones propias sobre la variedad de experiencias de la vida social. Sea como fuere, se carac terizan por representar constructos abstractos, no directamente observables, como son, por ejemplo, los conceptos de anomia, cohesión social, amistad, discriminación o xe nofobia. Para Kaplan (1964: 49) el concepto es “una familia de ideas”. Son constructos. El concepto de compasión, por ejemplo, es un constructo creado a partir de la idea de com pasión, que comparten quienes han utilizado dicho término. No se puede observar ni directa ni indirectamente porque no existe. Nosotros lo construimos. Otros autores (Kerlinger, 1986; Hox, 1997) prefieren distinguir el concepto del cons tructo, como “abstracciones teóricas”. El concepto es una abstracción formada por la generalización de fenómenos similares. Incluso cuando su nombre es una palabra co múnmente utilizada (como pueden ser los términos clase social, desempleo, satisfac ción) se adaptan o crean por los investigadores en consonancia con sus objetivos de in vestigación. En cambio, el constructo es un concepto sistemáticamente definido, más formal, para su uso en la teoría científica. Por ejemplo, delincuencia es un concepto que expresa la tendencia de las personas a mostrar conductas que se clasifican como “delictivas”. Puede definirse haciéndose re ferencia a las conductas que cada sociedad cataloga de “delictivas”. Por el contrario, la desviación sería (en consonancia con estos autores) un constructo. Aunque se refiere a la tendencia de las personas a mostrar conductas que se clasifican como “desviadas”, só lo puede definirse en el marco de alguna teoría que delimite qué conductas son “des viadas”. En consecuencia, los conceptos cumplen una función fundamental de “síntesis”, de denominación común, que englobe a una serie de observaciones, proporcionándolas un sentido.
El concepto de tristeza, por ejemplo, ofrece una denominación común a una serie de manifestaciones diferentes: llanto, desánimo, bajo tono de voz, negativa a hablar, a comer, problemas de sueño. Difieren por su mayor o menor grado de abstracción. El concepto de poder connota un grado de abstracción superior al de los conceptos de edu cación o empleo.
Tanto los conceptos como los constructos han de vincularse a variables empíricas u observacionales mediante una definición operacional. En ella se indica cómo pien sa medirse el concepto, las variables con las que están vinculados y qué valores se diferenciarán en la misma. Este proceso de traducción de constructos teóricos a va riables observables que le representen adecuadamente se define como operacionalización. Por el contrario, la conceptualización “implica la formación de conceptos, que establece el significado de un constructo, elaborando la red nomológica y definiendo importantes subdominios de su significado” (Hox, 1998: 53). En la concepción del operacionismo han sido claves la aportación pionera de G. A. Lundberg, de 1939 (Foundations of Sociology. Macmillan. Nueva York), a partir de las propuestas de P. W. Bridgman en el campo de la física (expresas en su obra The logic ofmodern physics, editada igualmente por Macmillan, en 1927). Para Lundberg la de finición operacional es el constructo, no un proceso para observar un constructo des pués de que se ha definido. Supone que cualquier cambio en la definición operacional implica un nuevo constructo teórico. Por ejemplo, “si medimos el calor con un termómetro de mercurio y con un ter mómetro de alcohol, se están midiendo cosas diferentes. De manera similar, si cam biamos una palabra en nuestra pregunta, estamos midiendo un constructo diferente” (Hox, 1998: 50). Igualmente ha sido clave la aportación de Paul E Lazarsfeld, en su artículo pionero “Evidence and inference in social research”, de 1958 (Daedalus, 87: 99-130) y en publicaciones posteriores (1971,1972 y 1973). En ellas propone el procedimiento a se guir para pasar de la conceptualización a la operacionalización de conceptos teóricos. Cuatro son las fases esenciales: 1. Representación teórica del concepto, de forma que queden reflejados sus rasgos definitorios. 2. Especificación del concepto, descomponiéndolo en las distintas dimensiones o aspectos relevantes que engloba. 3. Para cada una de las dimensiones se selecciona una serie de indicadores (o va riables empíricas), que “indiquen” la extensión que alcanza la dimensión en los casos analizados. 4. Síntesis de los indicadores mediante el cálculo de índices. A cada indicador se le asigna un peso o valor, de acuerdo con su importancia. A partir de estos valo res se confecciona un índice. Es decir, una medida común que agrupe a varios indicadores de una misma dimensión operacionalizada numéricamente.
Fiske (1971) describe un procedimiento análogo al de Lazarsfeld. Parte, asimismo, de la representación teórica del concepto. De la necesidad de identificar su contexto teó rico, a partir del marco teórico de la investigación. Si bien, insiste en que: a) El núcleo teórico es la esencia del concepto. Ha de cubrir todos los fenómenos a los que se refiere. Exige: • Establecer explícitamente lo que el concepto incluye y excluye. Además, las diferencias con otros conceptos relacionados. • Describir su polo opuesto. Por ejemplo, si quiere medirse el concepto de sa tisfacción lo opuesto sería definir insatisfacción. Asimismo, en la medición de pobreza, describir su opuesto: riqueza. b) En las fases iniciales de la investigación, se puede partir de constructos más ge nerales. Después, pueden especificarse subconstructos (equivalentes a las subdimensiones de Lazarsfeld) para alcanzar una mayor precisión. Con posterioridad, Hox (1997) insiste en la necesidad de: a) Clarificar la definición constitutiva del constructo, asemejándose al análisis del significado de núcleo de Fiske (1971). La definición constitutiva del cons tructo ha de ser: • Adecuada: contener suficientes características que permitan una delineación
satisfactoria de los límites empíricos y referentes del constructo: la definición denotativa. • Parsimoniosa: no incluir ninguna característica innecesaria. A tal fin, Sartori (1984) propone recoger características de definiciones con no tativas existentes (de un diccionario, de investigaciones previas). A partir de ellas, abstraer un núcleo común. Este autor distingue dos formas diferentes en que puede definirse un constructo: • Las asociaciones que tienen en mente sus usuarios o la lista de característi cas incluidas en el constructo: definición constitutiva. • La denotación semántica del constructo, por ejemplo, listando la serie de ob jetos a los que se refiere: definición operacional. Hox (1997) advierte de la posibilidad de que aparezcan varias definiciones constitutivas diferentes. Razón por la cual es importante comprobar la ocu rrencia de homónimos y sinónimos. Ha de evitarse la ambigüedad, que no que de claro el significado del constructo, porque éste tenga más de un significado. En este caso, habría que seccionarlo, de acuerdo con sus distintos significados. O porque exista más de un constructo para un mismo significado.
b) Determinar los referentes empíricos que pertenecen al constructo y cuáles no. Pa ra evitar deficiencias en la definición constitutiva del constructo, que no esté de finido con suficiente precisión. Hay que restringir su significado, incrementando el número de sus características definitorias. c) Asegurarse de que la etiqueta verbal dada al constructo sea comprendida ine quívocamente. Los términos abstractos con frecuencia tienen pocas caracte rísticas distintivas y se refieren a un gran conjunto de referentes empíricos. Pa ra evaluar la terminología empleada, Hox (1997: 57) propone el test de la sustitución. Significa que “si en una definición constitutiva una palabra puede ser sustituida por otra palabra con una ganancia en claridad o precisión, en tonces la primera palabra está siendo mal usada”. Por su parte, Sartori (1984) insiste en la necesidad de que los términos cla ve del concepto sean entendidos unívocamente, no ambiguamente. Ello exige que, al seleccionar los términos que designen al concepto, se relacione y controle con el campo semántico al que pertenece el término. Quiere decir, la serie de palabras vecinas asociadas. Puede decirse que tenemos un concepto de A (o de no A) cuando somos capaces de distinguir A de cualquier cosa que no sea A (Sartori, 1984:74).
Con estas tres propuestas Hox (1997) quiere evitar tres problemas que pueden dar se en un constructo teórico: a) Problemas de connotación. Confusión de significados porque el constructo está asociado a más de un significado, o porque dos constructos apuntan el mis mo significado y los investigadores no han hecho explícito lo que pretenden. b) Problemas de denotación. Constructos “vagos”. No queda claro a qué objetos o referentes se aplica. c) Problemas terminológicos. Haber elegido, para el constructo, una etiqueta que induce a características o referentes erróneos. Y admite que “el análisis semántico no lleva directamente a preguntas de encuesta. Sin embargo, ayuda a desintegrar significados diferentes y a reconocer la ambigüedad en nuevos constructos” (Hox, 1997: 58). A la conceptualización puede llegarse desde la teoría, mediante un proceso de ductivo (de la teoría a los datos, de lo general a lo concreto), a través del cual se extraen los constructos y se seleccionan las variables observables. Pero también puede llegarse desde los datos empíricos, mediante la operación metodológica de la inducción (de lo concreto a los principios generales, de los datos a la teoría). La teoría puede concebirse como “un grupo de proposiciones lógicamente interconectadas, de las que pueden deducirse uniformidades empíricas” (Merton, 1983: 56). Aparte de proposiciones (que indican cómo y en qué condiciones generales se cree que están relacionados los fenómenos definidos conceptualmente), las teorías están inte gradas por conceptos y por axiomas o leyes.
Los conceptos constituyen “categorías para la organización de ideas y observa ciones” (Bulmer, 1992: 43). “Sirven para clasificar y medir operativamente los fenó menos que se observan (Blalock y Blalock, 1968: 7). Los axiomas o leyes permiten ex plicar las regularidades o conexiones existentes en los fenómenos sociales.
E jem plo d e d ed u c c ió n d e h ip ó t e sis y definición CONCEPUAL A PARTIR DE AXIOMAS
Una de las teorías que mayor apoyo empírico ha recibido en la explicación de la delin cuencia juvenil es la Teoría del Control Social de Hirschi (1969). Esta teoría se fundamenta en los siguientes axiomas (o aseveraciones) esenciales: a) Los controles sociales son los que mantienen al joven en la conformidad. b) La interiorización de la norma constituye el determinante de la conducta delictiva. c) Los lazos o frenos que mantienen al individuo en la conformidad son: • • • •
Afecto a personas convencionales (padres, profesores, amigos). Compromiso con líneas convencionales de acción. Implicación en actividades convencionales. Creencia en la legitimidad. Es de la creencia en la legitimidad de la norma de lo que depende, en último término, la “autorrepresión” del individuo y su no implicación en la conducta delictiva.
De estos comienzos axiológicos pueden deducirse proposiciones de las que derivan hi pótesis como las siguientes: • Cuanto mayor respeto y admiración sienta el joven hacía las personas con las que se identifica, menor es la probabilidad de que se emprenda en conductas delictivas. • Cuando el joven se libera de las ataduras que le vinculan a la sociedad convencional (familia, escuela, comunidad) está más predispuesto a transgredir la norma legal. • Cuanto más ocupado esté el joven en la realización de actividades convencionales, me nor tiempo encontrará para cometer actos delictivos. • La ausencia de creencias que prohíban la realización de conductas delictivas llevan al joven desvinculado a la delincuencia. Las hipótesis contienen conceptos que precisan medirse para su comprobación empírica, proceso que se conoce como operacionalización de conceptos teóricos en indicadores empíricos. De las hipótesis anteriores podrían operacionalizarse los conceptos: • Delincuencia juvenil: todo tipo de conducta contranormativa (que infringe la norma le gal establecida) llevada a cabo por las personas menores de 18 años.
• Falta de control paterno: grado al que el joven percibe que sus padres le rechazan o no apoyan. Por medio de un proceso deductivo, los conceptos y las proposiciones que con forman una teoría se concretan en variables empíricas o indicadores, que posibiliten la contrastación empírica de la teoría. A este proceso se le conoce como operacionali zación de conceptos teóricos. Supone: a) La delimitación de los conceptos mediante definiciones nominales o teóricas, al igual que operativas (u operacionales). • La definición nominal o teórica es la que se asigna a un concepto, a modo de lo indicado anteriormente, para definirlo y perfilarlo, pero que carece de las precisiones necesarias para medir los fenómenos a los que el concepto hace referencia. • La definición operacional comprende el significado concreto que se da al con cepto, especificando cómo se medirá su ocurrencia en una situación deter minada. Detalla el contenido del concepto a medir, vinculando los constructos definidos teóricamente con los procedimientos operacionales. b) La descomposición del concepto en las diferentes dimensiones o aspectos que in cluye. Éstos los determina el investigador en función de sus objetivos de in vestigación. Es preferible, a efectos operativos, acotar el número de dimensiones a aquellas que sean más relevantes en la medición del concepto que abarcar in discriminadamente toda dimensión que se le ocurra. La elección de dimensio nes ha de estar justificada en relación con el problema de investigación.
E y
je m p lo d e d e fin ic ió n d e u n c o n c epto te ó r ic o
su d e s c o m p o s ic ió n e n d im e n s io n e s
Retomando el concepto de delincuencia, a continuación va a ilustrarse cómo la opera cionalización de un concepto teórico no siempre cubre la variedad de dimensiones que re presenta. Siempre se tratará de una aproximación susceptible a ser rebatida. En el Diccionario de Uso del Español de María Moliner (Editorial Gredos), la delin cuencia se define como “cualidad de delincuente”: “fenómeno de cometerse delitos”. En tendiéndose por delito, “acción penada por las leyes por realizarse en perjuicio de alguien o por ser contrario a lo establecidójpor aquéllos”. Éstas son definiciones teóricas, que precisan de una mayor concreción a eféctos operativos.
Se revisan teorías explicativas de la delincuencia, en busca de aclaración. Lo primero que se aprecia es la distinta conceptualización de la delincuencia, dependiendo del foco de interés en su análisis: qué motiva la transgresión de la norma legal (definición normativa) o qué ha ce de la transgresión un delito (definición reactiva). Definición normativa Primero, la delincuencia se define como transgresión o conducta que infringe la norma legal establecida en una sociedad determinada. Ésta es una definición normativa de la conducta delictiva, presente en el paradigma que podría llamarse de socialización y control. Agrupa aquellas perspectivas teóricas, que partiendo de la aportación de Durkheim y Merton (Teoría de la Anomia), coinciden en una misma concepción de la delincuencia como trans gresión de la norma legal, debida a la existencia de defectuosos procesos de socialización y de control, que no logran mantener al individuo en la conformidad. • A la delincuencia se recurre en busca de remedio a la tensión que se padece ante el fracaso en el logro de las metas valoradas culturalmente: “metas culturales” (Merton) o “aspiraciones ilimitadas” (Durkheim). Favorecida por la carencia de unas normas efec tivas de control social que “controlen” a aquellos que comienzan a descomprometer se, moralmente, con las normas existentes (Teoría de la Anomia de Durkheim y de Merton, Teoría de la Oportunidad Diferencial de Cloward y Ohlin, Teoría de la Neu tralidad de Sykes y Matza, Teoría del Control Social de Hirschi). La pérdida de integración del orden colectivo, la desigualdad económica, la pre sión hacia el éxito (elevadas aspiraciones contrapuesto a limitadas oportunidades), la pérdida de vínculos con la sociedad convencional (familia, escuela, comunidad) y la no interiorización de la norma legal (fracaso del proceso de socialización) se sitúan co mo desencadenantes de la delincuencia. • La delincuencia se debe a un proceso de socialización diferencial, en la que se con sigue la interiorización de una serie de normas y de valores contrarios a la legalidad (Teoría de la Subcultura de Cohén; Teoría de la Transmisión Cultural de Shaw y McKay y Teoría de la Asociación Diferencial de Sutherland). Se insiste en la influencia del entorno social inmediato (tener amigos, familiares de lincuentes), junto con el compromiso con las expectativas que éstos tengan sobre ellos. Definición reactiva Es la reacción social la que define la conducta como “delictiva”, no la transgresión de la norma. Para el paradigma interaccionista (Teoría del Etiquetamiento), la delincuencia se ge nera por la reacción social, a través de la creación, aplicación y fijación de la norma legal a determinadas conductas e individuos. El énfasis se pone en aquellas circunstancias socioestructurales que precipitan la reacción social. También, en el “rol” de delincuente, como re sultado de la nueva identidad y expectativas que los “otros” tengan hacia él. Además de en la acción marginante de la sociedad. Gibbons y Jones (1971) proponen una definición de la delincuencia que pretende abar car una mayor dimensionalidad del concepto:
• • • •
Supuestamente viola normas generales, desde el punto de vista cultural. Origina fuertes reacciones sociales. Se manifiesta en actividades de control social, en manos de policías y similares. A menudo lleva a la desviación secundaria (al rol de delincuente).
Ante esta distinta concepción de la delincuencia, en función de los objetivos de investi gación, el investigador procederá a la acotación de las dimensiones de los conceptos im plicados en su análisis. Como ilustración, a continuación se seleccionan algunos de los más presentes en investigaciones empíricas, en la explicación de la delincuencia juvenil, aunque relacionados con la comisión de cualquier conducta contranormativa. De la hipótesis siguiente: “cuanto menos vinculado esté el joven en la sociedad con vencional (familia, escuela, comunidad), más predispuesto estará a transgredir la norma le gal”, se deriva el siguiente desglose del concepto de “vinculación social”, en tres dimensio nes básicas: familiar, escolar, comunitaria (amigos, vecindad). Familia a) Características familiares:
• Si vive o no con ambos padres. En caso contrario: motivo de la “ruptura familiar”; edad que tenía cuando se produjo; cómo le afectó. • Número de hermanos, lugar que ocupa (orden de nacimiento). • Estatus familiar: nivel de ingresos, de estudios y ocupación de los padres y her manos. b) Afecto hacia padres y hermanos1: • Tipo de relación que mantiene con los padres y hermanos: de cariño, cordialidad, indiferencia. Grado de comunicación entre ellos. • Tiempo que pasa con ellos y tiempo que desearía pasar. • Identificación con los padres y hermanos. • Interés de los padres y hermanos con las actividades que realizan; con sus pro blemas e inquietudes. • Compartir actividades con los padres y hermanos. • Valores familiares: cumplimiento de las normas. Sanciones que suelen aplicarse cuando no se cumplen (castigos físicos, materiales, psíquicos). • Deseos de satisfacer expectativas familiares. • Discusiones familiares: frecuencia, intensidad, relevancia del tema. Escuela a) Actuación escolar: • Último curso académico realizado. Calificaciones obtenidas. • Si ha repetido o no algún curso académico.
b) Actitud hacia la escuela: • Motivación al éxito escolar. Interés y afecto hacia la escuela. Si le gusta ir al colegio. Número de horas que dedica al estudio. • Participación (voluntaria) en actividades escolares. • Aceptación de la autoridad escolar. Si les preocupa la opinión que de él/ella tengan sus profesores y compañeros. • Percepción de sí mismos como estudiantes: autoestimai2. • Aspiraciones educativas y ocupacionales (compromiso con modelos de trabajo con vencionales). Comunidad a) Amigos:
• • • •
Número de amigos. Tipo de relación que mantienen con ellos. Si cometen o no alguna clase de conducta contranormativa. Grado de identificación con los amigos. Tiempo que pasa con ellos.
b) Vecindad: • Relaciones de vecindad.------------ ------------------------------------------------------------• Características de la vivienda donde reside: condiciones de habitabilidad, haci namiento, tenencia en propiedad, en alquiler, período de tiempo en última resi dencia. • Características del barrio: densidad de la población, movilidad residencial, hete rogeneidad3, ubicación en la ciudad, porcentaje de viviendas en propiedad y en al quiler, servicios comunitarios (escuelas, mercados, red sanitaria, equipamientos de portivos y de ocio, espacios verdes, espacios controlados: patios privados, jardines), vigilancia en las calles, iluminación, tasa de delincuencia en la zona. • Tiempo que pasa en la calle. Atendiendo a los objetivos del estudio, el investigador puede utilizar estas variables en la medición de la actitud diferencial ante la comisión de un acto considerado “delictivo” (de 1 De acuerdo con la Teoría de Control Social de Hirschi (1969: 90), la supervisión paterna es un factor cla ve de la conducta delictiva. “Es menos probable que el chico cometa actos delictivos no porque sus padres res trinjan sus actividades, sino porque comparten sus actividades con ellos. No porque sus padres sepan en rea lidad en dónde están, sino porque les perciben enterados de su localización. 2 Hirchl (1969:113) destaca la importancia de la variable autoestima en el proceso causal de la delin cuencia: “cuanto más competente crea el individuo que él es, menos probable será que cometa actos delic tivos”. 3 Estas tres características del barrio fueron destacadas por la Teoría de la Transmisión Cultural de Shaw y McKay (1969), como características de las áreas de delincuencia.
transgresión de la norma legal), por las instancias de control social (policías, tribunales). Aparte de analizarse la seriedad y la gravedad de la infracción, junto con el número de di ligencias policiales previas a la actuación judicial, por ejemplo. De esta forma se daría un carácter más amplio al análisis de la delincuencia. Se abarcarían más dimensiones en su conceptualización.
c) Para cada dimensión, buscar indicadores (o variables empíricas), que logren re presentar la propiedad latente que el concepto representa. Su existencia e in tensidad, en condiciones de validez y de fiabilidad. Entre el concepto (latente) y los indicadores elegidos para su medición ha de haber una plena correspondencia. Si bien se asume, como en cualquier proceso anah'tico, unos márgenes de incertidumbre. Quiere esto decir que se tra ta de una relación “probable”, sujeta a ser cuestionada, precisamente debido a las características de generalidad y abstracción que definen a todo concepto. En cambio, los indicadores son variables empíricas, concretas. De ellos se exige que sean “expresión numérica, cuantitativa de la dimensión que reflejan” (González Blasco, 1989: 235). De lo que se trata es de fundamentar dicha relación, con cepto-dimensión-indicador, lo más posible, reduciendo al mínimo el error de me dición. Fara tal propósito es fundamental elegir varios indicadores para cada dimensión y no sólo uno. Esto se conoce como operacionalización múltiple. Pro puesta por D. T. Campbell y D. W. Fiske, en 1959 (en “Convergent and discriminant validation by the multitrait-multimethod matrix”. Psychological Bulletin, 56: 81-105), como una estrategia para aumentar la validez de cons tructo. La validez de constructo es un concepto clave en la teoría psicométrica. En su delimitación fue igualmente esencial la aportación pionera de L. Cronchological Bulletin, 52:281-302). Hace referencia a la adecuación de la medición de los conceptos teóricos. Lo bien que éstos han quedado medidos por los in dicadores elegidos. Para su consecución es primordial la delimitación clara y pre cisa de los conceptos teóricos a medir. Pero, también, proceder a una opera cionalización múltiple por dos razones principales: • Una, utilizar varias medidas para un mismo concepto contribuye a abar car las distintas dimensiones que incluye. Un cuestionario que pregunte sobre aspectos ligeramente diferentes de la mis ma cosa varias veces y utilice una combinación de los resultados de estas preguntas (un índice), para indicar la presencia de una actitud, probablemente está menos afectado en sus resultados por error aleatorio (Henerson y otros, 1987:71).
• Dos, proporciona una mayor precisión y validez de la medición, cuando coinciden los resultados de mediciones diferentes. Pero esto último exige que los distintos indicadores realmente midan el mis mo concepto. También es importante la fundamentación teórica del concepto. De acuerdo con Heath y Martin (1997: 81), “si un concepto no es parte de una teoría bien desarrollada, entonces las oportunidades para comprobar la validez de constructo se reducirán”.
E jem plo d e validez d e c o n st r u c t o
Tomar las “detenciones policiales” como único o principal indicador de delincuencia se ría inexacto. Puede haberse cometido un acto delictivo y no haberse registrado ninguna de tención policial o a la inversa. Una persona puede ser detenida sin que haya cometido nin gún acto delictivo. El acudir exclusivamente a las “detenciones policiales” ayuda a medir la delincuencia “oficial”, que no siempre coincide con la “real”. Probablemente ayudará a co rroborar las teorías que enfatizan la mayor implicación en la comisión de actos delictivos por los grupos más desfavorecidos o marginales de la sociedad. Por el contrario, las encuestas de autodenuncia dibujan una mayor extensión de la de lincuencia en los distintos segmentos de población. Estas encuestas incluyen preguntas re feridas a la comisión de conductas contranormativas. Generalmente, infracciones que pudieran considerarse no graves: conducir sin cinturón de seguridad, pasarse un semáforo en rojo, sus traer algún artículo de un centro comercial, de la empresa donde se trabaja, consumo de sus tancias ilícitas y similares. Ayudan a medir la discrecionalidad de los agentes de control so cial (policía, instancias judiciales). La actuación diferencial depende de quién infrinja la norma legal, en consonancia con los supuestos del paradigma interaccionista. El uso combinado de ambas medidas de delincuencia lograría una mejor radiografía de la actividad delictiva en una sociedad. Más cuando se incluyen indicadores varios, tanto en los informes oficiales como en las encuestas de autodenuncia. Eso sí, procurando que midan la delincuencia en su distinto grado de severidad e intensidad. Los indicadores elegidos han de adecuarse a los objetivos de investigación. En su elección se recomienda: • Elaborar una lista que incluya el mayor número posible de indicadores, para así abarcar la variada dimensionalidad del concepto a medir. Des pués, en función de la información que proporcionen, se procederá a la eliminación de aquellos indicadores que resulten no significativos en la medición del concepto.
• Acudir a indicadores ya validados en investigaciones previas. Ello favo
rece la realización de estudios comparativos y ayuda en la selección de aquellos que ya han mostrado cumplir requisitos de validez y de fiabili dad (como se verá en el capítulo 6). Si bien, el investigador ha de tener presente su posible efecto diferencial, debido al contexto sociocultural y temporal en que se apliquen. d) La información proporcionada por los distintos indicadores de una misma di mensión puede sintetizarse en un índice. Éste ayudará a calibrar el grado al que los distintos casos observados se ajustan al concepto medido. Su cálculo preci sa que los indicadores a agrupar compartan una escala de medición común pa ra facilitar su agregación. Asimismo, los indicadores deben ponderarse de acuerdo con su importancia relativa en la medición de cada dimensión del con cepto. Como ésta suele ser una actuación posterior a la recogida de información, se posterga al capítulo 6 el detalle del procedimiento a seguir en la elaboración de índices. Aquí únicamente se avanza la gran contribución de las técnicas ana líticas multivariables factoriales en el cálculo de índices y, en general, en la operacionalización de conceptos teóricos. Ya se dijo que a la conceptualización puede llegarse desde la teoría, pero también desde los datos empíricos. De las observaciones (datos de encuesta), mediante la operación metodológica de la inducción, se procede a la consecución de constructos teó ricos: de los casos particulares a los generales. En este proceder destaca la contribución de las técnicas analíticas multivariables factoriales y similares, que indagan en las interrelaciones entre una serie de variables empíricas en busca de un nexo de unión en tre ellas. Después de que los datos de encuesta se han recabado, en la fase de análisis se procede a determinar qué variables, de las incluidas en el cuestionario, varían conjuntamente. Las variables correlacionadas, o que comparten variabilidad, quedan agrupadas formando una misma dimensión latente (factor o componente principal). La condición que se impone es que el número de dimensiones sea inferior al de indicadores o variables empíricas. En caso contrario, el análisis no sería pertinente porque las va riables no tienen un nexo común. Las dimensiones aparecen ordenadas conforme a su relevancia en la medición del concepto específico de que se trate. Dentro de cada dimensión se gradúa la aportación de cada indicador, de manera que aquellos que presenten un coeficiente factorial más elevado son los que más contribuyen a la configuración de la dimensión latente. En función de qué variables lo integren, se asigna una etiqueta a cada dimensión. És ta proporcionará un nombre común a los distintos indicadores que la componen. El concepto queda finalmente perfilado cuando se conocen los distintos valores que presenta cada una de las dimensiones latentes obtenidas. Los indicadores son los que proporcionan la información numérica. A partir de ella, se llevan a cabo una serie de ope raciones aritméticas, que concluyen con la obtención de un índice, una cifra numérica de síntesis del concepto que pretendía medirse mediante el cuestionario diseñado al efecto.
E je m p l o d e o p er a c io n a liz a c ió n d e c o n c e p to s TEÓRICOS MEDIANTE ANÁLISIS FACTORIAL Tomemos el concepto de racismo, definido por Wetherell (1996:178) como “el proceso de marginalizar, excluir y discriminar contra aquellos definidos como diferentes sobre la ba se de un color de piel o pertenencia grupal étnica”. En su conceptualización se han dado va rias propuestas, que se ajustan a una escala acumulativa, que va de las formas menos ex tremas de discurso racista (racismo aversivo o prejuicio sutil) a las más manifiestas (racismo biológico). Racismo aversivo Término acuñado por Gaertner y Dovidio en 1986, para quienes representa la forma más actual de racismo. Se caracteriza por: • No asumir la superioridad de unas razas sobre otras. Las diferencias étnicas se consideran fruto del aprendizaje social. • Defender los valores igualitarios: la igualdad de derechos para los distintos grupos ét nico?^ incluido r ! mantener sus propias tradiciones culturales. Aunque supeditada a la del grupo mayoritario. • Se consideran “no racistas”, “no prejuiciosos”, pero valoran el contacto interétnico co mo un “problema social”. Son favorables a políticas de ayuda a países en desarrollo para evitar que su población emigre. Un racista aversivo puede defender la igualdad de las razas y, al mismo tiempo, pro pugnar un cierto control de las fronteras ante la llegada masiva de inmigrantes africanos, o una mayor presencia policial en barrios ocupados por inmigrantes (Rodríguez y Rodrí guez, 1999: 42).
Racismo simbólico y moderno (McConahay y Hough, 1976; McConahay, 1983) Asume la superioridad cultural del propio grupo étnico, considerando a los “otros” una amenaza a la distintividad cultural del grupo. Los inmigrantes están destruyendo nuestra cultura, nuestra lengua y nuestras tradiciones [..]. Los demás grupos étnicos tienen derecho a ser tratados igual que los miembros de nuestro grupo, pero no pueden esperar más derechos de los que se merecen (por ejemplo, que no es peren el derecho al voto) (Echevarría y Villareal, 1995: 220).
Sentimiento de que los otros grupos étnicos están violando valores preciados y haciendo demandas ilegítimas para cambiar el status quo racial (McConahay, 1986).
Racismo biológico La forma clásica de racismo. La que tradicionalmente se mide en los sondeos de opinión. La más manifiesta. Se caracteriza por: • La creencia en la superioridad genética del grupo propio frente al exogrupo. • No admiten derechos para los grupos étnicos considerados inferiores ni la igualdad de oportunidades. • Los matrimonios interétnicos, u otro tipo de contacto personal, se perciben como una amenaza de degeneración cultural y biológica de la propia raza. Coincide con lo que Pettigrew y Meertens (1995) llaman prejuicio explícito: el rechazo ma nifiesto o “explícito” hacia los integrantes de otros grupos, hacia quienes se evita el contac to íntimo. La medición del racismo (manifiesto y latente) no siempre incluye indicadores de sus dis tintas modalidades. Lo habitual es que comprenda tres aspectos fundamentales (Morales, 1996): a) Distancia social (Oskamp, 1991): grado de separación considerada aceptable en las relaciones entre personas de países o de etnias distintas. Se distingue un grado de intimidad máximo (matrimonio, noviazgo, relaciones de amistad), intermedio (vivir en el mismo vecindario, compartir los mismos clubs sociales, recreativos) y mínimo (com partir el mismo autobús, acudir a los mismos establecimientos públicos, como bares o cafeterías), b) Igualdad de tratamiento: grado de aceptación de principios generales de discriminación en distintos ámbitos de la vida social (trabajo, transporte público, posibilidad de asistir a los mismos centros escolares, libertad de elección de la pareja sin tener en cuenta su raza o país de origen). No obstante, se advierte que las preguntas de los cuestionarios apuntan a principios generales, no a prácticas concretas. c) Implementación de los principios de igualdad: grado de aceptación de políticas con cretas emprendidas por el gobierno con vistas a conseguir la igualdad racial. Los principios de igualdad de derechos están presentes en las versiones más actuales del discurso racista. Lo habitual, en dichas encuestas, es que se deduzca una actitud más ne gativa, hacia personas de otra etnia o país diferente, cuando se evalúan políticas guberna mentales concretas y se responde a cuestiones referidas al polo de distancia social que im plica una mayor intimidad. Por el contrario, la actitud menos negativa se obtiene en preguntas sobre principios generales de discriminación y las relativas al polo de distancia social que im plica una intimidad escasa (Morales, 1996). Asimismo, en la medición de racismo se precisa la consideración de los tres componentes “esenciales” en cualquier medición de actitudes (Lamberth, 1980). a) Afectivo. Controla el nivel de agrado o desagrado de la persona con respecto al ob jeto de actitud. b) Cognitivo o de creencias con respecto a un objeto, que sugiere, a su vez, dos di mensiones adicionales. Una, la especificidad o generabilidad de la actitud. Dos, el gra do de diferenciación de las creencias.
c) Comportamental o conductual. Verifica cómo se comporta la persona relacionándo lo con los otros dos componentes de la actitud. Atendiendo a estas consideraciones, Cea D’Ancona (2002b) evalúa los indicadores tradicionales de “racismo”, presentes en la última encuesta ex profeso de actitudes ante la in migración, hasta la fecha, realizada por el Centro de Investigaciones Sociológicas. Con los indicadores incluidos en la encuesta, un total de 41, se realiza un análisis factorial de com ponentes principales. El objetivo es descubrir si éstos comparten alguna estructura latente. Esta serie menor de variables latentes ha de caracterizarse por aglutinar variables bastante correlacionadas entre sí y escasamente correlacionadas con aquellas que forman otra es tructura latente o dimensión del concepto que se analiza: racismo. En el cuadro 4.A figuran las diez dimensiones latentes obtenidas tras la rotación varimax. Ésta permite maximizar la varianza de los coeficientes factoriales cuadrados en cada com ponente principal, obteniendo dimensiones relevantes no correlacionadas entre sí. Los componentes figuran en su orden de aparición, acompañados de la etiqueta asignada por la autora para su denominación. Se ha intentado que el nombre dado a la dimensión latente re fleje el significado de las variables que en él ponderen más y que sinteticen su contenido “co mún”. Las variables aparecen acompañadas de sus coeficientes factoriales, cuya magnitud señala lo que caracteriza a cada componente. Su valor expresa la correlación de cada in dicador (o variable observada) con cada componente. Su signo, la dirección de dicha relación: positiva o negativa. CUADRO 4.A. Composición de los componentes principales tras la rotación varimax 2 Derechos de ciudadanía
1 Derechos sociales Educación pública Vivienda digna Asistencia sanitaria Practicar su religión Trabajo en igualdad Constituir asociaciones Traer a su familia Cobrar el paro Mantener sus costumbres
0,824 0,770 0,747 0,702 0,672 0,669 0,666 0,463 0,286
3 Sociabilidad con marroquíes Vecino marroquí Compañero de trabajo marroquí Casar con marroquí Colegio con inmigrantes Simpatía hacia marroquíes
Votar municipales Votar elecciones generales Afiliarse a partidos políticos Obtener la nacionalidad
0,879 0,877 0,780 0,491
4 Política inmigratoria 0,822 0,788 0,708 0,595 -0,492
Valoración inmigración Supresión fronteras UE Refugiado político Control inmigración Regularizar inmigrantes Leyes inmigración Facilitar entrada a inmigrantes Número de inmigrantes
0,614 0,606 0,519 0,509 0,455 0,452 0,429 -0,368
5 Imagen tópica negativa del inmigrante Bajan salarios Quitan trabajo Aumentan delincuencia
0,751 0,750 0,586
o
7 Partido racista Aceptación partido racista Partido racista
Condiciones de vida del inmigrante -0,699 0,582 Dificultades de los inmigrantes 0,536 Trabajos no cualificados 0,456 Ampliación derechos 8 Aceptación del inmigrante
0,766 0,446
9 Violencia contra inmigrantes Problema agresiones inmigrantes
6 Discriminación étnica o de la alteridad
Amistad con inmigrantes Aumentará número de inmigrantes Cupo inmigrantes
0,668 -0,583 -0,274
10 Temor al asentamiento de inmigrantes 0,817
Intención quedarse Trato con desconfianza
0,652 -0,593
Después, la efectividad de las diez dimensiones obtenidas se comprueba mediante un análisis discriminante. Ello exige el resumen de la aportación de los distintos indicadores que forman una misma dimensión o componente principal en un índice. Para ello se calculan las puntuaciones factoriales, con el propósito de que en la representación de cada dimensión la tente intervengan todas las variables empíricas con coeficientes factoriales significativos. Se aplica el método de Anderson-Rubin porque propicia la obtención de puntuaciones factoriales no correlacionadas. El análisis discriminante se realiza tomando como variable dependiente los tres grupos obtenidos del análisis de conglomerados K-medias, en consonancia con la actitud declara da ante la inmigración; y como independientes las diez puntuaciones factoriales. De él se ob tiene que, en consonancia con las nuevas propuestas de racismo, las preguntas relativas a derechos sociales y de ciudadanía son las de mayor utilidad en la medición de racismo. Le siguen los ítem relativos a política inmigratoria que son, a su vez, los que mayor variabilidad obtienen en las respuestas de los encuestados. En cambio, los relativos a distancia social, presentes en la generalidad de las encuestas de actitudes y prejuicios étnicos raciales, se si túan en el cuarto lugar en efectividad. De las diez dimensiones latentes sólo las seis prime ras mostraron relevancia estadísticamente significativa en la medición de racismo. El orden es el siguiente, de acuerdo con el índice de potencialidad compuesto calculado: derechos so ciales (0,464), derechos de ciudadanía (0,044), política inmigratoria (0,038), sociabilidad con marroquíes (0,017), discriminación étnica y de la alteridad (0,013) e imagen tópica negativa (0,012). Para mayor información véase el susodicho artículo. En una investigación posterior (Cea D’Ancona, 2004b) se profundiza en la medición de racismo. Se analiza su evolución en los últimos años, comprobándose su relevancia en en cuestas realizadas por el CIS en fechas más próximas. Además, se muestran los indicado res utilizados en otros sondeos de opinión y estudios sobre inmigración y racismo. A destacar los llevados a cabo por CIRES/ASEP y los eurobarómetros. En especial, el Eurobarómetro 53, de 2000, cuyos indicadores de racismo (un total de 31) también se agruparon en siete di
mensiones latentes (culpar a las minorías, apoyo a políticas de mejora de la coexistencia so cial, aceptación restrictiva de inmigrantes, molestia, optimismo multicultural, condiciones de repatriación y asimilación cultural) mediante la realización de un análisis factorial. Sus valores se sintetizaron en índices, que igualmente sirvieron para realizar una tipología de actitudes ante la inmigración.
En suma, de los datos empíricos se infieren constructos teóricos que, con poste rioridad, pueden ser alterados, a la luz de nuevos datos empíricos. Ésta es una apro ximación inductiva a la conceptualización. La más aplicada en la metodología cuan titativa, cuando la medición se hace mediante encuesta. Pero ésta no es la única aproximación empírica a la conceptualización o formación de conceptos. También es tá la representada por la Teoría Fundamentada (The Grounded Theory) de Glasser y Strauss (1967), congruente con el paradigma interaccionista. El interaccionismo simbólico indaga en la comprensión de cómo se aprenden los significados y símbolos del lenguaje en interacción unos con otros. La teoría funda mentada busca la generación de conceptos teóricos a partir de datos empíricos, por me dio del análisis comparativo. No es meramente un método específico o técnica. Es un estilo de realizar análisis cualitativo que incluye una serie de rasgos distintivos, tales como muestreo teórico y cier tas guías metodológicas, como realizar comparaciones constantes y el uso de la codifi cación para asegurar el desarrollo conceptual y la densidad (Strauss, 1987: 5).
El investigador analiza los datos sistemática e intensivamente (frase por frase de las notas de campo, texto de entrevista, protocolo de observación u otro docu mento), en busca de indicadores empíricos. Clasifica en categorías los incidentes que encuentre en los datos. Mediante la comparación constante de su contenido, va redefiniendo las categorías hasta que éstas adopten una forma abstracta. El análisis concluye con la reducción de “conceptos emergentes” en una serie más pequeña de conceptos clave. Estos se integran en una teoría global que establezca las relaciones entre ellos. Para más información de esta aproximación analítica y otras cualitativas véase Valles (1997).
4.2. La formulación de las preguntas: sus efectos en el error de medición Una vez concretados los indicadores a incluir en la medición de los conceptos cen trales de la investigación, se procede a la formulación de las preguntas del cuestionario. Esta constituye una fase esencial en el desarrollo de una encuesta. Los resultados que de ella se obtengan dependen de qué se ha preguntado, cómo se ha formulado la pre gunta, las opciones de respuesta que se han considerado, el contexto de la pregunta y demás aspectos relacionados con la redacción del cuestionario y su administración.
El interés por los efectos de la formulación de las preguntas en los resultados de la encuesta llevó, en los años cuarenta y posteriores del siglo xx, a una serie de investi gadores, pertenecientes tanto al ámbito académico como comercial, a la realización de experimentos. Querían comprobar si distintas redacciones de preguntas suscitan res puestas diferentes. Algunos de estos experimentos se publican en la compilación realizada por H. Cantril en 1944 (Gauging public opinion. Princeton University Press). A ellos también hace referencia S. L. Payne en 1951 (The art ofasking question. Princeton University Press). En 1981 H. Schuman y S. Presser publican una monografía que reúne los diversos experimentos llevados a efecto por ellos mismos y otros investigadores, referidos a la forma de la pregunta, su redacción y contexto (Questions and answers in attitude surveys: experiments in question form, wording and context. Academic Press. Nueva York). Un total de 130 experimentos en 34 encuestas nacionales y regionales, entre 1971 y 1980. Nuevamente se constata que pequeños cambios en la formulación de las preguntas pueden provocar grandes diferencias en las respuestas. Observan la exis tencia de efectos debidos a la redacción de la pregunta, su orden y disposición conjunta en el cuestionario. Así como los relativos a las opciones de respuesta (en preguntas ce rradas): sesgos de aquiescencia, primacía y recencia, junto con los debidos a la inclusión de alternativas de respuesta intermedias y de “no opinión” (no sabe/no contesta). Con anterioridad, Sudman y Bradburn (1974) habían demostrado que los efectos de la formulación de la pregunta afectan tanto a las preguntas de opinión como a las de hechos. A esta conclusión llegaron tras haber realizado un meta-análisis (es decir, un análisis conjunto de los resultados cuantitativos de una serie de estudios indivi duales sobre una cuestión concreta) de 900 experimentos “split-ballot”. Éste es el pro cedimiento experimental más aplicado en la comprobación de diferencias en las respuestas ante dos alternativas de una misma pregunta. Para ello se divide la mues tra al azar en dos mitades, o más, dependiendo del número de formulaciones alter nativas que se hagan de la misma pregunta. Garantizada la homogeneidad de los gru pos, por haberse procedido a la distribución aleatoria de sus integrantes, las diferencias en las respuestas se interpretan como debidas a la formulación de la pregunta. Tras su realización, los autores concluyen que la mayoría de los errores de medición se de ben al diseño del cuestionario. En concreto, a la extensión del cuestionario, el orden de las preguntas, a su formato abierto o cerrado, al empleo de palabras ambiguas, de difícil comprensión, a la saliencia de la pregunta para el encuestado y al empleo de ayudas al recuerdo. En general, los errores principales debidos a la formulación de la pregunta cabe re sumirlos en los seis que figuran en el cuadro 4.1. Errores de especificación La pregunta no se adecúa a los objetivos de la investigación. No logra su traduc ción en un indicador válido en la medición de los conceptos esenciales del estudio.
ERRORES De especificación
MOTIVO
No correspondencia de la pregunta con los objetivos de la encuesta Desigual interpretación de términos de la pregunta La redacción de la pregunta, su introducción y formulación concreta
De medición
Las opciones de respuesta
Qué alternativas se ofrezcan: efectos de las opciones intermedias, de no opinión, equilibradas En qué orden: efectos de primacía, recencia, aquiescencia
Orden y contexto de la pregunta en el cuestionario Sesgo de deseabilidad social Tema de la pregunta
Errores deliberados (o motivados) de memoria, de comunicación
Errores de medición debidos a la interpretación de términos de la pregunta En la investigación mediante encuesta la medición se hace no por observación di recta de los fenómenos, sino a través de la información transmitida mediante “pala bras” y “frases”. La introducción de determinadas palabras o términos puede llegar a sesgar los resultados del estudio. Palabras ambiguas o que tengan distintas connota ciones pueden suscitar respuestas dispares. Aunque el lenguaje en las preguntas de encuesta puede estar estandarizado, no exis ten garantías de que el significado asignado a las preguntas sea constante por encima de los encuestados (Groves, 1989:450).
Un ejemplo famoso, frecuentemente citado, sobre el efecto de la redacción de la pregunta en la respuesta es el ilustrado por D. Rugg en 1941 (“Experiments in wording question II”. Public Opinion Quarterly, 5: 91-92). Muestra que un simple cambio de pa labra, “prohibir” por “permitir” modifica la respuesta. Las preguntas y sus porcenta jes de respuestas fueron los siguientes: • ¿Piensa usted que Estados Unidos debería prohibir discursos políticos contra la democracia? El 54% de los encuestados dijo “sí”.
• ¿Piensa usted que Estados Unidos debería permitir discursos públicos contra la de mocracia? El 75% dijo “sí”.
Este ejemplo ilustra cómo un cambio, aparentemente pequeño, en la redacción de la pregunta produce grandes diferencias en la información captada en la encuesta. En consecuencia, conviene evitar que, tanto en la pregunta como en las opciones de respuesta (en pregunfas cerradas), se incluyan palabras ambiguas o que puedan tener una connotación dispar. Errores de medición debidos a la redacción de la pregunta Los errores de medición invisibles al analista de datos surgen debidos a la formu lación de la pregunta (Groves, 1989:497).
Lohr (2000:10) ilustra el efecto en la respuesta suscitado por cómo se enuncia y for mula en conjunto la pregunta con el siguiente ejemplo. A finales de 1993 y a principios de 1994 se hicieron dos encuestas sobre Elvis Presley. • En una se preguntaba, En los últimos años ha habido muchos rumores e histo rias acerca de si Elvis Presley realmente murió. ¿Qué le parece esto? ¿Piensa que existe alguna posibilidad de que estos rumores sean ciertos y que Elvis siga vivo o no? El 8% de los sondeados respondió que es posible que Elvis esté aún con vida. • En la segunda encuesta, la pregunta varió: Un programa de televisión re cientemente examinó varias teorías sobre la muerte de Elvis Presley. ¿Cree us ted que Elvis Presley está vivo o no? El 16% respondió que es posible que El vis siga vivo. Este ejemplo indirectamente también puede ilustrar los peligros de asociar una con ducta o actitud a personas o instituciones de prestigio, a los que se atribuya una cierta autoridad. Errores de medición debidos a las opciones de respuesta Afecta no sólo qué alternativas de respuesta se ofrezcan, en las preguntas cerradas, si se presentan de una forma equilibrada, que no induzca a una respuesta concreta. También, el orden en que éstas se presenten. En las preguntas cerradas, en las cuales hay que elegir una (o varias) de las res puestas ofrecidas en la pregunta, pueden darse errores de medición debidos al orden de la respuesta. En especial, en las encuestas telefónicas y cara a cara, cuando son va rias las alternativas de respuesta entre las que elegir y éstas no pueden ser visualizadas, por parte del entrevistado, en hojas de respuesta o tarjetas. Consiste en la elección pre ferente de la primera alternativa de respuesta que se mencione (efecto de primacía) o
la última (efecto de recenciá), con independencia del contenido de la respuesta. Am bos efectos se dan más en personas con un bajo nivel de estudios (Schuman y Presser, 1981/1996; Krosnick y Alwin, 1987). Principalmente en aquellas preguntas con más de tres opciones de respuesta. Los efectos de primacía y de recencia pueden deberse a problemas de retención, de memoria, de recordar las distintas alternativas de respuesta entre las que elegir. Pero, también, influye la saliencia o relevancia del tema, del que trata la pregunta y la en cuesta en general, para el encuestado. Cuando no sea de su interés, estará más pre dispuesto a querer concluir cuanto antes la entrevista; no dedicará mucho tiempo a me ditar la respuesta, contestando lo primero que le venga a la mente, o se le sugiera, se ajuste o no a su sentir real. De acuerdo con Krosnick y Alwin (1987), los efectos de orden de la respuesta ocu rren porque algunos encuestados no conceden a todas las alternativas de respuesta igual consideración. En su incidencia afecta el orden en que se presente la alternativa de respuesta y cómo se rellene el cuestionario. • En encuestas autoadministradas, o cuando pueden visualizarse las alternati vas de respuesta en una tarjeta u hoja de respuestas, en el transcurso de una en trevista cara a cara, se da más el efecto de primacía. Las respuestas que figuran al principio del listado son las que reciben un procesamiento cognitivo más pro fundo (Schuman y Presser, 1981/1996; Bishop y otros, 1988; Krosnick y Alwin, 1987). • Cuando es el entrevistador quien lee las alternativas de respuesta al encuestado (en persona o por teléfono), es más probable que se produzca el efecto de re cencia. Las últimas respuestas obtendrán un procesamiento cognitivo mayor que aquellas que las antecedan. Este efecto ya fue constatado por Cantril y cola boradores en 1944. Posteriormente, Payne (1951) defiende que la dificultad de la pregunta y su longitud (el número de sílabas por palabras) es lo que provoca el efecto de recencia en encuestas mediante entrevista. Krosnick y Alwin (1987) advierten que los efectos de memoria pueden también ju gar un papel importante en las presentaciones orales de las preguntas. Es más probable que se recuerde la primera y la última de las alternativas de respuesta del listado sien do, en consecuencia, las más probables a ser elegidas. Schuman y Presser (1981/1996) descartan, por el contrario, la memoria como un factor clave en los efectos de recencia. Constatan la existencia de dichos efectos (de recencia) incluso en preguntas breves de respuesta tricotómica (de tres opciones de respuesta). Esto último es después corro borado por Dillon (1990). Este investigador constata que la última alternativa de res puesta mencionada atrae, en promedio, un 10% más de las respuestas adicionales que cuando se menciona en primer o en segundo lugar, con independencia de su contenido. Para demostrarlo, considera una pregunta acerca del divorcio, cuyo efecto había sido ya comprobado por Schuman y Presser (1981). La pregunta se formula en los térmi nos siguientes:
El divorcio debería ser más fácil o más difícil de obtener de lo que es ahora. El porcentaje de respuesta variaba dependiendo de si se ofrecía una opción de res puesta intermedia y de la ubicación de la respuesta:
Orden de las alternativas de respuesta
Porcentaje de respuesta
El divorcio debería ser: • Más fácil de conseguir • Más difícil
40 50
El divorcio debería ser: • Más fácil • Más difícil • Permanecer como está
21 34 45
El divorcio debería ser: • Más fácil • Permanecer como está • Más difícil
23 35 41
Para McClendon (1991/2002) el conocimiento del tema, junto con el interés que és te suscite, puede afectar tanto a los efectos de recencia como a los de aquiescencia. Por aquiescencia se entiende la tendencia al acuerdo indistintamente del significado de la pregunta. Schuman y Presser (1981/1996) muestran que la aquiescencia no se da exclusiva mente en preguntas de acuerdo/desacuerdo. También pueden ocurrir en las dicotómicas sí/no y verdadero/falso. Para su resolución aconsejan utilizar preguntas de elección forzada equilibradas, con referencia a los ítems o preguntas de acuerdo/desacuerdo. Sea el caso de la siguiente pregunta de elección forzada, en la que hay que elegir en tre dos alternativas de respuesta: ¿Cuál es, en su opinión, el principal responsable del aumento de la delincuencia en nuestro país, las actuales peores condiciones socioeconómicas o la mayor presencia de in migrantes? Con esta formulación de pregunta se lograría reducir el efecto de aquiescencia, res pecto a su redacción en el formato de acuerdo/desacuerdo. Las peores condiciones socioeconómicas son más probables que la mayor presencia de inmigrantes en el aumento de la delincuencia en nuestro país. De acuerdo/En desa cuerdo.
Aunque suscitará otro tipo de errores, como se verá cuando se analicen los efec tos de distintos formatos de preguntas. El sesgo de aquiescencia es más habitual que se dé en personas de estatus social ba jo y en miembros de minorías étnicas (Ross y Mirowsky, 1998). En el meta-análisis rea lizado por Narayan y Krosnick (1996), de encuestas nacionales y regionales norte americanas, igualmente se constata que el menor nivel educativo de los encuestados afecta, directamente, a los siete efectos de respuesta: de orden de la respuesta, de aquies cencia, de alternativa de respuesta intermedia, de inclusión de respuesta de “no opi nión”, de prohibir/permitir, de equilibrio y de orden de la pregunta basado en la re ciprocidad. La aquiescencia también se da, cuando el encuestado elige la respuesta que él cree que se espera que dé. Es decir, cuando se quiere ajustar a las expectativas o demandas del investigador (definido por Orne, 1969). Una redacción de la pregunta “neutral”, equilibrada en afirmaciones positivas y negativas, puede ser una forma de evitar los errores de medición debidos al efecto de aquiescencia. Asimismo, han de considerar se los efectos en la respuesta que puede ocasionar el ofrecer alternativas de respues ta intermedia (tipo “ni de acuerdo ni en desacuerdo”, “ni satisfecho ni insatisfecho” o “indeciso”) o de “no opinión” (no sabe/no contesta). Éstos se tratan con posterioridad, cuando se aborda el formato de la pregunta cerrada. Errores de medición debidos al orden de la pregunta Suelen atribuirse a la transferencia de significados de una pregunta a otra. Ya en 1939 J. Sayre comprobó (en “A comparison of three indexis of attitudes towards radio advertising”. Journal o f Applied Psychology, 23: 23-33) que las preguntas precedentes pueden influir en las respuestas a preguntas posteriores. Varios de sus hallazgos re lativos a los efectos de orden de la pregunta fueron posteriormente confirmados por va rios autores. En 1944, H. Cantril obtiene un menor respaldo de la opinión pública norteameri cana a la participación conjunta de su ejército con el francés o el británico, cuando la pre gunta era precedida por una relativa a servir en el ejército alemán. Por su parte, Schu man y Presser (1981/1996) constatan la existencia del efecto de orden de la pregunta en varias de las preguntas que analizan. En una relativa a la felicidad conyugal, por ejem plo, captan un mayor porcentaje de encuestados que declaran sentirse felices (70%), cuando esta pregunta es posterior a una genérica sobre la felicidad, que cuando la an tecede (63%). En cambio, la pregunta genérica sobre la felicidad obtiene un mayor por centaje de respuestas favorables cuando es preguntada primero (52%) que después de la específica sobre la felicidad conyugal (38%). Igualmente, la opinión favorable al abor to en general es mayor, cuando se formula después de una relativa a hijos con defectos físicos o mentales, que cuando aparecen en primer término.
Más recientemente, Singleton y Straits (2002) observan que, cuando una pre gunta general sobre un determinado tema (por ejemplo, la satisfacción en la vida en ge
neral) sigue a una pregunta específica relacionada (la satisfacción matrimonial), las per sonas procuran reiterar la información dada con anterioridad en su respuesta a la pre gunta específica. Quiere esto decir que interpretan la segunda pregunta como pidiendo nueva información sobre la satisfacción en la vida en general, aparte de la marital. A veces la forma en que una persona responde a una pregunta influye en su res puesta a preguntas posteriores, con el propósito de no parecer “incongruentes”. Si bien, Schuman y Presser (1981/1996) advierten que el efecto de orden no se crea por poner dos preguntas de contenido similar próximas unas a otras; sino cuando el encuestado tiene necesidad de que su respuesta a la segunda pregunta sea consistente con la da da en la primera pregunta. Este efecto es más habitual en personas de nivel educati vo bajo, como igualmente demuestra Sigelman (1981). Las preguntas generales, más que las específicas, están más expuestas al efecto de orden. Los efectos de contexto también pueden acontecer cuando la interpretación de una pregunta está influida por la información que la anteceda. Bien en las preguntas inmediatamente anteriores, bien en la introducción de la pregunta, o en las instruc ciones que se den para responderlas. Obviamente, la pregunta ¿Está usted satisfecho o insatisfecho con la actuación del Gobierno? captará un menor porcentaje de satisfacción si va precedida de la pregunta más específica ¿Cómo valora usted la actuación del Gobierno en la Guerra de Irak?, que cuando no es precedida por esta pregunta.
De acuerdo con Wánke y Schwarz (1997), asignar una pregunta específica y una ge neral al mismo contexto conversacional induce a los sujetos a interpretar esta última como perteneciente a aspectos no cubiertos por la pregunta específica, evitando de es ta forma la redundancia. Formular varias preguntas específicas previo a una general cambia, sin embargo, el significado pragmático de la pregunta general: de una petición para información adicional a una información para un juicio de resumen integrativo. Esta última explicación sólo es factible, no obstante, cuando las preguntas específicas se hallan relacionadas unas con otras y pueden integrarse en un juicio común. Para Kalton, Collins y Brook (1978), las diferencias en el orden de las preguntas se advierten me jor cuando las preguntas específicas anteceden a la general. Errores de medición debidos al tema de la pregunta En especial, cuando éste pueda inhibir al encuestado de dar una respuesta veraz. Llámense preguntas “embarazosas” (Goode y Hatt, 1952), “amenazantes” (Sudman y Bradburn, 1974), “sensitivas” (Lin, 1976) o aquellas potencialmente “ofensivas” (Berdie y Anderson, 1974). Lo cierto es que incomodan al encuestado y, si no se aborda el tema con la debida cautela, la captación de respuestas “válidas” se limita. Tradicionalmente en este grupo de preguntas potencialmente “amenazantes” se han incluido las relativas a renta, conducta sexual, ideología política, religiosa, salud mental y física, o conductas desviadas, como consumo de drogas (De Lamater y McKinney,
1982). Si bien, cabría extenderlo a toda cuestión que aborde conductas, opiniones o ac titudes que quieran mantenerse ocultas, por temor a la censura social. Lo que lleva a la mayor captación de respuestas “políticamente correctas” o socialmente deseables, an te la necesidad que todos tenemos de “aprobación social”, a menos que las preguntas se formulen de forma que quede oculta su intencionalidad o se diluya la gravedad de la res puesta. A veces las personas no dicen la verdad. La obtención de respuestas veraces es un reto importante en las encuestas que implican temas delicados, como las encuestas so bre consumo de drogas (Lohr, 2000:8).
A diferencia de otros sesgos, como el de aquiescencia, el llamado de deseabilidad social se da más en personas de mayor nivel educativo. En un estudio de actitudes ra cistas, Krysan (1998) detecta, en sus tres situaciones experimentales (encuesta cara a cara estándar, encuesta cara a cara con hojas de respuesta y encuesta por correo), que las personas de mayor nivel educativo tienen mayor interés en no aparecer como “racistas”. Perciben más la intencionalidad de la pregunta que aquellos con un menor nivel educativo, y emiten las respuestas que saben que son “políticamente correctas”. Por el contrario, los niños y los jóvenes son menos susceptibles que los adultos a ses gos de deseabilidad social (Scott, 1997). Johnson y otros (1997) comprueban que las definiciones de deseabilidad social es tán culturalmente mediadas, varían de unas sociedades a otras. La sociedad mejicana está más predispuesta a dar respuestas “socialmente deseables” que la anglosajona, por que está más influida por “el qué dirán”. El mundo de las apariencias está, en general, más presente en las culturas hispanas. En el capítulo 2 ya se indicó cómo el método de encuesta afecta a la consecución de respuestas menos afectadas por el sesgo de deseabilidad social. En el subapartado 4.2.1 y siguientes se dan algunas recomendaciones relativas a la formulación de las pre guntas y su ubicación en el cuestionario, que ayudan a diluir este tipo de sesgo. También, se hace mención específica a preguntas referidas a acontecimientos del “pasado”, por ser más vulnerables a la captación de respuestas no “veraces”, aunque no sea de liberadamente. Bradburn (1983) distingue tres tipos de errores de respuesta: a) Errores deliberados o motivados. El encuestado añade u omite información pa ra causar una buena impresión al entrevistador; o para evitar que éste averigüe algo. b) Errores de memoria sobre la ocurrencia de determinados acontecimientos y cuándo sucedieron. c) Errores de comunicación. Causados bien porque el entrevistador no ha ex presado con claridad lo que está preguntando, bien porque el entrevistado fa lla en aclarar su respuesta al entrevistador. Es decir, no expone su respuesta ade cuadamente, repercutiendo en el registro de una respuesta errónea.
Además de los posibles efectos de la mediación del entrevistador en las respues tas (tratado en el capítulo 5), el investigador ha de considerar el posible efecto en la va riabilidad de la respuesta debido al encuestado. Existen diferencias de personalidad que pueden afectar sistemáticamente a su voluntad de dar respuestas “veraces”. Sobre to do, en preguntas que podrían afectar a su autoestima o imagen pública. Pero, también, puede incidir: a) La presencia de otras personas durante la entrevista. b) Acontecimientos que le ocurrieron antes de que la entrevista comenzase. c) Presiones sociales para no cooperar con extraños. Como ilustración de los distintos errores de respuesta posibles, Bradbum (1983) to ma, precisamente, la pregunta referida a la renta familiar durante el año pasado. Ante ella pueden darse las siguientes circunstancias que pueden inducir la sospecha de que no se está consiguiendo una medición adecuada de la renta familiar: • Los encuestados pueden omitir deliberadamente algunos tipos de renta, que no quieren que se conozcan (por su procedencia ilegal o porque no han sido de claradas a Hacienda). • Pueden olvidar alguna clase de renta (dividendos o intereses en sus cuentas de ahorro) o informar estimaciones falsas de renta no debidamente contabilizadas. • Una mala comprensión de la pregunta o no definir el concepto de renta de igual forma que lo hace el investigador. Por ejemplo, obsequios, herencias, pagos de seguros, de acciones, dividendos, ¿se informan como renta? La pregunta pue de no aclarar lo que el investigador tiene en mente cuando pregunta sobre ren ta. • Los encuestados pueden incluir renta desde un período de tiempo equivocado. Este error de memoria se conoce como “telescoping”. De acuerdo con Sudman y Bradburn (1974), este error de respuesta se produce cuando se recuerda un acontecimiento como habiendo ocurrido en una fecha más reciente de la que en realidad aconteció. • Los encuestados pueden deliberadamente inflar la información sobre su renta para impresionar al entrevistador o parecer de una posición social superior a la que tienen en realidad. En el capítulo 2 se dijo que la encuesta cara a cara, preferiblemente la rea lizada en el domicilio de los encuestados, es la menos expuesta a la captación de un nivel económico y educativo, por parte de los encuestados, superior al real. La más favorable es la encuesta telefónica, donde ambas variables suelen estar sobredimensionadas. Los distintos errores de medición debidos a la respuesta de los encuestados pueden traducirse en errores sistemáticos y en errores variables o aleatorios. Depende de su in cidencia en el conjunto de la encuesta.
• Los errores sistemáticos son aquellos que “no suman cero cuando las observa ciones de la muestra son promediadas” (Biemer y Lyberg, 2003: 47). Es decir, cuando los errores positivos o los negativos prevalecen en el conjunto de los ca sos analizados, resultando en una sobreestimación o subestimación de los valores “reales” en la población. En general, se deben a una “falsificación” deliberada de la información. El sesgo de aquiescencia, por ejemplo, puede resultar en un error sistemático en en cuestas que incluyen escalas sociológicas estándar. Lo mismo puede acontecer en cues tiones que suscitan el sesgo de deseabilidad social. Como sucede cuando se capta una me jor valoración de la inmigración que la realmente existente, debido a que la población sondeada ha descubierto la intencionalidad de la pregunta y, deliberadamente, decide ocultar su valoración “real” para no parecer “racista”.
• Los errores variables o aleatorios no producen, en cambio, una sobreestimación o subestimación de los valores promedio. Ante una misma cuestión, por ejemplo declarar el nivel de renta, unas personas pue den estar predispuestas a informar un nivel de renta superior al real para “impresionar”, mientras que otras prefieren decir menos de lo percibido, por temor a actuaciones fiscales futuras o, simplemente, para no impresionar. Lo mismo es extensible a preguntas referidas al pasado. Especialmente, si son de escasa relevancia como, por ejemplo, los programas de televisión vistos la semana pasada o los alimentos comprados. A menos que se haga uso de alguna “táctica de ayuda al recuerdo”, como se verá en el subapartado 4.2.1.
El error será variable cuando, en el análisis conjunto de la muestra, no ha habido una mayor desviación ni de exceso ni de defecto, anulándose los valores positivos y negati vos. En caso contrario, se estaría ante un error sistemático. La incidencia, en los resultados de la encuesta, de los primeros (los errores variables) pueden reducirse incrementando el tamaño de la muestra. No así los errores sistemáticos, que precisan de un mayor cuidado cuando se diseña la encuesta. Principalmente, cuando ésta aborda cuestiones delicadas que puedan despertar suspicacias por parte del encuestado y provocar que “mienta” de manera deliberada, resultando en datos de encuesta erróneos o “inválidos”. La distorsión sistemática del estatus verdadero del respondiente pone en peligro la va lidez de las mediciones de encuesta. A diferencia del error aleatorio, los sesgos de respuesta no se anulan con mediciones repetidas. Más, al contrario, la distorsión entre las puntua ciones observadas y las verdaderas de un respondiente persisten (Fox y Tracy, 1986: 9).
4.2.1. Recomendaciones para la redacción de las preguntas Varios de los errores de medición pueden corregirse con una redacción adecuada de la pregunta. En el capítulo 1 ya se hizo referencia a la conveniencia de realizar in
dagación exploratoria cualitativa previa (observación, grupos de discusión, entrevis tas en profundidad) para ayudar a descubrir la variedad de discursos y aspectos que in cluye el problema de investigación. Esta información complementará a la que se ex traiga de la exigida revisión bibliográfica, de estudios teóricos y empíricos referidos al problema de investigación. Especial relevancia adquiere, para el diseño del cuestionario, acceder a cuestio narios ya “validados” en estudios anteriores. Aunque sea difícil encontrar un cues tionario que cubra todos los objetivos que persigue la encuesta, el ver qué preguntas se hicieron, qué se trataba de medir con ellas, qué resultados se obtuvieron, puede ayu dar a la redacción de nuevas preguntas. Con ello se evita caer en errores cometidos con anterioridad. Además, el investigador puede optar por tomar algunas preguntas, mediante las que se alcanzó una buena medición de los conceptos de interés, e in cluirlas en su cuestionario. De esta forma pueden realizarse análisis comparativos. Es ta práctica permite, en concreto: a) Replicar hallazgos de estudios anteriores en otras poblaciones o en fechas posteriores, comparándose sus resultados. b) Analizar su evolución o tendencia, en distintos períodos de tiempo. c) Comprobar su fiabilidad, en estudios realizados en poblaciones y contextos si milares, donde no existan razones para esperar cambios. La realización de estos análisis exige modificar lo menos posible las preguntas to madas de otros cuestionarios, tanto en su redacción como en su ubicación en el cues tionario. Como se verá en el apartado 4.3., la distinta localización de la pregunta en un cuestionario, en el contexto en el que se sitúe, afecta a la respuesta. Al igual que la in troducción de cambios, aunque sean menores, en su formulación. Cuando la pregunta proceda de cuestionarios redactados en otro idioma o en el mismo, pero en unas circunstancias sociotemporales muy dispares, debe procederse a un análisis más detenido de su redacción. No sólo porque incluyan términos que en su tra ducción actual tengan unas connotaciones diferentes. También, porque la población a la que ahora se dirige le dé una interpretación distinta. Johnson y colaboradores (1997) mues tran la existencia de diferencias culturales tanto en la comprensión de las preguntas como en la exposición diferencial a los distintos sesgos debidos a la formulación de la pregunta. Pero, ¿qué se entiende por una “buena” pregunta? Para Payne (1980: 72), “una ‘buena’ pregunta, entre otras cosas, es aquella que no afecta a la respuesta”. Para Fow ler (1998: 344), es aquella que “produce respuestas que son medidas válidas y fiables de algo que queremos medir”. Válidas en el sentido en que se correspondan con algún valor “verdadero”, hipotético, que intenta medirse. Fiables a la extensión en que las res puestas que se están describiendo sean “consistentes”. (La validez y la fiabilidad de las preguntas de encuesta se tratan en el capítulo 6, junto a otros criterios de calidad de los resultados de encuesta). Aunque algunos puedan considerar la elaboración de preguntas de encuesta un “ar te”, que se adquiere por experiencia (el mismo Stantley Payne publica en 1951 un pe
queño libro con el título The art o f asking questions, con una edición más reciente en 1980), cada vez son más los metodólogos que asientan el diseño de cuestionarios en teo rías cognitivas y de la comunicación interpersonal. Gracias a la aportación de nume rosos experimentos de preguntas de encuesta (algunos de los cuales ya han sido mencionados), que exploran en “los procesos comunicativos y cognitivos que subyacen en las respuestas de encuesta” (Schwarz, 1997: 31). El entender los procesos sociopsicológicos implicados en la respuesta a preguntas de encuesta ayuda en la formu lación de “buenas” preguntas. Antes de comenzar a redactar las preguntas, es conveniente: 1. Especificar los objetivos de la encuesta. La información que pretende recogerse. 2. Identificar los conceptos centrales en la investigación y traducirlos en indicadores “válidos”, que ayuden a reducir los errores de especificación. 3. Elegir el método de encuesta a aplicar y concretar la población a sondear. Esto significa que: Las preguntas que funcionan en una situación pueden ser improductivas en otras y que pocas reglas generales pueden encontrarse que se apliquen a todas las circunstan cias (Sheatsley, 1983:206).
Ha de tenerse presente el nivel de formación de la población, su dominio del idioma, su capacidad de comunicación verbal, además de su interés por el tema. Con el objeto de elaborar un cuestionario que le sea atractivo, fácil de responder y que no le lleve a rechazarlo. Asimismo, el modo como se administrará el cues tionario influye no sólo en su formato y presentación. También, afecta a la re dacción específica de las preguntas. 4. Concretar los análisis que se prevén realizar, en consonancia con los objetivos de la investigación. Como se verá en el capítulo 6, cada técnica analítica tiene unos supuestos básicos que garantizan su correcta realización. En la medida en que las variables incluidas en el cuestionario los satisfagan, podrá ésta llevarse a buen término. Por ello se recomienda incluir variables “relevantes” para la ex plicación del objeto de estudio y que estén medidas en el nivel correcto que am plíe sus posibilidades analíticas. Cuantas más actuaciones se prevean respecto al análisis de los datos, más se facilitará la fase analítica de la investigación. De la redacción de las preguntas, la investigación empírica ha contribuido a perfilar una serie de pautas a seguir en la consecución de “buenas” preguntas. Si bien, los mis mos metodólogos de encuesta reconocen la dificultad del empeño: Qué difícil es escribir buenas preguntas. Requiere gran habilidad y juicio, mucho tiempo y experiencia y, todavía, incluso después de años de experiencia, nadie puede es cribir una pregunta perfecta (Sudman y Bradburn, 1982: 3,283). Desesperamos de poder elaborar preguntas inmunes de crítica seria (Schuman y Presser, 1981:13).
Las recomendaciones más citadas en la literatura de encuesta para la redacción de preguntas se resumen en el cuadro 4.2 y se describen a continuación.
CUADRO 4.2. Recomendaciones para la redacción de preguntas 1. 2. 3. 4. 5. 6. 7. 8.
Formular preguntas relevantes a la investigación. Preguntas breves y fáciles de comprender por las personas a las que van dirigidas. Emplear un vocabulario sencillo, evitando conceptos o términos abstractos. La redacción de la pregunta ha de ser precisa. La pregunta ha de ser lo más objetiva o neutra posible para no influir en la respuesta. No redactar preguntas en forma negativa. Redactar preguntas de forma personal y directa. Ni las preguntas ni las alternativas de respuesta (cuando se ofrezcan) pueden refe rirse a varias cuestiones al mismo tiempo. El principio de la idea única. 9. No emplear palabras que comporten una reacción estereotipada.
Formular preguntas relevantes a la investigación Siempre tiene que haber un vínculo entre la pregunta y el problema de investi gación. La pregunta ha de adecuarse a la consecución de los objetivos propuestos. En caso contrario, deberá descartarse. A tal efecto, Sudman y Bradburn (1987) recomiendan que, como regla general, el investigador se pregunte (cada vez que piense en una posible pregunta): “¿por qué es toy haciendo esta pregunta?”. Por su parte, Henerson, Morris y Fitz-Gibson (1987) aconsejan la elaboración de hojas de resumen para eliminar preguntas innecesarias. Adviértase que uno de los criterios en la evaluación de las preguntas de un cues tionario es, precisamente, su adecuación en la consecución de los objetivos de encuesta, como se verá en el apartado 6.3. Preguntas breves y fáciles de comprender, por las personas a las que van dirigidas Sin duda, la mejor estrategia es utilizar preguntas breves, cuando sea posible, y que los entrevistadores den a los entrevistados tiempo suficiente para responder a las pre guntas (Converse y Presser, 1994:93).
Payne (1980:129,234) reivindica la “necesidad de preguntas cortas, compuestas por palabras sencillas”. “Utilizar tan pocas palabras como sea necesario. Puedes pre guntar la mayoría de las preguntas con veinte palabras o menos”. Y aporta evidencia empírica de que las preguntas cortas consiguen mejores datos que las largas.
Las preguntas largas y complejas aumentan la probabilidad de que el encuestado se pierda y no las siga (Orenstein y Phillips, 1978). En el mismo sentido se pronuncia Molenaar (1982), para quien las preguntas con instrucciones relativamente largas obtendrán más respuestas “no sabe”. Sobre todo, en preguntas de actitudes. En consecuencia, estarían desaconsejadas preguntas como, por ejemplo, Algunas personas opinan que el Gobierno no debería ceder a las presiones na cionalistas, otros dicen que es el momento de reformar la Constitución, ¿qué piensa us ted? Para Mangione (1998) dos reglas generales para la elaboración de preguntas son hacer preguntas claras y no ir más allá de lo que razonablemente se espera que la gen te recuerde. Sin duda, las preguntas largas exigen más, tanto del encuestado como del entre vistador, cuando el cuestionario se rellena mediante entrevista. Su capacidad para leer entera la pregunta, palabra a palabra, intentando mantener al mismo tiempo el in terés del entrevistado y que éste retenga el contenido completo de la pregunta. No obs tante, hay ocasiones en las cuales las preguntas largas pueden funcionar mejor que las cortas. Aunque Fowler (1998) desaconseja el uso de preguntas largas referidas al pasado, existe evidencia empírica que avala el empleo de preguntas largas para reducir los efectos de “deseabilidad social” y mejorar la evidencia del recuerdo de aconteci mientos del pasado. Bradbum, Sudman y colaboradores (1979) experimentaron con la longitud de la pre gunta en la medición de las conductas sensitivas mediante encuesta. Añadieron una fra se inicial a cada pregunta o una introducción larga a la pregunta. Por ejemplo,
Ocasionalmente, la gente bebe con el estómago vacío o beben un poco demasiado y se intoxican. El año pasado, ¿con qué frecuencia se intoxicó mientras bebía algún tipo de bebida alcohólica? La declaración de consumo de bebidas alcohólicas y de drogas fue mayor cuando la pregunta se introdujo con ese preámbulo. Lo mismo sucedió en preguntas referidas a conducta sexual. Posteriormente se verá que ésta es una estrategia para aumentar la de claración de conductas o actitudes no aprobadas socialmente.
En consonancia con Molenaar (1982), Sudman y Bradbum (1982:50-51) aceptan que las preguntas cortas son mejores cuando se indaga en actitudes. Por el contrario, las pre guntas largas se prefieren cuando se analizan conductas. Son tres las razones que esgrimen: a) Las preguntas más largas pueden utilizarse para proporcionar al encuestado ayudas a la memoria. Dar ejemplos en la pregunta puede estimular el recuerdo. Ayudar a recordar puede ser importante cuando se preguntan cuestiones delicadas (Lee, 1993: 77).
b) Las preguntas más largas llevan más tiempo para que el entrevistador las lea. Como resultado, al entrevistado se le da más tiempo para pensar, meditar su res puesta y, en general, cuanto más tiempo se le dé para pensar más recordará. Las preguntas más largas pueden mejorar la calidad de la respuesta forzando a los respondientes a implicarse en el procesamiento cognitivo más profundo (Groves, 1989: 497).
El tomar más tiempo para responder puede contribuir al recuerdo de in formación adicional. c) El encuestado puede interpretar la longitud de la pregunta como un indicador de su importancia. Le anima a prestarla mayor atención (Sudman y Brad burn, 1974,1983; Cannel y otros, 1981; Kalton y Schuman, 1982/2002). Cannel, Miller y Oksenberg (1981) efectuaron una serie de experimentos, en The Survey Research Center, en los que se analizan los errores de medición debidos a fallos de memoria y a deseabilidad social. En concreto, en algunos comprueban si es cierto que las preguntas más largas pueden, en alguna circunstancia, obtener respuestas más lar gas y, de esta forma, ser más válidas. Así, por ejemplo, se comparan dos formulaciones (corta y larga) de una misma pregunta: • Corta: ¿Qué problemas de salud ha tenido usted en el pasado? • Larga: La siguiente pregunta es sobre problemas de salud durante el último año. Esto es algo que preguntamos a todo el mundo en la encuesta. ¿Qué problemas de
salud ha tenido usted el año pasado? Obtuvieron un mayor número de acontecimientos de salud recordados e informa dos con el formato de pregunta largo que con el corto.
Esto viene a corroborar los hallazgos anteriores de Sudman y Bradburn (1974) de que una introducción a la pregunta, aunque alargue su longitud y aumente la dificul tad en su retención, favorece la información de hechos referidos al pasado y de con ductas sensitivas o delicadas. A este respecto, Kalton y Schuman (1982/2002: 15) puntualizan que El consejo usual de “mantén las preguntas cortas” es probablemente una forma ina decuada de decir “mantén las preguntas sencillas”; en la práctica, las dificultades de las preguntas largas probablemente derivan de su complejidad más que de la longitud por sí misma.
No obstante, adviértase que el uso continuado de preguntas largas, en un mismo cuestionario, puede aumentar el cansancio o fatiga del encuestado. Ello revierte ne gativamente en la calidad de sus respuestas en las últimas preguntas del cuestionario. Por tanto, en la mesura está el acierto. El reservar las preguntas largas exclusivamente para cuando sea necesario, en el tratamiento de determinados temas (delicados o ín
timo-personales, del pasado). Lo que tampoco puede hacerse, para reducir la exten sión de la pregunta, es acudir a abreviaturas (como IPC, índice de precio al consumo; o PIB, producto interior bruto), a menos que sea de uso muy extendido. Emplear un vocabulario sencillo, evitando conceptos o términos abstractos Máxime en encuestas dirigidas a personas mayores o con problemas de lenguaje. Las preguntas complejas o difíciles de entender suelen obtener un mayor porcentaje de no respuesta de ítem (no saben/no contestan). Por otra parte, Dillon (1990) advierte que las respuestas “fáciles” no son necesariamente respuestas “fiables”. En el diseño de la encuesta, antes de comenzar a confeccionar el cuestionario, ha de concretarse la población a la que se piensa sondear. Es bueno conocer su nivel de conocimientos, su dominio del lenguaje. La elección de las palabras que compondrán la pregunta ha de estar supeditada a las peculiaridades de la población. Como regla, de ben utilizarse palabras que sean comprendidas por los miembros de menor nivel educativo de la población. Términos aparentemente sencillos, como “proporción”, pueden ser erróneamente interpretados por algunos segmentos de población. Así lo constata Belson (1981:240) con la siguiente pregunta:
¿Qué proporción del tiempo que ve la televisión lo dedica a ver programas de noticias? Sólo 14 de las 53 personas entrevistadas interpretaron correctamente la palabra “proporción” como porcentaje, parte o fracción. El resto lo interpretó como “cuánto tiempo” o “qué programas de noticias ve”.
Es preferible incluir palabras familiares, que se empleen con frecuencia. “Las pa labras familiares son las más útiles, si no tienen demasiados significados en el contexto” (Payne, 1980: 235). Para asegurarse de su familiaridad, este autor recomienda comprobar. en un diccionario, si la palabra elegida en realidad tiene el significado que se busca en ella. Además, es bueno consultar qué otros significados puede tener y que puedan confundir al encuestado sobre el sentido de la pregunta. Han de evitarse palabras ambiguas, que carezcan de un significado uniforme, al igual que expresiones que puedan inducir a error. Esta recomendación adquiere ma yor relevancia, cuando el cuestionario es rellenado por el mismo encuestado, sin la me diación de un entrevistador, que pueda aclarar el significado de la pregunta y de las res puestas (si se ofrecen y ha de elegirse entre ellas). Se desaconseja el uso de palabras habituales en el argot de los sociólogos, como proporción, socialización, alineación, interacción social. No son plenamente com prendidas por la generalidad de los individuos (Newell, 1993). Igualmente, se ha de ser precavido en el uso de términos como trabajador, mayor, joven, progresista, mucho, con bastante frecuencia, usualmente, barato. Su acepción puede variar dependiendo de a quién se pregunte, dificultando la interpretación de la respuesta. Para evitar su distinta
interpretación, puede seguirse la recomendación, expresada por Fowler (1998), de no utilizar escalas con adjetivos, en la medición de estados subjetivos (actitudes, opinio nes, valores), en estudios internacionales o que incluyan a poblaciones de culturas di versas. En estos casos, se propone el empleo de escalas numéricas para garantizar la comparabilidad de las respuestas. Ha de procurarse que tanto las preguntas como las respuestas (en caso de pre guntas cerradas) estén*redactadas en un lenguaje sencillo, fácilmente comprendido por el ciudadano de a pie. Por ejemplo, en la siguiente pregunta sobre salud: En el último mes, ¿alguien de su familia ha sufrido de cefalea intensa?; es preferible cambiar el término usual en el argot médico de “cefalea” por “fuertes dolores de cabeza”, al ser éste de más fácil comprensión por el conjunto de la población. Asimismo, en encuestas dirigidas a poblaciones de distinta procedencia cultural o idioma, es importante asegurarse que la traducción a otro idioma (expresa en el cuestionario) no cambie el significado de la pregunta. En caso contrario, no podrían compararse las respuestas, como sucedió en algunas de las preguntas incluidas en el Eurobarómetro 53, del año 2000, que presentaron sesgos culturales (diferencias de in terpretación), como se indica en el apartado 6.4. Una vez redactada la pregunta, es conveniente ponerse en el lugar de la persona de menor nivel educativo a la que se piensa encuestar y preguntarse: “¿Cómo res pondería yo a la pregunta, si fuese preguntado?”. Después, en el pretest o precom probación del cuestionario, antes de su lanzamiento definitivo, tendrá el investigador oportunidad de comprobar si realmente la pregunta es entendida por la población a la que se dirige. Fijándose en los problemas surgidos en su administración y en la pro porción de personas que optan por no contestarla (los “no saben/no contestan”). Pa ra ello es exigido que el pretest del cuestionario se haga en personas que se ajusten a toda la variedad de la población que finalmente va a ser sondeada (apartado 4.5). La redacción de la pregunta ha de ser precisa Cuantos más detalles se aporten en la pregunta, más se contribuye a su precisión, a la especificación de lo que se pregunta y a su interpretación. Palabras sencillas y fami liares, para el conjunto de la población, pueden tener, no obstante, significados diferentes. Lohr (2000) lo ilustra con una palabra tan sencilla como auto. La pregunta ¿Posee usted un auto?, puede suscitar diferentes interpretaciones, a menos que se aclare lo que quiere decirse con los términos auto y posee. Ha de evitarse que suijan preguntas como: ¿Cuenta como propiedad un vehículo aún no pagado en su totalidad?, o ¿puede con siderarse una furgoneta o una camioneta un auto?
De acuerdo con Kalton y Schuman (1982/2002), el punto de partida al elaborar una pregunta es hacer una definición precisa del hecho a recoger. Cambios aparente
mente marginales en la definición pueden tener efectos profundos en los resultados de la encuesta. Incluso hechos aparentemente sencillos, como el número de habitaciones ocupadas en una vivienda, pueden tener problemas de definición: ¿Ha de incluirse la cocina, si sólo se utiliza para cocinar?; ¿se incluyen los baños, aseos, el hall?; ¿una ha bitación dividida por un biombo o una cortina es una o dos habitaciones? Para evitar errores de especificación en la pregunta, su interpretación errónea, es conveniente añadir alguna especificación que concrete el sentido de lo que se pregunta. Por ejemplo, Aproximadamente, ¿cuánto dinero se gastó usted en las pasadas Navidades? (Inclúyase el dinero gastado en todo tipo de conceptos: alimentación, transporte, viajes, com pras de regalos, lotería y demás.) La pregunta ha de ser lo más objetiva o neutra posible para no influir en la respuesta Aunque algunos autores, como Hox (1997: 53), consideren que “en el contexto de la medición en encuestas, no existe ninguna pregunta de encuesta puramente objetiva”, ha de perseguirse la “objetividad”. Éste es un requisito de calidad de la pregunta. Una “buena” pregunta es, entre otras cosas, aquella que no afecta a la respuesta (Payne, 1980: 72).
De la pregunta se demanda que sea consonante con los objetivos de la encuesta y que esté redactada de forma que no invite a una determinada respuesta. En conse cuencia, ha de evitarse la práctica deliberada, por parte de algunos investigadores, de formular preguntas tendenciosas, que permitan corroborar sus hipótesis de partida, al incitar a una respuesta concreta. Preguntas como, por ejemplo, ¿No pegará usted a sus hijos, verdad?, además de in citar a una respuesta negativa, no aportaría una información “creíble”. Lo mismo puede decirse de preguntas cerradas, que fuercen a los encuestados a elegir entre pocas opciones de respuesta, no cubriendo todo el abanico de alternativas posibles.
La pregunta ha de ser equilibrada, en consideraciones positivas y negativas, si quie ren evitarse sesgos como el de aquiescencia (o tendencia al acuerdo, indistintamente del contenido de la pregunta). Especificar sólo una alternativa de respuesta es una forma de cargar la pregunta (Sheatsley, 1983: 214).
Sea el caso, por ejemplo, de las preguntas siguientes: • Recientemente se ha propuesto incrementar el gasto sanitario para dar asistencia mé
dica a todos los colectivos de inmigrantes. ¿Le parece a usted una buena propuesta?
Es más probable que esta pregunta capte un estado de opinión más favora ble a dicha propuesta que cuando, en el enunciado de la pregunta, se añade: Le
parece a usted ésta una buena o una mala propuesta? • ¿Está usted a favor de la pena de muerte para personas condenadas por terrorismo? Sería mejor proporcionar un equilibrio formal en la pregunta del tipo: ¿Está us
ted a favor o en contra de la pena de muerte para personas condenadas por terrorisma? • Lo mismo puede decirse de la pregunta ¿Cree usted que la actual política exterior del Gobierno es positiva? Suscitará más respuestas favorables a la actuación gubernamental que cuando en el enunciado de la pregunta se añaden los térmi nos: “excelente, buena, regular, deficiente, mala”. La consecución de preguntas objetivas o neutrales parece más difícil de alcanzar en las preguntas referidas a aspectos subjetivos. Como Schuman y Presser (1996:179) se ñalan, Ninguna pregunta de actitud puede ser completamente neutral, ya que el mero he cho de indagar sobre ella puede agudizar la definición de ella como un “asunto”.
De todas formas, si va a formularse una pregunta cerrada (que incluye las distin tas opciones de respuesta), debe procurarse que su enunciado incluya las diferentes al ternativas de respuesta entre las cuales el encuestado ha de elegir una o varias. Nun ca debe presentarse una única vertiente del tema, ya sea positiva o negativa, y preguntar por su opinión. Sobre todo conociendo de la predisposición de algunas per sonas a manifestarse “de acuerdo” con cualquier proposición plausible que se le ofrezca (sesgo de aquiescencia), a menos que se den otras alternativas de respuesta. El investigador debe formular las preguntas para dar igual énfasis a todas las al ternativas; para legitimar todas las variedades de opinión; para hacer que el encuestado estime que cualquier respuesta que escoja sea tan aceptable como cualquier otra (Orenstein y Phillips, 1978: 219).
Molenaar (1982: 66) advierte, no obstante, que “añadir un argumento ‘pro’ a una de las alternativas en una pregunta obtendrá más elecciones para esa alternativa; añadir un argumento a la otra alternativa necesariamente no hace ambas alternativas de igual peso”. En el mismo sentido, ha de insistirse en la recomendación de evitar que expresiones como “la mayoría de la gente opina que...”; o la referencia a la opinión expresa de una autoridad (la Iglesia, el Gobierno, los expertos) antecedan a una pregunta. Excepto que se opte, deliberadamente, por esta fórmula como estrategia para aumentar la proba bilidad de informar de conductas ilícitas o socialmente censurables, como después se verá. Estas introducciones a la pregunta tienen el efecto de “cargar” la pregunta, ses gando la respuesta, al influir en la misma. Como sucede con la pregunta:
Muchos expertos creen que la actuación del Gobierno en el control de la delin cuencia es equivocada, pero otra gente opina que es acertada. ¿Cuál es su opinión? Aunque todos estamos familiarizados con preguntas cargadas, diseñadas para mostrar que el público apoya a un candidato político particular o causa o producto co mercial, el profesional de la investigación respetable hará todo el esfuerzo para evitar influir en los respondientes y permitir la igual expresión de todos los puntos de vista. Es to no siempre es fácil, sin embargo, ya que todos operamos sobre la base de supuestos inconscientes y sesgos que podemos compartir con nuestros conocidos, pero que son bas tante inaceptables para otros segmentos del público (Sheatsley, 1983:215).
Para evitar la inclusión de sesgos en la pregunta, sería conveniente discutir su re dacción con personas que compartan otros puntos de vista (con “abogados del diablo”). Ello contribuye al enriquecimiento de la pregunta. No redactar preguntas en forma negativa La comprensión de la pregunta se dificulta con su redacción en negativa. Sirva de ilustración una encuesta realizada por Ropper en 1993 y destacada por Lohr (2000). En ella se obtuvo un resultado sorprendente: el 25% de los norteamericanos en cuestados “no creían” que el Holocausto realmente hubiese ocurrido. Cuando se eliminó de la pregunta la palabra “no” tan sólo un 1% de los sondeados opinaba que “posi blemente el exterminio hacia los judíos (el Holocausto) nunca ocurrió”.
La formulación negativa de una pregunta suele comprenderse peor que su co rrespondiente enunciado en positivo. De manera especial, cuando se pide al encues tado que manifieste su grado de acuerdo o desacuerdo ante determinadas cuestiones. Por ejemplo, en vez de la pregunta ¿No debería castigarse a los estudiantes que sus penden?, es preferible A los estudiantes que suspenden, ¿debería castigárseles? Este último enunciado clarifica el significado de una respuesta negativa. Igualmente, en la pre gunta ¿Está usted de acuerdo o en desacuerdo en que el Gobierno no debería inhibirse en el conflicto de Irak?, habría que eliminar la palabra “no” para facilitar la comprensión e interpretación de la pregunta. En caso de preferir la redacción negativa de la pregunta (por ejemplo, ¿Preferiría us ted que sus hijos no llegasen tarde a casa?), es conveniente subrayar la palabra “no” para llamar la atención sobre ella y que el encuestado se percate del sentido de la pregunta. Redactar preguntas deforma personal y directa Se prefiere lo concreto a lo abstracto. Por ejemplo, ¿Qué sentiría usted si tuviese un accidente de tráfico? Se obtendría ma yor información con una redacción más directa y personal: ¿Ha tenido usted, alguna vez, un accidente de tráfico? Si es así, ¿qué sintió?
En experimentos actitudinales, informados por Molenaar (1982), se cambió la típica pregunta referida a la política gubernamental: “¿Está usted de acuerdo con...?”, por una pregunta más personalizada: “¿Votaría usted por....?”. Con esta modificación de la pre gunta se consiguió de un 4 a un 12% más de acuerdo con la política propuesta. Asimismo, en The National Crime Survey de Estados Unidos, en vez de la pregunta genérica ¿Alguien le atacó a usted en los últimos seis meses?; se plantean una serie de pre guntas específicas, que detallan la forma en que alguien puede ser atacado, captando una mayor información (Lohr, 2000):
¿Alguien le ha atacado o amenazado en alguna de estas formas?: • Con algún arma, por ejemplo, una pistola, un cuchillo. • Con algo como un bate de béisbol, una sartén, un palo, etc.
En general, las preguntas específicas suelen proporcionar una información más precisa que las preguntas genéricas. Estas últimas, por el contrario, pueden provocar una mayor va riedad de interpretaciones. Por esta razón Converse y Presser (1994) aconsejan restringir su uso a aquellas circunstancias en que interese la obtención de una medida global. Igualmente, cuando se analicen conductas que precisen una especificación temporal o numérica, se recomienda proporcionar categorías de respuesta específicas. Las ex presiones “con frecuencia”, “regularmente”, son vagas y ambiguas. Habría que evi tarlas. En su lugar son preferibles opciones de respuesta concretas. Como, por ejemplo, “diariamente”, “2-3 veces por semana”, “una vez a la semana”, “dos veces al mes”. Ni las preguntas ni las alternativas de respuesta pueden referirse a varias cuestiones al mismo tiempo Se defiende el principio de la idea única. Preguntas como ¿Cree usted que la sociedad actual es egoísta e insolidaria?, no son adecuadas. No ayudan a una interpretación correcta de la respuesta. No puede separarse la doble mención de la pregunta. Lo mismo cabe decir de la pregunta: En las últimas Navidades, ¿cenó usted con su familia y se divirtió? Puede que la respuesta a la primera parte de la pregunta sea afir mativa, pero la correspondiente a la segunda parte negativa. La pregunta comprende dos cuestiones diferentes, por lo que sería mejor transformarla en dos preguntas distintas co mo, por ejemplo, P ll. En las últimas Navidades, ¿cenó usted con su familia? — Sí 1 No 2
->■ P ll A. ¿Se divirtió? Sí 1 No 2
Lo mismo cabe decir de las opciones de respuesta de una pregunta cerrada. Éstas tampoco deberían contener dos o más ideas afines en una misma categoría de res puesta. Así, por ejemplo, se considera inapropiada la siguiente pregunta, incluida en el cues tionario de CIRES/ASEP en la medición de las actitudes ante la inmigración. En ella se pide a los encuestados que seleccionen la afirmación, de las dos siguientes, con la que se sienten más de acuerdo con el tipo de inmigración: • Que los inmigrantes vengan a España con sus familiares y se asienten para siem
pre. • Que los inmigrantes vengan una temporada sin sus familiares y que luego regresen
a su país. Así expresas, ambas opciones de respuesta incluyen dos cuestiones a la vez. Una, el carácter familiar e individual de la inmigración. Dos, su carácter definitivo o temporal. Ello dificulta la interpretación de las respuestas. Además, se fuerza a los encuestados a elegir entre dos opciones en las cuales puede compartir una parte, pero no la otra tam bién incluida. Sería mejor haber ampliado las opciones de respuesta para que cada una de ellas incluya una única idea referida al tipo de inmigración que se prefiere. No emplear palabras que comparten una reacción estereotipada Preguntas directas, como por ejemplo, ¿Se considera usted racista?, hay que conce derlas una validez limitada en la medición de racismo. En la sociedad contemporánea po cas personas manifiestan abiertamente que son “racistas”, por miedo a la desaprobación social. Habría que complementar esta pregunta con otras que logren ocultar su inten cionalidad, permitiendo captar la actitud latente (“real”) ante la inmigración. En las encuestas de actitudes ante la inmigración es práctica usual incluir pre guntas referidas a “distancia social”, como por ejemplo las siguientes dos preguntas in cluidas en las encuestas del CIS:
A usted lepreocuparía mucho, bastante, poco o nada que un hijo o una hija suya se casara con un ciudadano de Marruecos u otro país norteafricano? Hasta qué punto, mucho, bastante, poco o nada, le importaría a usted que sus hijos (si no los tiene, en caso de que los tuviera) compartieran en el colegio la misma clase con niños de familias inmigrantes extranjeras? En Cea D’Ancona (2002b, 2004b) se demuestra la escasa utilidad de estas preguntas en la medición de racismo, frente a preguntas relativas a derechos sociales, de ciudadanía y de política inmigratoria, que consiguen ocultar más la intencionalidad de la pregunta. Lo cual favorece la captación de conductas, actitudes u opiniones que suscitan desa
probación social. Además, no suele recomendarse el uso de palabras hipotéticas, como “¿Qué haría si...?” o “¿Le gustaría....?”.
Newell (1993) observa que lo que el encuestado dice que “podría hacer”, cuando se enfrenta a una situación concreta, no siempre expresa su conducta futura “real”. Existen preguntas que inevitablemente consiguen respuestas favorables (como, por ejemplo, ¿Le gustaría a usted tener mayores ingresos?), por su deseabilidad social. En cambio, otras obtienen respuestas desfavorables porque no son socialmente deseables. Si bien, el autor reconoce que la utilidad de las preguntas hipotéticas lo dicta el tema de estudio, i En el mismo sentido se manifiesta Sheatsley (1983), para quien preguntas como ¿Compraría este producto si estuviese disponible? o Si las elecciones se celebrasen hoy, ¿votaría al candidato A o al candidato B?, aunque puedan tener interés, son de es casa utilidad como predictores de conducta futura, debido a que las circunstancias cam bian. Frey (1989) recomienda evitar preguntas hipotéticas, que piden predicciones so bre el futuro (“¿Qué sucedería si....?”), por su escasa fiabilidad. Obtienen respuestas también “hipotéticas”. Además de evitar el empleo de palabras estereotipadas o con un significado pe yorativo, hay otras actuaciones dirigidas a reducir el sesgo de deseabilidad social. Recuérdese que la deseabilidad social supone un error de medición, cuando los en cuestados no admiten la tenencia de conductas, actitudes u opiniones que perciben co mo “socialmente indeseables”. El temor a ser rechazados, desaprobados socialmente, les lleva a dar respuestas “políticamente correctas” o socialmente deseables, pero que no se adecúan a su situación o sentir particular. Este tipo de error de medición se relaciona más con los métodos de encuesta me diante entrevista, como se vio en el capítulo 2. Su presencia se infiere cuando hay una sobre declaración (o declaración en exceso) de conductas, opiniones o actitudes va loradas positivamente en la sociedad analizada. Por el contrario, las negativamente va loradas apenas se declaran. Conductas socialmente deseables describen al buen ciudadano, a la persona culta y bien informada, y al individuo que cumple con sus responsabilidades morales y sociales. Estas conductas incluyen votar, leer, utilizar bibliotecas, ir a acontecimientos educativos y culturales, dar a la caridad, estar empleado e incluso ponerse el cinturón de seguridad mientras se conduce. Todas éstas están sobreinformadas. Por ejemplo, un tercio de los res pondientes que informaron dar a la caridad en realidad no lo dieron; un tercio más de su jetos informó haber votado y por el ganador, que en realidad votaron. Conductas socialmente indeseables describen la enfermedad y la incapacidad, la conducta ilegal o contra normativa. Estas describen padecer cáncer, enfermedades venéreas y mentales, delin cuencia, consumo de drogas y de alcohol, posesión de armas y actividad sexual. Todas és tas están subinformadas. También están subinformadas preguntas relativas a estatus fi nanciero, como la renta, el ahorro, activos financieros y bancarrota (Dillon, 1990:120).
En la reducción del sesgo de deseabilidad social pueden seguirse algunas o varias de las actuaciones resumidas en el cuadro 4.3 y que después se detallan.
1. Motivar al encuestado para que responda con sinceridad. 2. Ocultar la intencionalidad de la pregunta. 3. Preferir el formato de pregunta abierto al cerrado, las preguntas largas a las cortas o breves, y las escritas en un vocabulario familiar al encuestado más que el estándar. 4. Proporcionar respuestas flexibles (en preguntas cerradas) o atenuar la gravedad de la pregunta. 5. Aleatorizar las opciones de respuesta. 6. Dar mayor privacidad a la respuesta. 7. Cargar deliberadamente la pregunta: • • • • •
Todo el mundo lo hace. Asumir la conducta y preguntar por su frecuencia y otros detalles. Uso de la autoridad para justificar la conducta. Razones de por qué no. Escoger marcos de tiempo apropiados.
Motivar al encuestado para que responda con sinceridad En la introducción de la pregunta es bueno enfatizar la importancia de propor cionar una información “veraz”. Asimismo, Fowler (1998: 355) recomienda que se ex plique el propósito de la pregunta para que los encuestados “puedan ver por qué son apropiados”. Al mismo tiempo, es imprescindible transmitir garantías de confidencialidad y ano nimato de la información que se proporcione en la encuesta. Como Singer, Von Thurn y Miller (1995) demuestran, las garantías de confidencialidad reducen la no respuesta y aumenta la adecuación de las respuestas en temas sensitivos o delicados. En suma, se trata de garantizar a los encuestados que sus respuestas no se vincu larán a ellos, a una identidad concreta, sino que se analizarán en conjunto, anonimizándose. Por lo que no han de tener temor a declarar su nivel de renta “real”, porque no va a repercutir en una futura actuación fiscal, por ejemplo; o que un empresario omita la contratación de inmigrantes “ilegales” por miedo a actuaciones policiales fu turas. Ocultar la intencionalidad de la pregunta Aunque ésta sea una recomendación general, extensible a todo tipo de pregunta, en el tratamiento de cuestiones que puedan suscitar el sesgo de deseabilidad social ad quiere mayor relevancia. Siempre y cuando se desee obtener una respuesta que se ajus te a la realidad.
Por esta razón se prefieren indicadores indirectos, como los relativos a política in migratoria, por ejemplo, en la medición del concepto de racismo (Cea D’Ancona, 2002b, 2004b). En el contexto norteamericano, Hesselbart (1975) advirtió, con ante rioridad, que en preguntas “directas” las personas de mayor nivel educativo son menos propensas a asumir estereotipos raciales que en preguntas “indirectas”.
Preferir el formato de pregunta abierto al cerrado, las preguntas largas a las cortas o breves; y las escritas en un vocabulario familiar al encuestado más que el estándar Con estos formatos de pregunta, Bradburn, Sudman y colaboradores (1979) y, con posterioridad, Sudman y Bradburn (1982), lograron incrementar la declara ción de conductas sensitivas en algo más de un 30%. Schuman y Presser (1981) consiguieron incluso aumentar al doble la revelación de consumo de alcohol y otras conductas ilícitas.
Proporcionar respuestas flexibles (en preguntas cerradas) o atenuar la gravedad de la pregunta Ha de evitarse que el encuestado piense que su respuesta puede ser valorada ne gativamente. Una pregunta se considera “amenazante” no sólo cuando puede perci birse como una invasión a la intimidad personal. También, cuando se aprecia que exis te una respuesta “correcta” y otras “incorrectas”. Pudiendo ser aprobado o desaprobado socialmente, si se pronuncia por una u otra de las respuestas. El temor a la censura social puede llevarle a elegir la respuesta que atribuya mayor deseabilidad social o a no pronunciarse (es decir, no responder a la pregunta). Es habitual relacionar preguntas “amenazantes” con la obtención de un mayor porcentaje de no respuesta en la pregunta. En la última encuesta de actitudes ante la inmigración del CIS de 1996, por ejem plo, se obtuvo un mayor porcentaje de no respuesta (no sabe/no contesta) en las pre guntas referidas a ideología política (27,6%), ingresos (28,1%), seguidas de otras re lativas a los derechos de los trabajadores extranjeros (¿Considera usted que los derechos de los trabajadores que viven en España, deberían ampliarse, deberían dejar se como están o deberían reducirse? Un 28% de los 2.493 encuestados optó por no res ponder a la pregunta). Ante todo, hay que procurar que la pregunta no incomode al encuestado. Preguntas como ¿Alguna vez ha robado usted algo de un centro comercial? suelen provocar rechazo e incomodidad en el entrevistado. Podría mejor preguntarse ¿Alguno de sus amigos o conocidos acostumbra a sustraer algún producto de centros comerciales? Después, se for mularían preguntas indirectas, que permitan conocer si el encuestado también acos tumbra a dicha práctica.
Hay que procurar redactar la pregunta de forma que logre minimizar la probabi lidad de que los encuestados piensen que su respuesta puede ser valorada de forma ne gativa. Para ello es imprescindible que la pregunta y sus alternativas de respuesta (en preguntas cerradas) se redacten de la forma más objetiva o neutra posible, no intro duciendo ningún término que pueda llevar a deducir “desaprobación”. Todas las respuestas han de percibirse como igualmente aceptables. Cuando se estime necesa rio, puede optarse por solicitar una respuesta aproximada. Como sucede en preguntas habituales en las encuestas, como es la relativa a “ingresos”, que suele generar reti cencias por parte de los encuestados a declarar la cantidad exacta. De acuerdo con Groves y Kant (1979), las preguntas directas sobre renta son las que obtienen un mayor porcentaje de no respuesta. Por su parte, Hipler e Hipler (1986), tras analizar varias encuestas de ámbito nacional en Alemania del Oeste, obtienen que las preguntas abiertas sobre renta consiguen un mayor porcentaje de no respuesta que cuando la pregunta es cerrada. En esta cuestión, la pregunta abierta suele percibirse co mo más amenazante y ofensiva que la cerrada, aunque permita la obtención de re sultados más precisos y eviten problemas usualmente relacionados con las preguntas cerradas (como se verá en el subapartado 4.2.2). En estos casos se recomienda la redacción flexible de la pregunta. Por ejemplo, ¿Podría usted indicar; aproximadamente, cuál es la cuantía de sus ingresos mensuales? Y, preferiblemente, cerrada, preguntando por una cantidad aproximada dentro de unos intervalos específicos, como hace el CIS, en la encuesta de actitudes ante la inmigra ción de 1996 (estudio n.° 2.214). En su cuestionario, ésta es la última pregunta (P. 52) y aparece con el siguiente enunciado: P. 52 Actualmente, entre todos los miembros del hogar (incluido el entrevistado) y por todos los conceptos, ¿de cuántos ingresos netos disponen por término medio en su hogar al mes? No le pido que me indique la cantidad exacta, sino que me señale en esta tarjeta en qué tramo de la escala están comprendidos los ingresos de su hogar. (MOSTRAR TARJETA DE INGRESOS) Menos de 50.000 ptas........................... De 50.001 a 100.000 ptas...................... De 100.001 a 150.000 ptas.................... De 150.001 a 200.000 ptas.................... De 200.001 a 300.000 ptas.................... De 300.001 a 400.000 ptas.................... De 400.001 a 500.000 ptas.................... De 500.001 a 750.000 ptas.................... De 750.001 a 1 millón de ptas............... Más de 1 millón de ptas....................... N.C......................................................
01 02 03 04 05 06 07 08 09 10 99
(172)(173)
Adviértase en esta pregunta la mayor concreción de la variable renta para evitar errores de especificación: “entre todos los miembros del hogar (incluido el entrevistado) y por todos los conceptos”.
Ésta es una práctica posible en encuesta mediante entrevista, no en las autoadministradas. Con ella se quiere reducir el temor a revelar conductas, opiniones o ac titudes que pudieran tener desaprobación social. Esta técnica, conocida como RR T (Randomized Response Technique), fue origi nariamente propuesta por S. L. Warner en 1965 (en “Randomized response: a survey technique for eliminating evasive answer bias”. Journal o f American Statistical Association, 60: 63-69). Su denominación introduce, no obstante, una cierta confusión. Es la “pregunta” más que la “respuesta” lo que, en realidad, se aleatoriza. Consiste en ofrecer al encuestado al menos dos preguntas (pueden ser tres o inclusive más), una considerada “amenazante” (por ejemplo, conducir sin el cinturón de seguridad, sustraer productos de un centro comercial) y otras “no amenazantes” (la compra de un producto o la práctica de una determinada actividad deportiva). La condición es que las preguntas elegidas se respondan de la misma forma. Lo usual, con respuestas dicotómicas, tipo “sí”, “no”. El encuestado elige cuál de las dos preguntas (o más) responde, me diante un procedimiento aleatorio, como puede ser tirar una moneda al aire, arrojar un dado. Por ejemplo, si obtiene, tras lanzar una moneda al aire, “cara”, responderá la pri mera pregunta, mientras que si es “cruz”, la pregunta será la segunda. Como las opciones de respuesta a ambas preguntas son las mismas, el entrevistado puede responder “sí” o “no”, sin que el entrevistador sepa realmente qué pregunta está siendo contestada. De es ta forma se quiere transmitir al entrevistado la sensación de mayor privacidad en su res puesta, esperando que ello posibilite una mayor sinceridad en su contestación. Locander, Sudman y Bradburn (1976) consiguieron una mayor declaración de conductas socialmente indeseables, como el consumo de bebidas alcohólicas o estar arruinado, haciendo uso de esta técnica. Al igual que Zdep y Rhodes (1976), en su en cuesta sobre consumo de marihuana; o Bradburn, Sudman y colaboradores (1979). Si bien, estos últimos investigadores precisan que esta técnica muestra mayor adecuación en conductas que no sean muy “amenazantes”. Tras entrevistar a una muestra aleato ria de 200 personas, que habían sido arrestadas, en Illinois (Chicago), por conducir be bidas y a 200 que habían declarado bancarrota, mediante cuatro métodos de encuesta (entrevista cara a cara, telefónica, utilizando RTT y encuesta autoadministrada), con siguen una mayor admisión de conducta indeseable, como haberse arrumado, con RTT . Pero no en la conducta más amenazante: conducir bebidos. Ésta fue escasa mente revelada en cualquiera de los cuatro métodos de encuesta que se aplicaron.
El inconveniente principal de esta técnica es la dificultad de identificar la respuesta con la persona que la emite. Lo cual entorpece la realización de análisis explicativos de determinadas conductas. Dar mayor privacidad a la respuesta Se prefiere la encuesta autoadministrada a la aplicada mediante entrevista y, en las encuestas cara a cara, el uso de hojas de respuesta autorrellenadas. La autocumpli-
mentación del cuestionario, en su totalidad o en parte, contribuye a transmitir la sensación de mayor anonimato y confidencialidad en la respuesta. Un requisito ne cesario para la obtención de respuestas más “sinceras”. En un estudio llevado a cabo por Jobe y colaboradores (1997), sobre preguntas sen sitivas en encuestas de fertilidad, en colaboración con NCHS (The National Center for Heath Statistics de Estados Unidos, que desde 1973 realiza la National Survey of Family Growth: NSFG) y con NORC (The National Opinion Research Center), se consiguió una mayor declaración de promiscuidad sexual, de padecer enfermedades de transmi sión sexual y el uso de preservativos, en encuestas autoadministradas. De un 19 a un 37% más que cuando la encuesta se hacía mediante entrevista. Por otra parte, en el estudio comparativo de Kormendi (1988) se muestra la mayor inadecuación de la encuesta telefónica en la indagación de cuestiones como la renta eco nómica. Un mayor porcentaje de no respuesta se obtuvo en la pregunta referida a la ren ta, en la entrevista telefónica que en la cara a cara. En ambos métodos, aquellos que no respondieron a esta pregunta mostraron ser, precisamente, los de menor renta.
En el capítulo 2 se hace referencia a otros estudios que corroboran la mayor adecuación de la encuesta autoadministrada, seguida de la encuesta cara a cara, con o sin hojas de respuesta, como los métodos más idóneos para tratar temas delicados o es pecialmente sensitivos, en contra de la encuesta telefónica. A las razones entonces da das, añádase una consideración también importante. La entrevista cara a cara permi te controlar la presencia de otras personas en el transcurso de la entrevista, que pueden contribuir a sesgar las respuestas de los entrevistados. El control de la posible influencia de “otros” no se consigue en los demás métodos de encuesta (telefónica y autoadministrada). Lo que puede favorecer la obtención de una respuesta menos “sesgada” en la encuesta cara a cara. Pero, siempre y cuando se sigan, en su práctica, las recomendaciones dadas en el capítulo 2. “Cargar” deliberadamente la pregunta Como sucede con otras reglas (antes expuestas) referidas a la formulación de la pregunta, el propósito de la pregunta puede llevar a contradecir alguna de las reco mendaciones precedentes. Sea el caso de la enunciada en quinto lugar, la referida a “no cargar” la pregunta para garantizar su neutralidad y objetividad. En el tratamiento de temas delicados o sensitivos puede optarse por lo contrario: “cargar la pregunta”. Al menos ésta es una estrategia aconsejada por Sudman y Bradbum (1987) para aumentar la probabilidad de informar conductas socialmente no deseables. Con ella se quiere conseguir una información más “veraz” o “creíble”. En especial, cuando se parte del supuesto de que algunas personas pueden decidir no desvelar conductas, actitudes u opiniones porque creen que se desvían de lo socialmente deseable. Este proceder fue primeramente aplicado por Alfred Kinsey, C. Wardell, B. Pomero y C. E. Martin, en su famoso estudio sobre la conducta sexual masculina, publicado en
1948 (Sexual behavior in the human male. Saunders. Philadelphia). Primero, obtuvieron que pocos entrevistados admitían, en una pregunta abierta, la práctica de la masturba ción, que ellos presumían que era más generalizada de lo declarado. Con la finalidad de conseguir una mayor revelación, decidieron “cargar” la pregunta, siguiendo la estrategia de asumir la conducta y preguntar detalles sobre la misma. Por ejemplo, ¿Cuántos años
tenía usted la primera vez que se masturbó? Esta pregynta se considera que está “cargada” porque asume que los entrevis tados tienen alguna experiencia de masturbación. Además, indirectamente se informa a los entrevistados que la práctica de la masturbación es “común” y no deben sentirse culpables si la practican. Para sorpresa de los autores, la mayoría de los entrevistados respondió afirmativamente la pregunta. Es decir, reconoció la práctica de la mas turbación. Junto a ésta, hay otras formas de “cargar” la pregunta. Sudman y Bradburn (1987) las resumen en cinco principales: a) Todo el mundo lo hace. Introducir la pregunta con una frase que exprese que se trata de una conducta común o frecuente, con el propósito de reducir la ame naza de su revelación. Por ejemplo, Incluso los padres más tranquilos alguna vez se enfadan con sus hijos. En la última semana, ¿han hecho sus hijos algo que le enfadara? Calvo Buezas (2000) hace uso de esta estrategia en su medición de racismo, en una encuesta a 6.000 alumnos de primaria y bachillerato, cuando pregunta: P.ll TODOS TENEMOS NUESTROS GUSTOS PERSONALES Y NUESTROS RECELOS. CON ALGUNAS PERSONAS NOS MOLESTARÍA CASAR NOS. ¿Te molestaría casarte con uno/a persona de los siguientes grupos? (Sí o No): moros/árabes, gitanos, judíos, portugueses, negros de África, latinoamericanos, españoles, norteamericanos, europeos, asiáticos, negros de Latinoamérica, indios
)lancos.
Adviértase la importancia que se concede a las frases introductorias, al ha berse destacado escribiéndolas, en el cuestionario original, en mayúsculas. Esta técnica Sudman y Bradburn (1982) la desaconsejan en tópicos de amenaza moderada. b) Asumir la conducta y preguntar por su frecuencia y otros detalles. Por ejemplo, ¿Cuántos cigarrillos fuma usted al día?, puede resultar menos estig matizante que la pregunta: ¿Es ustedfumador? Como así lo demostró el estudio de Kinsey y colaboradores, antes referido, en el tratamiento de la masturbación. Sudman y Bradburn (1987) detectan un inconveniente importante en este tipo de pregunta. Los encuestados que no realicen las actividades sobre las que
se pregunta podrían incomodarse, ante el supuesto de que sí las practiquen. Es to repercutirá, negativamente, en su cooperación posterior. c) Uso de la autoridad para justificar la conducta. Los encuestados pueden reac cionar de forma más favorable a una aseveración, si se atribuye a alguien a quien respetan o sienten simpatía. Por ejemplo, Varios estudios científicos actuales avalan que beber vino reduce la probabilidad de sufrir un infarto y favorece la digestión. ¿Bebe usted vino durante las comidas?. ¿Con qué frecuencia? (Preguntas a las que siguen otras referidas al consumo de bebidas al cohólicas.) d) Razones de por qué no. Cuando a los encuestados se les dan razones que jus tifiquen la no comisión de conductas socialmente deseables (como votar en los comicios electorales, lectura de prensa diaria, ponerse el cinturón de seguridad), se reduce su predisposición a no informarles. Por ejemplo, Muchos conductores afirman que llevar puesto el cinturón de seguridad es incómo do y dificulta el acceso a los mandos del coche. Pensando en la última vez que usted se montó en un coche, ¿se puso el cinturón de seguridad? e) Escoger marcos de tiempo apropiados. Para conductas socialmente no deseables es preferible comenzar con una pregunta como, por ejemplo, ¿Alguna vez ha cruzado usted un semáforo en rojo? En cambio, si se trata de una conducta so cialmente deseable (leer la prensa, votar en las elecciones), es preferible omi tir la expresión “alguna vez”. Al encuestado le puede molestar que se dude de que realiza conductas que tienen aprobación social. En vez de preguntar: ¿Alguna vez se ha puesto usted el cinturón de seguri dad?, es preferible: Pensando en la última vez que usted se subió en un coche. ¿Se puso usted el cinturón de seguridad? Sheatsley (1983) defiende la conveniencia de “cargar” la pregunta, incluso cuan do se trata de cuestiones que pueden considerarse “normales”. Sea el caso de: • Estudios cursados. Una pregunta, como por ejemplo, ¿Cuál fue el último curso que
completó en el colegio?, puede ayudar a evitar que se exagere el nivel educativo. Se facilita al encuestado la admisión de que dejó la escuela a una edad temprana. • Atención sanitaria. Porque mucha gente es reacia (al menos en Estados Unidos) a criticar la atención médica dispensada. En vez de preguntar si se está o no sa tisfecho con la atención médica recibida, se considera preferible preguntar: ¿Está usted enteramente satisfecho con el cuidado médico que recibe o existe alguna cosa con la que no esté enteramente satisfecho?
Éstas son las recomendaciones más corroboradas empíricamente, que pueden ayu dar en la declaración de conductas, actitudes, opiniones “ilícitas” o socialmente de saprobadas. Si bien, hay autores, como Phillips y Clancy (1972/2002), que manifiestan su escepticismo con el control de esta variedad de error de medición. Otra cuestión que ha recibido tratamiento específico, por su efecto en el error de medición, son las preguntas referidas al pasado. A este respecto, en general se reco mienda evitar, en el cuestionario, preguntas que obliguen a realizar cálculos mentales o recurrir, con frecuencia, a la memoria. La razón es que este tipo de preguntas ponen en juego la fiabilidad de las respuestas e, incluso, la posibilidad de que el sujeto las con teste. Suelen ser más difíciles de responder de una forma precisa. En especial, cuando la cuestión sobre la que se pregunta es para el encuestado trivial o inusual. No tienen la trascendencia necesaria que garantice su retención en la memoria. Sin duda, en su capacidad de recuerdo incide: a) La relevancia o saliencia del tema para el encuestado. Como la memoria es se lectiva, es más probable que se recuerden los eventos que tuvieron especial re percusión en la vida del encuestado, aunque sucedieran hace un largo período de tiempo, que aquellos considerados “triviales”. b) El tiempo transcurrido desde su ocurrencia. Obviamente, es más fácil recordar acontecimientos próximos en el pasado (ayer, hace dos días, la semana pasada) que los lejanos. Sobre todo, si fueron inusitados y de escasa trascendencia para el encuestado. c) El detalle de la información que se solicite. Esto juega en contra de aconteci mientos triviales y aquellos que ocurrieron hace tiempo. Las preguntas que requieren mayores detalles de los que los encuestados sean ca paces de proporcionar suscitarán respuestas menos fiables y también reducirán la coo peración del encuestado (DeLamater, 1982:41).
Por esta razón se aconseja reducir la cantidad de detalle pedido en la res puesta, cuando se trate de acontecimientos de escasa relevancia para el en cuestado y sea amplio el período de tiempo transcurrido. d) La motivación del encuestado en responder. Su éxito en recordar la información que se le solicita depende de la facilidad del re cuerdo y del esfuerzo que se le persuada que haga (Kalton y Schuman, 1982/2002: 216).
Habitualmente, participar en una encuesta es de escasa relevancia para el enquestado. Más bien, se le aborda en un momento concreto y se le requiere para res ponder, con premura, a una serie de preguntas. Salvo que la encuesta sea por correo, pudiéndose rellenar el cuestionario cuando se quiera y en el tiempo que se estime ne cesario. Si el tema de la encuesta no es de su interés, lo más probable es que se quiera concluir el cuestionario cuanto antes, concediendo escaso tiempo a meditar las respuestas.
Se han propuesto una serie de actuaciones que pueden facilitar la actuación del en cuestado y contribuir a la reducción del error de medición, debido a fallos en la me moria. Entre ellas las más referenciadas son: a) Anteceder la pregunta con una introducción que indique la importancia de res ponder la pregunta, referida al pasado, con precisión. Anteriormente, ya se in dicó que las preguntas largas son recomendadas, no sólo en el tratamiento de temas sensitivos, sino también en los referidos al pasado. Ayudan en la contextualización de la pregunta y pueden estimular el recuerdo. b) Proporcionar un marco temporal adecuado a la relevancia del tema. Para evitar obtener respuestas poco fiables, aproximar en el tiempo las preguntas referidas a eventos de escasa notoriedad (compras de alimentos, programas de televisión vistos, desplazamientos urbanos). Por el contrario, en aquellos de mayor tras cendencia (compra de una vivienda, de un vehículo, viajes al extranjero, hos pitalizaciones, defunciones), lo usual es espaciarlo más. Puede superarse in clusive el año. También debido a su escasa cotidianidad, su limitada frecuencia. Fowler (1998) observa que en cuestiones de escaso impacto, como las re feridas a consumo diario, un período de tiempo corto, como veinticuatro horas, puede incluso generar error de medición, debido a un fallo en el recuerdo. Ade más, es habitual que, cuando se solicite información referida a la semana pasada o hace dos semanas, se tienda a dar estimaciones promedio o típicas, más que intentar recordar. Por esta razón, cuanto más proximidad tenga en el tiempo, mejor. Para Converse y Presser (1994), las preguntas de “promedio” (por término medio) o las concernientes a un día típico, suelen resultar más útiles que cues tiones relativas a un día concreto. Para ayudar al recuerdo, estos autores tam bién aconsejan: • Estrechar el período de referencia al pasado más inmediato (como la
última semana o ayer). Por ejemplo. La semana pasada, ¿realizó usted al gún ejercicio físico? En caso afirmativo, ¿Qué tiempo dedicó? • Tomar como referencia acontecimientos o fechas importantes del calen dario, para datar acontecimientos de la vida personal. Por ejemplo, Desde su último cumpleaños, ¿ha recibido usted algún regalo? • Preguntar por acontecimientos que han sucedido en los últimos seis meses. Después, puede incluso remontarse “más allá”. No obstante, ha de insistirse en que esta estrategia de distanciamiento progresivo en el tiem po sólo se aconseja en eventos de cierta notoriedad para el encuestado. Fowler (1998) propone un procedimiento sencillo para mejorar la capa cidad de que los encuestados ubiquen acontecimientos en el pasado: mos trarles un calendario con el período de tiempo (sobre el que se pregunta) su brayado.
c) El uso de “procedimientos de ayuda al recuerdo” (Sudman y Bradburn, 1987). Consiste en proporcionar una o más “señales de memoria” como parte de la pregunta. Puede consistir en: • Proponer ejemplos en la pregunta. Por ejemplo, ¿A qué organizaciones
pertenece usted? (por ejemplo, religiosas, sindicales, gubernamentales, de caridacf, etc.). • Mostrarles una tarjeta, que contenga el listado de respuestas, en encues tas cara a cara. En las autoadministradas, la persona puede leer todo el cuestionario antes de responder. El listado ha de ser lo más exhaustivo posible, incluyendo las distintas opciones posibles. Por ejemplo, en la pregunta ¿Qué hace ustedpara relajarse? Mostrar una taijeta que comprenda distintas actividades lúdicas (ir al cine, ir de compras, dar un paseo, montar en bicicleta, leer, ver la televisión, escuchar música, hacer yoga, darse un baño o ducha, dejando espacio para que se indique otras, si se practican) y preguntar si se realizan o no. Este proceder se sigue bastante en encuestas de audiencia, de hábitos de lec tura y de actividades lúdicas en general. Contribuye a la reducción del núme ro de acontecimientos omitidos, pero puede favorecer los efectos de utelescoping”, situándolo en una fecha más reciente que en realidad ocurrió. En acontecimientos documentados (como gastos, atención sanitaria) pue de pedirse al encuestado que consulte la documentación que precise para res ponder (Bradburn, 1983). También puede recurrirse a viñetas, cuando se quiera que el encuestado rea lice juicios, explícitos o implícitos, sobre el alcance de fenómenos complejos (Martin y Polivka, 1995). d) Realizar varias preguntas, referidas a la misma cuestión, para aumentar la probabilidad de su recuerdo. A este respecto, Dex (1995/2002) aconseja que, cuando se quiera fechar determinados eventos, aquellos de más difícil recuer do se pregunten al final de la secuencia de preguntas relacionadas.
4.2.2. El formato de la pregunta: abierto versus cerrado in el cuestionario, la pregunta puede aparecer en un formato abierto o cerrado, de pendiendo de si aparecen expresas las alternativas de respuesta. Preguntas abiertas Las preguntas abiertas son aquellas en las que no se menciona ninguna opción de respuesta. El encuestado puede expresarse en sus propios términos, no circunscribiendo su respuesta a unas alternativas predeterminadas.
IJEMPLO DE PREGUNTAS ABIERTAS ¿Qué le gustaría hacer las próximas Navidades? . En su opinión, ¿cuál es el principal problema que más preocupa a los españoles en la ac tualidad? ................................................................................................................................ Cuando se habla de inmigrantes extranjeros que viven en España, ¿en quiénes piensa usted de manera inmediata?................................................................................................. Esta “libertad” concedida al encuestado en la respuesta conlleva unas ventajas y unos inconvenientes que hay que valorar. Entre las ventajas de la pregunta abierta des tacan las cinco siguientes: a) Son más fáciles de elaborar que las preguntas cerradas. No exigen un conoci miento previo sobre el tema. b) Ocupan menos espacio en el cuestionario. De gran interés cuando existan límites de espacio. c) Permiten a los encuestados responder con sus propias palabras, no sugiriéndoles ningún tipo de respuesta. En cambio, cuando se les pide que elijan alguna de las opciones de respuesta predeterminadas, pueden sentirse forzados a dar una respuesta que no se ajusta, exactamente, a lo que dirían si la pregunta fuese abier ta. Además, puede introducir “matices”, que ayuden a interpretar su respuesta. El punto de vista de los investigadores más experimentados es que las preguntas cerra das producen respuestas más relevantes y comparables, pero que las preguntas abiertas producen las respuestas más completas y “profundas”, que reflejan más adecuadamente matices de significado que se pierde forzando al respondiente en una serie bastante prie ta de respuestas alternativas (Bradburn, 1983:299).
d) Pueden obtenerse respuestas no anticipadas, no previstas o inesperadas, cuan do se diseñó el cuestionario. Por ejemplo, ante estos dos formatos de pregunta: • Abierta: ¿Qué le gusta más de la Universidad? ................................................ • Cerrada: Del siguiente listado de cosas generalmente mencionadas como positivas
de la Universidad, ¿cuál le gusta a usted más? Lo más probable es que el formato abierto recoja respuestas no consideradas en la redacción de la pregunta cerrada, obteniéndose respuestas no coincidentes. Puede de-
U n iv e r s id a d ALBERTO HURTADO B IB L IO T E C A
Capítulo 4: El diseño del cuestionario
243
berse a que en la elaboración de la pregunta cerrada no se incluyeron todas las alter nativas de respuesta posibles. También a que, al mencionar unas alternativas concretas, se está influyendo en la respuesta del encuestado, llamando incluso su atención en aque llas respuestas en las que antes no habían pensado. La sugerencia puede incluso llevar a modificar su pensamiento inicial.
e) Permiten captar lo más “saliente”para el encuestado. Lo primero que le viene a la mente. Si quiere conocerse la impresión más saliente de un programa, una pregunta abier ta sobre impresiones es mejor que una lista chequeada de respuestas posibles (Henerson y otros, 1987: 61).
Preguntas como, por ejemplo, “¿Qué piensa sobre...?”, “¿A qué se refiere con...?”, conceden a los encuestados libertad para pronunciar cualquier idea que puedan pensar. “Sus respuestas son libres, abiertas, ilimitadas. No establece al ternativas definidas y el sujeto las responde en sus propias palabras” (Payne, 1980:33). Ahora bien, cuando el cuestionario sea rellenado por un entrevistador habrá que insistirle que escriba exactamente lo que dice el encuestado y que no introduzca ninguna modificación en lo que dicen (su verbatim). Pese a sus amplias posibilidades, las preguntas abiertas no predominan en los cuestionarios. Sobre todo, en los elaborados por empresas privadas de opinión pública. Ello se debe, principalmente, a su mayor coste (económico y temporal) y a problemas de comparabilidad de las respuestas. En general, los inconvenientes principales de tectados en las preguntas abiertas son: a) Más caras que las preguntas cerradas. Requieren un mayor esfuerzo en su re gistro (por parte del entrevistador o del propio encuestado, en encuestas autorrellenadas), trascripción y codificación posterior. Como indica Payne (1980: 53-54): Pocas personas emplean las mismas palabras incluso para expresar la misma idea. Algunos clarifican sus afirmaciones mejor que otros. Esto hace la grabación difícil cuando queremos distinguir entre dos ideas estrechamente relacionadas pero aun así di ferentes.
Esta dificultad se extiende a la codificación de las respuestas. En especial, cuando en la respuesta aparecen palabras que pueden tener más de un signi ficado. Una vez concluido el trabajo de campo, a menos que se utilice el pretest del cuestionario para el cierre de las preguntas abiertas, se procede a la codificación de las respuestas abiertas. Para este propósito lo habitual es extraer una mues tra aleatoria de los cuestionarios completados. La muestra suele oscilar entre
el 20 y el 50% del total de cuestionarios (Bourque y Clark, 1994). Varias per sonas, a ser posible, se encargan de transcribir, literalmente, las distintas res puestas emitidas. Buscarán “términos comunes”, que permitan su agrupación en un número reducido de categorías de respuesta. El número de categorías de penderá de: • La variabilidad de las respuestas. • Los objetivos de la investigación. Si se quiere una mayor especifica ción en la respuesta o, por el contrario, se prefiere su síntesis en un nú mero reducido de categorías genéricas. Cada categoría debe incluir un número considerable de respuestas simi lares. Su contenido dictará el nombre (o etiqueta) que se dará a la categoría de respuesta. Categorías que han de cumplir los requisitos comunes a la co dificación de preguntas cerradas: exhaustividad, exclusividad y precisión (como después se verá). A cada categoría se le asignará, como en cualquier proceso de medición, un código numérico, que facilitará su análisis estadístico posterior. b) Más expuesta a errores de registro y de traducción de la información, a una ma yor subjetividad en su interpretación. El entrevistador (cuando el cuestionario no sea autorrellenado) ha de anotar, literalmente, la respuesta del encuestado. No debe introducir ninguna modificación que pudiera alterar su significado. Esto, obviamente, supone una mayor duración de la entrevista que únicamente marcar una o varias de las alternativas de respuesta dadas en una pregunta cerrada. Asimismo, los codi ficadores deben procurar proporcionar etiquetas que se ajusten al significado co mún de las respuestas agrupadas. Además, no se ha de simplificar o reducir en exceso la respuesta del encuestado. A veces, cuando las preguntas abiertas abarcan un amplio abanico de cuestiones dispares, el recurso al análisis de contenido es de gran utilidad para conseguir una interpretación más precisa de las respuestas. c) Más susceptibles a errores de medición, provocados por la actuación del entre vistador. Mayor dificultad para alcanzar uniformidad en su actuación: cómo for mula las preguntas y cómo anota las respuestas. d) Su contestación exige más tiempo y esfuerzo por parte del encuestado. Tanto que su uso se desaconseja en cuestionarios autoadministrados (Dillman, 1978). El tener que escribir la respuesta, sobre todo si se le pide una respuesta muy detallada y extensa, puede desmotivarle y llevarle a no contestar la pregunta (habiendo una mayor no respuesta de ítem) o a hacerlo con una ex cesiva brevedad. En la encuesta telefónica, que carece del contacto visual entre el entrevis tador y el entrevistado, también se ha constatado que las respuestas a pregun tas abiertas tienden a ser más breves y simples que en las entrevistas cara a ca
ra. La razón está, de acuerdo con Biemer y Lyberg (2003:142), en que “los res pondientes tienden a ser menos conversacionales en una entrevista telefónica que en una entrevista cara a cara”. La mayor dificultad de la comunicación a tra vés del hilo telefónico ya fue comentada en el capítulo 2, donde se señalaban las ventajas y los inconvenientes que ofrece este canal de comunicación. e) Los encuestados pueden dar respuestas irrelevantes o no acordes con la inten cionalidad de la pregunta. O, como indica Payne (1980: 51), “algunos se nega rán a establecer sus observaciones más pertinentes simplemente porque pare cen tan obvias”. Por ejemplo, si se pregunta la razón por la que compraron una botella de aceite por 0,80 euros, en vez de 1,30 euros, muchos no dirán que es para ahorrar dinero. Tal vez po dría encontrarse que sólo un 40% de las respuestas lo mencionan. Otros simplemente pueden optar por decir “porque lo prefiero” o “porque sí, eso es todo”. f) Mayor dificultad para modificar tendencias. Davis y Smith (1992) destacan la mayor dificultad de mantener reglas de codificación sutiles a lo largo de los años. Por estas razones -tiempo, coste, variabilidad del entrevistador, variabilidad del res pondiente, problemas de codificación y de análisis- el investigador es generalmente bien aconsejado, en cualquier encuesta a gran escala, a que cierre tantas preguntas como sea posible (Sheatsley, 1983: 208).
Pese a estas limitaciones, las preguntas abiertas muestran ser de gran utilidad: a) En estudios exploratorios, cuando no se dispone de un conocimiento previo su ficiente del tema que se investiga. A veces puede utilizarse el pretest como una primera aproximación exploratoria al tema de estudio y, después, proceder, a partir de la información recabada, al cierre de la pregunta. Quizás el más importante uso de preguntas abiertas es en pretestar preguntas cuando el investigador quiere explorar muchas dimensiones de un tema y está insegu ro exactamente de qué preguntas realizar. El uso extensivo de preguntas abiertas con muestras pequeñas puede permitir al investigador desarrollar mejores preguntas cerradas que, cuando sea utilizada en muestras más grandes, obtendrá los mejores resultados (Bradburn, 1983:302).
b) Cuando el investigador no prevé todas las posibles respuestas a una cuestión determinada. O ésta precise de la enumeración de un listado extenso de res puestas, o complejo para presentarse a los encuestados. De especial rele vancia, en encuestas telefónicas, en las que no puede acudirse al empleo de tarjetas de respuesta. O, sencillamente, se quiera ahorrar espacio en el cues tionario.
E je m plo s d e p r e g u n t as a b ie r t a s para o bviar UN LISTADO EXTENSO DE RESPUESTAS ¿Qué le gustaría hacer ahora? ¿Qué programas de televisión ha visto usted el pasado fin de semana? O, en preguntas referidas a nivel de estudios y ocupación, cuando se opta por un formato de pregunta abierta para obtener una mayor concreción. Como sucede en las encuestas del CIS. En su estudio n.° 2.214, estas variables aparecen con los siguientes formatos de pregunta: P43a. ¿Cuáles son los estudios de más alto nivel oficial que Ud. ha cursado (con in dependencia de que los haya terminado o no)? Por favor, especifique lo más posible, diciéndome el curso en que estaba cuando los terminó (o los inte rrumpió), y también el nombre que tenían entonces esos estudios (ej.: 3 años de Estudios Primarios, Primaria, 5 ° de Bachillerato, Maestría Industrial, Preuniversitario, 4 ° de EGB, Licenciatura, Doctorado, FP1, etc.). (ENTREVISTADOR: Si aún está estudiando, anotar el último curso que haya completado. Si no ha completado la Primaria, anotar el número de años que asistió a la escuela.) CURSO..................... NOMBRE (de los estudios) ............................................................................ NIVEL (Codificar según T. ESTUDIOS) ........................................................ P46. ¿Ycuál es/era su actual/última ocupación u oficio? Es decir, ¿en qué consis te/consistía específicamente su trabajo? (Precisar lo más posible las actividades realizadas. EJEMPLO: mecánico reparador de automóviles, ayudante de odontología, profesor de enseñanza primaria, etc.). Nos referimos a su ocu pación principal: aquella por la que Ud. (o el cabeza de familia) obtiene/obte nía mayores ingresos. c) Cuando se busca una respuesta inmediata, no influida, y quieran identificarse prioridades o preferencias. Por ejemplo, En la actualidad, ¿qué es lo que más le preocupa? .....................................................
En la última semana, ¿cuál ha sido la noticia que más ha llamado su atención? Para estas cuestiones es preferible el formato de pregunta abierto porque amplía las respuestas posibles, no circunscribiéndolas a las propuestas por el in vestigador. Además, hace innecesario el uso de ayudas visuales, que faciliten la retención de las alternativas de respuesta, por lo que se adecúa a las encuestas cara a cara y telefónica, d) Cuando se desea una mayor especificación de una respuesta dada con anterio ridad. “Probablemente éste es el tipo de pregunta abierta más habitual en la en cuesta” (Payne, 1980: 37). Suele seguir a una pregunta cerrada y se redacta con pocas palabras: “por qué”, “cuáles”, “cómo”. Si bien, se desaconseja el uso rei terado de estas preguntas abiertas a lo largo del cuestionario porque pueden cansar al encuestado e, incluso, resultarle impertinente. Conviene no abusar. Así lo constata Becker (1998: 58-59), quien recomienda el uso preferente de “¿có mo?” a “¿por qué?”. La primera incomoda menos al entrevistado en el trans curso de la entrevista. Su reflexión es la siguiente: Yo primero comprendí que “¿cómo?” era mejor que “¿por qué?”, como resultado de hacer trabajo de campo. Cuando entrevisté a personas preguntándoles “¿por qué?”, les provocaba una respuesta defensiva. Si les preguntaba por qué habían hecho alguna cosa particular en la que estaba interesado -¿ “Por qué se convirtió en médico?”, “¿Por qué eligió esa escuela para enseñar?”- el entrevistado entendía mi pregunta co mo una petición de justificación, para una buena y suficiente razón para la acción sobre la que estaba indagando. Respondían a mi pregunta “¿por qué?” brevemente, a la de fensiva. Como si dijeran “de acuerdo compadre, ¿eso es suficientemente bueno para ti?”. Cuando, por otro lado, preguntaba cómo había ocurrido algo - “¿Cómo se te ocu rrió meterte en esa línea de trabajo?”, “¿Cómo dejaste de enseñar en esa escuela?”- mi pregunta “funcionaba” bien. La gente la respondía en extensión, me contaba historias llenas de detalles informativos, me daba explicaciones que incluían no sólo sus razones para lo que habían hecho, sino también las acciones de otros que habían contribuido al resultado sobre lo que estaba indagando.
E je m p lo s d e p r e g u n t a s a b ie r t a s c o m p le m e n tan d o A UNA PREGUNTA CERRADA P31. ¿Recomendaría este Centro a un familiar o amigo? — Sí
No
1
2
-► P31a. ¿Porqué?...........................................
P38. ¿Ha participado Ud. En la organización de alguna de las actividades del Centro? Sí 1 No 2 P38a. ¿En cuáles?.......................................................................................
e) Si quiere conocerse el valor numérico exacto de una variable. Por ejemplo, ¿Cuántos años tiene?, la pregunta se deja abierta para permitir la grabación exac ta del valor numérico y no unos valores (códigos de respuesta) que le represente a él y a otros valores agrupados en un intervalo. Ello permite una mayor pre cisión en la estimación de la media aritmética y demás estadísticos univariables, bivariables y multivariables, como se verá en el capítulo 6. Si sólo quiere cla sificarse a los encuestados utilizando estas variables (por ejemplo, edad) como variable de clasificación, en la fase de análisis, se procede a su agrupación en in tervalos, de acuerdo con las respuestas obtenidas.
ZJEMPLO DE PREGUNTAS ABIERTAS NUMÉRICAS ¿Cuántos años cumplió Ud. en su último cumpleaños?............ ¿Cuántas horas, por término medio, dedica al día a la lectura?. Dígame, por favor, el número de personas que viven en la actualidad en esta vivienda contándose usted................................ Año de nacimiento. En encuestas autoadministradas este tipo de preguntas abiertas numéricas pueden figurar en el cuestionario seguidas de una línea o de cuadrados. Los cuadrados tienen la ventaja de indicar el número de dígitos que se solicita. Mes
19
¿Cuántos metros cuadrados tiene su vivienda?
Año
f) En el tratamiento de temas delicados, en particular, cuando se está interesado en la frecuencia de la conducta, como ya se ha mostrado. Así, por ejemplo, Brad burn y Sudman (1979) obtuvieron más mención de conductas sensitivas (con sumo de bebidas alcohólicas, prácticas sexuales ilícitas) en preguntas abiertas que cerradas. En su favor está el permitir a los encuestados describir su conducta con sus propias palabras, pudiéndose conseguir respuestas “espontáneas” y tér minos propios ’que etiqueten su conducta. Con posterioridad, Sudman, Bradburn y Schwarz (1996), al igual que Bie mer y Lyberg (2003), insisten en la recomendación de utilizar preguntas abier tas en la obtención de frecuencias conductuales. Debido a que los encuestados a veces emplean el rango de alternativas de respuesta numéricas como marco de referencia en la estimación de la frecuencia de su propia conducta. Si ven su conducta como “típica”, pueden seleccionar un valor cercano a la alternativa del medio, sin intentar asegurar más adecuadamente la frecuencia verdadera de su conducta, lo cual puede resultar en un error sistemático. Además, como las res puestas son numéricas y no categóricas, pueden grabarse, como ya se ha dicho, directamente en el ordenador. Esto significa que no precisan del tedioso pro cedimiento posterior del cierre de preguntas abiertas. No obstante, en algunas cuestiones sensitivas, como las referidas a renta, Dillman (1978) observa que los encuestados proporcionan una información más sincera cuando se les ofrece una serie amplia de categorías de respuesta en un formato cerrado más que si se les pide la cantidad exacta (en una pre gunta abierta). g) En la consecución de empatia o “rapport” con el encuestado, ofreciéndole la oportunidad de responder como él quiera. Ya sea al principio del cuestionario, ya tras una serie de preguntas cerradas para ofrecer a los entrevistados una oca sión de expresarse con sus propias palabras, pudiendo así dar una respuesta más matizada. Por ejemplo, Dígame, por favor, ¿qué piensa sobre la actual progra mación de Televisión Española? Preguntas cerradas También denominadas precodificadas o de respuesta fija. Son preguntas cuyas res puestas ya están acotadas cuando se diseña el cuestionario. El investigador determi na, previamente, cuáles son las diversas alternativas de respuesta posibles a una cuestión determinada. El encuestado se limita a señalar cuál o cuáles (si la pregunta es múltiple), de las opciones dadas refleja su opinión o situación personal. Las respuestas se listan verticalmente. A cada una de ellas se adjunta un número. Ese número constituye el código numérico, que facilitará tanto la transferencia de la respuesta verbal a un fichero de datos informatizado como su posterior análisis esta dístico. Ello repercute en una mayor exigencia de rigor y de exhaustividad en su formulación.
El investigador deberá documentarse (con anterioridad a la redacción de la pre gunta) sobre las distintas alternativas de respuesta existentes a la cuestión que se pre gunta. Las distintas categorías u opciones de respuesta deberán, asimismo, cumplir los requisitos de exhaustividad, exclusividad y precisión, exigidos en cualquier proceso de medición. Porque, como afirman Schuman y Presser (1981: 299), los encuestados generalmente “juegan por las reglas del juego”. Eligen entre las alternativas de res puesta ofrecidas para la pregunta cerrada, más que ofrecer una respuesta no incluida en la serie dada. Quiere esto decir que: a) Las categorías diferenciadas en la variable han de comprender el mayor número de atributos para satisfacer el requisito de exhaustividad. El propósito es que nin guna observación quede sin poder clasificarse. Por eso la recomendación de in cluir la opción de respuesta “otros”, cuando se prevea la posibilidad de que exis tan otras opciones de respuesta distintas a las enunciadas en la pregunta, A esta opción se la dotará de espacio suficiente que facilitar su especificación. b) Las categorías de respuesta también han de cumplir el requisito de exclusividad. Es decir, han de ser mutuamente excluyentes y no solaparse, de forma que cada observación sólo pueda clasificarse en un atributo. Debe evitarse que un mis mo encuestado escoja más de una opción de respuesta, salvo que la pregunta sea múltiple. Para evitarlo, han de meditarse las distintas alternativas de respuesta dadas y preguntarse si es posible que alguien escoja más de una. Si fuese ne cesario, poner expresamente la instrucción “escoger sólo una”. Téngase además presente que las “alternativas de respuesta” pueden contribuir a errores de com prensión. Sobre todo, cuando es habitual utilizar las opciones de respuesta co mo ayuda en la interpretación de la pregunta. c) El requisito de precisión concierne a la exigencia de realizar el mayor número de distinciones posible. Ello contribuye a la consecución de una información más precisa. Tiempo habrá para agrupar las distintas categorías o valores de las variables. Generalmente, después de haberse recabado la información (en la fa se de análisis), a la vista de la frecuencia que presente cada atributo de la va riable. Pero, por el contrario, nunca será factible desglosar los atributos después de la obtención de los datos.
ZJEMPLO DE PREGUNTAS CERRADAS Para ¡lustrar la inclusión de la opción de respuesta abierta “otros” y demás formatos de pregunta cerrada, se toman preguntas incluidas en el estudio del CIS n.fi 2.221, tal y como fi guran expresas en el cuestionario (a excepción del tipo de letra, que se ha modificado para diferenciar más la pregunta de las opciones de respuesta).
P.7. ¿Trabajas (o trabajabas) como .... ? (MOSTRAR TARJETA A) - Asalariado fijo (a sueldo, comisión, jornal, etc., con carácter fijo). - Asalariado eventual o interino (a sueldo, comisión, jornal, etc., con carácter temporal o interino)............................................ - Empresario o profesional con asalariados ............................... - Profesional o trabajador autónomo (sin asalariados).............. - Ayuda familiar (sin remuneración reglamentada, en la empresa o negocio de un familiar)................................................. ...... - Miembro de una cooperativa.................................................. - Otra situación, ¿cuál?_______________________________ ------------------------------------------------------------------------- N. C.........................................................................................
1 2 3 4 (40) 5 6 7 9
P.33. Pasando ahora a cuestiones más generales. De los siguientes objetivos sociales por los que la gente suele decir que merece la pena luchar, ¿cuáles consideras, per sonalmente, los más interesantes? (MOSTRAR TARJETA I) (MÁXIMO CUATRO RESPUESTAS) -
La prevención del SIDA......................................................... La prevención de la delincuencia............................................ La ayuda a los enfermos y a los minusválidos ......................... La defensa del medio ambiente.............................................. La prevención de la droga...................................................... La lucha contra el racismo...................................................... La ayuda a los más necesitados, los pobres.............................. Los derechos de los jóvenes.................................................... Las causas humanitarias en el mundo (hambre, víctimas de guerra)................................................... La integración de los inmigrantes ........................................... La acción a favor del Tercer Mundo....................................... Otra, ¿cuál?______________________________________ N. S.......................................................................................... N.C..........................................................................................
01 02 03 04 05 06 07 08
(131) (132) (133) (134) (135) (136) (137) (138)
09 10 11 98 99
P.34. Y, refiriéndonos a nuestro país, de las siguientes posibles metas a conseguir, ¿cuál te parece la más importante de todas? (MOSTRAR TARJETA J) (ELEGIR SÓLO UNA) -
Que en España haya justicia.................................................... Que en España haya orden..................................................... Que en España haya libertad................................................... Que en España haya desarrollo económico.............................. Que en España haya paz......................................................... Que en España haya trabajo................................................... N. S.......................................................................................... N. C.........................................................................................
1 2 3 4 (139) 5 6 8 9
P.35. En líneas generales, ¿la sociedad española te parece muy justa, justa, injusta o muy injusta? - Muy justa ............................................................................... - Justa......................................................................................... - Injusta...................................................................................... - Muy injusta.............................................................................. - Justa en unas cosas e injusta en otras (NO LEER) ................
1 2 3 4 (140) 5
- N. S....................................................................................... - N. C......................................................................................
8 9
P.51. Cuando se habla de política se utilizan normalmente las expresiones izquierda y de recha. En esta tarjeta hay una serie de casillas que van de izquierda a derecha. ¿En qué casilla te colocarías? (MOSTRAR TARJETA ESCALA) (PEDIR AL ENTRE VISTADO QUE INDIQUE LA CASILLA EN LA QUE SE COLOCARÍA Y REDON DEAR EL NÚMERO CORRESPONDIENTE) (217) (218) Dcha.
Izda.
N.S. 98
N.C. 99
01 02 03 04 05 06 07 08 09 10 Esta última pregunta es más precisa que el formato tradicional de una variable ordinal en siete categorías de respuesta y más que si se limita a cinco. Después, en la fase de análisis po drá procederse a la agrupación de categorías inclusive en sólo tres, para la realización de ti pologías (por ejemplo, izquierda, centro y derecha). Extrema izquierda........................... Izquierda......................................... Centro izquierda.............................. Centro.............................................. Centro derecha................................ Derecha........................................... Extrema derecha.............................
1 2 3 4 5 6 7
Extrema izquierda............................ Izquierda........................................... Centro............................................... Derecha............................................. Extrema derecha...............................
1 2 3 4 5
En los ejemplos ilustrados se ha podido ver que las preguntas y las categorías de respuesta aparecen ordenadas en sentido vertical. Cada opción de respuesta va acom pañada de un número. Éste es el código que representa a la categoría de respuesta a todos los efectos analíticos. Respecto a la codificación de las respuestas conviene se guir las tres pautas a continuación:
a) Asignar los mismos códigos numéricos a las mismas respuestas. Por ejemplo, codificar la respuesta “Sí” con el número “1”, “No” con el “2”. Es ha bitual que las respuestas “no sabe” se codifiquen con los números “8”, “98” o “998”, de pendiendo de cuántos dígitos correspondan a la pregunta, en función del número de res puestas posibles. La respuesta “no contesta” como “9”, “99” o “999”. En algunas circunstancias puede optarse por reservar el “0” para designar la no respuesta de ítem. b) El código numérico asignado es conveniente que tenga correspondencia con el significado de la respuesta. Sobre todo en variables ordinales (clase social, nivel de estudios, de ocupación), para posibilitar su tratamiento estadístico como va riable continua. Por ejemplo, en la variable “clase social”, medida con cinco categorías: alta, mediaalta, media, media-baja y baja; debería aplicarse una escala numérica, en consonancia con el nivel de estatus correspondiente. El código numérico más bajo, el “1”, se apli caría a la categoría “clase social baja”. En cambio, el más elevado, el “5”, a “clase so cial alta”, y no a la inversa. Lo mismo cabe decir de los dos ejemplos siguientes: Podría indicar, aproximadamente, ¿cuántos cigarrillos fuma Ud. al día? -
Sólo l o 2 ................................. Menos de medio paquete......... Un paquete diario.................... Alrededor de paquete y medio. Dos o más paquetes.................
1 2 3 4 5
¿Cómo calificaría Ud. su situación económica? -
Pésima..................................... Mala......................................... Regular................................... Buena...................................... Muy buena...............................
c) Los códigos numéricos suelen figurar a la derecha de cada opción de respuesta para facilitar el trabajo del codificador. Si bien, en los cuestionarios para ser autorrellenados suele ponerse a la izquierda de la respuesta, para evitar que el encuestado se equivoque. Cuando se pone a la derecha suele quedar espacio en blanco entre la respuesta y su código numérico, pudiendo provocar equívocos, a menos que se pongan puntos suspensivos. En cambio, si el número figura a la izquierda, se deja el espacio a la derecha de las respuestas “libre” por si el en cuestado quiere realizar alguna aclaración sobre las respuestas. Los números que figuran en los ejemplos ilustrados entre paréntesis corres ponden a la columna o columnas que ocupará la pregunta en la matriz de datos. Cuando la pregunta incluye un número de respuestas inferior a diez, ocupará una sola columna. Excepto que se trate de una pregunta múltiple, en cuyo caso el número de columnas dependerá del número de opciones de respuesta que se permitan: dos, tres e inclusive todas, cuando se pide al encuestado que ordene las opciones de res puesta de más a menos o de menos a más, según su opinión en el tema en cuestión.
E
je m p l o s d e p r e g u n t a s c e r r a d a s m ú l t ip l e s
P.11. De las siguientes maneras de invertir dinero, ordénelas de acuerdo con sus pre ferencias. (Respuesta múltiple.) (MOSTRAR TARJETA A) (18-24) -
En cuenta corriente ............. En libreta a plazo fijo ............. En Deuda Pública o en Bonos del Estado ............. Invertir en Bolsa ............. En fondos de pensiones ............. Compra de vivienda ............. Compra de joyas u obras de arte ............. Otras (Especifica t) ..........................................................
P. 12. ¿Qué cualidades, de las siguientes, admira Ud. más en una persona. (Respuesta múltiple). (SEÑALAR SÓLO TRES). (MOSTRAR TARJETA B) -
Lealtad ............................. .................. Respeto............................ .................. Sinceridad ........................ .................. Tolerancia ........................ .................. Amabilidad ....................... .................. Simpatía........................................... Entrega ............................ ................ Perseverancia.................................. Humildad ......................... .................. Comprensión.................................... Sociabilidad .................... ................ Sencillez........................... ..................
01 02 03 04 05 06 07 08 09
(25-26) (27-28) (29-30)
10 11 12
La primera pregunta pide que se ordenen las categorías de respuesta. Cuando se bus que una ordenación, hay que especificarlo en la pregunta indicando la forma de proceder. Por ejemplo, escriba “1” junto a la categoría de respuesta que considere más importante; “2”, en la segunda más importante; y así hasta la última. Adviértase que, en vez de por códigos nu méricos, las respuestas aparecen acompañadas de una línea. Éste es el mejor procedimiento para evitar confusiones entre unos códigos numéricos y otros. Cuando la pregunta incluye más de 10 alternativas de respuesta, pero menos de 100, ocupa dos columnas. Si supera los tres dígitos, pero es menor de 1.000, serán tres las columnas asignadas, y así sucesivamente. Además, obsérvese que en muchas preguntas (de las ilustradas) se especifica si la pregunta admite una única respuesta o varias. Cuando se admiten dos o más respuestas,
se está ante una pregunta cerrada múltiple. En cuyo caso, habrá que dar instrucciones expresas (entre paréntesis, en mayúsculas, cursiva u otro tipo de letra diferente a la uti lizada en el enunciado de la pregunta) de cuántas opciones de respuesta se admiten, si se establecen límites de cantidad. También, conviene especificar la manera de in dicarla, como se hace en la pregunta, de las ilustradas, referida a ideología política. Es ta última recomendación es forzada en los cuestionarios autorrellenados. En ellos siem pre deben darse instfucciones de cómo contestar la pregunta. Por ejemplo, “ponga una cruz en la casilla correcta”, “rodee con un círculo la res puesta elegida”, “elija sólo una respuesta”, “señale como máximo tres respuestas”. Y ello en un tipo de letra que destaque del resto de la pregunta. Estas instrucciones han de fi gurar tantas veces como se estime necesario, para evitar que el encuestado no sepa có mo debe responder la pregunta y opte por no contestarla o lo haga mal. Asimismo, adviértase que cuando la pregunta incluye muchas alternativas de respuesta, en la encuesta cara a cara es habitual, y lo más aconsejable, el recurso a tar jetas. Su uso posibilita la visualización de las distintas respuestas posibles por parte del entrevistado antes de contestar a la pregunta, no teniendo que retener en la memoria las alternativas de respuesta. No obstante, se recomienda que, cuando se muestre una tarjeta de respuestas, el entrevistador lea las respuestas que en ella figuren expresas, pa ra evitar molestar al encuestado. Principalmente, cuando se entrevista a poblaciones con dificultades para la lectura, por problemas de visión o simplemente de lectura. Respecto a las opciones de respuesta, existen además tres cuestiones que convie ne considerar: a) El número de categorías de respuesta a diferenciar. Aunque anteriormente se ha insistido en la necesidad de cumplir el requisito de precisión (hacer el mayor nú mero de distinciones posibles), a veces se plantea la limitación de las alternativas de respuesta. Sobre todo, en encuestas telefónicas, en las cuales no puede recurrirse a tarjetas de respuesta, obligando al entrevistado a su retención memorística. En este contexto, se aconseja limitar el número de categorías de res puesta alternativas a no más de cinco, para asegurarse de que el entrevistado retenga las distintas alternativas de respuesta antes de contestar. A veces incluso se plantea la conveniencia de rotar el orden de lectura de las alternativas de respuesta, cuando se prevea que su disposición pudiera afectar a la misma. En especial, el efecto de respuesta llamado de recencia (el elegir la última respuesta mencionada), más probable en la encuesta telefónica, como se vio en el apartado 4.2. Pero, igualmente, el de primacía, es decir el ele gir la primera respuesta mencionada, se ajuste o no a la realidad, desaten diéndose del resto. También, en la medición de estados subjetivos (opiniones, actitudes, valo res), como se verá en el subapartado 4.2.3. Lo más habitual es diferenciar cuatro o cinco alternativas de respuesta. Depende de si se incluye o no una op-
ción de respuesta intermedia (“ni de acuerdo ni en desacuerdo”, “indiferente”, “ni satisfecho ni insatisfecho”). Por ejemplo, muy de acuerdo “4”, bastante de acuerdo "3”, poco de acuerdo “2”, nada de acuerdo “1”. Más de cinco categorías no resulta conveniente. Sobre todo, más de siete, porque se genera la dificultad de “matiz” y una peor diferenciación, en la interpretación, de unas alternativas respecto de otras. Lo que sí parece deseable es que, siempre que sea posible, no limitar las op ciones de respuesta a menos de tres, aunque muchas preguntas constituyan “di cotomías naturales” (como designa Sheatsley, 1983). Por ejemplo, ¿Tiene usted un ordenador? Sí / No. Es bastante habitual que las pre guntas dicotómicas ofrezcan poca información o una pobre distribución de respuesta. Sheatsley (1983: 209) lo ilustra con el siguiente ejemplo: Si se pregunta ¿Está usted satisfecho o insatisfecho con el cuidado médico que recibe?, sólo cerca del 20% de una muestra nacional expresará insatisfacción; la gran mayoría di rá que están satisfechos. Esto no es irrazonable porque la gente con frecuencia es reti cente a criticar a los doctores y a otros expertos. Pero si se pregunta ¿Cómo de satisfe
cho está usted con el cuidado médico que recibe: muy satisfecho, algo satisfecho o no muy satisfecho?, la distribución marginal aparecerá: 50% muy satisfechos, 35% algo satis fechos y 15% no satisfechos. Los dos primeros grupos que llegan a combinarse en la ver sión dicotómica pueden bien parecer bastante diferentes en términos de sus caracte rísticas, conducta y otras actividades. Es mejor clasificar a la población en un número mayor de categorías y, des pués, en la fase de análisis proceder a su agrupación, si fuese necesario. b) La inclusión de una alternativa de respuesta intermedia. Si la hace explícita o no. Es decir, sólo registrarla, si es mencionada de forma espontánea por el entre vistado (cuando la encuesta sea mediante entrevista). El ofrecer explícitamente una alternativa intermedia suele resultar en un aumento de valoraciones “neutras”, que pueden no ajustarse a la realidad, pro vocando errores de medición. Puede ser un escape fácil ante una elección difí cil, que no guste, o simplemente porque no se quiere meditar la respuesta o ma nifestarse claramente. En especial, en cuestiones delicadas o sensitivas. En un estudio experimental comparativo en Estados Unidos y Alemania, Bishop y colaboradores (1988) observaron que los encuestados son mucho más probables a se leccionar una alternativa de respuesta intermedia, cuando ésta se ofrece explícitamente. Este efecto se da tanto en encuestas autoadministradas como en las telefónicas. En experimentos anteriores, llevados a cabo por Kalton, Roberts y Holt (1980), el in cremento se cifró entre el 15 y el 49% de las respuestas. Schuman y Presser (1981/1996) lo reducen entre el 10 y el 20%. Para Converse y Presser (1994), cuando se ofrece una alter nativa de respuesta intermedia, el 20% de los encuestados la escogen, pese a no ser ésta la alternativa que habrían elegido, si no se hubiese ofrecido en el enunciado de la pregunta.
cj El explicitar las opciones de no respuesta: “no sabe/no contesta”. Normalmen te se recomienda su no inclusión expresa en la pregunta, salvo que se estime de interés en su formulación. Por ejemplo, cuando se quiera captar la inexistencia de datos o de opinión sobre una cuestión determinada. La experiencia muestra que éstas constituyen opciones de respuesta muy re curridas, cuando el encuestado no quiere pensar o manifestar una respuesta con creta (o sea, “dfescubrirse”). Este problema se evidencia más en cuestionarios autoadministrados. El encuestado puede visualizar la alternativa de no respuesta y elegirla sólo por no pensar en la respuesta o por quererla ocultar. Schuman y Presser (1979a) analizaron los efectos de ofrecer explícitamente la al ternativa de no opinión, como una opción de respuesta, en preguntas referidas a acti tudes ante los líderes políticos de varios países. Cuando se ofrecía como alternativa de respuesta un 20% más de encuestados la mencionaban que cuando no se ofrecía de for ma explícita. Con posterioridad, Gilljam y Grandberg (1993) observan, en un estudio pa ra medir las actitudes hacia la energía nuclear, que, cuando se ofrecía, un 15% de los en cuestados la escogían. Si no se mencionaba, el porcentaje que la elegía, de forma espontánea, descendía al 4 e, incluso, al 3%. La mayoría de los encuestados que ini cialmente dijeron “no sé” acabaron dando respuesta a dos preguntas posteriores y re lacionadas con la anterior (con aquella que dijeron no tener opinión).
En los cuestionarios autorrellenados es totalmente desaconsejable la in clusión explícita de la alternativa de no opinión en la pregunta. En cambio, en los cuestionarios a cumplimentarse mediante entrevista, la alternativa de no opi nión puede incorporarse al listado de opciones de respuesta. Si bien, debe ins truirse a los entrevistadores para que no la mencionen. Sólo han de registrar la cuando el entrevistado la diga espontáneamente y tras haber intentado conseguir otra respuesta por parte del entrevistado, ya sea aclarando cualquier duda que la pregunta le suscite; ya concediéndole más tiempo para meditar la respuesta; ya transmitiéndole confianza para emitir cualquier tipo de respues ta (no va a recibir ninguna reprobación). En palabras de Sheatsley (1983:211): A los entrevistadores se les debería instruir para que sondeen la respuesta “No sé” con frases como “Justo su opinión” o “Por supuesto, nadie realmente sabe. Pero ¿qué piensa de ello?”.
Sánchez y Morchio (1992) también aconsejan “sondear” las respuestas “no sé” para clarificar su verdadero significado. Debido, precisamente, a los distintos sig nificados que estas respuestas pueden tener: ignorancia, indecisión, no certeza del sentido de la pregunta. En general, una respuesta “no sé” puede reflejar: • Actitudes ambivalentes, que pueden ser especialmente difíciles de infor mar, cuando no se ofrecen escalas con un punto intermedio (Krosnick y Fabrigar, 1997).
• Inexistencia de opinión sobre el tema o que no se ofrece una respuesta que comparta el encuestado. De acuerdo con Kalton y Schuman (1982/2002), en preguntas de hecho (u objetivas), la respuesta “no sé” representa un fracaso en obte ner información. Existe una respuesta a la pregunta, pero el encuestado no puede proporcionarla. Por el contrario, en las preguntas de opinión (o subjetivas) tiene una interpretación diferente. El encuestado puede, en realidad, no tener ninguna opinión sobre el tema que se le pregunta. Y advierten del peligro de que algunos encuestados puedan sentirse pre sionados a dar una respuesta específica, incluso aunque “no sé” sea su respuesta correcta. Este peligro puede darse igualmente en las preguntas de hecho , pero es más probable en las de opinión. • Que el encuestado no entienda la pregunta o esté indeciso sobre la opción de respuesta a escoger. Converse (1976) muestra que los porcentajes de “no opinión” aumentan, cuanto más complejo es el lenguaje empleado en la redacción de la pregunta. También, cuando las preguntas: - Contienen largas explicaciones. - Requieren predicciones futuras más que describir el presente y el pa sado. - Son dicotómicas (con sólo dos opciones de respuesta) más que politómicas, porque las preguntas dicotómicas suscitan mayor dificultad para descubrir opiniones moderadas. - Tratan temas poco conocidos por el conjunto de la población.
• Falta de motivación o de capacidad para pensar en una respuesta. Nadeu y Niemi (1995) han c o m p ro b ad o que los encuestados más habilidosos y motivados son los más propensos a responder las preguntas del cuestionario, aunque sea incorrectamente, antes que admitir ignorancia. Principalmente, va rones y personas de mayor nivel educativo e interés. Esto último es corroborado en diversos estudios (Schuman y Presser, 1981/1996; Bishop y otros, 1986; Groves, 1989; Krosnick y Fabrigar, 1997/2002). Se ha constatado que la tendencia a responder “no sé” es mayor en personas de me nor nivel educativo y de habilidades cognitivas, así como entre aquellos que con ceden al tema sobre el que se pregunta menor importancia. Por ejemplo, Krosnick y colaboradores (2002), con datos de nueve experimentos con tres encuestas a ho gares, encontraron que la opción de “no opinión”es mayor en personas con me nos habilidades cognitivas (medidas por el logro académico); que responden en se creto, más que de forma oral; y que dedican poco esfuerzo a contestar la pregunta. Resumiendo, se desaconseja la inclusión de las categorías de respuesta de “no sabe/no contesta” en indagaciones conductuales o de hecho, pero también sobre aspectos subjetivos. No aumenta la calidad de los datos, sino que reduce
la medición de opiniones significativas. Sólo cabe su incorporación, cuando se quiera recoger la inexistencia de información u opinión sobre un particular. Sea el caso, por ejemplo, de cuestionarios diseñados para el vaciado de información de documentos existentes u observaciones registradas. De acuerdo con Bourke y Clark (1994:19), “uno de los mayores errores que se cometen al extraer da tos de informes es no advertir que se buscó información y no se encontró”. Des pués, en la fase de grabación de los cuestionarios, a las preguntas que finalmente quedaron sin respuesta, se les asignan los códigos correspondientes a “no sabe” (8,98, 998) o “no contesta” (9, 99, 999), dependiendo del sentido de la no res puesta. El uso mayoritario de preguntas cerradas en la encuesta se debe a la conjunción de una serie de ventajas importantes: a) La rapidez y comodidad de su registro. Resulta bastante más sencillo y rápido anotar la respuesta a una pregunta cerrada que la correspondiente a una abier ta. Ello se traduce en ahorro de costes en el trabajo de campo (en tiempo de en trevista) y de edición de los cuestionarios. Las respuestas pueden grabarse inmediatamente en el ordenador (durante o después del trabajo de campo) pa ra su posterior tratamiento estadístico, sin necesidad de mediar una actuación previa de cierre de preguntas, como en las preguntas abiertas. b) La mayor estandarización de las respuestas, ampliando sus posibilidades de com paración. Al estar expresadas en los mismos términos, también permite elimi nar la vaguedad o ambigüedad de las respuestas. c) La posibilidad de centrar las respuestas de los encuestados a aquellas opciones consideradas relevantes y relacionadas con la cuestión que se pregunta. Pueden incluso guiar a los encuestados en la búsqueda de una respuesta. En especial, cuando las opiniones no están bien cristalizadas (Molenaar, 1982). Doh renwend (1965) recomienda el uso de preguntas cerradas cuando la desgana a responder restrinja respuestas a preguntas abiertas. d) Requieren menos esfuerzo por parte del encuestado, mostrando mayor ade cuación cuando éste tiene problemas de comunicación verbal. Pero no todo son ventajas. Las preguntas cerradas presentan, igualmente, graves inconvenientes que pueden llevar a cuestionar su utilidad en la medición tanto de as pectos objetivos como de subjetivos. Siete son los inconvenientes más señalados: a) Las preguntas cerradas coartan las opciones de respuesta. Éstas no siempre se ajustan a la variedad de respuestas posibles o no son apropiadas para el en cuestado. Ello revierte, negativamente, en la simplificación de la información conseguida. Para evitar que las preguntas cerradas no proporcionen una serie apropia da de alternativas de respuesta se recomienda comenzar el diseño del cues-
tionario con preguntas abiertas (Lazarsfeld, 1944; Mosser y Kalton, 1971; Schu man y Presser, 1981; Dillon, 1990). Después, utilizar las respuestas obtenidas en el pretest o prueba del cuestionario para desarrollar una serie significativa de res puestas “cerradas”. Pero igualmente puede optarse por realizar, previamente, indagación cualitativa ex profeso (entrevistas abiertas, grupos de discusión) a personas implicadas en el tema de estudio, como ya se dijo en el capítulo 1. b) La respuesta puede estar influida por las alternativas ofrecidas. Estas pueden for zar a que la contestación a la pregunta se conforme a la noción preconcebida del investigador sobre el tema. Es casi cierto que en casi todas las preguntas alguna fracción de sujetos dan res puestas que realmente no quieren dar (Payne, 1980: 79). Con certeza no representarán las actitudes de los sujetos [...]. Los respondientes me ramente reconfirmarán el propio marco de referencia del investigador sin ni siquiera comprenderlo (Schuman y Presser, 1981:108,110). El encuestador que formula preguntas cerradas puede estar especificando catego rías de pensamiento que no son representativas de lo que el encuestado piensa. Con el resultado de que los encuestados confirman nuestro propio marco de referencia sin in cluso darnos cuenta (Dillon, 1990:141).
Este último autor (Dillon, 1990) obtiene distinta mención de respuestas en preguntas cerradas y en abiertas. Por ejemplo, ante la pregunta ¿Cuál es el pro blema más importante al que se enfrenta este país en el presente?, el doble de en cuestados dijo “delincuencia” en la pregunta cerrada, que cuando la pregunta era abierta. Con anterioridad, Schuman y Presser (1979b, 1981/1996) ya habían de mostrado que distintas respuestas pueden captarse, dependiendo de si la pre gunta se formula con un formato abierto o cerrado. A la pregunta ¿Qué preferiría usted más en su trabajo?, el 60% de los encuestados dieron una respuesta, en la pregunta abierta, no incluida en las cinco alternativas de res puesta en la pregunta cerrada'. 1) sueldo alto (12,4%); 2) ningún peligro de ser despedi do (7,2%); 3) poca jornada laboral y mucho tiempo libre (3,0%); 4) oportunidades de promoción (17,2%); 5) el trabajo sea importante y de sentimiento de realización (59,1%) -las cifras entre paréntesis corresponden a los porcentajes de respuesta- En el formato de pregunta abierta, las tres respuestas más mencionadas fueron: “satisfacción y gusto por el trabajo” (17,0%), “trabajo agradable o divertido” (15,4%) y “buenas con diciones de trabajo” (14,9%). “Oportunidad de promoción”, por ejemplo, sólo fue mencionada por el 1,8% de los encuestados, cuando la pregunta era abierta, mientras que con el formato cerrado reunió al 17,2% de los sondeados. La no coincidencia de respuestas en preguntas abiertas y cerradas la obtienen, igualmente, en otras preguntas, como la referida a los valores de los hijos. En el formato cerrado se preguntó: Mientras que hablamos de sus hijos, por favor, le importaría mirar
esta tarjeta. Si tuviese que elegir, ¿qué cosa de esta lista escogería como la más importan-
te para que sus hijos aprendiesen para prepararles para la vida?: 1) obedecer (19,0%); 2) ser bien parecidos o populares (0,2%); 3) pensar por sí mismos (61,5%); 4) trabajar du ro (4,8%); 5) ayudar a otros cuando necesiten ayuda (12,6%). En el formato abierto se dieron hasta 17 respuestas diferentes. Las tres respuestas más mencionadas fueron: “conseguir una educación” (12,8%); “ser honesto, sincero” (7,4%); y “tener respeto a otros: aceptación de los derechos de otros, ejemplo, ser tolerante” (6,7%). “Obedecer”, sólo fue pronunciado por el 2,4% de los 460 encuestados y “pensar por sí mismos” por el 4,6%. Estos y otros hallazgos les llevaron a afirmar que la pregunta cerrada “reconduce” la respuesta a las opciones que el autor da. El diseño de una pregunta cerrada es bastante más laborioso que el de una pre gunta abierta. Exige del investigador el previo conocimiento de la realidad que investiga, su delimitación y medición expresa. No sólo ha de decidir cómo formular la pregunta, sino también qué categorías de respuesta considerar, en qué nivel de medición (nominal, ordinal, de intervalo, de razón o propor ción) y qué códigos asignar a cada respuesta. No permite al encuestado expresar el significado de su respuesta. Cuando se ofrecen muchas opciones de respuesta, aunque se recurra a una tar jeta de respuesta (en la encuesta cara a cara), cabe la posibilidad de que el en cuestado no medite las distintas alternativas de respuesta que se le ofrezcan, si no que elija, precisamente, la primera que parezca adecuarse a su parecer. Por ejemplo, en una encuesta autoadministrada a profesores de la escuela elemen tal -referenciada por Biemer y Lyberg (2003:142)- se ofrecía a los profesores una lis ta de diez ayudas para su docencia. Se les pidió que seleccionaran aquella que encon trasen más útil en su enseñanza a los alumnos. Aunque las ayudas se listaban sin seguir ningún orden particular, fueron más seleccionadas las que figuraban al principio de la lista. Casi el doble que las que aparecían al final. Esto sugiere que los encuestados dejaron de leer la lista una vez que encontraron una respuesta aceptable, en lugar de ha ber elegido la respuesta después de haber leído todas las alternativas de respuestas po sibles. Ya se dijo que este tipo de error de medición, debido al efecto de primacía, es más frecuente en encuestas autoadministradas y en las personales que utili zan tarjetas de respuestas. En cambio, el efecto de recencia se da más cuando la pregunta, y sus opciones de respuesta, se dicen de forma oral {entrevista tele fónica y personal sin tarjetas de respuestas). Sudman y Bradburn (1983) y, con posterioridad, Rasinski, Mingay y Bradburn (1994), también encuentran evidencia empírica de que los ítems que aparecen arriba de la lista son los más probables a ser seleccionados. Si bien, estos últimos autores comprueban que esta tendencia no se produce, cuando en la pregunta se incluye la instrucción “Marque todas las opciones aplicables”.
f) La estandarización de las palabras, que se consigue igualando la literalidad de la pregunta y de sus respuestas, no implica necesariamente estandarización de los significados. Los encuestados pueden atribuir significados diferentes a una misma pregunta. Respuestas como, por ejemplo, “mucho”, “poco”, “bastante”, “joven”, “caro”, suelen provocar interpretaciones dispares de una persona a otra. Mientras que algunos encuestados pueden considerar que fumar cinco cigarrillos al día es “poco”, para otros puede ser “mucho”. Asimismo, un jersey de 75 euros puede ser una “ganga” para al gunos y “muy caro” para otros.
En consecuencia, siempre cabe la duda de si las distintas opciones de res puesta son igualmente interpretadas por todos los encuestados. g) El formato de pregunta cerrado puede incrementar la “amenaza” de la pregunta, debido a que “fuerzan” al encuestado a elegir una de una serie de respuestas. Por esta razón, Sudman y Bradburn (1974) desaconsejan el formato cerrado, tanto para preguntas conductuales como actitudinales, que tengan respuestas socialmente deseables. El cuadro 4.4 resume las ventajas y los inconvenientes de cada formato de pregunta: abierto y cerrado. El investigador deberá valorarlos, en relación con sus objetivos de investigación, antes de elegir una u otra opción de pregunta-respuesta. También, de berá tener en cuenta los cuatro aspectos clave presentes en cualquier investigación: a) El tiempo y los recursos que el investigador quiera destinar a la codificación de las preguntas abiertas. b) El grado de exactitud que desee en las respuestas. c) La cantidad y tipo de información que necesita. d) Su conocimiento previo del tema que investigue. El grado al que puedan anti ciparse la variedad de respuestas posibles. Tal vez lo mejor sería su uso combinado. Ya Oppenheim (1966) proponía utilizar las preguntas abiertas primero, para suscitar las respuestas espontáneas, y, después, las cerradas. Estas últimas muestran mayor utilidad como ayudas a la memoria y para con seguir datos “comparables”. A lo que cabría añadir las potencialidades del formato de pregunta abierto para indagar en razones, prioridades, sugerencias de mejora y demás potencialidades enunciadas con anterioridad, respecto a cada tipo de formato. 4.2.3. La especificidad de la medición de actitudes La medición de las actitudes tradicionalmente ha tenido un tratamiento específi co. Como aspecto subjetivo, la forma de medirla es a través de su manifestación ex-
Tipos de preguntas Abiertas V entajas
Inconve nientes
C erradas
• Elaboración sencilla. • Ocupan menos espacio en el cues tionario. • Proporcionan una información más amplia y exacta, expresada en los propios términos del en cuestado. • Pueden obtenerse respuestas ines peradas. • Permiten captar lo más “saliente” para el encuestado.
• Rapidez y comodidad en su re gistro. • Mayor estandarización de las res puestas, reduciendo su ambigüe dad. • Favorecen la comparabilidad de las respuestas. • Pueden centrarse las respuestas en aquellas consideradas rele vantes. • Requieren menos esfuerzo por parte del encuestado.
• Mayor coste (económico-tempo ral) en su registro, transcripción y codificación posterior. • Su contestación exige más tiempo y esfuerzo por parte del encues tado (y del entrevistador, en su caso). • Más expuestas a errores de re gistro y a mayor subjetividad en su interpretación. • Más susceptibles a errores de me dición debidos a la actuación del entrevistador. • Pueden darse respuestas irrele vantes, no acordes con el propó sito de la pregunta. • Mayor dificultad para monitorizar tendencias.
• Coartan las opciones de respuesta. • Las alternativas de respuesta pue den influir en la contestación a la pregunta. • Su redacción exige un mayor es fuerzo y conocimiento del tema por el investigador. • No permiten expresar el signifi cado de la respuesta. • Posibilidad de respuesta no me ditada (efectos de primacía, de recencia y de aquiescencia). • Las respuestas pueden tener dis tintas interpretaciones para los encuestados. • Pueden incrementar la “amena za” de la pregunta.
terna: lo que se dice o hace, y ésta no siempre es congruente con la realidad, en especial cuando se mide por medio de la declaración verbal y se trata de actitudes expuestas a valoración social. El miedo a la desaprobación o censura social puede llevar a una ocul tación deliberada de la actitud “real”, habiendo dos vertientes de la actitud: la mani fiesta y la latente.
Ya en 1934 Lapiere (en su famoso artículo “Attitudes vs. Actions”. Social Forces, 13: 230-237) cuestionó la validez de las respuestas verbales en la medición de las ac titudes. Mediante un cuestionario se puede obtener una reacción verbal ante una si tuación enteramente simbólica, que no coincide necesariamente con la actuación real del encuestado cuando se encuentre ante dicha situación. No existe seguridad al res pecto. Véase Alvira (1977), quien, tras una revisión de estudios sobre actitud y con ducta, concluye que las mediciones verbales de las actitudes no son adecuadas como medidas de las actitudes subyacentes. Pese a ello, reconoce que ésta continúa siendo la estrategia más seguida en la medición de actitudes. Principalmente, desde 1928, fecha de edición del famoso artículo de L. L. Thurstone “Attitudes can be measured” (en American Journal o f Sociology, 33: 529544). Supuso el inicio de una serie de propuestas escalares en la medición de acti tudes. Consisten en la enunciación de una serie de aseveraciones acordes con la actitud a medir, de las cuales se pide declarar el grado de acuerdo sobre las mismas. Si bien, el formato varía. A continuación se exponen cinco propuestas principales: la escala de distancia social de Bogardus, la escala diferencial de Thurstone, el escalograma o escala acumulativa de Guttman, la escala aditiva de Likert y el diferencial semántico de Osgood. Escala de Distancia Social de Bogardus En 1925 aparece la propuesta de Emory S. Bogardus en la medición de la distan cia social (“Measuring social distance”. Journal o f Applied Sociology, 9:299-308). Ma tizada en una publicación posterior, de 1933 (“A social distance scale”. Sociology and Social Research, 17: 265-214). Consiste en una serie de proposiciones dispuestas en orden decreciente de deseo de interrelación con personas de etnias diferentes o expuestas a estigmas sociales. Ayu da en la medición de la distancia social o grado de separación, considerada aceptable, en las relaciones entre distintos grupos sociales. De gran relevancia en la medición, por ejemplo, de las actitudes ante la inmigración, como ya se vio en el apartado 4.1. Se dis tingue un grado de intimidad máximo (matrimonio, noviazgo, amistad), intermedio (te nerle como compañero de trabajo, vecino) o mínimo (compartir el mismo autobús, su presencia en bares, restaurantes, discotecas) e, inclusive, su exclusión en toda moda lidad de contacto. La propuesta de Bogardus presenta la siguiente graduación de creciente hacia otras personas o grupos sociales, entre las que elegir: 1. 2. 3. 4. 5. 6. 7.
Me casaría con él. Le tendría como un amigo más. Trabajaría con él en una oficina. Admitiría a algunas personas en mi vecindad. Le admitiría solamente como interlocutor. Querría que viviese fuera de mi vecindad. Querría que viviese fuera de mi país.
A partir de las respuestas se puede elaborar un índice de distancia social, en con sonancia con los pesos asignados en cada punto de la escala. Como puede verse en el ejemplo a continuación.
E je m p lo d e esc a la d e d ista n c ia DEBOGARDUS
so c ial
En el Informe FOESSA de 1970 (Informe Sociológico sobre la Situación en España), di rigido por Amando de Miguel, se hizo uso de la escala de distancia social de Bogardus, pa ra medir la distancia social con personas procedentes de otra región, con aquellos que han estado en un manicomio más de un año, con pobres y con aquellos que han estado en la cár cel por un delito común. El formato de la pregunta es el mismo. Lo que varía es el grupo so cial sobre el que se mide la actitud favorable o desfavorable de los españoles. La pregunta de distancia social con los de otras regiones, incluida en el cuestionario lla mado “Extra-A-Regionalismo”, figura así enunciada: P122. SI TUVIESE USTED QUE RELACIONARSE CON UNA PERSONA QUE NO ES DE ESTA REGIÓN, ¿CUÁLES DE ESTAS ACTITUDES ADOPTARÍA USTED?. (Enseñar tarjeta) (Respuesta única: la primera) - La aceptaría en todas las ocasiones e incluso no le importaría casarse con é l...................................................................................................... 1 - Le aceptaría en todas las ocasiones, exceptocomo yerno o nuera..................... 2 - Le aceptaría en casi todas las ocasiones como amigo y no tendría inconveniente en invitarle a comer a mi casa (pero no como yerno o nuera) ............................................................................................................... 3 - Le aceptaría como ciudadano y también como vecino, inquilino, compañero de trabajo, etc.................................................................................... 4 - Sólo le aceptaría como un ciudadano más.......................................................... 5 - No le aceptaría en ninguna de estas situaciones................................................ 6
En el cuestionario Extra F-Psicología se mide la distancia social con un ex paciente de un sanatorio mental, un ex presidiario y un pobre, utilizando la misma escala anterior. En el Apéndice Metodológico del Informe se detalla el procedimiento seguido en la ob tención de un índice de distancia social. Los porcentajes de respuesta en cada proposición (o categoría de respuesta) se multiplica por el coeficiente de ponderación asignado corres pondiente: 5,4, 3, 2,1 y 0. El resultado total se divide por 500 (al haber quedado excluida la sexta categoría por estar multiplicada por 0): A%x5 + 6 % x 4 + C % x 3 + D % x 2 + £ % x 1 Indice de distancia social = ---------------------------—----------------------------
El índice oscila entre un máximo de “+1” (aceptación máxima) y un mínimo de “O” (aceptación mínima), con un punto medio sin significación estadística. Más recientemente, en las encuestas de actitudes ante la inmigración realizadas por el CIS, la distancia social hacia personas de procedencia distinta se mide con varias preguntas que, aunque comparten similares supuestos con la escala de Bogardus, presentan un formato diferente, como preguntas separadas. Las preguntas son las siguientes: • ¿A Ud. le preocuparía mucho, bastante, poco o nada que un hijo o una hija suya (si no los tie ne, en caso de que los tuviera) se casara con un ciudadano de ....? • ¿Hasta qué punto: mucho, bastante, poco o nada, le importaría a Ud. que sus hijos (si no los tie ne, en caso de que los tuviera), compartieran en el colegio la misma clase con niños de familias de inmigrantes extranjeras? • ¿Y hasta qué punto: mucho, bastante, poco o nada le importaría a Ud. tener como vecinos a una familia de ciudadanos de....? • ¿Y hasta qué punto: mucho, bastante, poco o nada, le importaría a Ud. tener como compañe ro de trabajo a ciudadanos de....?
Salvo en la segunda pregunta, en el resto se distingue entre ciudadanos de diferentes países: Portugal, algún otro país de la Unión Europea, Estados Unidos, Europa del Este (Po lonia, Hungría, etc.), Latinoamérica, Marruecos u otro país norteafricano, un país del África Negra.
Escala diferencial de Thurstone En 1929, L. L. Thurstone propone, junto con E. J. Chave (en The measurement o f attitude. University of Chicago Press), un nuevo procedimiento en la medición de ac titudes, que sería perfilado, con posterioridad, en una publicación en solitario de 1931 (The measurement o f social attitudes. University of Chicago Press). Consiste en enunciar una serie de proposiciones relativas a una determinada actitud (más o me nos favorables o contrarias a la misma), expresadas en forma categórica (como ase veraciones). Al encuestado se le pide que indique su acuerdo o desacuerdo con cada frase o proposición. El promedio de las respuestas resumirá su actitud ante el problema que se investiga. En concreto, su realización exige: 1. Determinar qué actitud quiere medirse, en consonancia con los objetivos y el marco teórico de la investigación. 2. La generación de un número elevado de ítems o frases (de 100 a 150), rela cionadas con la actitud a medir. Éstas han de cubrir todo el continuo de la ac titud, desde el extremo más positivo hasta el más negativo. En su redacción han de seguirse las mismas pautas generales destacadas en la redacción de pre guntas de un cuestionario. En particular, se reitera la necesidad de evitar ela borar ítems o frases:
• Demasiado largas porque dificultan la comprensión y retención (por parte del entrevistado). Fundamentalmente, cuando se preguntan mediante entre vista telefónica o personal, sin el uso de tarjetas de respuesta. • Que contengan dos o más ideas. De Vellis (1991: 59) lo ilustra con el siguiente ejemplo: “Yb apoyo derechos civiles porque la discriminación es un crimen contra Dios.” Si una persona apoya los derechos civiles por razones diferentes, ¿cómo de bería responder? Una respuesta negativa podría incorrectamente expresar una fal ta de apoyo a derechos civiles y una respuesta positiva podría incorrectamente ads cribir un motivo al apoyo del respondiente.
• Las dobles negativas. • Referencias ambiguas y adverbios de cantidad (nunca, siempre, todos) y demás recomendaciones incluidas en el apartado 4.2.1. Asimismo, es conveniente que la ubicación u ordenación de los ítems en la escala mantenga una estructura similar a la del cuestionario en su conjunto. Quiere esto decir que los primeros ítems sean los más suaves o menos defini dores de la actitud a medir; los que expresan mayor controversia, en el segun do tercio de la escala; los intermedios, al final. 3. Un grupo de expertos, llamados “jueces”, preferiblemente 30 o más, evalúan la serie de ítems, indicando en qué punto del continuo de la actitud se sitúa. Para ello, cada juez o experto clasifica cada ítem en uno de los 11 montones que com prende el continuo de la actitud graduada. Es decir, de “bastante desfavorable” (1) a “bastante favorable” (11), siendo el “6” el valor neutro. Aquellos ítems ubicados en montones bastante diferentes quedan excluidos, por considerarse ambiguos en la medición de la actitud. A tal fin, se puede ela borar una matriz cuyas columnas incluyan las valoraciones dadas a cada ítem por el conjunto de expertos. Se calcula la mediana (también puede ser la media, aun que Thurstone prefiere la mediana) de cada columna, que representa a cada ítem, y el rango interpercentílico (P75 - P25). Éste es elegido por Thurstone pa ra medir la dispersión discriminante de cada ítem. Y, de acuerdo con él, se re tendrá todo ítem cuya dispersión no supere el valor de “2”. O sea, que suscite consonancia en su valoración. 4. Los 20 o 30 ítems finalmente seleccionados se listan, de forma aleatoria, en el cuestionario que va a pasarse a la muestra del estudio (elegida al azar de la po blación a analizar). Conviene que en el cuestionario no figuren los valores es calares promedios dados a cada ítem en la prueba de jueces. Para cada ítem los encuestados han de indicar si están “de acuerdo” o “en desacuerdo”. La puntuación de cada sujeto, en la escala, se obtiene de la media (o mediana) de los valores escalares de los ítems en que ha dicho estar “de acuerdo”.
’-JEMPLO DE ESCALA THURSTONE Los siguientes ítems con sus valores escalares están tomados de una escala de Thurs tone incluida en su publicación de 1931 (The measurement of social altitudes) y reseñada por Lamberth (1980: 230). Se trata de una escala de actitudes ante los negros. Las frases o ítems elegidos concuerdan con cómo se medía el racismo por aquel entonces. Consonante con lo que actualmente se conoce como racismo tradicional o biológico (como ya se dijo en el apar tado 4.1). Valor escalar 10,3 10,3 7,7 5,4 2,7 0,9 0,9
ítem Creo que el negro tiene los mismos derechos sociales que el blanco El negro debería ser considerado como igual al hombre blanco y disfrutar de sus mismas ventajas El negro es perfectamente capaz de cuidar de sí mismo, si el hombre blanco le deja tranquilo No me interesa en absoluto la situación social del negro En ningún caso los niños negros deberían asistir a la misma escuela que los niños blancos El negro está siempre un poco encima de los animales El negro debería ocupar el lugar más bajo entre los seres humanos
De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo
En el cuestionario, los ítems nunca han de figurar de forma ordenada (ascendente o des cendente), sino aleatoria. Es decir, alternando aquellos que expresen actitudes positivas con ne gativas y neutras. Tampoco han de figurar los valores escalares dados por los expertos (o jue ces). Tan sólo la frase junto con las opciones de respuesta posibles: de acuerdo y en desacuerdo. Normalmente sin código numérico expreso. El encuestado deberá señalar (con una cruz, por ejemplo) aquellas frases con las que está de acuerdo. La media o la mediana, de los valores es calares atribuidos a los ítems elegidos, representará su actitud hacia los negros. La laboriosidad que su práctica exige contribuye al uso limitado de la escala Thurstone en la investigación social. Escalograma o escala acumulativa de Guttman En 1944 Louis Guttman (en “A basis for scaling qualitative data”. American So ciological Review, 9:139-150) propuso un procedimiento escalar acumulativo para la medición de las actitudes. En ella la respuesta positiva a un ítem supone una respuesta
positiva a aquellos ítems que se sitúen por debajo de él. Ello exige una clasificación je rárquica y acumulativa de los ítems. A diferencia de la escala de Thurstone, el universo de ítems se reduce sensible mente. A 30 enunciados, e inclusive menos, si aparecen acompañados de otras pre guntas en el cuestionario. Además, se elimina la prueba de jueces. Basta su previa com probación en una muestra de la población: la prueba piloto o pretest del cuestionario. Las categorías dfe respuesta pueden ser dicotómicas (“de acuerdo” 1, “en desa cuerdo” 0; “sí” 1, “no” 0) o incluir más de dos opciones de respuesta como en las es calas Likert. En este último caso, la puntuación más elevada se asigna al valor de la res puesta que sea más favorable a la actitud. Por ejemplo, “completamente de acuerdo” (4), “de acuerdo” (3), “indiferente” (2), “en desacuerdo” (1), “completamente en de sacuerdo” (0). En ambos casos se sigue el mismo procedimiento de escalamiento, apli cándose la técnica de escalograma llamada Cornell (el nombre de la universidad dónde Guttman trabajaba por aquella fecha), pero con cinco categorías de respuesta.
ZJEMPLO DE ESCALOGRAMA GUTTMAN De Vellis (1991) ilustra el escalograma de Guttman en una escala de aspiraciones de los padres hacia el logro educativo de sus hijos. — Lograr el éxito escolar es la única forma de que mis hijos compensen mis esfuerzos como padre - Ir a un buen colegio y obtener un buen trabajo son importantes para la felicidad de mis hijos - La felicidad es más probable, si una persona ha logrado sus metas educativas y materiales
De acuerdo 1 En desacuerdo 0 De acuerdo 1 En desacuerdo 0 De acuerdo 1 En desacuerdo 0
En una escala Thurstone los ítems quedarían enunciados de esta forma: Lograr éxito es sólo una forma de que mis hijos compensen mis esfuerzos como padre Ir a un buen colegio y obtener un buen trabajo son importantes, pero no esenciales en la felicidad de mis hijos La felicidad nada tiene que ver con lograr metas educativas o materiales
De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo
Las respuestas obtenidas de los sujetos se disponen en una matriz. En las colum nas se sitúan las preguntas, especificándose la respuesta: “sí” (1), “no” (0). En las fi las, los sujetos que contestan. Para cada sujeto, se suma el número de respuestas afir
mativas. Se cambia el orden de las filas de la matriz original para que los sumatorios más elevados ocupen las primeras posiciones y los más bajos las últimas. Los ítems en las columnas también se reordenan para que en las primeras columnas aparezcan los ítems cuyo sumatorio sea más bajo y en la última el más alto. A modo de lo ilustrado en el cuadro 4.5. CUADRO 4.5. Escalograma de seis ítems con respuesta favorable (1) y desfavorable (0)
Sujetos que contestan
Items 3
6
1
2
5
4
Puntuación de los sujetos
1 2 3 4 5 6 7 8 9 10 11 12 13
1 1 1 1 0 0 0 0 0 0 1* 0 0
1 1 1 1 1 1 0 0 0 2* 0 0 0
1 1 1 1 1 1 1 1 1 0 0 0 0
1 1 1 0* 1 1 1 1 1 1 0 0 1*
1 1 1 1 1 1 1 1 0* 1 1 0 0
1 1 1 1 1 1 1 1 1 1 1 1 0
6 6 6 5 5 5 4 4 3 3 2 1 0
Puntuación categorías
5
7
9
10
10
12
53
Errores *
1
1
0
2
1
0
5
* Errores: Valores “1” ubicados en la zona de “0” y a la inversa, “0” en la zona de “1”. Después se calcula el índice de reproductividad para validar la escala:
Donde E = número total de errores; Q = número de ítems; S = número de sujetos que responden. La escala obtenida se considera “válida” cuando el índice es mayor o igual a “0,90”. En caso contrario, se considera invalida. Cuando esto sucede, suele precederse a la eliminación gradual de los ítems que presentan un mayor número de errores. Has
ta que el índice supere el valor de referencia de “0,90”, a partir del cual la escala se con sidera válida. Quiere esto decir que se eliminan aquellos ítems que han obtenido re s p u e s ta s de mayor dispersión.
J E je m p lo d e a p lic a c ió n d el ín d ic e d e r e p r o d u c t iv id a d " I e n la e la b o r a c ió n d e una e sc a la d e g u ttm a n González Blasco (1989/2000) ilustra la confección de una escala de Guttman con cinco proposiciones (o ítems) extraídas de una escala utilizada por C. Srole en la medición del ni vel de anomia (en García Ferrando, M., “Estructura comunitaria y desarrollo organizado”. Reavista de Estudios Sociales, 1971, 3: 3-18). ítems - No es útil escribir a los funcionarios públicos porque a menudo no están interesados en los problemas del hombre de la calle. - Actualmente hay que vivir al día y dejar que el mañana se cuide a sí mismo. - A pesar de lo que se dice, las cosas están cada vez peor para el : hombre medio y no mejor. - El traer niños a este mundo es un problema, dado cómo se presenta el futuro. - En estos días uno no sabe en quién confiar.
% % respuesta Error Error afirmativa 67,3
30,50 7,90
54,4
50,00 12,95
41,7
51,00 13,21
40,7
54,00 13,99
35,2
52,50 13,60