163 57 5MB
Spanish; Castilian Pages [282] Year 2019
AKAL / LINGÜÍSTICA DIRECTORES M. Victoria Escandell Vidal y Manuel Leonetti
SEBASTIAN M. RASINGER
La investigación cuantitativa en Lingüística Una introducción Traducción de Ana Useros Martín y Gema Sanz Espinar
Diseño interior y cubierta: RAG
Reservados todos los derechos. De acuerdo a lo dispuesto en el art. 270 del Código Penal, podrán ser castigados con penas de multa y privación de libertad quienes sin la preceptiva autorización reproduzcan, plagien, distribuyan o comuniquen públicamente, en todo o en parte, una obra literaria, artística o científica, fijada en cualquier tipo de soporte.
Título original: Quantitative Research in Linguistics: An Introduction (2nd edition) La presente traducción se publica por acuerdo con Bloomsbury Publishing Plc. © Sebastian M. Rasinger, 2013 © Ediciones Akal, S. A., 2020 para lengua española Sector Foresta, 1 28760 Tres Cantos Madrid - España Tel.: 918 061 996 Fax: 918 044 028 www.akal.com
ISBN: 978-84-460-4645-5
A mis padres
Agradecimientos
Como suele ocurrir, muchísimas personas se han implicado en el proceso que ha dado lugar a este libro y a todas ellas les estoy eternamente agradecido. Deseo dar las gracias (en una enumeración sin un orden determinado) a mis alumnos y colegas de la Anglia Ruskin University, a los antiguos y a los actuales, por sus aportaciones, por su paciencia y por prestarse a ser las cobayas en mi experimento de hacer accesibles los métodos cuantitativos; a los lectores y comentaristas de la primera edición por sus amables y útiles respuestas y por las sugerencias para mejorar esta segunda edición, y a Gurdeep Mattu y al resto del equipo de Bloomsbury por dar vida a este libro. Y todos los errores o carencias, por supuesto, son únicamente míos. Sebastian M. Rasinger Cambridge, marzo de 2013
1
Introducción
Hay cosas que no cambian: el sol sale por la mañana, el sol se pone por la tarde. Muchos lingüistas odian las estadísticas. Llevo una década enseñando lengua y lingüística inglesa en diversas universidades e, invariablemente, me encuentro con una aversión generalizada a todo lo que sea numérico. La queja más habitual es que la estadística es “¡taaan difícil!”. Pero no lo es. O, al menos, no tendría por qué serlo. Este libro quiere ser varias cosas a la vez. No debería sorprender a nadie que sea una introducción a los métodos de investigación cuantitativos. Como tal es un silabario: un libro que se dirige especialmente a aquellos cuyo conocimiento de la materia sea mínimo. De hecho, la mayoría de quienes lean este libro, deberían poder seguirlo sin ningún conocimiento previo o familiaridad con sus contenidos. Es también una guía, que nos conducirá en el proceso, en ocasiones abrumador, de articular y llevar a cabo un estudio cuantitativo desde el principio hasta el final. Y, en último lugar, es un manual y, como tal, proporciona consejos prácticos sobre la investigación cuantitativa en general y sobre los métodos estadísticos en particular. La idea original que impulsó la primera edición de este libro, publicada en 2008, surgió tras un debate con algunos de mis estudiantes de máster. Después de hablar de los factores que influían en el éxito o fracaso de la adquisición de un segundo idioma, empezamos a centrarnos en el tema de la motivación del aprendizaje y acabé preguntando a) cómo podríamos demostrar empíricamente la motivación del aprendiz y b) cómo podríamos concluir con fundamento que la motivación y los resultados estaban causalmente relacionados. El resultado fue desalentador. Varios estudiantes, de un grupo compuesto en su totalidad por docentes de idiomas con una experiencia de varios años, argumentaron que “un buen profesor puede ver que esto es así”. Y, finalmente, una de ellas me acusó de tratar de medirlo todo: “Tienes una mente demasiado
16
La investigación cuantitativa en Lingüística científica”, me decía. Me fue preciso emplear métodos no demasiado amables para convencerlos de que cualquier trabajo académico sólido debería inevitablemente emplear métodos y técnicas metodológicamente adecuadas, ¡o de lo contrario...! Han pasado cinco años y aún sigo teniendo estas discusiones, pero al menos ahora tengo un libro que recomendar a los alumnos. ¡La investigación cuantitativa no tiene por qué ser difícil! Los criterios de evaluación que marca la UK Quality Assurance Agency —la organización que supervisa los estándares académicos de la educación superior— para los grados de lingüística dictan que: 6.13. Para licenciarse en lingüística, los estudiantes deberán: sDEMOSTRAR UNA COMPRENSIN DE LAS T£CNICAS BÕSICAS DE ANÕLISIS DE datos y sopesar y elegir las técnicas adecuadas, como criterios de distribución, análisis espectrográfico, el uso de herramientas de TI para la investigación de bases de datos informatizadas, el empleo de programas informáticos para el análisis de los fenómenos acústicos, el empleo de técnicas de laboratorio para la investigación de los fenómenos articulatorios, pruebas estadísticas relevantes, el empleo del material de audio y vídeo para el análisis de la interacción oral...; sdemostrar comprensión de datos y análisis presentados mediante diagramas (incluidos diagramas de árbol), tablas, matrices y otros diagramas, así como presentar datos de manera adecuada usando estos medios con una supervisión mínima. (The Quality Assurance Agency for Higher Education, 2007. Linguistics. Subject Benchmarks [222.qaa.uk/ publications/InformationAndaGuidance/Documents/ Linguistics07.pdf, pp. 14-15]. La cursiva es mía).
Puede parecer una extravagancia empezar un manual introductorio con citas de un documento político; pero esta cita muestra lo importante que es una comprensión exhaustiva de los métodos de investigación. A lo largo de los años he calificado una buena cantidad de trabajos de estudiantes, en diversas universidades y en diversos niveles, que empezaban siendo excelentes pero que se desplomaban en cuanto llegaban a la parte del análisis de datos, en muchas ocasiones porque no se había sabido manejar adecuadamente los datos recogidos, porque los análisis eran equivocados y porque se cometían fallos en operaciones matemáticas básicas. Y, lo que es peor, algunos trabajos seguían defendiendo el argumento que habían planteado con indiferencia de si los resultados empíricos lo respaldaban o no. Hay pocas cosas peores que obtener (o dar) una mala nota por algo que podría haberse resuelto con tanta facilidad. Lo digo por experiencia. También tenemos el caso contrario. Puede darse el caso de que no queramos emprender un estudio cuantitativo, por la razón que sea; sin embargo, eso no quiere decir que no surja la ocasión en la que tenga-
Introducción
17
mos que asimilar las líneas básicas de una investigación cuantitativa. La mayoría de los estudios de psicolingüística y sociolingüística –especialmente los que tratan de la variación lingüística– se basan en datos y análisis cuantitativos. Si queremos comprender por completo estos estudios, tenemos al menos que hacernos una idea de lo que significan todos esos términos, índices, ilustraciones y gráficos que contiene. Puede que no sea necesario conocer todas las complejidades matemáticas que implica una prueba t o un Análisis de la Varianza (ANOVA) (véase Capítulo 8), pero es evidente que leer en un artículo que “una prueba t mostró significativas diferencias estadísticas entre los dos grupos” y no saber qué es una prueba t ni qué es estadísticamente significativo no es algo positivo. Hay en el mercado, sin duda alguna, una miríada de libros acerca de los métodos cuantitativos y sobre estadística. Habitan predominantemente en las estanterías de disciplinas como las ciencias sociales o naturales, psicología o economía. Hay también, qué duda cabe, libros de estadística que atienden específicamente a la lingüística, como, por ejemplo, Butler (1985) o Wood et al. (1986) o, más recientemente, los manuales de Johnson (2008) o Gries (2009), por mencionar solamente unos pocos. Todos ellos son obras muy completas a las que poco se puede añadir. Pero mi experiencia como docente de estadística y métodos cuantitativos, tanto a estudiantes como a lingüistas profesionales, me ha enseñado que lo que mucha gente necesita no es únicamente una introducción a la estadística (la parte de mascar números) sino también el enfoque general de la investigación cuantitativa: con frecuencia el problema no son únicamente las matemáticas, sino toda la concepción metodológica. Y, por lo tanto, este libro no trata únicamente de estadística, sino que busca ser una introducción a la investigación cuantitativa en general, escrita específicamente para estudiantes e investigadores en lengua y lingüística. Así pues, este libro está escrito teniendo en mente tres tipos especiales de lectores que, de un modo u otro, forman parte de la vida de su autor: sALOSCOLEGASYESTUDIANTESAQUIENESLESENTRAELPÕNICOCUANDOSE les pide que ejecuten análisis estadísticos sencillos como calcular medias y, por lo tanto, se niegan en redondo a acercarse a nada remotamente relacionado con los números; sALLINGÓISTAQUE APESARDEESTARVERSADOENM£TODOSESTAD¤STICOS insiste en hacer complicados cálculos con lápiz y papel, y se niega a usar un programa informático accesible, haciendo, por lo tanto, de la estadística un asunto aún más penoso; sALESTUDIANTEDEGRADOOPOSGRADO OCUALQUIEROTROINVESTIGADOREN lingüística y otras disciplinas relacionadas con el lenguaje, que se da cuenta en algún momento de que necesita una introducción global a los métodos cuantitativos en su campo para que su proyecto investigador sea metodológicamente sólido. Este libro no exige requisitos previos, aparte de unas destrezas numéricas elementales y un conocimiento básico de cómo usar un
18
La investigación cuantitativa en Lingüística ordenador y los programas habituales: lo único que hace falta es ser capaz de realizar operaciones matemáticas básicas como sumas, restas, multiplicaciones y divisiones, a mano o con la ayuda de una calculadora. Y, claro, ¡mejor si somos lingüistas! Este libro no busca ni pretende que su lector se enamore de la estadística. No obstante, de manera ideal, cualquier lector, una vez leído el libro, debería ser capaz de diseñar un estudio cuantitativo, sencillo pero bien desarrollado, recoger buenos datos empleando métodos apropiados, ejecutar los análisis estadísticos más importantes e interpretar y presentar adecuadamente los datos; en otras palabras, debería impedirnos caer en la “trampa estadística”. También es posible emplear este libro o capítulos individuales para entender conceptos y herramientas particulares de la investigación cuantitativa que aparecen en estudios que usan estas herramientas. Este libro no pretende elaborar o explicar las complejidades matemáticas de los métodos que debate. Más bien ha sido escrito como una guía práctica y debería capacitar a sus lectores para ponerse manos a la obra y hacer investigación cuantitativa desde sus primeras páginas. A lo largo del libro, demostraremos y examinaremos ejemplos o investigaciones lingüísticas reales y discutiremos los métodos y herramientas empleados en investigaciones como Language in the Inner City (Labov, 1977), en la obra de Trudgill acerca de la variación sociolingüística en Norwich (1974) o en los estudios de Johnson y Newports sobre el “periodo crítico” de la adquisición de una segunda lengua (1989, 1991), con el objetivo de ayudar a los lectores a entender los conceptos que presentamos. Esto tiene la ventaja de que podemos leer los estudios originales simultáneamente con el capítulo de este libro en cuestión y aumentar nuestra comprensión de los temas que se debaten. Algunas reseñas de la primera edición de este libro han criticado que los ejemplos se centren en demasía en ejemplos sociolingüísticos y de lingüística aplicada, algo con lo que estoy totalmente de acuerdo. En parte es un reflejo de mis propios intereses investigadores, pero una razón más importante para ello es que muchos de estos ejemplos son comparativamente más fáciles de entender y, a menudo, forman parte del currículo docente. Tratar de explicar estadística a la vez que se explican conceptos lingüísticos complejos es una tarea que excede el alcance de este libro. Además, habiéndose generalizado ya la presencia de los ordenadores, vamos a presentar los pasos apropiados para ejecutar un análisis estadístico usando un programa de hojas de cálculo, específicamente Microsoft Excel. De nuevo, se trata de evitar imponer complicados cálculos manuales y dar a los lectores la oportunidad de practicar la estadística lo más rápidamente posible. Aunque no es un manual de empleo de Excel, no necesitaremos mucho más que un conocimiento básico de cómo meter datos en un programa de hojas de cálculo (el título del manual de Harvey, Excel 2016 para dummies, puede magullarnos un poquito el ego, pero el libro es un buen punto de partida para quienes no hayan usado nunca antes el programa).
Introducción
19
La tarea de escribir una segunda edición de un manual introductorio no es sencilla: por una parte, debería ser diferente, pero por otra, debería conservar su mismo alcance y profundidad. Así que a la vez he ampliado y actualizado ligeramente la edición previa. El libro se divide en tres partes. En la Primera Parte (Capítulos 2-4) presentamos los fundamentos de la investigación cuantitativa, analizando los conceptos fundamentales y los métodos más comunes. El Capítulo 2 expone los conceptos clave de la investigación cuantitativa y examina de cerca diferentes tipos de mediciones y variables, así como la fiabilidad y validez. El Capítulo 3 analiza varios diseños de investigación diferentes y proporciona información acerca de cómo elegir un diseño adecuado según la cuestión en concreto que se quiera investigar. He ampliado este capítulo para incluir un breve epígrafe sobre gestión de proyectos: no es suficiente saber cómo montar un proyecto metodológicamente sólido sobre el papel, hay que hacerlo realidad. El Capítulo 4 se dedica a una discusión en profundidad sobre los cuestionarios, su diseño y su uso en la investigación cuantitativa. La Segunda Parte (Capítulos 5-9) cubre las herramientas estadísticas que se usan más habitualmente en la investigación lingüística. De modo específico, analizaremos cómo describir adecuadamente los datos (Capítulos 5 y 6), cómo demostrar las relaciones entre variables empleando herramientas estadísticas estándares (Capítulo 7) y cómo comprobar si los diferentes conjuntos de datos son significativamente diferentes unos de otros, por ejemplo en situaciones previas y posteriores a la introducción de un estímulo (Capítulo 8). A petición popular, el Capítulo 8 incluye también una discusión sobre ANOVAs. El Capítulo 9 proporciona un panorama de las herramientas estadísticas para el análisis de datos no paramétricos. La Segunda Parte se ha escrito con el siguiente lema en mente: “Exprime todo lo posible tus datos con el menor esfuerzo posible” y, al concluir esta, deberíamos ser capaces de ejecutar análisis sencillos pero exhaustivos de cualquier conjunto de datos empleando Microsoft Excel o un programa similar. Esta segunda parte incluye muchos ejercicios que animo al lector a que haga. Muchos de ellos se analizan detalladamente en el momento para asegurar su comprensión (¡no hay nada peor que obtener una respuesta genérica en las últimas páginas pero que nadie sepa realmente de dónde sale la solución, y no digamos ya interpretarla!). En otros casos, las soluciones de los ejercicios se encuentran en el Apéndice, junto con las tablas estadísticas necesarias para interpretar los resultados. La última parte, el Capítulo 10, es nueva: proporciona un panorama de métodos más avanzados. El primer epígrafe examina el Análisis de Varianza de Variables Múltiples (MANOVA), seguido por una exposición del metaanálisis estadístico, un método para combinar con sentido (por no llamarlo reciclar) resultados de investigaciones previas. El epígrafe final presenta dos ejemplos de programas informáticos para estadística: SPSS, de IBM, y R, con enlaces para obtener más información.
20
La investigación cuantitativa en Lingüística En la Segunda Parte he incluido cuadros de repaso rápido que resumen las principales herramientas estadísticas de las que se habla en el capítulo. En la página web hay también chuletas para estas herramientas, junto con plantillas de Excel y breves vídeos que muestran cómo ejecutar determinadas herramientas estadísticas en Excel. Igualmente cada parte incluye ahora un epígrafe final con sugerencias bibliográficas. Antes de empezar a leer el libro, un consejo que procede de mi experiencia de estudiante así como de profesor de métodos cuantitativos: tratemos de aplicar lo que leemos lo antes posible. He escrito el libro de tal manera que debería ser relativamente fácil –o eso espero—aplicar los temas de los que se habla a medida que se avanza en la lectura. Así que vamos a por papel y lápiz, o abramos el ordenador. Como con muchas cosas en la vida, mejoraremos con la práctica, así que lo mejor es empezar cuanto antes.
Primera parte
2
La investigación cuantitativa: temas básicos
Palabras clave: causalidad - concepto - escala de medición - fiabilidad - hipótesis - investigación cuantitativa - ley - medida - teoría - tipo de variable - validez - variable dependiente - variable independiente - variable latente
Este capítulo trata de algunos conceptos básicos de la investigación cuantitativa, el objetivo principal de este libro. Después de resumir a grandes rasgos las diferencias entre investigación cualitativa y cuantitativa, examinaremos con más detalle los conceptos de medición y los diferentes tipos de variables, a lo que seguirá un análisis de las relaciones causales. Finalmente, presentaremos los conceptos de validez y fiabilidad.
2.1 Datos cualitativos y cuantitativos Aunque casi todos nosotros barruntamos que hay una diferencia entre la investigación cualitativa y cuantitativa, el concepto general que se maneja a menudo suele ser fundamentalmente erróneo. Después de años impartiendo cursos sobre métodos de investigación en varias universidades y en distintos niveles, me encuentro con que la respuesta más habitual a mi pregunta “¿Cuál es la diferencia entre datos cuantitativos y cualitativos?” suele ser algo parecido a “Datos cuantitativos quiere decir muchos datos, y datos cualitativos, buenos datos”. En el peor de los contextos posibles, esto puede conducir a afirmaciones como: “Quiero hacer investigación cualitativa porque quiero hacerlo muy bien.” O, por el contrario: “No merece la pena recoger tantos datos.” Parece, por lo tanto, una buena idea comenzar con un breve resumen de las diferencias entre los datos cualitativos y cuantitativos, proporcionando ejemplos específicos de aplicaciones para ambos tipos y ejem-
24
La investigación cuantitativa en Lingüística plos de conjuntos de datos que puedan interpretarse tanto cuantitativa como cualitativamente. La idea de que datos cuantitativos quiere decir grandes cantidades de datos es solo parcialmente correcta. De hecho, la amplia mayoría de las herramientas de análisis de datos cuantitativos de las que hablaremos en este libro requieren un conjunto de datos de un tamaño importante para poder funcionar adecuadamente. Las cantidades pequeñas de datos a menudo pueden conducir a resultados insignificantes, no concluyentes o erróneos, porque los procedimientos matemáticos que implica el análisis cuantitativo (o estadístico) requieren una determinada cantidad de datos para funcionar adecuadamente. Hablaremos con más detalle de este tema a partir del Capítulo 5. No obstante, la característica principal de los datos cuantitativos es que se componen de información que puede ser, de una forma u otra, FXDQWLÀFDEOH. En otras palabras, podemos convertir los datos cuantitativos en números, cifras y gráficos y procesarlos empleando procedimientos estadísticos (que son un tipo de procedimientos matemáticos). Cuando hacemos análisis cuantitativos, lo que nos interesa averiguar normalmente es cuánto o cuántos casos hay de lo que sea que nos interesa. En la investigación lingüística, una típica variable cuantitativa (es decir, una variable que puede expresarse numéricamente) son las ocurrencias de un rasgo particular, fonológico o sintáctico, en el habla de una persona. Pongamos que nos interesa saber si es más probable que los hablantes del Grupo A se coman la /h/ que los hablantes del Grupo B. Al analizar nuestros datos, por lo tanto, contaremos todas las instancias en las que los hablantes pronuncian una /h/ (como en hotel o house) así como todos los momentos en los que esa /h/ se omite (‘ouse, ‘otel,). Lo que obtenemos al final son cuatro cifras: empleo de la /h/ en el Grupo A, omisión de la /h/ en el Grupo A, empleo de la /h/ en el grupo B, omisión de la /h/ en el grupo B. Un conjunto básico de datos cuantitativos, que podría adoptar la apariencia de la Tabla 2.1 Tabla 2.1. Conjunto básico de datos cuantitativos. Grupo
/h/ pronunciada
/h/ elidida
A
5
18
B
36
1
De hecho, contar las ocurrencias de rasgos particulares (o, dicho técnicamente, el resultado de una variable particular) es la forma más sencilla de análisis cuantitativo. ¡Sí, el análisis cuantitativo puede ser así de fácil! Otras variables cuantitativas populares son la edad de la gente (de nuevo, un número), el peso de la gente (probablemente menos relevante para la lingüística, pero cuantificable y, por lo tanto, cuantitativo) o incluso el sexo de la gente (cuántos hombres/mujeres hay en un grupo concreto). Más adelante, en este capítulo, vamos a examinar los diferentes tipos de datos cuantitativos.
Investigación cuantitativa: temas básicos
25
Los datos cualitativos, por otra parte, se ocupan de las cuestiones de cómo es algo, en oposición a cuánto/cuántos. Cuando se usan datos cualitativos estamos hablando de textos, patrones y cualidades. El análisis cualitativo en lingüística se encuentra más habitualmente en investigaciones sobre análisis del discurso. Por definición, los dos enfoques de análisis también difieren en otro aspecto: la investigación cualitativa es inductiva, es decir, la teoría se deriva de los resultados de la investigación. El análisis cualitativo se emplea a menudo en los estadios preliminares del estudio con vistas a valorar el área de investigación. Por ejemplo, podríamos hacer grupos de discusión y entrevistas, y analizarlas cualitativamente para hacernos una idea de lo que ocurre. Después podemos usar estos hallazgos para explorar estos temas en una escala mayor, por ejemplo mediante una encuesta, y hacer así un análisis cuantitativo. No obstante, hay que subrayar que el análisis cualitativo no es únicamente una herramienta auxiliar para analizar datos, sino un enfoque valioso por sí mismo. La investigación cuantitativa, en cambio, es deductiva: basándonos en una teoría ya conocida, elaboramos hipótesis, que después intentamos demostrar (o falsar) en el curso de nuestra investigación empírica. De la misma manera, optar entre una metodología cuantitativa o cualitativa tendrá un impacto decisivo sobre cómo procedamos con nuestra investigación. Las Figs. 2.1 y 2.2 resumen los procesos deductivo e inductivo de manera gráfica. Hipótesis/ teoría Desarrolla Metodología Genera Datos Analiza
Resultado
Deduce Hipótesis correcta
Hipótesis equivocada
Figura 2.1. Enfoque cuantitativo-deductivo.
26
La investigación cuantitativa en Lingüística Metodología Genera
Datos Analiza Patrones, estructuras Induce Hipótesis/ teoría
Figura 2.2. Enfoque cualitativo-inductivo.
Al inicio del proceso cuantitativo-deductivo figura la hipótesis (o teoría). Una hipótesis es una afirmación acerca de un aspecto concreto de la realidad, como, por ejemplo, “cuanto más baja es la clase socioeconómica, más rasgos no normativos muestra el lenguaje del hablante”. La hipótesis se basa en hallazgos de investigaciones previas y el objetivo de nuestro estudio es demostrarlas o refutarlas. Basándonos en una hipótesis formulada de manera precisa, o en una pregunta de partida, desarrollamos una metodología, es decir, un conjunto de instrumentos que nos permitan medir la realidad de tal forma que los resultados demuestren si la hipótesis es o no correcta. A lo largo de este libro, recordaremos periódicamente que es esencial que la hipótesis/pregunta de partida y el marco de análisis/metodología se desarrollen a la vez y formen una unidad coherente y sólida. Dicho sin rodeos, nuestros métodos de recogida de datos deben facilitarnos recopilar datos que realmente encajen en nuestra pregunta de partida, así como deben encajar nuestras herramientas de análisis de datos. Veremos esta cuestión con mayor claridad a lo largo de este capítulo y de los siguientes. El diseño del marco metodológico/analítico puede ser un proceso que lleve mucho tiempo; especialmente en estudios complejos necesitamos invertir un tiempo y un esfuerzo considerables para desarrollar un conjunto de herramientas fiables y válidas (véase más adelante). Al desarrollo de una metodología exhaustiva y sólidamente cimentada le sigue el proceso de recogida de datos, es decir, la producción de los datos en los que basaremos nuestro estudio. De manera ideal, el estadio de la recogida de datos estaría precedido por un estudio piloto, donde probaríamos la fiabilidad y validez de nuestras herramientas; en el Capítulo 4 hablaremos de las pruebas piloto en relación con las encuestas basadas en cuestionarios. Dependiendo del tema que se investigue, el estadio de la recogida de datos puede ser el que consuma más
Investigación cuantitativa: temas básicos
27
tiempo y recursos de todo el proceso, especialmente cuando los datos (o la gente de la cual obtenemos los datos) no están a mano. Esto incide una vez más en la necesidad de una planificación exhaustiva con antelación: imaginemos que vamos a hacer un estudio que concierne a una tribu de la selva amazónica. Lo último que querríamos es encontrarnos allí en medio de la jungla y descubrir que nuestras herramientas de recogida de datos no funcionan. En el Capítulo 3 aportaré una introducción muy básica a la gestión de proyectos, que nos dará una idea de cómo equilibrar el alcance del proyecto, el tiempo y los recursos con el fin de llegar al resultado que se persigue. Una vez recogidos, analizamos nuestros datos empleando los métodos analíticos que hemos desarrollado con antelación y que nos proporcionarán nuestros resultados. En la investigación cuantitativa, los resultados serán un conjunto (o un grupo de ellos) de números y de índices numéricos que describirán con mucho detalle lo que ocurre en nuestros datos. Ahora viene la parte crucial: basándonos en nuestros propios resultados, volveremos a revisar la hipótesis y compararemos si los resultados encajan bien o mal con ella; solo entonces deducimos si la hipótesis es correcta o incorrecta. Volviendo al sencillo ejemplo de la clase socioeconómica y el uso del lenguaje no normativo, en los datos encontramos que las clases sociales inferiores muestran un número más elevado de uso no normativo del lenguaje, que las clases medias muestran un empleo ligeramente inferior del lenguaje no normativo y que las clases sociales superiores no muestran en absoluto un empleo no normativo del lenguaje. Por lo tanto, nuestros resultados consisten en tres observaciones generales a partir de las cuales deducimos que hay una relación entre la clase social y el uso del lenguaje, de tal forma, que cuanto más baja la clase, más rasgos no normativos aparecen; la hipótesis original ha resultado ser correcta. No obstante, en la vida real normalmente habría muchos más factores implicados y las relaciones entre ellos a menudo no son tan obvias como nos gustaría que fueran. En este caso, el proceso deductivo consiste en sacar conclusiones con precaución y evaluar minuciosamente las pruebas a nuestro alcance. Con frecuencia, no podremos decir de manera concluyente si una hipótesis es correcta o no, pura y simplemente porque las circunstancias son demasiado complejas. Un apunte: a la mayoría de nosotros (no me estoy excluyendo) nos gustaría concluir demostrando siempre que la hipótesis que hemos planteado es correcta y, a menudo, se percibe como un fracaso concluir que nuestra propia hipótesis es falsa. Pero, siempre que la hipótesis original tenga sentido, que el marco de trabajo metodológico/analítico sea bueno y exhaustivo, y que los datos sean de buena calidad (véase al final de este capítulo la discusión acerca de la fiabilidad y validez), no hay nada inherentemente malo en demostrar que una hipótesis no es correcta. A lo mejor nos mina un poco la moral, pero, incluso si mostramos que algo no es así, estamos contribuyendo en cualquier caso a la acumulación del conocimiento. Así que bien podríamos haber descubierto que en nuestro estudio concreto, con nuestros participantes con-
28
La investigación cuantitativa en Lingüística cretos, no hay relación entre la clase social y el uso del lenguaje; si el marco de trabajo es fiable y válido, este sigue siendo un resultado permisible, aun cuando otras investigaciones previas hayan llegado a conclusiones diferentes: simplemente es que, en este contexto particular, no es el caso. Mucho peor, sin embargo, sería una situación en la que los resultados que hemos producido no tuvieran sentido y parecieran aleatorios. Si nos limitamos a Gran Bretaña, habitualmente es cierto que la clase social y el empleo del Standard English están vinculados hasta determinado punto, tal como proponíamos en la hipótesis (las excepciones no hacen sino confirmar la regla). Sin embargo, podríamos descubrir que nuestros resultados invierten la hipótesis y que las clases sociales más altas emplean lenguaje no normativo con mayor frecuencia, mientras que las clases socioeconómicas más bajas emplean más cantidad de lenguaje normativo. Aunque no podríamos descartar inmediatamente este resultado como “equivocado”, sí deberíamos examinar atentamente la metodología, los análisis y los resultados e intentar ofrecer una explicación a este patrón. Como en el ejemplo anterior, podría ser que nuestro resultado fuera únicamente un fenómeno propio del contexto concreto que hemos estudiado; sin embargo, también podría ser que algo hubiera salido catastróficamente mal a lo largo del proceso, bien en la forma en la que recogimos nuestros datos, bien en la forma de analizarlos. Las estadísticas que se obtienen mediante los programas informáticos modernos pueden ser comparativamente sencillas –con unos pocos clics obtenemos los resultados buscados–, pero el número que aparece en la pantalla del ordenador no es más que el resultado de determinadas operaciones matemáticas. La interpretación final sigue siendo cosa nuestra. Como guía general, si alimentamos nuestros programas con basura, lo que obtenemos es basura. El proceso cualitativo-inductivo, por otro lado, es significativamente diferente. Aquí nos limitaremos a hacer una descripción general. Al principio no hay una hipótesis definida, sino una “idea”. Como en el caso anterior, desarrollamos una metodología que nos permita generar y analizar datos. No obstante, mientras que los resultados de un estudio cuantitativo giran inevitablemente alrededor de la hipótesis, el análisis cualitativo revela esquemas o estructuras que están presentes en nuestros datos. Y, a partir de esos esquemas, inducimos una hipótesis o una teoría. La investigación cuantitativa es probablemente el enfoque más habitual en la investigación sociolingüística tradicional, así como en la psicología, la psicolingüística y en buena parte de la investigación social en general. El análisis del discurso, y especialmente el Análisis Crítico del Discurso (ACD), en la tradición de Fairclough (Fairclough, 1988, 1992, 1995), es habitualmente de naturaleza cualitativa, aunque su reciente desarrollo hacia el empleo de métodos derivados de la lingüística de corpus en apoyo del ACD le ha dotado también de aspectos cuantitativos (véanse Hardt-Mautner, 1995, o Baker, 2006, para una visión general). Observemos una muestra de datos que ilustra la diferencia entre el análisis cuantitativo y cualitativo. El siguiente ejemplo procede de Lan-
Investigación cuantitativa: temas básicos
29
guage and Power, de Fairclough (Fairclough, 1988: 18) y es una conversación entre un policía (P) y un testigo (T). 1. P: ¿Pudo ver al del coche? 2. T: Sí, vi su cara. 3. P: ¿Qué edad podría tener? 4. T: Unos 45. Llevaba... 5. P: ¿Y de alto? 6. T: Algo más de 1,80 m. 7. P: Algo más de 1,80 m. ¿El pelo? 8. T: Rizado, oscuro. ¿Cuánto va a durar esto? Tengo que recoger a los niños del colegio. 9. P: No mucho más. ¿Y la ropa? 10. T: Un poco desaliñado, pantalones azules... 11. P: ¿Vaqueros? 12. T: Sí.
No hay que ser un lingüista experto para darse cuenta de que el diálogo se caracteriza por un desequilibrio de poder, en el que P claramente lleva el control de la interacción. Un analista cuantitativo trataría de respaldar esta hipótesis mediante números. Podríamos, por ejemplo, fijarnos en la longitud media de cada turno de palabra, del número de preguntas y respuestas que da cada participante, o podríamos fijarnos en las interrupciones que hace cada participante. Nuestro resultado se parecería bastante a la Tabla 2.2. Tabla 2.2. Análisis cuantitativo del interrogatorio policial. Policía
Testigo/a
Número de turnos de palabra
6
6
Longitud media de cada turno, en palabras
5,5
7
Número de preguntas hechas
6
1
Número de respuestas dadas a las preguntas
2
6
Número de interrupciones realizadas
2
0
A partir de la Tabla 2.2 podríamos concluir sin duda que P parece controlar el diálogo, puesto que hace la mayoría de las preguntas, a la vez que da menos respuestas, y porque es quien interrumpe. Podríamos emplear diversos métodos estadísticos para reforzar este argumento. En cualquier caso, tenemos una buena pista de que P controla la situación hasta un determinado punto. Más concluyente en este caso, no obstante, sería observar lo que ocurre en la conversación en términos de contenido y patrones, es decir, hacer un análisis cualitativo (para un análisis cualitativo completo, véase Fairclough, 1988). Las preguntas de P parecen seguir una secuencia predefinida concreta, tratando de sonsacar información clave. La digresión de T sobre el vestuario en la línea 4 es interrumpida por P, pero P vuelve a retomar el asunto en la línea 9. El intento de T de
30
La investigación cuantitativa en Lingüística parar la entrevista en la línea 8, aunque obtiene un reconocimiento, es más o menos ignorado (línea 9), lo que indica claramente que no estamos ante una charla entre dos amigos. En resumen, nuestro breve (y extremadamente superficial) análisis ha mostrado hasta qué punto difieren los enfoques cuantitativo y cualitativo. Ambos pueden aplicarse a los mismos conjuntos de datos, pero, en este caso, el análisis del cómo es mucho más útil que el análisis del cuánto. La decisión de optar por un enfoque cuantitativo o cualitativo está irremediablemente vinculada al tipo de cuestión que investigamos. Las preguntas que guían la investigación y los métodos empleados para responderlas deben desarrollarse a la vez en un marco de trabajo coherente; esto es algo en lo que insistiré mucho a lo largo del libro. Como hemos dicho antes, la investigación cualitativa observa cómo es algo, mientras que la investigación cuantitativa se interesa por cuántas veces ocurre ese algo o cuánto hay del elemento que nos interesa. Para que un proyecto de investigación alcance su objetivo es necesario especificar desde el inicio qué queremos descubrir y cómo vamos a conseguirlo. Los investigadores primerizos, como es el caso de los estudiantes de grado, a menudo conciben una idea tipo ‘quiero observar X y voy a usar Y’, a pesar de que Y sea una herramienta inapropiada para conducirnos a cualquier conclusión razonable acerca de X. A menudo esto se debe a un fuerte miedo (o aversión) ante cualquier cosa relacionada con las matemáticas, y la consecuencia es un enorme rechazo hacia cualquier cosa que suene a estadística y, por lo tanto, hacia la investigación cuantitativa, aun cuando la única forma razonable de responder la cuestión sea cuantitativa. Así que veamos algunas situaciones en las que es inevitable usar un análisis cuantitativo. s#UALQUIERESTUDIOCUYOARGUMENTOPRINCIPALSEBASEENCONTARCOsas. Esto puede sonar bobo, pero constituye la forma más básica de un análisis cuantitativo. Por ejemplo, puede que nos interese saber: ° ¿Cuántos verbos transitivos hay en Beowulf? ° ¿Cuántos estudiantes se han examinado de selectividad este año? ¿En cuántas ocasiones un determinado político se ha contra° dicho en un mismo discurso? Ninguna de estas preguntas requiere un procedimiento matemático sofisticado; no obstante, todas son de naturaleza cuantitativa, puesto que se basan en el trabajo numérico (número de palabras, de estudiantes, de contradicciones). Si elegimos una tema de investigación que se base esencialmente en los números, tendremos que trabajar con números, y eso no tiene por qué ser difícil. s#UALQUIERESTUDIOQUEBUSQUEdemostrar que dos o más grupos de personas (u objetos) son claramente distintos. Entre las preguntas típicas que inician una investigación podríamos tener: ° “Los hombres dicen más tacos que las mujeres”.
Investigación cuantitativa: temas básicos
31
° “Los miembros de una clase social inferior emplean más las formas no normativas del lenguaje que los miembros de las clases sociales superiores”. ° “La promoción de este año ha sacado mejores notas en los exámenes que la promoción del año pasado”. Para todos estos casos, básicamente, hay primero que contar y después hacer una comparación: en el primer caso, contaríamos el número de tacos que emplean los hombres (durante una hora, por ejemplo) y compararíamos el resultado con el número de tacos que emplean las mujeres. El segundo ejemplo funciona exactamente igual: contamos y después comparamos el empleo de formas no normativas entre los dos grupos. El tercer ejemplo, de nuevo, se basa en la comparación de dos valores: las notas de los exámenes de la promoción de este año y las notas de la del año pasado. En los Capítulos 5 y 6 hablaremos con más detalle de cómo describir estas diferencias, mientras que en el Capítulo 8 explicaremos cómo pueden hacerse estas comparaciones de una forma estadísticamente sólida. s#UALQUIERESTUDIOQUEBUSQUEMOSTRARQUEDOSVARIABLESESTÕNRELAcionadas, es decir, que ocurren simultáneamente siguiendo un patrón concreto, a menudo en la forma de ‘cuanto más/menos X, más /menos Y’. Estos estudios se basan en la premisa de que un cambio en una de las variables tendrá como resultado un cambio en la otra variable: ° “Cuánto más tarde se comience a adquirir un segundo idioma, más lento será el progreso”. ° “Cuanto más baja la clase social, más formas no normativas del lenguaje aparecen”. ° “El número de préstamos lingüísticos ha aumentado regularmente a partir del año 1300”. En términos muy básicos, estas cuestiones se basan de nuevo en comparaciones entre diferentes valores numéricos, pero, a diferencia de los ejemplos anteriores, ahora observamos más de dos grupos y/o más de dos puntos temporales. Por supuesto, hay muchas más situaciones en las que tendremos que emplear una metodología cuantitativa; sin embargo, y hasta cierto punto, son únicamente modificaciones de las situaciones arriba propuestas. Así que, ¿en qué situaciones no podemos (ni debemos) emplear una metodología cuantitativa sino un método cualitativo? Recordemos que la investigación cuantitativa es deductiva: basamos nuestra investigación e hipótesis en teorías que ya existen, mientras que la investigación cualitativa es inductiva y busca desarrollar teorías. La investigación cualitativa puede que tenga la ventaja de no necesitar matemáticas, pero es una ventaja únicamente superficial: no solo no tendremos una base teórica profunda, sino que muy a menudo no sabremos qué es
32
La investigación cuantitativa en Lingüística lo que encontramos. Para investigadores sin experiencia puede convertirse en una pesadilla. Ejemplos destacados de investigación cualitativa sobre lengua son los estudios de etnografía o de lingüística antropológica (véanse, por ejemplo, Duranti, 1997, o Foley, 1997, para una introducción al tema). La antropología en general se ocupa, dicho muy toscamente, de los patrones de comportamiento humano y la lingüística antropológica se centra en el comportamiento comunicativo en general. Baquedano-López (2006) ha analizado prácticas de alfabetización en diferentes contextos de aprendizaje como pueden ser el entorno educativo, fuera de la escuela, etc. La obra de Baquedano-López es cualitativa, puesto que se centra en cómo es la alfabetización, en oposición a cuánta alfabetización hay (es decir, el alcance o la competencia, que serían claramente cuestiones cuantitativas), así como en los patrones y estructuras de esta, en oposición a, por ejemplo, la proporción de alfabetismo en una población determinada (que de nuevo sería un asunto cuantitativo). Los análisis cualitativos pueden proporcionar sorprendentes hallazgos, pero requieren que el analista se sumerja profundamente en los datos para poder así desarrollar algún marco de trabajo teórico a su medida. Una simple descripción de lo que está ocurriendo no es un análisis cualitativo adecuado. Y así, en la investigación cualitativa, a menudo nos encontramos frente a enormes cantidades de datos a los que tenemos que dar un sentido, ordenándolos y desarrollando categorías en las que podamos colocar los diversos fragmentos de estos datos. Para quienes tengan menos experiencia, esto puede resultar difícil, especialmente si tenemos en cuenta que los datos cualitativos pueden a menudo interpretarse de maneras diferentes y que no hay una respuesta correcta o incorrecta. Los métodos cuantitativos, por otro lado, al menos nos dan un resultado matemáticamente correcto (si se aplica bien) que a menudo funciona como un punto de partida para nuestra interpretación: 2 y 2 siempre son 4 y lo único que necesitamos es interpretar ese resultado dentro de nuestro marco de trabajo teórico. Sin embargo, en los últimos años hemos asistido a una proliferación de investigaciones que emplean diseños metodológicos mixtos, es decir, que emplean métodos tanto cuantitativos como cualitativos para investigar un tema; esto suele ser habitual cuando se trata de temas tan complejos que una separación categórica entre cualitativo y cuantitativo no funcionaría. Bergman (2012), Creswell y Plano Clark (2010) y Dörnyei (2007), entre otros, proporcionan una buena introducción acerca de cómo llevar a cabo estudios de metodología mixta.
2.2. Variables y mediciones El concepto de variable está en el núcleo de la investigación cuantitativa. Como definición general, una variable es un rasgo mensurable de un caso concreto: un caso es una ‘cosa’ concreta o una unidad que
Investigación cuantitativa: temas básicos
33
muestra este rasgo mensurable concreto. En lingüística, un caso puede ser una persona, o un grupo de personas, o una unidad lingüística. Tal como el término variable implica, los valores (o resultados) de este rasgo pueden variar de manera considerable entre los casos. Cada caso solamente puede arrojar un valor para un rasgo concreto. Por ejemplo, la variable sexo, cuando se aplica a los seres humanos, se considera habitualmente que tiene dos valores o resultados potenciales, ‘varón’ o ‘mujer’, y que una persona solamente puede ser lo uno o lo otro, es decir, o varón o mujer, pero no ambos al mismo tiempo, con las excepciones que pueda haber. La variable edad puede, en teoría, variar desde los 0 años de edad hasta un número indefinido (dando por sentado que no hay una edad naturalmente predefinida para que los seres humanos se mueran) y, de nuevo, un individuo solamente puede arrojar un resultado: obviamente solo se tiene una edad cada vez. En un grupo, por ejemplo, de diez personas, podemos obtener diez valores diferentes para la variable edad, cuando se dé la circunstancia de que ninguna de las diez personas tenga la misma edad que otra del mismo grupo. Las variables lingüísticas funcionan según el mismo principio: en un estudio de la variación sintáctica en el lenguaje oral podemos querer observar la presencia o ausencia de verbos copulativos en construcciones sujeto-predicado del tipo “La chica es guapa” o “Él ø gordo”. Nos puede convenir definir nuestra variable presencia copulativa de tal manera que solamente pueda arrojar dos resultados: cópula presente ({+Cop}) y cópula ausente ({–Cop}). En nuestros ejemplos, la primera frase, “La chica es guapa” adoptará el valor {+Cop}, mientras que la segunda adopta {–Cop}. En un corpus ficticio de, pongamos por caso, 1.000 construcciones sujeto-predicado podemos encontrar 750 {+Cop} y 250 {–Cop}, pero, al igual que ocurría con el sexo, no se permiten otros valores (‘un poco de cópula’ no tiene demasiado sentido, de la misma manera que alguien no puede estar ‘un poco muerto’). Para un proyecto diferente, podría ocurrir que simplemente nos interesara el número de sintagmas nominales (SN) por frase en un corpus de 1.000 frases. Aquí la variable número de SN puede, teóricamente, adoptar muchos valores: sLa chica es guapa contiene 1 SN (“la chica”) sEl gato persigue al ratón 2 SN (“el gato” y “el ratón”). sEl gato persigue al ratón por el jardín de grandes árboles y verde hierba tiene 5 SN: “el gato”, “el ratón”, “el jardín”, “grandes árboles” y “verde hierba”. Estrechamente ligado al concepto de variable encontramos el concepto de medición. Medición es el proceso de asignar el valor específico de una variable a un caso concreto, usando criterios predefinidos. Tanto el término como el concepto son muy conocidos: cuando medimos el tamaño de un objeto, acercamos una regla o una cinta métrica al objeto; dependiendo de las unidades con las que trabajemos (centí-
34
La investigación cuantitativa en Lingüística metros, metros, pulgadas, pies), podemos entonces asignar el valor correspondiente a nuestro objeto. Si nos interesa su peso, colocamos el objeto en una balanza y le asignamos el valor correspondiente (en kilos o gramos). La medición, sin embargo, puede ser algo mucho más importante, en tanto que normalmente significa colocar un objeto o una persona concreta (un ‘caso’) en una categoría predefinida. Así que, hablando en puridad, también podemos medir el sexo de una persona: tenemos dos categorías claramente definidas, varón y mujer, y colocamos nuestro caso dentro de una de ellas, dependiendo de lo bien que nuestro caso se ajuste a la categoría. Es crucial que las categorías que asignemos a nuestros objetos estén bien definidas y estas no deben cambiar durante el proceso de medición: solo podremos emitir afirmaciones fiables acerca de la longitud de un objeto en centímetros cuando, en primer lugar, hayamos definido con claridad cuánto mide un centímetro y, en segundo lugar, cuando un centímetro se refiera siempre exactamente a la misma longitud y no varíe durante la medición. Además, nuestras herramientas de medición de las propiedades de un objeto deben diseñarse de tal forma que puedan medir adecuadamente todos nuestros casos. Por ejemplo, en los seres humanos, normalmente nos apañamos con dos categorías para medir el sexo biológico (se vuelve todo más complejo cuando observamos la categoría de género, que se define culturalmente): varón y mujer, y, en la amplia mayoría de los casos, deberíamos poder colocar a un ser humano en una de las dos categorías. Sin embargo, si quisiéramos emplear nuestro sistema de medición de dos categorías para determinados invertebrados, como las lombrices, nos meteríamos en un atolladero: las lombrices son hermafroditas, esto es, son a la vez macho y hembra, y, cuando se aparean, pueden ejercer simultáneamente las dos funciones. Ya hemos dicho antes que cada caso solo puede tener un único valor para una variable concreta, es decir, que no podemos colocar a un individuo lombriz en ambas categorías, macho y hembra; sin embargo, en este caso, colocarlo dentro del grupo de los machos (o de las hembras) reflejaría la realidad de manera inexacta. Por lo tanto, tendremos que ajustar convenientemente nuestra herramienta de medición: en el ejemplo de las lombrices probablemente tendríamos que añadir una categoría ambos.
2.3. Definiciones, conceptos y operacionalización Habrá lectores que piensen que presto un interés desusado a cosas muy sencillas. Después de todo, la mayoría de nosotros somos perfectamente capaces de medir la edad, el sexo o el peso de alguien. No obstante, hay casos en los que el proceso de adjudicar un valor a la variable de un caso no es tan sencillo. Un problema habitual, especialmente para los investigadores que se inician en un área de estudio determinada, es
Investigación cuantitativa: temas básicos
35
que no siempre está claro qué se mide, por no hablar de cómo se mide. Un ejemplo típico es el concepto de motivación. A lo largo de los años me he cruzado con innumerables estudiantes, tanto de grado como de posgrado, a quienes les interesaba saber cómo influye la motivación en el progreso de los aprendices de una segunda lengua. El problema suele empezar cuando pregunto, “Y eso, ¿cómo vas a medirlo?”. Todos sabemos que la motivación desempeña un papel crucial en la adquisición/aprendizaje de una segunda lengua; sin embargo, para llegar a una conclusión sólida del tipo ‘cuanto más alta sea la motivación de los estudiantes, mejor será el resultado’ necesitamos medir los diferentes niveles de motivación. Pero, incluso antes de medirlos, tenemos que GHÀQLU con claridad lo que realmente es la motivación. Un repaso a la bibliografía sobre el tema muestra que la motivación es un sistema complejo con varios factores interrelacionados, entre los cuales Stern (1983) identifica actitudes sociales, valores y sin duda otros “factores del aprendiz”. Más recientemente, la motivación suele vincularse con el “yo del aprendiz” (véase Dörnyei y Ushioda, 2009, para un panorama general). Como tal, la motivación es un concepto, más que una variable; de hecho, la motivación consistiría en diversas variables, cada una de las cuales debe medirse por separado. En otras palabras, no podemos medir con fiabilidad la motivación tal cual, y mucho menos mediante métodos tipo preguntar a los aprendices “si están muy motivados”. Cuando se construyen conceptos, hay que asegurarse de que sean epistemológicamente sólidos. Para decirlo claramente: tienen que tener sentido. Por ejemplo, un concepto solo puede describirse mediante términos y definiciones que sean previamente conocidos y mensurables. En el ejemplo que hemos puesto, necesitaríamos varios factores del aprendizaje, ya conocidos y mensurables, para poder definir nuestro concepto “motivación”. Un ejemplo diferente sería el concepto de cohesión: “La cohesión puede definirse como un conjunto de recursos para construir las relaciones en el discurso” (Martin, 2001: 35). La clave está en la definición: como tal ‘conjunto de recursos’, no puede medirse directamente, pero podemos aproximarnos a él observando los diversos componentes que dan cohesión a un texto. Una vez hayamos definido el concepto que queremos investigar, hay que establecer una serie de definiciones operacionales; tenemos que operacionalizar nuestro concepto. En otras palabras, necesitamos decidir cómo medimos la variable o las variables que describen nuestro concepto. Para volver a nuestro ejemplo, desarrollaríamos una serie de preguntas (o variables) que se referirían a los diferentes aspectos de la motivación, como pueden ser las actitudes hacia la lengua, el proceso de aprendizaje, el entorno, etcétera. Vamos a ver un ejemplo real que ilustre la idea de concepto y de su medición. A finales de la década de 1970, Giles et al. (1977) desarrollaron el concepto de vitalidad etnolingüística para proporcionar un marco de trabajo que pudiera responder a la cuestión de “qué hace que sea probable que un grupo se comporte como una entidad colectiva distintiva
36
La investigación cuantitativa en Lingüística y activa en las relaciones entre grupos” (308). No hay que profundizar mucho para entender que el ‘comportamiento grupal’ no es algo que pueda medirse directamente, como la edad o el peso de una persona, sino que es un constructo que comprende diversos temas y aspectos. Giles et al. identificaron tres categorías de variables, cada una de las cuales debía medirse independientemente y, más o menos, de manera objetiva: a. La posición social del grupo, basada en variables objetivas y objetivamente mensurables, como los ingresos (cuánto dinero ganan los miembros individuales del grupo), la actividad económica (tasa de paro), los patrones de empleo (qué tipo de trabajos tienen), pero incluyendo también aproximaciones al estatus más complejas, como la percepción del grupo o el idioma del grupo (por ejemplo, si el idioma del grupo es un idioma oficial, como el catalán en España). b. Los factores demográficos, teniendo en cuenta tanto los tamaños absoluto y relativo del grupo así como su densidad (es decir, cuántos miembros del grupo viven en un espacio geográfico claramente definido). De nuevo, estas variables son comparativamente sencillas de medir. c. El apoyo institucional, que mide hasta qué punto el grupo recibe apoyo formal e informal a través de instituciones oficiales y/o comunitarias (gobierno, escuelas, iglesias, autoridades locales, etc.). Aunque esta última categoría es en sí misma un concepto bastante abstracto (véase la obra original para más detalles), en último término proporciona un resultado cuantificable. Giles et al. defienden que, cuanto más alto puntúa un grupo en cada una de estas categorías, más elevada es su Vitalidad Etnolingüística. Así, los valores (o las puntuaciones) obtenidos en las categorías individuales nos permiten cuantificar de manera bastante objetiva la vitalidad de un grupo. En otras palabras, podemos adjudicar una cifra comparativamente fiable para describir un concepto bastante abstracto. Es importante que dediquemos algún tiempo, cada vez que diseñemos un estudio cuantitativo, a pensar exhaustivamente en nuestras variables, en cómo medirlas y en cómo operacionalizar esta medición. Y para ello es de enorme importancia que tengamos una idea precisa del aspecto que podrían potencialmente tener nuestras variables antes de desarrollar un método que capture la mayor variación posible dentro de esta variable. La fonología es un buen ejemplo lingüístico para ilustrar esto. Tradicionalmente, los sociolingüistas y los dialectólogos se han centrado en la variación en la pronunciación y han intentado explicar esta variación mediante diversas dimensiones, como pueden ser las categorías sociales y las áreas geográficas. Sebba (1993: 23), en su estudio sobre el London Jamaican, habla de algunas de las diferencias fonológicas entre el criollo jamaicano y el inglés de Londres y, en su ejemplo, identifica, en un mismo hablante, dos realizaciones diferentes para la pronunciación del sonido /u/ en “who” y de la consonante inicial en “the”: [hu:] frente a [hݜ:] y [di] frente a [ÿ]ܫ. Si, al igual que
Investigación cuantitativa: temas básicos
37
Sebba, consideramos que esta diferencia fonológica es importante, debemos emplear una medición que la tenga en cuenta. En otras palabras, necesitamos una definición operacional que nos permita –en la práctica– clasificar claramente una vocal concreta como [u:]/[ݜ:] y una consonante concreta como [d]/[ÿ]. Al mismo tiempo, si dichas diferencias no fueran de interés para nuestro estudio, no necesitaríamos tenerlas en cuenta. El truco consiste en desarrollar una metodología que nos permita medir lo más exactamente posible lo que necesitamos, pero que no complique innecesariamente las cosas. Lo mismo podríamos hacer con la distribución de las distintas pronunciaciones de la ‘ll’ en castellano como []ݠ/[y] o incluso [li]. Una advertencia: algunos conceptos, especialmente los abstractos y los que comprenden diversas variables y subconceptos, son especialmente difíciles de medir. La motivación, como hemos señalado antes, es uno de ellos, como también lo son las actitudes. Un análisis cuantitativo de estos conceptos lleva mucho tiempo, mucho trabajo y un montón de pruebas de ensayo y error. La valoración exhaustiva de los trabajos previos y, en especial, de las metodologías empleadas (incluidas todas las dificultades y trampas) es vital, posiblemente más que para cualquier otro estudio. Suele ser es una buena idea, aunque consuma mucho tiempo y recursos, apoyar los datos cuantitativos en estos temas con hallazgos cualitativos procedentes de entrevistas o de grupos de discusión. A menudo, la combinación de los resultados cualitativos y cuantitativos proporciona conclusiones mejores y más fiables que los de un solo enfoque aislado.
2.4. Variables independientes y dependientes Siguiendo con el estudio de las variables en general, vamos a ver ahora las relaciones que las variables pueden tener entre sí. Más específicamente nos centraremos en las variables independientes y dependientes. La diferencia crucial entre variables independientes y dependientes es que estas últimas pueden ser influidas por las primeras, pero no viceversa. Una variable independiente habitual en la investigación lingüística es la edad. La investigación en adquisición de segundas lenguas ha mostrado que la edad influye –hasta cierto punto– en el éxito de la adquisición, en tanto que es más probable que los aprendices mayores alcancen una competencia menor en la segunda lengua que los más jóvenes. En este caso, el éxito de la adquisición del lenguaje depende de la edad y, por lo tanto, el éxito es la variable dependiente. Al mismo tiempo, nadie argumentaría que la competencia en una segunda lengua influye en la edad de una persona, ¡nadie envejece únicamente porque aumente su competencia en otras lenguas! En entornos experimentales, la variante independiente es a menudo manipulada deliberadamente por el investigador, mientras que la variable dependiente es el resultado observado del experimento. Por ejem-
38
La investigación cuantitativa en Lingüística plo, si nos interesa medir si el reconocimiento de palabras disminuye a medida que aumenta la velocidad con la que esa palabra se le presenta a un participante, la variable independiente sería la velocidad (en tanto puede ser manipulada por el investigador), mientras que la variable dependiente sería el resultado (es decir, la exactitud con la que son reconocidas las palabras). Aunque en muchas preguntas de investigación las variables independientes y dependientes están claras desde el inicio, puede haber constelaciones en las que sea más difícil definir cuál es cuál. Por ejemplo, la investigación sociolingüística ha mostrado fehacientemente que las clases sociales y el empleo de rasgos no normativos son variables correlacionadas; a menudo, los rasgos no normativos ocurren con más frecuencia en el habla de las clases socioeconómicas más bajas. Se puede considerar que la clase social es la variable independiente, puesto que influye en la manera en la que habla la gente. Sin embargo, se puede entender también que las actitudes en contra del empleo de rasgos no normativos concretos suponen una desventaja para los hablantes no normativos, que les impide acceder a determinados trabajos y, en último término, les veta el éxito socioeconómico. Al final es una cuestión tipo huevo/gallina y requiere de un minucioso estudio a la hora de interpretar nuestros resultados.
2.5. Causalidad y variables ocultas La discusión sobre las variables independientes y dependientes nos conduce inevitablemente al tema de la causalidad. Como ya hemos visto en el ejemplo previo, no siempre está del todo claro qué variable produce qué resultado. Causalidad significa que hay una relación causal entre A y B, es decir, que los cambios en A producen cambios en B o viceversa. Como veremos más adelante, hay diversos métodos estadísticos que pueden emplearse para medir la relación entre dos variables; no obstante, no nos dicen nada sobre si las dos variables están causalmente vinculadas. Volvamos al ejemplo de la edad y el inicio de la adquisición. He apuntado antes que la edad en la que se comienza la adquisición influye en la posterior competencia en la segunda lengua; y muchas investigaciones empíricas han mostrado que, cuanto mayor sea la edad que tengan los aprendices en el momento de comenzar a aprender una segunda lengua, menor será la puntuación de su competencia. A partir de aquí, no cuesta nada defender que la edad y la competencia se encuentran en una relación causal la una con la otra; de hecho, hay mucha gente que defiende exactamente esto. Sin embargo, hablando con exactitud, lo que muchos estudios muestran es solamente una cosa: que los valores de la variable edad y los valores de la variable competencia ocurren simultáneamente en un patrón especial, es decir, que cuanto más altos son los valores edad, más bajos son los valores competencia. Para poder hablar de una relación causal, nuestras variables deben mostrar tres características:
Investigación cuantitativa: temas básicos
39
a. Deben estar correlacionadas la una con la otra, es decir, sus valores deben ocurrir a la vez siguiendo un determinado patrón: por ejemplo, cuanto más mayor sea un hablante, más rasgos dialectales se encontrarán en su habla (véase Capítulo 7). b. Debe haber una relación temporal entre las dos variables X y Y, es decir, Y debe ocurrir después de X. En el ejemplo sobre el reconocimiento de palabras del Epígrafe 2.4, esto querría decir que, para que la velocidad tuviera un efecto causal sobre la ejecución, la velocidad debería aumentar primero y el bajón en la ejecución de los participantes debería producirse después. Si la ejecución empeora antes de que aumentemos la velocidad, es altamente improbable que haya causalidad entre las dos variables. Los dos fenómenos simplemente ocurren de manera simultánea por pura coincidencia. c. La relación entre X e Y no debe desaparecer cuando se controla mediante una tercera variable. Mientras que, a la hora de analizar la causalidad entre dos variables, la mayoría de la gente tiene en cuenta habitualmente los dos primeros puntos, los investigadores con menos experiencia (como es el caso de los estudiantes de grado) cometen con frecuencia el error de ignorar el efecto que las terceras variables (a menudo variables ocultas) puedan tener en la relación entre X e Y y dan por bueno cualquier resultado que hayan obtenido. Que esto puede tener graves consecuencias para la investigación lingüística resulta obvio cuando reflexionamos sobre la naturaleza propia del lenguaje y de sus usuarios. Todo estudiante de primer curso de lingüística aprende que hay más o menos una docena de factores sociolingüísticos que influyen en la forma que usamos el lenguaje, entre ellos la edad, el género, el contexto social, educativo y regional, etc. Y todo esto antes de que hayamos empezado a considerar siquiera los aspectos cognitivos y psicológicos. Cuando investigamos la relación entre dos variables, ¿cómo podemos estar seguros de que no hay una tercera (o cuarta o quinta) variable ejerciendo una influencia sobre lo que sea que estemos midiendo? En el peor de los casos, las variables ocultas afectarán a nuestras mediciones de tal forma que amenacen su validez, como veremos más adelante. Volvamos, por ejemplo, al debate sobre la edad de inicio de la adquisición. En general se aduce que la edad a la que la gente adquiere una segunda lengua influye en el éxito de dicha adquisición hasta cierto punto; muchos estudios han mostrado que, cuanto mayor es el aprendiz al comienzo de su adquisición, menor será su progreso. No hay que ser un experto en este campo para localizar un enorme problema con esta hipótesis: como muchos de nosotros probablemente tengamos presente, el progreso de la adquisición de una segunda lengua está sometido a toda una gama de factores, entre ellos la motivación o la cantidad y cualidad de la información que se recibe. Por lo tanto, defender que únicamente la edad influye en el desarrollo de una segunda lengua es algo altamente problemático. Cualquier estudio que trate de establecer un vínculo así debería, pues,
40
La investigación cuantitativa en Lingüística prestar una atención considerable al resto de los factores y tratar de eliminarlos, ya sea mediante modificaciones metodológicas, ya mediante imaginativos métodos estadísticos.
2.6. Escalas de medición Cuando estudiamos algunas de las variables lingüísticas más frecuentes, queda claro que estas difieren entre sí en lo que se refiere a los valores que pueden adoptar. Como ya hemos mencionado, en el caso de los humanos, la variable sexo solamente puede adoptar uno de dos valores: ‘varón’ o ‘mujer’. La edad, por otra parte, puede tener cualquier valor a partir de cero, como ya hemos visto. Las puntuaciones de un examen estandarizado de competencia idiomática, como el International English Language Testing System (IELTS), habitualmente coloca a los examinados dentro de una clase o categoría concreta que se describe mediante un número: una puntuación IELTS de 1 indica que el examinando “esencialmente no posee la habilidad de emplear el idioma más allá posiblemente de unas pocas palabras aisladas”, mientras que una puntuación de 9 significa que “muestra un dominio del idioma totalmente operativo: adecuado, exacto y fluido, con una comprensión total” (www.ielts.org2013). Estas diferencias, que se explican más detalladamente en los siguientes epígrafes, se refieren a la escala de medición de una variable y tienen un profundo impacto sobre el tipo de métodos estadísticos que podemos emplear, por lo que es muy importante que, desde el inicio de nuestra investigación, establezcamos los distintos niveles que hay que tener en cuenta en una variable.
Escala categórica o nominal En general distinguimos entre cuatro escalas de medición diferentes. En el extremo inferior se encuentran las variables categóricas. Estas variables pueden tener dos o más resultados claros, es decir, nos permiten clasificar nuestro caso solo en una clase o categoría. Cuando nos fijamos en la variable sexo, la variable solamente puede adoptar uno de los dos valores potenciales, ‘varón’ o ‘mujer’. Respuestas intermedias no están permitidas, no se puede ser ‘0,7 varón’. De manera similar, las preguntas sobre si una mujer está o no embarazada solo pueden arrojar uno de los dos valores: sí o no, pues evidentemente no se puede estar “un poquito embarazada”. El Cuestionario Habitual sobre Igualdad de Oportunidades le pide a la gente que señale su origen étnico y normalmente proporciona una lista de categorías entre las cuales la persona entrevistada debe escoger una, por ejemplo, blanco británico, blanco irlandés, blanco otros, afrocaribeño, surasiático, etc. De nuevo, esto nos permite asignar a los entrevistados una categoría concreta y, de nuevo, las respuestas intermedias del tipo 70 por 100 blanco británico con 30 por 100 afrocaribeño no se tienen en cuenta, incluso aunque sean genéticamente posibles.
Investigación cuantitativa: temas básicos
41
Es muy importante señalar que los resultados de las variables categóricas no reflejan ningún tipo de jerarquía: “varón” no significa ‘mejor’ o ‘más’ que “mujer”, de la misma forma que “embarazada” o “no embarazada” no pueden colocarse en un orden que tenga sentido. Estamos simplemente etiquetando o categorizando nuestros casos.
Escala ordinal De manera semejante a los datos categóricos, las variables ordinales nos permiten poner etiquetas concretas en cada caso. Pero, además, los datos ordinales pueden adoptar algún tipo de orden o sistema jerárquico. Un ejemplo popular que ilustra los datos ordinales es lo aburridas que pueden ser las clases magistrales en la universidad. Los estudiantes pueden clasificarlas como “interesantes”, “buenas”, “aburridas” o “muy aburridas”. Es evidente que hay un orden semántico inherente en estas etiquetas, en las que el aburrimiento va en aumento, desde “interesantes” hasta “muy aburridas”; en otras palabras, se pueden jerarquizar las clases según su grado de aburrimiento. No obstante, no podemos hacer ninguna afirmación acerca de las diferencias entre las etiquetas particulares: “muy aburrida” no quiere decir “dos veces más aburrida que aburrida”, sino que sencillamente es un indicador de que una es peor que la otra.
Escala de intervalo Avanzamos un poco más con las variables de intervalo. De nuevo nos permiten etiquetar casos y ordenarlos en una secuencia con sentido. Sin embargo, a diferencia de la escala ordinal, aquí se le asigna un valor fijo a los tramos entre las variables individuales de la escala. Un ejemplo típico son los sistemas de puntuación que evalúan el trabajo entre la A y la D, en el que A es la mejor nota y D la peor. La diferencia entre A y B es la misma que entre B y C y que entre C y D. En el sistema de puntuación de la universidad británica, B, C y D (Upper Second, Lower Second y Third Class) cubren un tramo de 10 puntos porcentuales y, por lo tanto, serían variables de intervalo; sin embargo, como la puntuación First Class abarca entre el 70 y el 100 por 100 y Fail (suspenso) desde un 30 por 100 hasta 0, este orden se sabotea en cierto modo. En su forma más pura, y con el fin de evitar problemas en el análisis estadístico, todas las categorías de una medición de intervalo deberían guardar la misma distancia entre ellas. Los datos de intervalo se emplean habitualmente en la investigación social y psicológica (y, por lo tanto, en la investigación sociolingüística y psicolingüística) bajo la forma de escalas de Likert, de las que hablaremos con detalle en el Capítulo 4.
Escala de razón Además de indicar distancias iguales entre dos puntuaciones adyacentes, como en la medición de intervalo, las escalas de razón o racionales se caracterizan por tener un punto cero natural, donde cero indica que no hay una cantidad mensurable de lo que sea que estemos midiendo.
42
La investigación cuantitativa en Lingüística Es también posible que una medición racional quede abierta. Por ejemplo, un peso cero indica que el objeto no pesa nada; la cantidad de peso es, por lo tanto, igual a cero. Y, al mismo tiempo, un objeto puede ser infinitamente pesado. Para ilustrar la diferencia entre datos de intervalo y datos racionales en términos más asociados con la lengua, se suele interpretar que las puntuaciones del IELTS que hemos comentado antes tienen habitualmente distancias iguales, indicando, por lo tanto, un aumento gradual de la competencia de los estudiantes; como tal las interpretaríamos como datos de intervalo. Una puntuación IELTS de 1 significa que el examinando ‘no es un usuario’. Un no usuario podría emitir o no emitir ‘posiblemente unas pocas palabras sueltas’. Una puntuación de cero querría decir que el examinando no ha intentado hacer la prueba. No obstante, no indicaría que los conocimientos del examinando sean igual a cero. Podríamos, sin embargo, imaginar una sencilla prueba de reconocimiento de vocabulario usando una medición racional, donde se les presentara a los alumnos una lista de 100 ítems léxicos y se les preguntara cuántos de esos ítems conocen. Al final calcularíamos la puntuación simplemente contando el número de ítems reconocidos. Una puntuación de cero indicaría que el participante no ha logrado reconocer un solo ítem de vocabulario, es decir, que tiene un conocimiento cero del vocabulario. Un participante que puntúe 60 ha reconocido el doble de ítems que quien haya obtenido una puntuación de 30.
2.7. Datos continuos y discretos La última distinción fundamental que podemos hacer es comprobar si nuestros datos son discretos o continuos. Los datos discretos consisten en valores finitos o contables, mientras que los datos continuos permiten infinitos valores posibles en una escala continua sin huecos ni interrupciones. Por ejemplo, el número de estudiantes en una clase es una variable discreta, puesto que el número ha de ser un entero (un ‘número entero’), es decir, 1, 2, 5, 62, etc. No podemos tener 6,5 estudiantes, o 12,7. Si nos centramos, por el contrario, en la edad de nuestros estudiantes, hablamos de datos continuos, puesto que un estudiante puede tener 21,85482 años, si nos molestamos en señalar exactamente cuántos años, días y horas tiene. Hay que señalar que la distinción discreto-continuo solamente se aplica a nuestros datos en bruto, sin procesar, no a los resultados que pueda arrojar cualquier tipo de análisis estadístico: si nos interesa el tamaño medio de una clase de seminario en la universidad, es muy posible que tengamos algo así como una media de 15,7 estudiantes, lo que no quiere decir que tengamos una clase con un 0,7 de estudiante. Hablaremos de los cálculos de la media aritmética en el Capítulo 6.
Investigación cuantitativa: temas básicos
43
2.8. Fiabilidad y validez Los métodos cuantitativos tienen una ventaja que no debe subestimarse: las ciencias naturales, como la química o la física, requieren experimentos adecuados (es decir, determinados procedimientos y métodos investigadores) para ser objetivas y para (y esto es crucial) poder ser replicadas por cualquier otra persona siguiendo las instrucciones. En otras palabras, cualquiera que siga exactamente la receta debería obtener el mismo resultado (o casi). Se parece mucho a hacer un bizcocho: si dos personas ponen exactamente la misma cantidad de ingredientes, los mezclan exactamente de la misma manera y los hornean bajo exactamente las mismas condiciones (tiempo y temperatura), deberíamos obtener dos bizcochos idénticos (o casi idénticos). Más aún, deberíamos obtener dos bizcochos idénticos con independencia de quién sea el pastelero: no debería importar que uno tenga más experiencia o que esté de mal humor o cansado, o simplemente que odie hacer bizcochos. Esto funciona bien con la química básica: si juntamos exactamente las mismas cantidades de A y B, exactamente a la misma temperatura y con otros factores ambientales iguales, deberíamos confiar en obtener C, una y otra vez. Aquí es donde reside la belleza de la investigación cuantitativa: una vez que hemos establecido nuestros métodos, es probable que queramos que midan exactamente lo mismo una y otra vez. Dicho brevemente, la ÀDELOLGDG se refiere a que un método mida de forma repetida y coherente lo que se supone que tiene que medir. En el caso más extremo, si cogemos a los mismos individuos y les hacemos exactamente las mismas pruebas, exactamente de la misma forma y en el mismo entorno, deberíamos obtener exactamente el mismo resultado, si nuestro método es fiable. Esto es algo difícil de lograr en el caso de la investigación lingüística: la gente cambia, el entorno cambia e, incluso si la gente es idéntica, no es probable que responda a la misma prueba exactamente de la misma manera una vez más, ya sea porque tiene la experiencia de haber pasado previamente la prueba, ya simplemente porque tiene un mal día. No obstante, necesitamos asegurarnos de que nuestros métodos funcionan, de que son fiables y de que seguirán siendo fiables a lo largo del tiempo. A la vez, los métodos de medición deben construirse de tal manera que funcionen con independencia del investigador que los utiliza: sea cual sea la manera en la que operacionalicemos una variable, necesitamos asegurarnos de que cualquier investigador potencial que use nuestra operacionalización obtenga datos y resultados similares. Por eso es tan importante que definamos con claridad y con la menor ambigüedad posible las variables: si lo que nos interesa es el uso de verbos copulativos, como en el ejemplo que hemos puesto antes, debemos definir nuestra variable, es decir, lo que constituye una cópula y lo que no, de tal manera que cualquier otro investigador que trabaje con nuestro análisis sepa exactamente qué está buscando. Las cópulas son un buen ejemplo: hay gente que considera que
44
La investigación cuantitativa en Lingüística los verbos copulativos y los verbos auxiliares son uno y lo mismo. Por lo tanto, el verbo inglés be sería el mismo en ambas frases; después de todo, en ambos ejemplos, la cópula no tiene un significado independiente: a. The girl is pretty (“La niña es guapa”). b. I am working (“Estoy trabajando”). En algunos casos, sin embargo, puede ser útil distinguir entre los dos tipos. Crystal (1999), por ejemplo, define la función primaria de la cópula como “vincular elementos de la estructura de la frase, habitualmente el sujeto y el complemento” (73), mientras que los verbos auxiliares están “subordinados al verbo principal léxico en una frase verbal, ayudando a expresar distinciones gramaticales como el tiempo, el modo y el aspecto” (30). Según estas definiciones, be en (a) es una cópula, puesto que liga el sujeto (“the girl”) con el predicado (“pretty”), mientras que en (b) ayuda a indicar el tiempo y el aspecto verbal (presente continuo). Que usemos un enfoque amplio (no diferencia) o restringido (diferencia) no es importante per se; lo importante es, primero, que nuestra definición sea la que mejor se ajuste a la pregunta de partida y, segundo, que todos los investigadores implicados en el proyecto usen la misma definición. Imaginemos qué ocurriría si dos personas que analizan los mismos datos usaran definiciones diferentes: sus resultados serían incomparables y directamente inútiles. La capacidad de nuestros métodos para medir el mismo tema con una fiabilidad independiente de quién es el investigador a veces se denomina ÀDELOLGDGLQWHUREVHUYDGRUHV. En algunos contextos, en los que la exactitud es crucial pero, a pesar de una adecuada operacionalización, puede ser difícil medir las cosas exactamente, es habitual que haya dos personas para codificar los datos, ya sea de manera independiente la una de la otra, ya con una comprobando en el momento la codificación de la otra. Pero, incluso si somos la única persona que investiga, es importante que usemos la misma definición en todo momento del mismo estudio. Una forma rápida y fácil, aunque no es ni de lejos la forma más fiable de comprobar la fiabilidad de un método (señalemos la paradoja), es el método de dividir por la mitad: tomamos una muestra de, por ejemplo, 100 personas (para muestreos, véase el Capítulo 3) y la dividimos al azar en dos grupos de 50 personas. Después aplicamos nuestro método a ambos grupos. Si nuestro método es fiable, deberíamos obtener resultados iguales o casi iguales en ambos grupos. Hablaremos del aspecto práctico de los datos ‘iguales’ en los Capítulos 8 y 9. Otra forma de comprobar la fiabilidad es el método de prueba y repetición de la prueba: en lugar de probar dos muestras con el mismo método, probamos la misma muestra con el mismo instrumento en dos momentos distintos. Si nuestro instrumento es fiable, deberíamos obtener resultados muy similares en la prueba y en la repetición. El método prueba-repetición es problemático cuando se trabaja con seres humanos: la gente aprende con la experiencia y suele recurrir a la experien-
Investigación cuantitativa: temas básicos
45
cia de la primera prueba durante la ejecución de la segunda. En otras palabras, saben lo que les espera, y esto puede dañar significativamente la relevancia de la prueba. Cuando sea posible, es preferible obtener un buen indicador para la fiabilidad de una medición empleando un análisis de correlación basado en el método prueba-repetición. Hablaremos de esto al final del Capítulo 7. Un segundo factor que tenemos que tener en cuenta en la investigación cuantitativa es la validez. Cuando medimos algo, queremos evidentemente que nuestros resultados sean lo más exactos posible. La validez se presenta de maneras y formas diferentes; aquí nos centraremos en la que es más importante para la investigación lingüística: la validez de las mediciones. La validez de las mediciones, a menudo llamada sencillamente validez, es difícil de explicar, y no digamos ya de lograr: se refiere a si nuestro método en realidad mide lo que se supone que tiene que medir y si nos permite, por lo tanto, sacar las conclusiones adecuadas. El ejemplo de la definición de cópula que hemos comentado antes es también una cuestión de validez: si no hemos definido con claridad nuestra variable, ¿cómo podemos estar seguros de que mide lo que realmente queremos que mida? Otro ejemplo típico para ilustrar la validez es el diseño de los cuestionarios. Pongamos que nos interesan las actitudes de la gente ante el uso de lenguas o dialectos no normativos. Vamos a medir las actitudes mediante un cuestionario que consiste en diez preguntas y los entrevistados pueden elegir entre tres respuestas: ‘de acuerdo’, ‘indiferente’ y ‘en desacuerdo’. Ahora suponed que hacemos todas nuestras preguntas con una forma o esquema concreto, por ejemplo, que ‘de acuerdo’ siempre indique una opinión positiva de los dialectos, mientras que ‘en desacuerdo’ siempre indique una opinión negativa. Resulta fastidioso, pero mucha gente tiene la costumbre de responder cuestionarios con una tendencia o manera determinada: tienden siempre a estar más de acuerdo o más en desacuerdo o, en el peor de los casos, a tener una opinión ‘indiferente’. Si, como ocurre en nuestro ejemplo, ‘de acuerdo’ siempre se corresponde con una actitud positiva hacia los dialectos, todo lo que medirá nuestro cuestionario es la tendencia de los entrevistados a estar o no de acuerdo en general en la vida, pero no nos dará ninguna pista acerca de las actitudes reales de los entrevistados acerca de los dialectos. En este caso, nuestro cuestionario es un método nada válido. Volveremos al tema de la fiabilidad y la validez cuando estudiemos con detalle el diseño de los cuestionarios en el Capítulo 4. Como ya hemos comentado antes, la validez, o la falta de validez, puede llegar a ser un asunto muy engorroso en una situación en la que tengamos muchas variables terceras u ocultas. Si en realidad nuestros datos no están influidos por lo que pensamos que los influye sino por otra cosa, ¿cómo podemos medirlos con validez? La mejor opción es llevar a cabo un experimento puro (véase Capítulo 3), donde nosotros, en tanto investigadores, tengamos un control total y absoluto de todas las variables. Determinadas cuestiones psicolingüísticas se adaptan bien a una encuesta experimental y para estudiarlas se emplean con
46
La investigación cuantitativa en Lingüística frecuencia experimentos. Pero enseguida nos damos cuenta de que los experimentos en laboratorios no son una opción posible para aquellos estudios que requieran datos lingüísticos procedentes de la vida real. En estos casos, solamente una exhaustiva planificación y preparación, basada en una exploración profunda del contexto teórico, puede ayudarnos a minimizar el problema.
2.9. Hipótesis, leyes y teorías Antes de pasar al siguiente capítulo, necesitamos definir sucintamente tres conceptos clave para cualquier tipo de investigación, sea cualitativa o cuantitativa. Las hipótesis son afirmaciones acerca de la relación potencial y/o apuntada entre al menos dos variables como, por ejemplo, “cuanto mayor el aprendiz, menos tacos emplea” (dos variables) o “la edad y el sexo influyen en el uso del lenguaje” (tres variables). Podemos demostrar si una hipótesis es correcta o incorrecta: el fin de la investigación cuantitativa es justamente hacer eso. De hecho, debemos demostrar si la hipótesis es o no correcta. Para que quede demostrado que una hipótesis es o no correcta, es importante que estas hipótesis estén bien definidas. En especial, las hipótesis deben ser falsables y no ser tautológicas: la hipótesis “la edad de una persona puede influir o no en el uso del lenguaje” es tautológica, pues, independientemente de nuestros descubrimientos, siempre será cierta (la edad sin duda influye o no influye en el uso del lenguaje por parte de una persona). Una buena hipótesis, sin embargo, debe poder ser potencialmente falsa. Para la investigación cuantitativa es útil recordar que nuestras hipótesis deben tener relación con algo que podamos realmente medir. Como con todo, merece la pena dedicar algún tiempo a pensar la formulación de la (o las) hipótesis, nos facilitará mucho las cosas cuando lleguemos al estadio del desarrollo de nuestra metodología. Como regla general, cuanto más específica sea una hipótesis, mejor. Fijaos que ‘específica’ no tiene nada que ver con la profundidad o con el alcance del estudio: por razones obvias, un ensayo de investigación de 3.000 palabras para una asignatura de grado será distinto, en términos de profundidad y extensión, que un proyecto que tenga 500.000 euros de financiación externa. Aun así, para ambos es esencial tener claro lo que quieren averiguar. Debido a las líneas de trabajo generales de mi departamento, muchos de mis alumnos están interesados en temas relacionados con la enseñanza y el aprendizaje de la lengua y, con frecuencia, proponen temas para sus trabajos que giran en torno a dos aspectos: los aprendices a los que les ‘gusta/no les gusta’ algo, y si un método concreto de enseñanza/ aprendizaje es ‘mejor’ o ‘peor’ que otro. En los primeros estadios de sus investigaciones normalmente me encuentro con hipótesis del tipo: s!LOSESTUDIANTESLESGUSTAAPRENDERENGRUPO
Investigación cuantitativa: temas básicos
47
s5SARRECURSOSELECTRNICOSPARALAENSE¶ANZADELENGUASESMEJOR que usar los libros de texto tradicionales. No hay nada intrínsecamente ‘equivocado’ en estos dos ejemplos y ambos resumen lo que podrían ser proyectos de investigación más o menos interesantes. El problema radica en el grado de detalle y, en nuestro caso específico, en la mensurabilidad. Vamos a examinar el primer ejemplo. Mientras que sí nos proporciona una idea general acerca de lo que persigue la investigación, la “hipótesis” es demasiado vaga y, como tal, parece imposible encontrar una medición fiable y válida que la demuestre o no. Para empezar, el término estudiantes, ¿a quiénes se refiere exactamente?, ¿qué niveles de estudio?, ¿qué edades?, ¿qué formación cultural? Sabemos, por poco familiarizados que estemos con la teoría de la didáctica y el aprendizaje, que estas tres preguntas son únicamente tres cuestiones de una lista muy larga de temas importantes. Estudiantes, en tanto término genérico, sencillamente no es lo bastante preciso, y un estudio, especialmente uno a pequeña escala, tiene todas las papeletas para fracasar si no definimos adecuadamente el grupo que nos interesa. “Niños y niñas de primaria, hablantes nativos de inglés que aprenden japonés”, sin embargo, definiría con claridad el grupo y establecería el contexto para todas las implicaciones metodológicas que conllevara. Luego viene esa palabra que me produce escalofríos cada vez que la escucho: gustar. A todos nos gustan cosas, o nos disgustan, pero, desgraciadamente, gustar es un rasgo bastante difícil de medir. ¿Qué queremos decir exactamente cuando decimos que a alguien “le gusta” algo? ¿Cómo se muestra una preferencia por usar una cosa sobre otra? ¿Cómo de intensa es esa preferencia? ¿Dónde termina gustar y dónde empieza encantar (otra de mis favoritas)? Una formulación mejor sería usar preferir o mostrar preferencia por, pura y simplemente porque las preferencias se pueden medir objetivamente. En tercer lugar, nos topamos con la expresión genérica aprender. ¿Aprender qué? De nuevo necesitaríamos concretar mucho más. Y, en último lugar, en grupo es igualmente vago: lo menos que podríamos hacer es incluir en nuestra hipótesis alguna indicación concreta acerca del tamaño del grupo. A pesar de lo que pueda parecer al escucharme (o leerme), no estoy siendo tiquismiquis: ¿cómo podemos medir de manera fiable y válida lo que ni siquiera hemos definido con claridad de antemano? Un proyecto que busca saber “cómo aprenden los estudiantes” está predestinado al fracaso, simplemente porque es demasiado vago. Una hipótesis mucho mejor para nuestro ejemplo sería: s,OSNI¶OSYNI¶ASDEPRIMARIAHABLANTESNATIVOSDEINGL£SMUESTRAN una preferencia por trabajar en grupos de entre 3 y 5 miembros cuando adquieren vocabulario nuevo, en comparación con el trabajo tradicional, en el que se implica toda la clase.
48
La investigación cuantitativa en Lingüística Esta hipótesis está claramente definida, puede medirse y, lo más importante, puede falsarse: los niños podrían no preferir trabajar en grupos pequeños y tendríamos pruebas cuantitativas que lo demostrarían. Hablando de falsabilidad: a la mayoría de nosotros nos gustaría que nuestras hipótesis, diseñadas con tanto cariño y cuidado, resultaran ser correctas; es un asunto de ego. Sin embargo, podría ocurrir que las pruebas empíricas mostraran que la hipótesis no es correcta. Esto puede ser una decepción, pero no tiene por qué ser algo malo: siempre que la hipótesis sea razonable, es decir, que haya surgido de lo que hemos aprendido gracias a estudios previos, y siempre que nuestra metodología sea válida y fiable, demostrar que una hipótesis no es correcta sigue siendo un resultado notable. Después de todo, también contribuimos al conocimiento mostrando que una idea concreta sobre un tema no funciona. Y, aunque habitualmente formulamos las hipótesis de manera positiva (X produce Y), si realmente nos disgusta tanto que nuestros datos nos hayan llevado la contraria, podemos cambiar nuestra argumentación por completo, de tal forma que nuestra hipótesis sea que X no produce Y. En otras palabras, estructuraríamos nuestro estudio en torno a un argumento de exclusión. Las leyes son hipótesis o un conjunto de hipótesis que han sido reiteradamente demostradas. Podemos pensar en la siguiente hipótesis: “Las palabras de las oraciones declarativas sencillas en inglés se ordenan sujeto-verbo-objeto”. Si analizamos un número suficiente de oraciones simples declarativas inglesas, veríamos que esta hipótesis se demuestra repetidamente, por lo tanto la hipótesis se vuelve ley. Recordemos, no obstante, basándonos en el principio de la falsabilidad de las hipótesis, que, si estudiamos una cantidad de datos muy grande, encontraremos al menos unos pocos ejemplos en los que la hipótesis no sea correcta: la excepción a la regla. Y aquí es donde el asunto se complica: puesto que nuestra hipótesis acerca de las oraciones declarativas es una definición, en realidad no podemos demostrar que sea falsa. La definición dice que las oraciones declarativas deben tener el orden de palabra sujeto-verbo-objeto (SVO). Esto implica que una frase que no se conforme a SVO no es una frase declarativa; no podemos demostrar que la hipótesis es falsa, pues, si fuera falsa, no estaríamos ante una oración declarativa. En ese sentido es algo casi tautológico. Por lo tanto, hay que tomar muchas precauciones a la hora de incluir definiciones prescriptivas en nuestras hipótesis. Un ejemplo de ley mucho mejor nos lo proporcionan los cambios de sonido en la lengua. Si partimos de la hipótesis de que, a lo largo del cambio fonético del latín al castellano, la evolución de la /k/ latina (escrita originariamente ch) seguida de las vocales /a, o, u/ evolucionó según un criterio claro de posición del sonido dentro de la palabra, veremos que hay dos casos: a) Si la /k/ aparecía al inicio de palabra, se mantuvo el sonido, como en CHARTA > carta. b) Si la /k/ aparecía en posición intervocálica, se sonorizó y se transformó en /g/ como en $0Ʈ&8> amigo.
Investigación cuantitativa: temas básicos
49
Este proceso se produjo en la Península Ibérica relativamente pronto (ya se constata en algunas inscripciones de los siglos II y III d.C.) y veremos que, analizando un número suficientemente grande de ejemplos, la hipótesis resulta repetidamente correcta. Ahora bien, también hubo algunas excepciones, es decir, palabras en las que la vocal sorda oclusiva /k/ no se sonorizó en posición intervocálica, como es el caso de 3$8&8 > poco, donde aparece después del diptongo -au-. Así pues, tenemos una ley sobre el cambio fonético pero, como toda regla, tiene sus excepciones. En último lugar, las teorías son sistemas que combinan varias leyes e hipótesis, todas ellas en relación lógica las unas con las otras. Así, podríamos decir que el proceso de sonorización de las oclusivas en la evolución del latín al castellano es una teoría, puesto que solamente puede explicarse por completo mediante una compleja interacción de varias leyes: las oclusivas a inicio de palabra se mantienen sordas (ley 1), pero en posición intervocálica se sonorizan (ley 2), aunque en algunos casos no, lo que puede explicarse por el entorno vocálico de la oclusiva (ley 3), concretamente, detrás del diptongo -au-, que tardó en desaparecer y convertirse en el monoptongo -o-, las oclusivas permanecieron sordas. Por tanto, cuando el diptongo -au- desaparece pero tardíamente, la sonorización ya no se produce, como tampoco se produce en cultismos de introducción tardía (ley 4), como el caso de 3(//Ʈ&8/80> película. Es decir, con el paso del tiempo, el proceso de sonorización de estos casos de alguna manera ya se ha “completado” y “desactivado” (ley 5). Ejercicio 1. Variables 1. Identifica si los siguientes resultados son discretos o continuos, y justifica tu respuesta: a. Tiempo total que un taxista se detiene ante los semáforos en un día determinado. b. Número de huelgas en la industria automovilística cada año. c. Número de personas zurdas en la población. d. Cantidad de leche que produce una vaca cada día. 2. Determina y explica qué escala de medición es la más adecuada para los datos siguientes: a. Calificaciones de excelente, muy bueno, bueno, pobre, insatisfactorio para los trabajos de los estudiantes. b. El sexo de una persona. c. El número de la Seguridad Social. d. Porcentaje de estudiantes que estudian lingüística sobre el conjunto de la universidad.
50
La investigación cuantitativa en Lingüística Ejercicio 2. Construcción de hipótesis y teorías Diseña un conjunto de hipótesis que tengan las propiedades siguientes: s!LMENOSUNADELASHIPTESISDEBER¤AINCLUIRDOSOMÕSVARIABLES independientes. s,ASHIPTESISDEBER¤ANINCLUIRVARIABLESDEALMENOSDOSESCALAS de medición diferentes. s!LMENOSUNAHIPTESISDEBER¤ACONTENERUNARELACINCAUSALCLAra. s,ASHIPTESISDEBER¤ANTENERUNARELACINLGICAUNASCONOTRAS es decir, mostrar potencial de formar una teoría.
3
Diseño y muestreo de la investigación
Palabras clave: artefacto - ética - diseño de la investigación - diseño longitudinal, transversal, de panel - error de muestra - planificación y gestión de proyecto - población y muestreo - representatividad - técnicas de muestreo - tiempo real y tiempo aparente
Habiendo ya hablado de los aspectos más básicos de la investigación cuantitativa en el capítulo anterior, vamos ahora a responder la cuestión de cómo vamos a llegar, a partir de nuestra hipótesis, a resultados fiables y válidos. En este capítulo nos centraremos con detalle en el diseño y muestreo de la investigación. En la primera parte presentaremos diferentes diseños potenciales de la investigación, como los transversales, longitudinales, experimentales y cuasi experimentales, y debatiremos las ventajas, desventajas y trampas potenciales de cada uno de ellos. En la segunda parte hablaremos de diversas técnicas de muestreo, explicando las ventajas y desventajas de los métodos de muestreo. En especial trataremos de los típicos problemas de muestreo que nos encontraremos en la investigación lingüística (por ejemplo, la falta de estandarización de los participantes, etc.). Este capítulo se dedica también a las implicaciones éticas de la investigación lingüística, en lo que se refiere a la privacidad y al anonimato, a trabajar con menores de edad y miembros de minorías, y a la seguridad del investigador. En esta edición se ha añadido una recopilación de temas relacionados con la gestión del proyecto y sobre cómo mantener el control sobre el tiempo, los recursos y el alcance del proyecto. El diseño de la investigación puede describirse como la estructura real según la cual se organiza nuestro estudio. Como tal, junto con la fundamentación teórica, el diseño es una parte importante del marco de trabajo general metodológico-analítico que vamos a usar para respon-
52
La investigación cuantitativa en Lingüística der a las incógnitas de nuestra investigación y para probar si nuestras hipótesis son o no correctas. El diseño de la investigación no tiene que ver, en cualquier caso, con los instrumentos reales que empleamos (como los cuestionarios o las entrevistas), aunque nunca se subrayará lo suficiente la importancia de la correcta interacción entre las hipótesis, la teoría existente, los métodos y el diseño; y entre el diseño y los instrumentos escogidos hay una conexión especialmente intensa. Los diseños de investigación pueden subsumirse bajo dos categorías principales: los diseños longitudinales, transversales y de panel estructuran nuestra investigación en términos de su orden temporal, mientras que los diseños experimentales y cuasi experimentales nos permiten investigar mediante la manipulación explícita y deliberada de las variables. A continuación hablaremos de estos dos tipos.
3.1. Diseños transversales Los diseños transversales son probablemente los más empleados en la investigación lingüística, social y psicológica. En los diseños transversales se adquiere una cantidad comparativamente grande de datos en un punto determinado del tiempo, lo que proporciona un panorama general de cómo se distribuye esa variable concreta (o esas variables) a lo largo de una muestra (véase Epígrafe 3.6) en un momento concreto del tiempo. Como tal, la investigación transversal es útil para proporcionar una instantánea de un statu quo, describe la realidad tal como es justamente en ese preciso momento. La investigación transversal se caracteriza por dos rasgos clave: primero, estamos tratando con una multitud de casos, es decir, con un número de casos (en lingüística suelen ser personas) que es mucho mayor que uno; esa inmensa cantidad de datos nos permitirá describir y explicar el rasgo concreto de la realidad que nos interesa (es decir, nuestra pregunta de partida) con mucho detalle y exactitud. A partir del Capítulo 5 veremos que muchas herramientas estadísticas nos proveen de resultados progresivamente más exactos cuanto más abundantes son los datos; por lo tanto, un estudio basado en 50 personas nos dará una imagen más “veraz” que un estudio basado en 5 personas. En segundo lugar, los datos transversales se recopilan dentro de un marco temporal especialmente breve. De manera ideal, todos los datos se deberían recoger simultáneamente, eliminando, por lo tanto, cualquier cambio que pudiera producirse a lo largo del tiempo. No hay ni que decir que, en la práctica, esto puede resultar muy problemático. El estudio de Labov sobre la “estratificación social de la /r/ en los grandes almacenes de la ciudad de Nueva York” (Labov, 1972) es un excelente ejemplo de un estudio transversal de lingüística. Usando entrevistas anónimas rápidas, Labov fue capaz de recoger datos de 264 entrevistados en solo 6 horas y media, a lo largo de uno o dos días. Sus resultados le permitieron sacar conclusiones acerca del prestigio de la
Diseño y muestreo de la investigación
53
/r/ en diferentes clases sociales en un momento concreto del tiempo. La ventaja debería ser obvia: al recoger todos los datos de manera casi simultánea, es muy improbable que se produzca cualquier cambio en el comportamiento lingüístico, sencillamente porque los cambios lingüísticos y los cambios en el entorno sociocultural que los rodea son procesos mucho más lentos. Los diseños transversales se emplean habitualmente en la investigación cuantitativa, puesto que las cantidades comparativamente grandes de datos recogidos son especialmente útiles para estudios que buscan, o bien describir un statu quo hasta el punto en que pueda ser posible hacer generalizaciones a partir de él, o bien detectar relaciones entre variables dependientes e independientes, a la vez que se descartan los cambios que estas relaciones puedan sufrir con el tiempo. En el ejemplo antes citado de Labov, el comportamiento lingüístico estaba intensamente vinculado a la clase socioeconómica y al prestigio que las diferentes clases asignaban a un rasgo en particular. Si, por la razón que fuera, el prestigio hubiera cambiado mientras se llevaba a cabo la recogida de datos, inevitablemente los resultados estarían sesgados. A menudo los estudiantes me preguntan acerca del marco temporal en el que deberían efectuarse los estudios transversales; en otras palabras, ¿cuándo deja un estudio transversal de ser un estudio transversal? Desgraciadamente no hay una respuesta definida (tipo ‘dos días y seis horas’). Pero, usando el sentido común, debería ser relativamente sencillo establecer un marco temporal. En primer lugar, los estudios transversales, a diferencia de los estudios experimentales, se emplean habitualmente en lingüística para investigar las variables ligadas a los rasgos lingüísticos o al hablante de la lengua (incluidas las variables socioculturales exógenas en la sociolingüística). Doy por sentado que la mayoría de nosotros estamos de acuerdo en que el cambio lingüístico es un proceso comparativamente lento y que es muy improbable que se produzcan cambios de un día para otro o incluso a lo largo de unos pocos días o meses. Por lo tanto, es improbable que un estudio que investiga un rasgo lingüístico determinado se vea afectado negativamente por el cambio, aun cuando la recogida de datos tenga lugar a lo largo de un periodo de tiempo más largo. Es decir, aunque los datos se recojan en varios momentos dentro de un marco temporal concreto, es improbable que el cambio afecte a los resultados. El estudio de Milroy (1987) sobre el uso de la lengua y las relaciones sociales en Belfast era principalmente un diseño transversal, a pesar de que se llevó a cabo a lo largo de un periodo de tiempo prolongado: como las relaciones sociales que ella observaba eran muy estables, y como las normas que regían el uso de la lengua dentro de esas redes eran igualmente muy estables, no se produjo ningún cambio en la lengua, a pesar de que sus datos no se recogieron dentro de un espacio breve de tiempo. Es importante recordar que no se suele observar el lenguaje sin prestar a la vez la debida consideración a su usuario. Como seres sociales que somos, los seres humanos nos movemos dentro de un ambiente
54
La investigación cuantitativa en Lingüística que, a menudo, puede sufrir cambios rápidos. En otras palabras, el contexto en el que se emplea el lenguaje puede cambiar a mitad de un estudio transversal, lo que puede acarrear serias consecuencias para los resultados. En este caso hablaríamos de un diseño cuasi experimental (véase más adelante). Así, para resumir, aunque no hay un marco temporal definido para un estudio transversal, debemos monitorizar minuciosamente el ambiente en el que recogemos nuestros datos por si se produjeran cambios repentinos. De manera similar, en el caso de las preguntas de investigación que, por su naturaleza misma, implican procesos de cambio, los diseños transversales no son adecuados. Por ejemplo, la adquisición de una primera lengua es un proceso en el que los niños adquieren una competencia lingüística sustancial en un periodo de tiempo muy breve, principalmente entre las edades de 18 meses y 3 años. Siendo el cambio algo tan inherente al tema en cuestión, es muy improbable que obtengamos resultados fiables con un diseño transversal. Igualmente, para temas en los que el cambio es el criterio que los define, es más que probable que lo que nos interese sea ese cambio y desarrollo. Una vez más, esto es algo de lo que no podremos dar cuenta con un diseño transversal, que únicamente nos proporcionaría una instantánea.
3.2. Diseños longitudinales: paneles y cohortes Los diseños longitudinales se distinguen de los diseños transversales en dos cuestiones principales: en lugar de observar un número amplio de casos de una sola vez, los estudios longitudinales observan un número menor de casos en varias (al menos dos) ocasiones. En resumen, mientras que los estudios transversales nos permiten sacar conclusiones acerca de un statu quo en un momento determinado del tiempo, los estudios longitudinales nos permiten observar los cambios que acontecen con el tiempo. Igualmente, los estudios longitudinales podrían, hasta cierto punto, arrojar más luz sobre las relaciones causales que los estudios transversales, puesto que determinados patrones pueden hacerse más patentes cuando se miden repetidas veces. Señalemos que en el caso de los diseños longitudinales seguimos necesitando una cantidad considerable de datos para hacer un análisis cuantitativo adecuado, por razones matemático-estadísticas. Pero, a diferencia de los diseños transversales, donde se crea una gran cantidad de datos en un momento determinado del tiempo mediante un elevado número de “casos”, en los diseños longitudinales un número menor de casos produce datos de manera reiterada. Puesto que se basan en la recogida y análisis reiterado de datos, los diseños longitudinales consumen bastantes recursos y la investigación en ciencias sociales y psicología a menudo trata de evitarlos (véase Bryman, 2004). Sin embargo, para los estudios lingüísticos, los diseños
Diseño y muestreo de la investigación
55
longitudinales ofrecen la oportunidad de observar los cambios en el comportamiento lingüístico a lo largo del tiempo con gran detalle. De hecho, los diseños longitudinales son la única manera de observar el cambio lingüístico. Como ocurría con los diseños transversales, no hay una respuesta definitiva a la pregunta de qué hace longitudinal a un diseño longitudinal; como antes, depende de la pregunta de partida que estemos tratando de responder. Por ejemplo, puede que nos interese el desarrollo del volumen de vocabulario en los niños pequeños. En general, la mayoría de los niños pronuncia su primera palabra en torno a la edad de 12 meses y, cuando cumple dos años, tiene una media de 500 palabras a su disposición. Por lo tanto, si basamos nuestro estudio longitudinal en dos recogidas de datos, una a la edad de 12 meses, la otra a la edad de 24 meses, podremos ver un incremento enorme del volumen de vocabulario. No obstante, esto también quiere decir que nos estamos perdiendo muchos detalles, puesto que no podemos ver qué es lo que ha ocurrido exactamente a lo largo de esos 12 meses; no podemos detectar ningún estadio intermedio importante. Pero otros cambios lingüísticos son mucho más lentos: hay un consenso amplio en que el Gran Desplazamiento Vocálico, por ejemplo, durante el cual todas las vocales largas del inglés cambiaron de posición, se produjo en algún momento entre 1400 y 1700 (véase, por ejemplo, Baugh y Cable, 2000), es decir, durante un inmenso lapso de tiempo de 300 años. Como describiremos más adelante, el trabajo de Wood sobre los cambios de sonido en Nueva Zelanda indica que estos ocurren de generación en generación, mucho más lentamente que la adquisición del vocabulario por parte de un niño, pero más rápidamente que el Gran Desplazamiento Vocálico. Aunque sea repetirme, tengo que señalar que esto de nuevo subraya la importancia de hacer una investigación exhaustiva y familiarizarse bien con las teorías implicadas en nuestro estudio, así como la importancia de construir nuestro marco de trabajo metodológico a partir de ellas. Los estudios longitudinales tienen dos formas básicas, que se diferencian únicamente por su muestra: diseños de panel y de cohorte. Para los diseños de panel, la muestra (o panel) se extrae de manera aleatoria de entre la población (véase Epígrafe 3.6). Por ejemplo, supongamos que nos interesa la progresión de los estudiantes españoles de inglés en una universidad concreta (que sería nuestra población). A partir de esta población seleccionamos al azar un pequeño número de estudiantes, quizá diez, y monitorizamos sus progresos en tres ocasiones diferentes, mediante un examen de competencia lingüística estandarizado, así como mediante entrevistas: a principios de enero, a principios de abril y a principios de julio. Los datos recogidos en estas tres ocasiones nos permitirán sacar conclusiones acerca de a) la progresión de los estudiantes individuales a lo largo del tiempo y b) los patrones generales de progresión para toda la muestra. El diseño de cohorte funciona de una manera esencialmente similar, pero la muestra con la que trabajamos es ligeramente distinta. Las co-
56
La investigación cuantitativa en Lingüística hortes son grupos de personas que comparten una característica que a menudo es de naturaleza temporal, por ejemplo su año de nacimiento, el año de su matrimonio o el tiempo que han pasado aprendiendo un idioma concreto. En nuestro ejemplo anterior, en lugar de fijarnos en todos los estudiantes españoles de inglés de nuestra universidad, vamos a centrarnos únicamente en los estudiantes que empezaron durante el año académico 2011-2012. Los diseños de cohorte son indudablemente mejores para controlar terceras variables. Según Bryman (2004: 46), la diferencia crucial entre diseños de panel y diseños de cohorte es que, mientras que el diseño de panel nos permite observar tanto los efectos de cohorte como los efectos del paso del tiempo, los estudios de cohorte pueden identificar solo los efectos del paso del tiempo. Que esto sea una ventaja o desventaja depende del estudio individual. Un ejemplo: nos interesa saber si una variable fonológica concreta cambia a lo largo del tiempo. Un estudio de panel nos permitiría analizar nuestros datos en dos dimensiones: primero, podríamos sacar conclusiones acerca de hasta qué punto la edad progresivamente mayor de los encuestados influye en su empleo de esta variable concreta (por ejemplo, si cuanto mayores se vuelven los encuestados, emplean dicha variable con menor frecuencia); en segundo lugar, nos proporciona información acerca de si los encuestados nacidos en un año determinado emplean de manera diferente este rasgo, por lo tanto permitiéndonos incluir información sobre las diferencias generacionales. Por otra parte, con todos los encuestados nacidos el mismo año, los diseños de cohorte solo nos permitirían observar el cambio asociado al paso del tiempo, puesto que el año de nacimiento es constante y, por ejemplo, las diferencias generacionales no podrían ser observadas. Una de las ventajas principales de los diseños longitudinales, en concreto su capacidad de medir el cambio a lo largo del tiempo, es también uno de sus peligros potenciales más importantes. Como el estudio completo depende de un grupo concreto de gente a lo largo de un amplio periodo de tiempo, la investigación puede fácilmente tambalearse una vez que los miembros de la muestra empiecen a fallar, sea por falta de motivación, por cambios de domicilio o, en los casos más extremos, por defunción. En otras palabras, puede ocurrir que empecemos con una muestra de 20 personas en 2013 para un estudio de cinco años, pero que, para cuando lleguemos a 2017, solo queden 7 encuestados. Esto puede afectar sustancialmente la significancia de cualquier resultado que obtengamos y, en el peor de los casos, poner en peligro el estudio en su totalidad. Especialmente en contextos donde la gente cambia mucho debido a la naturaleza de ese contexto (en las universidades británicas, por ejemplo, una cohorte habitual de estudiantes de grado solo permanece allí tres años), retener la muestra y, por lo tanto, llevar a cabo un estudio longitudinal puede ser un asunto muy problemático.
Diseño y muestreo de la investigación
57
3.3. Diseños pseudolongitudinales: tiempo real y tiempo aparente Mientras que el estudio de Labov empleaba un diseño transversal para detectar las relaciones entre las variables sociales y lingüísticas en un momento concreto del tiempo, los estudios transversales pueden, hasta cierto punto, usarse también para simular estudios longitudinales (Fig. 3.1). En términos lingüísticos, podríamos necesitar diseñar un estudio sincrónico de tal manera que pudiéramos inferir el desarrollo diacrónico, sin el trastorno de tener que hacer repetidos estudios sincrónicos a lo largo de un periodo amplio de tiempo (Bailey, 2004). En especial, en la sociolingüística de Labov, esto se conoce como tiempo real y tiempo aparente. Labov (1963) fue el primero que desarrolló este método en su estudio sobre Martha's Vineyard. Aquí vamos a fijarnos en un ejemplo diferente. Longitudinal Tiempo
Transversal en momentos a, b y c
Figura 3.1. Diseño longitudinal versus diseño transversal.
Woods (2000), en su estudio sobre los cambios de sonido en Nueva Zelanda, esencialmente “simuló tiempo”: al observar el habla de encuestadas procedentes de tres generaciones –abuela, madre e hija–, pudo identificar los cambios en los sonidos vocálicos a lo largo del tiempo, incluso aunque la mayoría de los datos se hubieran recogido en el mismo momento, es decir, de manera sincrónica. Aquí las encuestadas proporcionaban datos en tiempo-real, pero, basándose en la teoría sociolingüística de que el lenguaje tiene una gradación de edad, observar datos procedentes de generaciones diferentes nos permite extraer conclusiones acerca del desarrollo diacrónico, o tiempo aparente, y, por lo tanto, del cambio en la lengua. En otras palabras, no estamos observando cómo cambia la lengua sino cómo ha cambiado. Hay que señalar, no obstante, que este tipo de diseño no despliega la absoluta potencia explicativa (por ejemplo, en lo que respecta a la causalidad) que ofrece un auténtico diseño longitudinal, pues el cambio solamente puede ser observado a lo largo de la muestra, pero no en el nivel de un encuestado individual. También da por sentada la estabilidad relativa del resto de factores. Véase Bailey (2004) para un resumen completo de este tema.
58
La investigación cuantitativa en Lingüística
3.4. Diseños experimentales y cuasi experimentales Los diseños experimentales difieren en aspectos fundamentales de los diseños de los que hemos hablado hasta ahora. A diferencia de los diseños longitudinales y transversales, que nos permiten recoger y observar datos naturales, es decir, datos tal como se producen en un entorno natural, los estudios experimentales se basan en la manipulación deliberada y sistemática de una o más variables por parte del investigador. En su forma más pura, los experimentos se llevan a cabo en laboratorios, instalaciones que permiten controlar todas o casi todas las variables implicadas en un estudio, tanto las explícitas como las ocultas. Tradicionalmente los diseños experimentales tienen una naturaleza cuantitativa y consisten en la comparación entre el grupo experimental (el afectado por la manipulación de las variables) y un grupo de control (no afectado por la manipulación). Vamos a empezar con un ejemplo clásico ajeno al campo de la lingüística: cuando desarrolla un nuevo fármaco contra la gripe común, una empresa farmacéutica, en algún momento, tiene que ensayar los efectos de ese nuevo fármaco. Básicamente lo que hace (primero con animales y después con humanos) es tomar a un grupo de gente que padece gripe y dividirlo en dos partes iguales. A continuación administra el medicamento al grupo experimental, no le da nada (o le da un placebo) al grupo de control y mide después las diferencias. Si el nuevo fármaco es bueno, el grupo experimental mostrará señales de recuperación, mientras que el grupo de control no lo hará. Los métodos estadísticos de los que hablaremos a lo largo de los Capítulos 6 a 10, ayudan a determinar si el fármaco en realidad supone una diferencia significativa. Es importante señalar que, en los diseños experimentales, la asignación de los sujetos de investigación a cualquiera de los dos grupos, al experimental o al de control, es totalmente aleatoria, es decir, cualquier sujeto puede terminar en cualquier grupo. Igualmente, los sujetos no saben a qué grupo pertenecen, para evitar el impacto de los factores psicológicos que este conocimiento podría producir en el participante. En la investigación lingüística, asimismo, los diseños experimentales se basan en la modificación deliberada de una variable para uno de los grupos. El estudio de Li (1988) sobre el impacto del input modificado en los aprendices avanzados chinos de inglés como segunda lengua presentaba a su muestra un grupo de frases bajo dos condiciones: a la mitad de los participantes (grupo experimental 1, GE1) se les daban frases cuyo significado podía inferirse por el contexto (‘inferibles’); la otra mitad (grupo experimental 2, GE2) recibía frases que eran no inferibles (cuyo sentido no podía inferirse). Es decir, la variable input se modifica de dos maneras: inferible/no inferible. La Fig. 3.2 resume el proceso de manera gráfica. En el paso 1, como puede verse, la asignación en el GE1 o GE2 se hizo de forma aleatoria y esto garantizaba que tanto el GE1 como el GE2 comenzaran el estudio con un nivel seme-
Diseño y muestreo de la investigación
59
jante de competencia lingüística en inglés. El paso 2 suponía la entrada de los dos estímulos (frases inferibles para GE1, frases no inferibles para GE2). En el paso 3, se examinó a ambos grupos acerca de su competencia después de la introducción de los estímulos y, en el paso 4, se analizaron los resultados. La hipótesis de partida de Li era que los inputs inferibles eran más beneficiosos para los aprendices que los inputs no inferibles; por lo tanto, el paso 4 debería mostrar que los resultados del GE1 eran mejores que los del GE2. Paso 1
Paso 2
GE 1
Estímulo 1: inferible
GE 2
Estímulo 2: no inferible
Paso 3 P R U E B A
Paso 4 GE1 &
GE2
Fig. 3.2. Planteamiento del estudio de Li.
Señalemos que en este ejemplo estamos tratando con dos grupos de personas, divididos por las dos versiones diferentes de la misma variable input. Esto se suele denominar diseño entre sujetos: cada grupo recibe un tipo concreto de input, de manera similar al ejemplo de la prueba de fármacos. Como escenario alternativo, en un diseño intrasujetos, el mismo grupo de gente recibiría dos tipos de estímulos y compararíamos las reacciones a ambos estímulos. Para cualquier contexto, teniendo en cuenta que el resto de los factores son constantes, por ejemplo, que las frases deberían tener la misma longitud y complejidad, la comparación entre los dos grupos, definidos según el input, debería proporcionar información fiable en lo que respecta a qué pistas conceptuales ayudan a los estudiantes a entender el significado de nuevas palabras, y, según Li, así lo hace. Tanto los diseños intra-sujetos como los entre-sujetos tienen varias ventajas y desventajas. Los estudios entre-sujetos requieren más participantes para poder formar dos grupos del mismo tamaño. También hay que asegurarse de que los dos grupos sean iguales en términos de las características de los participantes. Una distribución aleatoria de los participantes en los grupos debería evitar cualquier sesgo relacionado con los participantes; no obstante, no está de más comprobarlo siempre: es muy molesto descubrir a posteriori que el grupo A tiene muchos más varones que el grupo B, o que la edad de los participantes del grupo B es significativamente menor que en el grupo A, ambos factores que pueden sesgar sustancialmente el resultado. Trabajar con un solo grupo, en un diseño intra-sujeto, evita este problema. Por otra parte, los diseños intra-sujetos requieren un esfuerzo considerablemente mayor a los participantes. Esto puede llevar al aburrimiento o al cansancio, dos rasgos nada deseables en lo que respecta a la fiabilidad de nuestros resultados. Además, a medida que se alarga la
60
La investigación cuantitativa en Lingüística tarea, el participante puede adquirir práctica y, por lo tanto, mejorar sus resultados. En el peor de los casos, esto puede conducir a la creación de UHVXOWDGRVDUWLÀFLDOHV es decir, que los resultados que obtenemos no se basen en la reacción de los encuestados ante el contenido real sino en su reacción ante la tarea. En otras palabras, los resultados artificiales son resultados que se basan en cómo reaccionan los encuestados a una metodología concreta, no en el conocimiento o reacción de los encuestados ante el cambio de la variable. Este fenómeno está muy relacionado con el tema de la validez, del que ya hemos hablado en el Capítulo 2. Si Li hubiera empleado un diseño intra-sujeto, podríamos imaginarnos una situación en la que los participantes de hecho empezaran a notar el cansancio, lo que conduciría a que su ejecución disminuyera a lo largo de ambos estímulos. Como resultado, los datos obtenidos podrían no decirnos necesariamente cómo reaccionan los encuestados según si las frases fueran inferibles o no inferibles, sino sencillamente lo mejor o peor que reaccionan ante la tarea. Los resultados artificiales pueden ocurrir en todos los diseños de investigación y el riesgo de crearlos no es algo que deba subestimarse. Junto con el estudio exhaustivo de las investigaciones previas y de las metodologías empleadas, todo investigador que esté diseñando un estudio debería, por lo tanto, preguntarse continuamente y evaluar críticamente si el método empleado realmente mide lo que pretende medir. Los estudios cuasi experimentales (correlacionales o selectivos) se basan en el cambio de una (o más) variables; no obstante, hay dos diferencias cruciales con los auténticos diseños experimentales. En primer lugar, la asignación de los participantes a los grupos experimentales y de control no es aleatoria sino que, hasta cierto punto, “se da de manera natural”. En segundo lugar, en vez de una manipulación deliberada por parte del investigador, en los estudios cuasi experimentales lo que cambia esa variable en concreto es una fuerza externa. Como esto suena bastante abstracto, vamos a poner un ejemplo. Mientras escribo este libro, se está debatiendo con bastante intensidad en Gran Bretaña acerca de cómo mejorar la integración sociocultural de los migrantes e, inevitablemente, acerca del uso de la lengua inglesa como medio para facilitar la integración, así como la dotación de clases de lengua inglesa/ESOL (English for Speakers of Other Languages). Es un tema central en cuyo debate intervienen políticos, medios de comunicación, legisladores y el público en general. Imaginemos, en aras de la comprensión, que en este momento no hubiera ninguna dotación de ESOL a disposición de los migrantes. Supongamos también que el gobierno aprueba una ley por la que, a partir de la semana que viene, se aumenta considerablemente la dotación de ESOL, pero que también obliga a los migrantes a adquirir un diploma de competencia lingüística en inglés semejante al Cambridge Advanced English Certificate (CAE). Sin embargo, en este primer momento, sólo se proporcionarán clases a los migrantes de origen paquistaní. Por lo tanto, los paquistaníes en Gran Bretaña se convierten automáticamente en nuestro grupo experimental, es decir, en el grupo que será sometido a un cambio en una variable
Diseño y muestreo de la investigación
61
concreta (la dotación de ESOL), mientras que el resto de los migrantes no experimentarían ningún cambio (ergo serán nuestro grupo de control). Diseñaríamos nuestro estudio ficticio en torno a dos puntos de recogida de datos: midiendo la competencia de ambos grupos, el experimental y el de control, primero antes de que entre en vigor la nueva ley y después, digamos que dentro de seis meses. De manera similar a los diseños experimentales auténticos, obtendríamos cuatro puntuaciones que nos permitirían extraer conclusiones acerca de si la nueva política ha tenido algún efecto sobre la competencia de los migrantes en la lengua inglesa: s,ACOMPETENCIADELGRUPOEXPERIMENTALPREVIAALEST¤MULO s,ACOMPETENCIADELGRUPODECONTROLPREVIAALEST¤MULO s,ACOMPETENCIADELGRUPOEXPERIMENTALPOSTERIORALEST¤MULO s,ACOMPETENCIADELGRUPODECONTROLPOSTERIORALEST¤MULO La ventaja de los diseños cuasi experimentales es que requieren relativamente poco esfuerzo por parte del investigador, puesto que de la introducción del cambio o del estímulo se encargan otras personas. Pero este es también su mayor inconveniente: a diferencia de los experimentos reales, no tenemos ningún control sobre terceras variables y sobre lo que está ocurriendo, y nos basamos por completo en la observación de los cambios potenciales. Además, puesto que la asignación de los participantes en el grupo experimental no es aleatoria y puesto que los participantes serían conscientes de ello (¡imaginaos únicamente la cobertura mediática!), es posible que se desencadene algún tipo de reacción psicológica (positiva o negativa) en ellos, una reacción que no se basa en la dotación de ESOL sino en el hecho de que se les ha hecho participar.
3.5 Resumen: diseños de investigación El empleo de un determinado diseño de investigación depende de varios factores, pero nuestra pregunta de partida y las hipótesis son los aspectos más cruciales. La Tabla 3.1 resume las características principales. Tabla 3.1. Resumen de los diversos diseños de investigación. Tipo de diseño Longitudinal
Posible aplicación Cambio lingüístico; desarrollo de un rasgos concreto a lo largo del tiempo
Pros/Contras + observación del cambio en tiempo real – factores externos difíciles de controlar. – el tiempo y el riesgo de perder parte de la muestra
62
La investigación cuantitativa en Lingüística Tipo de diseño Transversal
Posible aplicación Descripción del estado actual de un rasgo lingüístico concreto
Experimental
Influencia de un estímulo particular externo en un rasgo lingüístico
Cuasi experimental
Influencia de un estímulo particular externo en un rasgo lingüístico
Pros/Contras + comparativamente rápido + muy preciso si se usan los métodos y el marco adecuados (puesto que no se producen cambios) – muestra muy amplia – no puede responder de ningún desarrollo anterior al momento de la recolección de datos + control total por parte del investigador – a menudo complicado de poner en práctica – cuestiones de validez y fiabilidad + observación del cambio real en un periodo de tiempo comparativamente breve (cf. longitudinal) – no control sobre el cambio en las variables – escaso control sobre los factores externos
3.6. Muestreo Ligada de manera inseparable a la elección de un diseño de investigación, tenemos la cuestión de a quién queremos investigar, es decir, quiénes son nuestros participantes. Es una cuestión que, superficialmente, puede parece obvia y hablar sobre ello algo obsoleto, pero, para poder diseñar un estudio fiable y válido, debemos examinar los principales conceptos implicados: la población, la muestra y las técnicas de muestreo. Se entiende por población el grupo de gente que nos interesa de manera general; sin embargo, no significa necesariamente toda la gente (como en “toda la gente que vive en Gran Bretaña” o incluso “en este universo”). Más específicamente, la población se refiere a un grupo de gente que comparte determinadas características. Como tal, población puede referirse tanto a grupos grandes como pequeños: si elegimos humanidad como la población que nos interesa, incluimos en ella a todos los seres humanos que viven en este planeta, en la actualidad aproximadamente 7.600 millones de individuos, que tienen como rasgo común el ser humanos. De manera similar, podemos definir nuestra población como “todos los hablantes nativos de la lengua inglesa”; en comparación con la humanidad, se trataría de una población mucho más pequeña, con solamente 380 millones de individuos. No obstante, las pobla-
Diseño y muestreo de la investigación
63
ciones pueden definir grupos mucho más pequeños. A lo largo de los últimos 20 años, la sociolingüística y la antropología lingüística han prestado un interés cada vez mayor por las lenguas que emplean las comunidades minoritarias. En mi propia investigación, definí la población como todos los migrantes de primera generación de origen bangladesí que vivían en un barrio concreto de Londres, excluyendo explícitamente a aquellas personas de segunda generación que ya hubieran nacido en Londres. Pero, normalmente, aconsejo a mis estudiantes de grado que, para sus proyectos de fin de grado, busquen algo mucho más pequeño y que definan su población como algo parecido a “todos los estudiantes del grado de Filología inglesa en la Anglia Ruskin University”, una población compuesta de unas pocas docenas de personas. El término población no se aplica necesariamente solo a la gente (o a los animales, si eres zoólogo, o a las plantas, si eres botánico). Hablando en puridad, “la población se define como un grupo de elementos; un elemento se define como la unidad básica que comprende la población” (Frankel, 2010: 85). Una población puede, por lo tanto, ser cosas como “todos los anuncios de citas que se han publicado en los periódicos de cotilleo británicos”, donde cada anuncio constituye un elemento. Mientras que hemos visto que las poblaciones pueden tener tamaños y formas significativamente diversos, todas tienen una cosa en común: normalmente son demasiado grandes como para que se puedan estudiar por completo. No hay proyecto de investigación que sea capaz de incluir a todos y cada uno de los seres humanos que viven en este planeta; incluso en el caso de poblaciones comparativamente más pequeñas, como la comunidad bangladesí en East London, aún estaríamos hablando de unas 65.000 personas, algo que supera con mucho los límites del proyecto medio. Un estudiante de último año puede echar el resto y entrevistar a unos 40 estudiantes para su tesina, aunque en este caso se haría más llevadero hacer una encuesta basada en cuestionarios. Este tema no se limita únicamente a las poblaciones basadas en encuestados humanos: uno de los problemas a la hora de tratar con los datos del lenguaje natural, tanto hablado como escrito, es que esos datos pueden fácilmente alcanzar cientos de miles, cuando no millones, de palabras. Las modernas técnicas de análisis de corpus han conseguido que tratar enormes cantidades de texto sea algo mucho más fácil, pero, a la hora de hacer un análisis más detallado o cualitativo, a menudo tiene más sentido centrarse en una porción menor. Los estudios sobre los paisajes lingüísticos urbanos (por ejemplo, la presencia visual de lenguas en una localización geográfica concreta por medio de elementos como señales de tráfico, publicidad, etc.) a menudo se centran en calles seleccionadas o en áreas estrechamente definidas para conseguir que la recogida y el análisis de los datos sea algo gestionable. El estudio de Du Plessis (2010) sobre la gestión del lenguaje en Bloemfontain, Sudáfrica, se basa, en parte, en la recogida de formularios de datos en una única planta de un edificio público. Lo que tenemos que hacer, entonces, es dividir nuestra población en porciones más pequeñas; necesitamos un tamaño de grupo con el que
64
La investigación cuantitativa en Lingüística podamos trabajar de una forma realista: la muestra. Una muestra es una parte de nuestra población, y lo importante es que la muestra debe ser un reflejo adecuado de dicha población. Dicho de otra manera, nuestra muestra debería tener las mismas características que nuestra población: ser representativa de la población. Ahora viene la parte complicada: cuanto más amplia es la población, más probable es que sea también bastante diversa, o heterogénea. Los miembros, o los elementos, pueden compartir los mismos rasgos que los convierten en miembros de esa población, pero también exhibir una serie de rasgos en los que difieren. Aunque la humanidad se defina por su ser-humano, hay muchos otros rasgos que nos hacen diferentes. De manera similar, si saltamos de los anuncios de citas en los periódicos a una población que también incluya tabloides y revistas, es posible que el estilo y gama de los anuncios cambie también como reflejo de la estratificación del conjunto de los lectores. Por otra parte, si tenemos una población pequeña, por ejemplo, todos los alumnos de segundo año de lingüística de la Universidad X, es posible que la población en sí misma sea más homogénea (en términos, por ejemplo, de edad y de nivel educativo, etc.). Ni la homogeneidad ni la heterogeneidad de una población son algo intrínsecamente negativo, de hecho ambas cosas pueden ser útiles dependiendo de nuestra pregunta de partida. Sin embargo, cuando seleccionamos una muestra, estas características se convierten en el problema principal: puesto que nuestra muestra ha de ser un reflejo realista de la población, esa homogeneidad o heterogeneidad debe reflejarse también en la muestra. Esto es, si nuestra población es bastante diversa, nuestra muestra debería serlo también. Si tenemos una muestra homogénea y la empleamos para extraer conclusiones acerca de una población heterogénea, ¿cómo van a ser fiables y válidos nuestros resultados? Más adelante, a lo largo de los Capítulos 7 y 10, hablaremos de algunas herramientas estadísticas que se conocen como estadísticas inferenciales (o inferencia estadística): la idea que subyace tras ellas es que nos permitirán observar una muestra y hacer inferencias acerca del aspecto de la población. Por lo tanto, es importante que la muestra sea una representación adecuada de la población o, de lo contrario, la inferencia estadística no nos llevará a ninguna parte: imaginemos que la población tiene un reparto de sexo de exactamente el 50 por 100 (50 por 100 de la población es masculina, 50 por 100 es femenina). Si tenemos una muestra con un reparto 90:10 (90 por 100 masculino, 10 por 100 femenino), ¿cómo vamos a hacer inferencias precisas acerca de la población? Un ejemplo: el estudio seminal de Lakoff (1975) acerca de las diferencias lingüísticas entre hombres y mujeres buscaba los rasgos típicos del habla femenina, defendiendo en último término que el lenguaje de las mujeres es inferior. Dado este resultado, podemos inferir que la población de este estudio está compuesta de mujeres, ¡un grupo bastante diverso! Cuando se lee en detalle el estudio, nos damos cuenta (aparte de otros problemas metodológicos de los que aquí no nos ocupare-
Diseño y muestreo de la investigación
65
mos) de que sus conclusiones se basan en datos recogidos dentro de su propia red social. El problema debería ser inmediatamente obvio: ¿cómo puede ser la red social de una profesora de universidad blanca un reflejo adecuado de las mujeres en general? No quiero decir con esto que el ambiente social de Lakoff fuera inherentemente homogéneo, pero parece improbable que fuera tan diverso como para reflejar adecuadamente la población, un tema que muchos investigadores posteriores no han dejado de señalar. En la Fig. 3.3 podemos ver la relación entre la población y la muestra: nuestra población consiste en 20 bolas, 10 de las cuales son blancas y 10 son negras. Pongamos una muestra de cuatro bolas (es decir, del 20 por 100 de la población). Si nuestra muestra ha de ser representativa de la población, la proporción de bolas blancas y negras debería ser idéntica (o al menos muy similar): el 50 por 100 de las bolas de la muestra debería ser negra, el 50 por 100 blanca. Por lo tanto, una muestra representativa de nuestra población consistiría en dos bolas blancas y dos bolas negras. Población
Individuos
Muestra
Figura 3.3. Muestreo.
Así que lo que necesitamos es una técnica apropiada que nos permita extraer una muestra adecuada y realista de nuestra población. Hay varios libros dedicados por completo al tema del muestreo; aquí vamos a tratar únicamente los métodos y problemas más importantes. El método de muestreo más válido sin discusión ninguna es el muestreo aleatorio o probabilístico. Se basa en la premisa de que todos los miembros de una población tienen la misma probabilidad de convertirse en miembros de la muestra. Una muestra probabilística es básicamente similar a echar las cosas a suerte: supongamos que nuestra po-
66
La investigación cuantitativa en Lingüística blación se compone de 100 personas y que hemos decidido que la muestra tenga un tamaño de 25 personas. Escribimos los nombres de cada una de las 100 personas en un trozo de papel y los metemos en un sombrero, los mezclamos correctamente y después sacamos 25 nombres del sombrero. En este caso, las 100 personas tienen la misma probabilidad de entrar en la muestra (aunque, técnicamente, esto es incorrecto: con cada nombre que se saca del sombrero, la probabilidad de que te elijan aumenta para los nombres que quedan allí: 1 sobre 90 es una probabilidad más alta que 1 sobre 100, pero vamos a ignorar los detalles matemáticos y suponer que sacamos los 25 nombres a la vez). Basada en las reglas de la probabilidad (véase el Capítulo 6), nuestra muestra debería componer ahora un reflejo bastante bueno de nuestra población. Es poco probable que hayamos escogido aleatoriamente una muestra especialmente rara (como, por ejemplo, los encuestados más ancianos, o compuesta únicamente de varones). Como el investigador no está implicándose activa o conscientemente en el proceso de muestreo (aparte del gesto de sacar los nombres del sombrero), se elimina cualquier sesgo potencial. Con muestras más amplias, la técnica del nombre en el sombrero se vuelve más difícil (para una población de 10.000 necesitarías un sombrero gigante), pero, esencialmente, la técnica es la misma. Para una población de 5.000 y un tamaño de muestra de 100, podemos asignar aleatoriamente números desde el 0001 al 5000 a los nombres de nuestra población y después seleccionar aleatoriamente 100 números. Como no conocemos los nombres de los individuos, descartamos cualquier sesgo que podamos tener (como, por ejemplo, escoger únicamente mujeres o nombres que nos hagan gracia). Tenemos también el muestreo sistemático, similar a este método puramente probabilístico: recopilamos una lista (alfabética) de nuestra población y seleccionamos cada quinto/sexto/décimo/etc. nombre de la lista, dependiendo del tamaño que requiera la muestra, sin prestar atención a quienes seleccionamos. Aunque la muestra probabilística es la única forma de eliminar el sesgo, no puede eliminar por completo el error de muestreo. El error de muestreo es el fenómeno por el cual nuestra muestra no tiene las mismas características que nuestra población, por razones que únicamente los matemáticos muy expertos pueden explicar. Lo dejamos aquí con una descripción del fenómeno. Un ejemplo: nuestra población incluye a 100 personas, de las cuales 50 son hombres y 50 son mujeres. Buscamos una muestra de 20 personas. Para que sea totalmente representativa de la población, nuestra muestra, por lo tanto, debería incluir tantos hombres como mujeres, 10 de cada. Sin embargo, después de sacar nuestra muestra aleatoria, nos damos cuenta de que tenemos 15 hombres pero solo 5 mujeres; dicho de otra manera, nuestra muestra no refleja la realidad. Esta es la cruz de las probabilidades: solo nos dicen lo que es posible que ocurra, pero no nos garantizan que vaya a ocurrir en realidad. En la Fig. 3.4 reflejamos un error de muestreo en el ejemplo anterior de las bolas, basado en un muestreo sistemático que escoge cada quin-
Diseño y muestreo de la investigación
Muestra
Pequeño error de muestreo, representatividad limitada
67
Muestra
Gran error de muestreo, ninguna representatividad
Figura 3.4. Error de muestreo.
ta bola. En el ejemplo de la izquierda vemos un pequeño error de muestreo: en lugar de un reparto 2:2 hemos seleccionado 3 bolas blancas y una negra. Por lo tanto, nuestra muestra no es demasiado representativa de nuestra población. En el lado derecho tenemos un error de muestreo grave, en el que únicamente se han seleccionado bolas blancas. En este caso, nuestra muestra no es representativa de nuestra población, simplemente porque las bolas negras, aun cuando estén representadas paritariamente en la población, no están representadas en la muestra. Es muy difícil aconsejar de manera genérica sobre qué hacer con los errores de muestreo, porque depende en gran medida de la pregunta de partida. Si, en nuestro ejemplo ficticio, nos interesaran las diferencias entre hombres y mujeres, entonces nos gustaría que nuestro error de muestreo fuera lo más pequeño posible. Si el sexo es un factor irrelevante, probablemente podamos asumirlo. Lo importante es que seamos conscientes del error. Dependiendo de las circunstancias, podríamos decidir volver a hacer el muestreo. Aunque el muestreo aleatorio/probabilístico es uno de los métodos más válidos, cuando no el más válido, también tiene un precio: especialmente con una población amplia, el muestreo puede ser un proceso tedioso y con tendencia al error (aunque los ordenadores nos pueden quitar mucha carga de trabajo). Igualmente, es improbable que todos aquellos que hayamos seleccionado para nuestra muestra acepten tomar parte en nuestro estudio. Podemos seleccionar aleatoriamente a 50 personas para nuestra muestra y que solo 20 de ellas accedan a participar. En este caso, tendríamos que aceptar lo que se llama una no respuesta que conduce a un error no de muestreo. Si no todos los
68
La investigación cuantitativa en Lingüística miembros de nuestra muestra cuidadosa y aleatoriamente seleccionada acceden a participar, la muestra pierde su representatividad: se da a menudo el caso de que quienes acceden a participar son significativamente diferentes de quienes no quieren, la muestra queda sesgada. Podemos apañar las cosas con un remuestreo, es decir, con la repetición del proceso para encontrar a los restantes 30 participantes. Sin embargo, las dudas sobre la representatividad de la muestra no se disiparán. Una muestra completamente probabilística (pura o sistemática) a menudo no es viable, especialmente cuando pensamos en proyectos a pequeña escala, como los trabajos de los estudiantes. En más ocasiones de lo que creemos tenemos que recurrir a un muestreo no probabilístico. No defiendo aquí el empleo del muestreo no probabilístico, pero es importante hablar brevemente de este método, puesto que lo emplean mucho quienes están cortos de recursos. Por decirlo sin rodeos, en el muestreo no probabilístico los participantes se seleccionan de manera no aleatoria, no probabilística. En otras palabras, no todos los miembros de la población tienen la misma posibilidad de convertirse en miembros de la muestra; el ingreso en la muestra se basa en algún tipo de selección deliberada por parte del investigador. El tipo más habitual de muestras no aleatorias son las muestras oportunistas (Sapsford y Jupp, 1996), también conocidas como muestras de conveniencia (Bryman, 2004). Como implican sus nombres, los participantes son escogidos por el investigador según quién está disponible en ese momento. Por ejemplo, en mi propio trabajo con la comunidad bangladesí en East London (Rasinger, 2007), una muestra probabilística estaba completamente fuera lugar, sobre todo debido a los limitados recursos del proyecto. En vez de ello recluté a los participantes entre las personas que visitaban un centro comunitario del barrio simplemente preguntándoles si podían concederme media hora para hablar conmigo. Los problemas de este enfoque son (espero) obvios: primero, la selección no aleatoria no excluye ni puede excluir cualquier sesgo que pueda tener el investigador. Si somos honrados, reconoceremos que todos nosotros, en algún momento de nuestra vida, nos hemos querido acercar o no a una persona; que sea una decisión consciente no importa, pero la selección o no selección deliberada de los participantes se reflejará inevitablemente en la muestra, de un modo u otro. En segundo lugar, las muestras oportunistas son a menudo muy problemáticas en términos de representatividad y, en última instancia, de la generalización de los datos que generan. Si una muestra se selecciona de una manera potencialmente sesgada, ¿hasta qué punto representa a toda una población? Pero la muestra oportunista puede tener sus beneficios, aparte de aquellos que resulten obvios a la hora de reclutar a los participantes. Y una subcategoría de muestra no aleatoria puede demostrarse especialmente útil en la investigación sociolingüística: muestras bola de nieve o muestras de red social (Milroy, 1987). Esencialmente, según este método, la muestra recluta a sus propios miembros. Milroy, en su estu-
Diseño y muestreo de la investigación
69
dio sobre el empleo de la lengua y la clase social, por ejemplo, contactó en un primer momento con unos pocos individuos de las zonas de clase obrera de Belfast. Posteriormente estos participantes reclutaron miembros de su red social: amigos, familia, etc., y, por lo tanto, expandieron la muestra. Este método bola de nieve funciona muy bien en contextos en los que podemos estar seguros de que las redes sociales son comparativamente homogéneas. Allá por la década de 1980, Milroy podía confiar en que los miembros de la clase obrera de Belfast interaccionaban principalmente dentro de su propio grupo. Siendo así, la muestra generada por el enfoque de la red social podía suponerse un buen reflejo de la población. No obstante, este método habría fracasado espectacularmente si la red fuera heterogénea en lo que respecta a la clase social, puesto que la muestra habría contenido miembros de todas las clases y no sería representativa de la población deseada.
3.7. Un apunte sobre ética Las universidades y otras instituciones de investigación y de educación superior tienen cada vez más en cuenta los temas éticos relacionados con las investigaciones que afectan a los seres humanos (o a los animales, o los tejidos, pero normalmente no suele ser el caso de la investigación lingüística). Mi universidad requiere que todos sus miembros (personal y alumnos) cumplan un código ético formalizado y aprobado; la mayoría de las fuentes de financiación lo exigen también. En parte es para proteger a la institución y a los investigadores de las posibles denuncias de los participantes en la investigación. Demostrar que se han seguido escrupulosamente los procedimientos éticos es un aspecto importante a la hora de demostrar que se ha procedido adecuadamente; también es un requisito legal en muchos países (Johnstone, 2000), recogido en la ley de protección de datos y en las leyes sobre privacidad, entre otras. Dejando aparte los temas deontológicos, es simplemente ético seguir determinadas reglas cuando se trabaja con otra gente. Como cada universidad tiene su propio sistema (y cada país puede tener una legislación diferente sobre estos asuntos), aconsejo a los lectores que se familiaricen con los detalles de su propia organización. Hammersley y Traianou, en su introducción a Ethics in Qualitative Research (2012), aportan una excelente definición tentativa del concepto: Un conjunto de principios que encarnan o ejemplifican lo que está bien o mal, o que nos permiten identificar lo correcto y lo incorrecto [...] Ético puede significar: lo que está bien o es justo, en contraste con lo no ético, lo que está mal o injusto (ibid.: 16-17; cursivas en el original).
Hay unas breves directrices generales que pueden aplicarse de manera universal en relación con la ética: en primer lugar, los participantes en una investigación deben dar su consentimiento para tomar parte en el estudio y deben también tener la oportunidad de retirar ese consenti-
70
La investigación cuantitativa en Lingüística miento en cualquier momento. La recogida de datos subrepticia es, esencialmente, robar datos de alguien y es algo profundamente no ético, tanto desde el punto de vista moral como, cada vez más, en sentido legal. En especial con las investigaciones que emplean datos del lenguaje natural real, el tema de cuándo pedir el consentimiento (si hacerlo antes o después de la grabación) es un asunto crucial: los participantes que desde el principio saben que están siendo grabados pueden cambiar o no deliberadamente sus comportamientos lingüísticos, un fenómeno que se conoce como la “paradoja del observador” (Labov, 1972). Por otra parte, podemos decidir grabar subrepticiamente a los informantes, para encontrarnos después con que no dan su consentimiento. No hay una respuesta perfecta para este dilema. Los sociolingüistas y los analistas del discurso se han pasado buena parte de las últimas cuatro décadas trabajando este asunto y han desarrollado diversas estrategias para recoger datos de habla buenos y fiables de una manera ética. La mayor parte de estos enfoques se basan en que el investigador de campo llegue a conocer lo mejor posible a sus encuestados; cuanto más estrecha sea la relación entre el investigador de campo y el informante, mayor será la probabilidad de que disminuya la paradoja del observador y aumente la calidad de los datos. Es obvio que un enfoque así consume mucho tiempo y recursos, cosas de las que no estamos sobrados. El uso de un gancho, es decir, de una persona que sea miembro del grupo que nos interesa, en el proceso de recogida de datos es a menudo algo muy útil, en tanto puede cubrir la distancia entre el investigador y los investigados. Pero incluso así puede pasar tiempo hasta que todo funcione de forma satisfactoria. Señalemos que algunas instituciones pueden exigir el consentimiento por escrito de los participantes o algún otro tipo de registro de dicho consentimiento; Johnstone (2000) proporciona una buena plantilla para esto. Como guía general, el formulario de consentimiento debería comenzar con una breve introducción del investigador y del proyecto de investigación, para que los participantes sepan con quién están tratando. La cantidad de información que debe incluirse es un tema controvertido: revelar demasiado podría influir en las respuestas de los participantes (porque pueden tratar de inferir qué es lo que se espera de ellos), darles una información demasiado escasa puede llevar a que no consientan porque no saben qué es lo que les va a ocurrir. Es aconsejable incluir una breve explicación de por qué se les ha invitado a participar. Proporcionar datos de contacto, para que los participantes puedan comunicarse con nosotros o con el resto de investigadores del equipo, se considera también una buena práctica y se incluye ahora en muchos formularios por defecto. Los puntos más importantes, sin embargo son los siguientes: 1. Hacer conscientes a los participantes del hecho de que pueden retirarse del estudio en cualquier momento sin necesidad de dar explicaciones. Son seres humanos independientes y, aunque es
Diseño y muestreo de la investigación
71
molesto perder participantes, tienen derecho a hacerlo sin aportar justificación. 2. Que los participantes sean conscientes de cualquier riesgo –psicológico o físico– que pueda ocurrir. De nuevo, los participantes tienen derecho a saber qué esperar y no es ético (y en muchos países es ilegal) exponerlos a riesgos sin su consentimiento. 3. Informarles de lo que va a ocurrir con sus datos, por ejemplo, dónde y cómo se van a almacenar y quién tendrá acceso a ellos. Esto también incluye información acerca de cómo pueden obtener sus propios datos y cómo pueden retirarlos del estudio. 4. El formulario de consentimiento debe ser firmado por el participante (o por su tutor legal). Hay que asegurarse de que los encuestados pueden realmente hacer uso del formulario de consentimiento: si los encuestados no pueden leer o no dominan el idioma concreto que empleamos, en el nivel requerido para entender el formulario de consentimiento, hay que buscar otras formas. Estas pueden ser una traducción a su propio idioma en el caso de hablantes no nativos, o se puede grabar un audio con la explicación y obtener un consentimiento oral en los casos de gente de quienes no es posible obtener un consentimiento escrito (por ejemplo, niños muy pequeños). Cuando se trabaja con niños o adolescentes menores de 18 años, hay que obtener el consentimiento de los padres o de los tutores legales. A lo largo de los últimos años se ha establecido el procedimiento de pedir igualmente permiso a los niños: nos podemos encontrar con unos padres muy dispuestos a que sus hijos participen en un estudio pero con los niños no tan dispuestos. No cuesta demasiado imaginarse qué tipo de datos producirá un niño al que sus padres han forzado a participar; casi no compensa que lo intentemos. En segundo lugar, ningún estudio debería dañar la integridad física y psicológica de los participantes; y los participantes no deberían sufrir ninguna desventaja a corto, medio o largo plazo por su participación en el estudio. El principio de evitar hacer daño es fundamental: no solo porque sea un comportamiento ético, sino porque el daño implica el riesgo muy concreto de que se demande judicialmente a los investigadores individuales o a las instituciones. Es cierto que pocos proyectos lingüísticos tendrán un grave impacto sobre la salud mental o física de los encuestados (aunque algún estudiante se me ha presentado con ideas para su trabajo de fin de grado que incluían el uso de sustancias ilegales). Pero es bastante sencillo crear situaciones en las que los encuestados puedan sentirse incómodos, intimidados o incluso amenazados hasta cierto punto. Los estudios que hacen uso de narraciones personales, por ejemplo, pueden desencadenar recuerdos desagradables; la naturaleza de la tarea en estudios más experimentales puede aumentar gravemente los niveles de estrés de los encuestados. Problemas similares pueden surgir cuando se trabaja con niños, con personas mayores o con gente que esté, por una u otra razón, en una posición de
72
La investigación cuantitativa en Lingüística debilidad con respecto al investigador. La presión en la que nos encontramos a la hora de recoger datos no debería tener como resultado que explotáramos nuestra posición de poder relativo ante nuestros participantes. La mayoría de los problemas pueden evitarse (y de hecho deberían evitarse) informando exhaustivamente a los encuestados. Los participantes que saben exactamente qué se les pide tienen menos posibilidades de mostrar reacciones adversas que los que no saben o solo saben de forma confusa lo que se supone que tienen que hacer. Esto debería hacerse en persona y por escrito (en el formulario de consentimiento/ información para el participante). Asimismo los encuestadores de campo deberían monitorizar cuidadosamente a los participantes durante la recogida de datos e intervenir si lo consideran necesario. En el peor de los casos, deberíamos abandonar nuestra recogida de datos y repensar la metodología. Hay una tercera implicación ética en un estudio, sin embargo, que sorprendentemente suele ignorarse: mientras que la mayoría de los debates sobre ética se centran en el bienestar y los derechos de los encuestados, a menudo se olvida por completo al investigador de campo. Así como la recogida de datos no debería afectar a la seguridad y la salud personal de los participantes, tampoco debería afectar a la nuestra. Esto puede ser algo muy sencillo: si estamos recogiendo datos en una zona de la ciudad conocida por sus altos niveles de criminalidad callejera, deberíamos evitar desplegar allí nuestro equipo (que a veces es muy caro). Füglein (2000), en su trabajo etnográfico sobre el empleo del alemán por parte de los adolescentes de origen turco de segunda generación en Alemania, comunicaba que, debido a su metodología etnográfica en la que actuaba como una infiltrada, se vio obligada a participar regularmente en las actividades del grupo, aunque algunas de ellas rozaban el límite de la legalidad. Además, Füglein informa de que, en tanto mujer joven dentro de un grupo exclusivamente masculino, tuvo que luchar para mantener su posición y no ser considerada un mero objeto de deseo sexual. Este grado de implicación parece admirable, pero está probablemente más allá de lo que cualquier estudio justifique: haría falta un proyecto muy bueno para convencerme de arriesgarme a ir a la cárcel por su culpa. Sin embargo, hay temas menos radicales pero no menos importantes que evaluar. La recogida de datos, incluso si todo va bien, puede ser muy estresante, y es de vital importancia que seamos conscientes (y lo seamos todo el rato) de lo que somos capaces de hacer física y psicológicamente. No hay nada malo en estar un poco estresado, pero los niveles de estrés que amenazan nuestro bienestar mental y nuestra salud sí son perniciosos. Puede que nos atraiga un tema determinado, pero, si nos exige recoger enormes cantidades de datos en un periodo muy corto de tiempo, deberíamos pensárnoslo dos veces. Es cuestión de sentido común: si en la vida normal no nos meteríamos en un callejón oscuro por la noche, ¿por qué hacerlo cuando estamos recogiendo datos? Si sabemos que otros compromisos nos van a impedir dedicar más que un
Diseño y muestreo de la investigación
73
tiempo determinado cada día a la investigación, ¿por qué hacerlo? No hay nada malo en forzarse un poco de vez en cuando, pero no hay estudio por el que merezca la pena morir (aunque parezca que a nuestros superiores les guste este tipo de compromiso). Mas, por raro que resulte, cuando nos gusta mucho un proyecto, tendemos a olvidarnos de estas cosas. Así que... recordémoslas. Es fácil rechazar hacer un determinado proyecto simplemente porque su aspecto ético parece desmoralizador, y mis referencias a los daños, pleitos y denuncias no habrán contribuido probablemente a disipar esos miedos. No obstante, hay una manera de contemplar el lado ético desde un ángulo mucho más positivo: un proyecto que se adapta a los principios éticos será probablemente un proyecto bien desarrollado y planificado, y gracias a eso será, en último término, un proyecto logrado. El formulario ético de mi universidad consiste en una batería de preguntas divididas en cinco bloques temáticos: sz1U£ QUIERES HACER Y CUÕLES SON TUS RAZONES PARA ELLO z0OR QU£ quieres hacerlo? sz%STÕSCUALIlCADOPARAHACERLO ESDECIR TIENESLASDESTREZASNECEsarias? sz#MOVASAHACERLO sz1UI£NESSONTUSPARTICIPANTESYQU£DA¶OPOTENCIALPODR¤AHACERLES tu proyecto? sz#MOVASACONSERVARTUSDATOS Aunque estos cinco bloques incluyen 27 preguntas intimidantes, todo lo que se busca averiguar es cuál es la pregunta de partida y la metodología. Cualquiera debería ser capaz de responder esto; si no podemos, entonces probablemente no deberíamos seguir adelante. El último bloque abarca cuestiones de protección de datos y privacidad, y debería ser evidente que los datos, especialmente los datos sin tratar que permiten identificar a los participantes, no deberían quedarse en el tren, o en el bar, o en un banco del parque. Así que la ética no es más que buena planificación, y eso siempre es bueno.
3.8. Gestionar la investigación: levantar un proyecto (y mantenerlo en pie) La mayoría de los manuales sobre métodos de investigación emplean una buena cantidad de tiempo hablando de las cuestiones básicas de la investigación, ya sea cualitativa o cuantitativa. La mayoría de ellos comienzan con un resumen de los temas que atañen al diseño de la investigación antes de pasar al meollo de las herramientas metodológicas y a los análisis e interpretaciones. Este libro no es una excepción. Lo que parecen ignorar muchos libros, sin embargo, es que los proyectos de investigación son justamente eso, proyectos. Tienen una fecha de
74
La investigación cuantitativa en Lingüística inicio, una fecha de finalización (¡la fecha de entrega del artículo!) y un resultado (un artículo, una tesis, una presentación, etc.). Entre las fechas de inicio y fin pasan cosas que hacen que (esperemos) alcancemos ese resultado. Una vez que lo hemos alcanzado, el proyecto finaliza. Esto se conoce como el ciclo de vida del proyecto. Los proyectos hay que gestionarlos o, de lo contrario, nunca producirán el resultado buscado. Este libro, evidentemente, no es una introducción a la gestión de proyectos (hay muchos, véase el Epígrafe “Para leer más”, al final de esta Primera Parte), pero bien está echar un vistazo rápido a las cosas más básicas. Cualquier proyecto, y esto incluye los proyectos de investigación (académicos), ya sea obra de un estudiante de grado o de una eminencia en la materia, tiene tres dimensiones: alcance, recursos y tiempo. Vamos a ver estas tres dimensiones con un poco más de detalle. Dicho rápidamente, el alcance de un proyecto es de lo que trata. Se define por nuestras preguntas de investigación, por lo que queremos averiguar. En el capítulo anterior he insistido en la importancia de unas hipótesis claramente definidas para la investigación cuantitativa, porque definirán el alcance de la investigación. Tiempo es fácil de comprender: ya sea un proyecto estudiantil o un proyecto dirigido por un académico con experiencia y una cuantiosa financiación, el tiempo es limitado; en algún momento hay una fecha de entrega para desprenderse de ese informe/artículo/ensayo y, al cabo de un cierto número de semanas/meses/años, la financiación se termina. Un problema clave respecto al tiempo es que normalmente es difícil obtener más: las fechas de entrega suelen estar fijadas y solo pueden negociarse hasta cierto punto y pasarse de la fecha suele tener repercusiones (una nota peor, ser excluido de futuras becas...). Los recursos son, como su propio nombre indica, los recursos que necesitamos para completar el proyecto. Pueden consistir en equipo técnico, o fuerza de trabajo, o cualquier otra cosa que necesitemos para llevar a cabo el estudio. Para plantearlo de la forma más sencilla posible, alcance, tiempo y recursos tienen que gestionarse de manera que conformen un proyecto equilibrado. La idea es que el alcance, el tiempo y los recursos están intrínsecamente vinculados, y que un cambio en una dimensión requiere un cambio en (al menos) otra. Vamos a poner un ejemplo: soy un investigador solitario en un proyecto que indaga en la conservación de la herencia lingüística en una comunidad migrante. Mi fecha de inicio es el 1 de julio y la fecha para terminarlo el 31 de octubre, momento en el que debo entregar un artículo sobre el tema o suspenderé el curso/me despedirán/no conseguiré un ascenso. Nunca he hecho nada así antes y tengo que empezar desde cero, lo que me concede cuatro meses desde el principio hasta el final. Mi idea es pasar un mes planificando (incluida una semana para hacer pruebas piloto), un mes recogiendo datos, un mes analizándolos y el último mes escribiendo, por lo que el proyecto se parecerá mucho a la Tabla 3.2.
Diseño y muestreo de la investigación
75
Tabla 3.2. Plan para el proyecto (ficticio) sobre conservación lingüística. Fase 1
Julio
Planificación y prueba piloto
Fase 2
Agosto
Trabajo de campo: recolección de datos
Fase
Septiembre
Análisis de datos
Fase 4
Octubre
Redacción
Durante la Fase 1 decido recoger todos los datos mediante una encuesta basada en un cuestionario. Lo pruebo, funciona bien, así que empiezo la Fase 2. Supuesto 1: después de dos semanas recogiendo datos me doy cuenta de que no estoy obteniendo una tasa de respuestas suficiente como para permitirme un análisis cuantitativo significativo. Sin embargo, me han informado fuentes fiables de que, en septiembre, la gente volverá de sus vacaciones y muchos han expresado interés en participar en la encuesta. No puedo cambiar las fechas del proyecto, así que necesito decidir si recortar el tiempo asignado a las fases 3 y 4 o resignarme a reducir el alcance del proyecto. Supuesto 2: estoy avanzando muchísimo con la recogida de datos e incluso he empezado un análisis preliminar a finales de agosto. Sin embargo, me doy cuenta de que hay un patrón enormemente interesante que se manifiesta en los datos, pero que mi encuesta cuantitativa no puede captar por completo. De nuevo, el proyecto debe estar terminado el 1 de octubre. Cualquier aumento del alcance del proyecto implica, bien que tendría que reducir las fases 3 y 4, bien que necesitaría ampliar los recursos. Quizá pueda contratar a un investigador ayudante. Desgraciadamente son malos tiempos y no hay dinero, así que en realidad hay que negociar si reducir el alcance o aumentar el estrés. Mediante la planificación de proyecto podemos ahorrarnos un montón de problemas. El ejemplo anterior puede que sea ficticio, pero no es inusual: todas estas cosas pueden ocurrir y ocurren, así que hay que asegurarse de contar con un margen de maniobra para las contingencias. A menudo confiamos en la buena voluntad de la gente a la hora de obtener datos para nuestro estudio, pero la gente no siempre está disponible. La razón por la que algunos formularios de ética preguntan sobre las cualificaciones del investigador no es para molestar: si tenemos la intención de usar un programa informático concreto o cualquier otro equipamiento, hay que asegurarse de que tenemos acceso a él y de que sabemos realmente usarlo. Aprender sobre la marcha puede ser bonito, pero, si estamos apurados de tiempo, probablemente necesitemos hacerlo ya y punto. Y pedir al supervisor o al decano que se gaste una buena cantidad de dinero en un equipo para que podamos terminar de escribir un artículo normalmente no sienta bien. No quiero decir que no lo vayan a hacer, pero es algo que debería quedar claro en la fase de planificación.
76
La investigación cuantitativa en Lingüística Tabla 3.3. Plan de proyecto (real).
Id
Tarea
Inicio
Final
Duración (días laborables)
Recursos
1
Nombre del proyecto
01/07
30/04
217
2
Fase de montaje
01/07
26/07
19
3
Repaso bibliográfico
01/07
19/07
14
Renovar carné biblio.
4
Contactar participantes
01/07
19/07
14
Lista de mails de Kate.
5
Contactar interesados
07/07
19/07
9
Lista de mails de Kate.
6
Desarrollar metodología 22/07
26/07
4
7
Vacaciones
14/08
12
8
Recogida de datos de los participantes
19/08
01/11
54
Cuestionarios a reprografía; grabadora del departamento audiovisual.
9
Filtrar datos cuantitativos
09/09
20/09
9
Comprobar versión SPSS y compatibilidad.
10
Filtrar datos cualitativos 09/09
20/09
9
Comprobar NVivo con Mark.
11
Afinar actores
23/09
27/09
4
Lista de Kate. Sharon??
12
Recoger datos actores
04/11
20/12
34
Grabadora del Servicio Audiovisual.
13
Parón navideño
23/12
03/01
9
14
Análisis principal
06/01
07/03
44
15
Análisis cuantitativo
06/01
17/01
9
16
Redacción análisis cuantitativo
20/01
31/01
9
17
Transcripción de entrevistas
06/01
21/02
34
Externalizado al equipo de transcripción. NB: Mary paga la factura.
18
Análisis cualitativo
24/02
07/03
9
NVivo
19
Redacción final
10/03
30/04
37
20
Informe de actores
10/03
21/03
9
21
Artículo A
24/03
11/04
14
22
Artículo B
14/04
30/04
12
29/07
SPSS
Diseño y muestreo de la investigación
77
Merece la pena escribir el plan del proyecto con todas sus fases en una hoja (electrónica) de papel, porque ayuda a ver cómo se desarrolla el proyecto y dónde están sus puntos potenciales de quiebra. Una tabla sencilla como la Tabla 3.2 bastará en la mayoría de los casos. O podemos desglosarlo en pasos más pequeños: la Tabla 3.3 es un plan de uno de mis proyectos. Observad que también he señalado mi propia falta de disponibilidad. Lo importante es que lo que empleemos nos funcione y nos permita hacer un seguimiento del proyecto. Así que, para resumir, merece la pena que al inicio de un proyecto de investigación se piense no solamente en los temas académicos (marco teórico, diseño de investigación, metodología, marco de trabajo analítico), sino también que se dedique un poco de tiempo a pensar sobre la gestión del proyecto. Puede parecer que al principio es más trabajo, pero normalmente evita desastres que son evitables, ¡lo que deja más energía para luchar contra lo inevitable!
4
Diseño de cuestionario y codificación
Palabras clave: codificación - directrices - escala de Likert - formulación de preguntas - medición de conceptos - presentación - preguntas de opción múltiple - prueba piloto - respuestas conjuntas - secuenciación de las preguntas
Es una escena habitual: un estudiante entra en el despacho del tutor para hablar de su proyecto y, con una sonrisa de oreja a oreja, anuncia que “va a investigar x porque es fácil. ¡Unos cuantos cuestionarios y listo!”. De acuerdo, quizás estoy exagerando un poco, pero es muy probable que los cuestionarios sean una de las herramientas metodológicas más populares. En especial, los estudiantes y los investigadores menos experimentados parecen pensar que son la panacea que puede resolver todos sus problemas. Una vez diseñados, logran acumular enormes cantidades de datos de una alta calidad. La realidad, no obstante, pinta un cuadro totalmente distinto. Aunque es verdad que los cuestionarios son especialmente prácticos si se necesitan grandes cantidades de datos, el problema surge en el estadio de su diseño. Vamos a dejarlo claro desde el principio: ¡Los cuestionarios NO son una forma fácil y barata de generar una enorme cantidad de datos con muy poco o ningún esfuerzo! Los cuestionarios deben ser perfectos –y, cuando digo perfectos, lo digo en serio– antes de ser distribuidos a la muestra de la población; los cambios posteriores, cuando parte de la muestra ya tenga una versión y otra parte tenga una versión diferente, pueden invalidar el estudio. Los cuestionarios son herramientas científicas que requieren de una minuciosa planificación y diseño para que funcionen con precisión. Después de todo, lo que buscamos con los cuestionarios es recolectar datos fiables y válidos, y si diferentes personas tienen cuestionarios diferentes
80
La investigación cuantitativa en Lingüística que investigan el mismo tema, ¿cómo van a ser fiables los datos? En el peor de los casos, tendríamos que empezar de nuevo a recoger los datos, algo que no es ni deseable ni práctico. Este capítulo tiene dos fines: primero, vamos a dar unas directrices generales acerca de cómo diseñar un cuestionario, centrándonos en la formulación de las preguntas, las formas de medición y registro de las respuestas, y la medición de las actitudes empleando escalas de Likert y respuestas múltiples. Además, hablaremos de cómo preparar para el análisis los datos basados en cuestionarios. Simultáneamente, el capítulo aborda los problemas potenciales de los cuestionarios y de los métodos examinados, como pueden ser la formulación confusa de las preguntas, las preguntas trucadas o el grado de detalle que un instrumento en concreto puede obtener. Antes de entrar en materia, tengo que hacer una advertencia. Por muy cuidadosamente que diseñemos nuestro cuestionario, por muy cuidadosamente que formulemos nuestras preguntas y por muy exhaustivamente que hagamos pruebas piloto, estamos, después de todo, tratando con seres humanos y las respuestas que obtengamos de ellos son las respuestas que dan en un momento concreto del tiempo. Tal vez porque es un reflejo exacto de su ser en ese momento, tal vez porque piensen (consciente o inconscientemente) que la respuesta es la correcta, su respuesta no es más que eso: una respuesta que ofrecen en un momento determinado. No es necesariamente la verdad fáctica, absoluta. Si calentamos agua a la altura del nivel del mar hasta los 100 grados Celsius, esta cambiará su estado de líquido a gaseoso (vapor). Esto es un hecho, y como tal es replicable. Pero cualquier cosa que implique a nuestros congéneres es más complicada, y es importante que interpretemos nuestros resultados como lo que son: son únicamente el reflejo de nuestra muestra en el momento de la recogida de datos. Un estudio seminal conducido por el difunto sociólogo estadounidense Richard LaPiere ilustra este sorprendente abismo entre lo que la gente dice que está haciendo y su acción (real). Entre 1930 y 1932, LaPiere viajó con una pareja de etnia china (“un hecho que no podía disimularse” [LaPiere, 1934: 231]) a lo largo de Estados Unidos. En algo así como 15.000 kilómetros de viaje, cruzando dos veces Estados Unidos y recorriendo la costa del Pacífico, solamente una vez nos encontramos con un rechazo tajante por parte de aquellos a quienes pedimos que nos atendieran. Nos recibieron en 66 hoteles, campings y Tourist Homes, nos rechazaron en uno. Nos sirvieron en 184 restaurantes y cafeterías diseminadas por todo el país [...] (ibid.: 232).
Parece un resultado bastante bueno en una época en la que, tal como la describe LaPiere, la actitud general hacia la población china se consideraba en su mayor parte negativa. Sin embargo, cuando LaPiere contactó de nuevo con todos los establecimientos unas pocas semanas más tarde y les preguntó: “¿Aceptan huéspedes de raza china en su establecimiento?” (ibid.: 233), más del 90 por 100 respondió que “no”. Esto revela un desajuste impresionante entre lo que la gente dice que
Diseño y muestreo de la investigación
81
hace y lo que en realidad hace. Y, aunque hay maneras de puentear este abismo (y veremos algunas posibilidades en este capítulo), el hecho sigue siendo que, en última instancia, confiamos en lo que nos dice la gente.
4.1. Punto de partida: saber lo que se quiere y preguntar lo que se necesita Uno de los problemas principales a la hora de diseñar cuestionarios es que nosotros, investigadores, tenemos claro lo queremos que haga el cuestionario. Desgraciadamente, no es el caso de nuestros encuestados. Por lo tanto, es crucial que formulemos nuestras preguntas de tal manera que todos los participantes de nuestra muestra puedan a) entenderlas completamente y b) responderlas lo mejor que sepan. ¡Así que deberíamos ser siempre totalmente claros y precisos en toda pregunta que hagamos! Esto puede parecer una perogrullada. Sin embargo, muchos de los cuestionarios diseñados por investigadores sin experiencia contienen a menudo preguntas confusas, vagas o ambiguas. Supongamos que nos interesan las actitudes de la gente ante el aprendizaje de una segunda lengua. Es tentador preguntar simplemente cosas como: “¿Te parece una buena idea aprender una segunda lengua?”; después de todo, la pregunta parece apuntar exactamente a lo que queremos saber. Vamos a pensarlo de nuevo. ¿Realmente la pregunta nos proporciona información útil? Tal como está formulada, sólo admite tres respuestas: sí, no y una opción neutral, no sabe no contesta. Así que, en una muestra de 100 participantes podríamos obtener un reparto de este tipo: Sí
62
No
26
NS/NC
12
Podemos concluir que 62 de los 100 participantes (es decir un 62 por 100) creen que es una buena idea aprender una segunda lengua, mientras que 26 creen que no lo es. Y ya está; no nos dice nada más. ¿Quién debería aprenderla? ¿Cuándo? ¿Y por qué? ¿Y cómo? Cualquier pregunta de partida válida inevitablemente tendrá que enfrentarse a alguno de estos aspectos; sin embargo, nuestra pregunta no nos proporciona las respuestas. Una pregunta mucho mejor, aunque aún lejos de la perfección, sería: “¿Cree que se debería enseñar a los niños una segunda lengua en la etapa de primaria?”. Esta cuestión extrae mucha más información: se centra en un grupo particular (niños y niñas de una edad determinada), en un momento concreto de sus vidas (en la escuela primaria) y excluye a los bebés, a los adolescentes y a los adultos. Aun así, el tipo de información que es más probable que nos interese no la cubre la pre-
82
La investigación cuantitativa en Lingüística gunta: ¿por qué la gente ha opinado de ese modo? Con toda sinceridad, en este contexto particular, un estudio que busque la respuesta a si en lugar de a por qué es muy probable que no obtenga resultados interesantes. Estoy diciendo una obviedad, pero una obviedad que los investigadores bisoños a menudo ignoran: antes de empezar a desarrollar nuestros métodos y metodología, como, por ejemplo, los cuestionarios, ¡tenemos que tener una pregunta de partida clara y precisa! Y hay una diferencia fundamental en averiguar si alguien está de acuerdo en un tema determinado o por qué está de acuerdo. Una vez más puede parecer una obviedad, pero, si lo que nos interesa es la razón que subyace a una respuesta determinada, no podemos olvidarnos de preguntarles a los participantes por esa razón en concreto. Como ya he mencionado antes, una vez que los participantes hayan completado el formulario, apenas tendremos la ocasión de obtener información adicional; por lo tanto, toda la información que necesitamos tiene que recogerse la primera vez. Mi experiencia reciente me dicta que esto tengo que dejarlo clarísimo: la pregunta de partida conduce la metodología y no al contrario. Es una práctica incorrecta (por decirlo de un modo publicable) construir una investigación en torno al método; hay muchas posibilidades de que acabes con un montón de datos, pero de datos basura. Sí, hay que tener en cuenta las cuestiones metodológicas cuando se diseña la investigación (en otras palabras, hay que pensar si el estudio es factible), pero la pregunta es la que define la metodología. Y punto. Y a menudo esto quiere decir que los cuestionarios no son la mejor herramienta metodológica para investigar nuestra pregunta. Vamos a seguir un rato con el ejemplo anterior. Tenemos (esperemos) una pregunta que nos da una primera impresión acerca de las actitudes de la gente hacia el aprendizaje de un segundo idioma en la escuela primaria. Ahora necesitamos encontrar una pregunta de la que sea razonable esperar que suscite respuestas que expresen las razones de los participantes para dar una respuesta concreta. A primera vista, preguntar simplemente “¿Por qué cree que...?” probablemente sea la mejor opción: en tanto pregunta abierta, es decir, en tanto una pregunta que permite que los participantes comenten con libertad sobre por qué..., puede darnos importantes pistas acerca de lo que piensan. Por otra parte, puesto que es una pregunta abierta, requiere que los participantes formulen sus pensamientos y que los anoten de una manera activa. En resumen, es mucho lío para que la gente se moleste en responderla y, en muchas ocasiones, la gente (empezando por mí) tiende a saltarse las preguntas abiertas. De manera similar, las preguntas abiertas pueden recolectar una cantidad sustancial de datos irrelevantes o innecesarios; después de todo, no tenemos ningún control sobre la respuesta que está proporcionando el participante. En cualquier caso, para nosotros, en tanto investigadores, el asunto es que tenemos una respuesta, pero no una explicación adecuada de esta. En tercer lugar, para hacer un análisis cuantitativo tendremos que codificar nuestras respuestas, es decir, traducir el texto a valores numéricos (como veremos más tarde). Y, en
Diseño y muestreo de la investigación
83
el caso de una pregunta abierta, puede ser una tarea muy complicada, especialmente con las respuestas ambiguas. Para evitar este problema, y aunque suelen ser una excelente fuente para los datos cualitativos, en este punto (y de hecho durante el resto del libro) vamos a ignorar la posibilidad de emplear entrevistas (semi)estructuradas y abiertas. Refiero aquí a los lectores al resumen de Tagliamonte (2006) sobre las entrevistas sociolingüísticas o a la obra de Litosseliti (2003), que, entre otros métodos, emplea grupos de discusión. Recordemos que, aunque este libro se centre en los métodos cuantitativos, eso no quiere decir que los métodos cualitativos sean peores o mejores. Son simplemente distintos.
4.2. Preguntas de selección múltiple/de opción múltiple Una solución potencial para nuestro problema a la hora de medir las actitudes mediante un cuestionario es el empleo de las preguntas de opción múltiple. Como el término da a entender, son preguntas que proporcionan al participante una gama de posibles respuestas, habitualmente al menos 3. Por ejemplo, en nuestra encuesta, que investiga la enseñanza de Lenguas Extranjeras Modernas en las escuelas primarias, quizá queramos ofrecer a los participantes una elección entre cuatro opciones, de las cuales deben escoger la que crean más importante. ¿Por qué cree que deberían enseñarse Lenguas Extranjeras Modernas en la escuela primaria? s%LCONOCIMIENTODEOTROSIDIOMASABREMEJORESPERSPECTIVASLABORAles en el futuro. s%LAPRENDIZAJEDEIDIOMASAUMENTAELDESARROLLOCOGNITIVO s5NAHORAMÕSDECLASELOSRETIENEMÕSTIEMPODENTRODELCOLEGIOY así no se meten en líos. s#UALQUIEROTRARAZNPORFAVOR ESPECIlQUE
A estas alturas ya deberíamos poder señalar dos trampas potenciales: en primer lugar, puesto que las preguntas anteriores ‘¿Piensa que...?’ ofrecían tres opciones de respuesta –sí, no, NS/NC– nuestro cuestionario debería proporcionar dos grupos de opciones múltiples para la segunda cuestión, un hecho que a menudo pasan por alto los investigadores no experimentados. Es decir, necesitamos un conjunto de opciones para la opción de respuesta ‘sí’ (que acabamos de formular), pero también para la opción de respuesta ‘no’. ¿Por qué cree que NO deberían enseñarse Lenguas Extranjeras Modernas en la escuela primaria?
84
La investigación cuantitativa en Lingüística s3ONDEMASIADODIF¤CILESPARALOSNI¶OS s)NTERlERECONELAPRENDIZAJEDELAPRIMERALENGUA s%SUNAP£RDIDADETIEMPO s#UALQUIEROTRARAZNPORFAVOR ESPECIlQUE
Es importante que, en este momento, le digamos al participante qué tiene que hacer y a dónde dirigirse. Si simplemente hacemos una lista con las preguntas, sin informar explícitamente a los participantes de cómo proceder, acabarán por responder las preguntas equivocadas y, por lo tanto, sesgando nuestros resultados. Para asegurarnos, es aconsejable decirle a la gente qué hacer tanto en la pregunta inicial como en la que se deriva; por ejemplo: P1: ¿Cree que debería enseñárseles a los niños una lengua extranjera en la escuela primaria? R Sí R No R NS/NC Si su respuesta es sí, pase a la P2; si su respuesta es no, pase a la P3. De no ser así, por favor pase a la P5. P2: Si su respuesta en la P1 fue sí: ¿por qué cree que deberían enseñarse Lenguas Extranjeras Modernas en la escuela primaria? R El conocimiento de otros idiomas amplia las oportunidades laborales. R El aprendizaje de idiomas aumenta el desarrollo cognitivo. R Una clase más hace que pasen más tiempo en la escuela. RCualquier otra razón (por favor, especifique) _________________ P3: Si su respuesta en la P1 fue no: ¿por qué cree que NO deberían impartirse Lenguas Extranjeras Modernas en la escuela primaria? R Es demasiado difícil para los niños. R Interfiere con su idioma materno. R Es una pérdida de tiempo. R Cualquier otra razón (por favor, especifique) __________________
En los últimos dos años he sigo testigo de una proliferación de herramientas para hacer encuestas online: en lugar de realizarla sobre papel, los participantes completan un cuestionario online. Muchos de estos proveedores de encuestas incluyen un ‘sistema automático de guía’, mediante el cual se dirige automáticamente a los participantes a la pregunta adecuada según haya sido su respuesta anterior (de modo que si se contesta sí a una pregunta, se le envía a la pregunta siguiente; si se ha contestado no, se le redirige a otra pregunta distinta). Desgraciadamente, aunque la mayor parte de las características son gratuitas, para beneficiarse de las características avanzadas suele ser necesario suscribirse. Esto es algo que hay que tener en cuenta en el estadio de planificación del proyecto (véase Capítulo 3).
Diseño y muestreo de la investigación
85
Para que la pregunta tenga un sentido dentro del debate académico en el que se inserta, es importante que las opciones no se elijan al azar, sino que provengan de hallazgos de la investigación previa en ese campo: todas las opciones de respuesta para las preguntas del ejemplo son razonables y podrían darse en la vida real. En muchos casos, especialmente para los proyectos a pequeña escala, esto supone revisar de manera crítica la bibliografía existente. Sin embargo, en estudios de mayor tamaño o en aquellos en los que las respuestas potenciales no son tan directamente predecibles, la construcción de las preguntas de opción múltiple se basa a menudo en estudios adicionales, previos a la encuesta mediante cuestionario. Por ejemplo, un estudio cualitativo a pequeña escala con entrevistas y/o grupos de discusión podría ayudarnos a establecer las actitudes generales hacia la enseñanza de lenguas; los hallazgos de este estudio previo podrían entonces emplearse para redactar las opciones de la encuesta a gran escala.
4.3. Medición de conceptos abstractos: actitudes y creencias En el Capítulo 2 hemos hablado de los conceptos, una categoría que comprende diversas variables interrelacionadas en oposición a una única variable, y mediante el ejemplo de la “motivación del aprendiz” hemos subrayado que los conceptos pueden ser muy difíciles de medir. Desgraciadamente, los conceptos son algo muy común; en especial, la investigación sociolingüística y la lingüística aplicada emplean con frecuencia dos tipos de conceptos que son muy problemáticos: actitudes y creencias. Ya nos hemos encontrado en el Capítulo 2 con el concepto de vitalidad etnolingüística de Giles et al. (1977) y hemos visto que este concepto podía medirse empleando tres categorías de variables. Unos años más tarde, Bourhis, Giles y Rosenthal (1981) ampliaron el marco de trabajo incluyendo la percepción del propio grupo, es decir, la percepción subjetiva, que hasta entonces se había pasado por alto; ahora se conoce este enfoque como Vitalidad Etnolingüística Subjetiva (SEV). Es muy importante señalar que una SEV, tal como la proponen Bouhris, Giles y Rosenthal, se basa completamente en cuestionarios. El impacto que esto tiene en el diseño de cuestionarios es obvio: Cada entrada del cuestionario se diseña para medir la valoración subjetiva de cada miembro del grupo acerca de cómo puntúa a su propio grupo en comparación con otro grupo destacado, acerca de importantes dimensiones de vitalidad (Bourhis, Giles y Rosenthal, 1981: 147-148).
El cuestionario original de Bouhris, Giles y Rosenthal tenía 22 preguntas, todas las cuales se basan en diferenciales semánticos o en escalas de Likert. Los diferenciales semánticos piden a los participantes que indiquen su respuesta a lo largo de un continuo entre dos términos
86
La investigación cuantitativa en Lingüística opuestos (por no decir antónimos), como se muestra en el siguiente ejemplo tomado de Bouhris, Giles y Rosenthal (1981: 152): En todas las zonas de Melbourne donde viven los grupos siguientes, ¿hasta qué punto estos están en minoría o mayoría? Gente de origen griego En una minoría muy pequeña _ _: _ _: _ _: _ _: una mayoría muy amplia
Analizando cuán a la derecha o a la izquierda han marcado, podemos cuantificar las actitudes de los participantes en lo que respecta a este asunto en particular. Examinaremos cómo se codifican realmente las respuestas a los cuestionarios al final de este capítulo. Un instrumento igualmente popular para medir las actitudes son las escalas de Likert. Como en el ejemplo anterior, se pide a los participantes que indiquen su opinión/actitud a lo largo de un continuo. Sin embargo, en lugar de emplear pares de adjetivos opuestos, las escalas de Likert piden a los participantes que indiquen si están de acuerdo o desacuerdo con un tema particular, habitualmente en una escala de 5 ó 7, según el grado de detalle que requiera la investigación. Los ítems de la escala de Likert deben ser afirmaciones: Hablar más de un idioma es beneficioso para la carrera laboral. Escala de Likert de 5 puntos donde 5 indica muy de acuerdo muy de acuerdo
5
4
3
2
1
muy en desacuerdo
Escala de Likert de 7 puntos donde 7 indica muy en desacuerdo muy de acuerdo 1
2
3
4
5
6
7
muy en desacuerdo
Con frecuencia nos encontramos con escalas acuerdo/desacuerdo como la que acabamos de mostrar para preguntas como “¿Cree que hablar una segunda lengua es algo útil?”. Estas no son auténticas escalas de Likert. Ya sean o no escalas de Likert, a la hora de procesar e interpretar los datos es crucial entender que nuestras escalas funcionan en un nivel de medición interválico, es decir, que la diferencia entre dos opciones de respuesta adyacentes es idéntico: la diferencia entre ‘muy de acuerdo’ y ‘de acuerdo’ es idéntica a la diferencia entre ‘en desacuerdo’ y ‘muy en desacuerdo’ (véase Capítulo 2). Señalemos que la escala procedente de Bouhris et al. permite que los participantes marquen una de las 7 casillas; de la misma forma, nuestra ficticia escala de Likert de arriba proporciona 5 y 7 opciones de respuesta, respectivamente. Que el número sea impar permite que los participantes señalen una opinión ‘neutral’ o ‘equilibrada’ si es así como lo perciben, pero también produce un riesgo significativo de que los participantes den la respuesta neutral en aras de la neutralidad. Por contraste, una escala que se basara en números pares obligaría a los participantes a dar una
Diseño y muestreo de la investigación
87
respuesta que se inclinara a uno u otro lado de la balanza. Esto no resuelve necesariamente el problema. Ping (2005: 1) discute este fenómeno del grupo de respuestas aquiescentes: Esto es, la tendencia a estar de acuerdo o a decir “sí” ante una afirmación independientemente del contenido de la afirmación o de la opinión real (de los participantes).
En el peor de los casos, la mayoría de nuestros participantes en la muestra tenderían a estar de acuerdo con todas las cuestiones, lo que sesgaría nuestros resultados inevitablemente y de manera sustancial. De una forma similar, los estilos de respuesta extrema se caracterizan por la tendencia de los participantes a elegir respuestas que se encuentran en los extremos de la escala. En un proyecto a gran escala basado en datos recogidos en 19 países, Johnson et al. (2005) concluyeron que los patrones generales de comportamiento cultural se reflejan en los estilos de respuesta: a grandes rasgos, los participantes de países individualistas y con un índice alto de distancia al poder es más probable que den respuestas extremas y menos probable que den respuestas aquiescentes (2005: 273), mientras que la aquiescencia es más frecuente en las culturas que valoran la conformidad. Por razones obvias, nuestro estudio lingüístico medio no permitirá una investigación en profundidad acerca del estilo de respuesta típico de esa cultura; sin embargo, merece la pena invertir algún tiempo en pensar acerca de nuestros potenciales participantes cuando se diseñen las escalas de medición. Una forma de bloquear las tendencias en las respuestas y, en especial, las respuestas aquiescentes es formular las preguntas en direcciones opuestas, intentando cubrir tanto las actitudes positivas como las negativas: Hablar más de un idioma en primaria beneficia a los alumnos. muy de acuerdo 5 4 3 2 1 muy en desacuerdo Hablar más de un idioma en primaria perjudica el desarrollo cognitivo de los alumnos. muy de acuerdo 1 2 3 4 5 muy en desacuerdo
Si un participante está a favor de la enseñanza del idioma extranjero en la escuela primaria, debería tender a estar de acuerdo en la primera y en desacuerdo en la segunda. Si está de acuerdo con las dos, es probable que te encuentres ante un ‘sí-señor’.
88
La investigación cuantitativa en Lingüística
4.4. Formular las preguntas Si has tenido la suerte de encontrar a alguien que rellene (¡y que te devuelva!) tu cuestionario, no lo abrumes con un exceso de información. Después de todo, están dispuestos a ayudarte, no los castigues. Hacer buenas preguntas es ser conciso y preciso, no presumir de tus dotes de novelista. Hay pocas preguntas que justifiquen que se proporcione un resumen del proceso de la investigación para que los participantes las entiendan. Además, a diferencia de nosotros, la mayoría de nuestros participantes no van a ser expertos en la disciplina. Muy pocos de ellos estarán familiarizados con la terminología lingüística, y las indagaciones acerca de la famosa ‘r rótica posvocálica’ van a producir tanta confusión como la pregunta acerca de si el complejo paradigma flexivo de la morfología verbal española justifica la omisión del pronombre. Por lo tanto, cuando formulemos una pregunta, tengamos en cuenta el nivel de conocimiento de los participantes. En el caso de los no expertos, este nivel será a menudo sorprendentemente bajo. En un cuestionario utilizado durante el trabajo de campo de mi investigación acerca del uso del lenguaje por parte de grupos migrantes (Rasinger, 2007), empleé originariamente el término hablante nativo para referirme a la gente cuya primera lengua no es el inglés. Sin embargo, en la práctica, resultó que la mayoría de mis encuestados bangladesíes (algunos de ellos con una competencia muy limitada en el idioma inglés, en cualquier caso) no entendían el término. Cuando, en una versión posterior, reformulé la pregunta usando el término lengua materna, el problema desapareció casi instantáneamente (y sí, queridos compañeros lingüistas, soy consciente de los problemas que los términos hablante (no) nativo y lengua materna plantean en primera instancia). Con demasiada frecuencia nos gustaría que nuestros cuestionarios midieran algo con mucho detalle, requiriendo, por lo tanto, que el participante dé respuestas detalladas. No obstante, aparte de los aspectos técnicos/lingüísticos de los que hemos hablado antes, tenemos que sopesar si nuestros encuestados tienen realmente la capacidad de proporcionar una información con un alto grado de detalle: podrían sencillamente no saber tanto de un tema determinado como para poder responder. Otro problema habitual son las preguntas claramente largas y, llevadas hasta el extremo, las preguntas dobles. Cada pregunta debería preguntar una sola cosa, ni más ni menos. Si le preguntamos a los participantes “¿Cree que el uso del dialecto es una señal de capacidad intelectual limitada y que debería prohibirse en las escuelas?” les estamos preguntando dos cosas: en primer lugar nos interesan las actitudes de los participantes respecto al empleo del dialecto y, en segundo lugar, si creen que su empleo debería prohibirse en las escuelas. Si, en el peor de los casos, proporcionamos únicamente dos posibilidades de respuesta (sí/no), tu participante deberá decidir cuál de las dos preguntas quie-
Diseño y muestreo de la investigación
89
re responder. Y, aunque es muy posible que las dos respuestas coincidieran, puedes toparte con una persona que quiera que se prohíban los dialectos en la escuela pero que no crea que su uso tenga nada que ver con la capacidad intelectual, ¿y qué contesta entonces? Otra regla muy sencilla pero muy importante para el diseño de las preguntas es evitar las construcciones negativas: “¿Cree que la enseñanza de las lenguas extranjeras en la escuela primaria no es una buena idea?”. Dicho sencillamente, no es una palabra de dos letras que fácilmente se pasa por alto, especialmente cuando se miran distraídamente las preguntas (como me pasa a mí). Del mismo modo, en preguntas más complejas, la forma negativa puede producir confusión, algo que queremos evitar por todos los medios posibles. De manera similar, deberían evitarse preguntas que contengan más de una oración subordinada sencilla, como una oración de relativo para aclarar: ¿Cree que los recientes cambios en la política del gobierno en lo que concierne a la introducción de la enseñanza de lenguas extranjeras en la escuela primaria, en especial, pero no exclusivamente, aquellas situadas en los centros urbanos, que fue anunciada ayer, son, especialmente en lo que se refiere a la importancia de las destrezas lingüísticas para el éxito profesional posterior, una buena idea?
Es posible que esta pregunta sea muy precisa, pero que confunda al menos a algunos participantes. Si realmente necesitamos incluir información adicional en alguna pregunta, y deberíamos sopesar cuidadosamente si realmente es necesario, hay que huir de la complejidad sintáctica y emplear construcciones sencillas, aunque sea algo que como lingüistas nos resulte muy difícil: El gobierno acaba de anunciar la introducción de la enseñanza de idiomas en la escuela primaria. La enseñanza de Lenguas Extranjeras empezará por las escuelas de los centros urbanos. Esto se debe a la presunción de que contribuirá en el futuro al éxito profesional. ¿Cree que es una buena idea enseñar lenguas extranjeras en las escuelas primarias?
Esto contiene la misma información, pero sin duda se entiende mucho mejor. Las preguntas dirigidas son preguntas que se formulan de tal manera que se nota que prefieren una respuesta concreta. Las cuestiones dirigidas suelen aparecer en los cuestionarios diseñados por investigadores novatos, como los estudiantes de grado, especialmente cuando el estudiante tiene una opinión muy marcada sobre el tema que investiga. Lo malo es que pueden influir en los resultados (y se usan para ello). El ejemplo siguiente procede de la popular serie de comedia británica de la década de 1980 Yes, Prime Minister (Sí, Primer Ministro). En esta escena, sir Humphrey Appleby (interpretado por el difunto Nigel Hawthorne), secretario permanente y un maestro de la manipulación y la ofuscación, y Bernard Woolley, el secretario particular principal del Primer
90
La investigación cuantitativa en Lingüística Ministro, hablan de cómo las preguntas dirigidas pueden emplearse para influir en los resultados de una encuesta; en este caso, acerca de la vuelta del servicio militar obligatorio: 6,5+803+5(